विषयसूची:

Google AIY Voice Kit में ट्रिगर स्टार्ट साउंड जोड़ें: 6 कदम (चित्रों के साथ)
Google AIY Voice Kit में ट्रिगर स्टार्ट साउंड जोड़ें: 6 कदम (चित्रों के साथ)

वीडियो: Google AIY Voice Kit में ट्रिगर स्टार्ट साउंड जोड़ें: 6 कदम (चित्रों के साथ)

वीडियो: Google AIY Voice Kit में ट्रिगर स्टार्ट साउंड जोड़ें: 6 कदम (चित्रों के साथ)
वीडियो: Unboxing and setting up the - AIY Voice Kit V2 from Google - Do-it-Yourself Artificial Intelligence 2024, नवंबर
Anonim
Image
Image
चरण 2: अधिक जानकारी के लिए Voicehat.py फ़ाइल देखें
चरण 2: अधिक जानकारी के लिए Voicehat.py फ़ाइल देखें

यह ट्यूटोरियल काफी सरल है। मैं वास्तव में Google AIY Voice Kit का आनंद ले रहा हूं, लेकिन वास्तव में मेरे सामान्य Google होम के शोर की तरह यह पुष्टि करने के लिए कि वे सक्रिय रूप से सुन रहे हैं। यह एआईवाई वॉयस किट छवि पर पहले से लोड किए गए किसी भी उदाहरण में डिफ़ॉल्ट रूप से सेटअप नहीं है।

मैं अपने ज़ूम रिकॉर्डर के साथ अपने वास्तविक Google होम से रिकॉर्ड किए गए स्टॉक स्टार्ट और कन्फर्म नॉइज़ का लिंक भी शामिल कर रहा हूं।

यहाँ हम जाते हैं-मेरी पहली शिक्षाप्रद!

चरण 1: आवश्यक सामग्री और फ़ाइलें

  1. पूरी तरह कार्यात्मक Google AIY Voice Kit-अपनी किट सेट करने के लिए आधिकारिक AIY Voice Kit पृष्ठ पर जाएं।
  2. एसएसएच, वीएनसी, या मॉनिटर और कीबोर्ड के माध्यम से अपने पीआई के टर्मिनल तक पहुंचने की क्षमता
  3. . Wav फ़ाइल जिसे आप तब चलाना चाहते हैं जब Pi ध्वनि इनपुट के लिए सुन रहा है-यदि कस्टम फ़ाइल का उपयोग नहीं कर रहा है, तो यहां मानक "सेंट आर्ट टॉकिंग" फ़ाइल डाउनलोड करें या संलग्न लिंक से डाउनलोड करें।
  4. (वैकल्पिक) ऑडियो संपादक जो फाइलों को परिवर्तित कर सकता है और उनकी बिट और नमूना दर बदल सकता है

चरण 2: चरण 2: अधिक जानकारी के लिए Voicehat.py फ़ाइल देखें

जरूरी

मैं अपनी वॉयस किट पर नवीनतम छवि का उपयोग नहीं कर रहा हूं जिसमें वॉयस और विज़न किट (यानी aiyprojects-2018-01-03.img) दोनों के लिए कोड शामिल है। मैं वॉयस किट शाखा से कोड का उपयोग कर रहा हूं जो Google AIY रास्पियन गिटहब पर पाया जा सकता है। मेरी निजी राय है कि वॉयस किट शाखा का उपयोग इसे सरल रखने के लिए करें और जब आप अपनी वॉयस किट के साथ काम कर रहे हों तो विज़न कोड से निपटने की आवश्यकता नहीं है।

आगे बढ़ते रहना…

यह कदम पूरी तरह से अनिवार्य नहीं है, लेकिन यह आपको दिखाएगा कि Google ने इसे काम करने के लिए निर्देशों को कहां दफन कर दिया है यदि आप इसे एक कदम आगे ले जाना चाहते हैं या यह समझना चाहते हैं कि मैं जो कोड जोड़ रहा हूं वह क्यों काम कर रहा है।

पीआई@रास्पबेरी: सीडी एआईवाई-वॉयस-किट-पायथन/src/aiy/

फिर हम उस फ़ोल्डर में Voicehat.py फ़ाइल की जाँच करने जा रहे हैं:

pi@raspberry: ~/AIY-voice-kit-python/src/aiy/sudo nano voicehat.py

संलग्न चित्र दिखाता है कि आप स्थिति UI के बारे में कहां से सीख सकते हैं और ट्रिगर के दौरान ध्वनि का उपयोग कैसे करें।

ठीक है, अब इस चीज़ को काम करने के लिए किसी एक उदाहरण फ़ाइल में कुछ कोड जोड़ते हैं।

चरण 3: चरण 3: डेमो कोड में ट्रिगर साउंड कोड जोड़ें

चरण 3: डेमो कोड में ट्रिगर साउंड कोड जोड़ें
चरण 3: डेमो कोड में ट्रिगर साउंड कोड जोड़ें

सबसे पहले, एआईवाई-वॉयस-किट-पायथन फ़ोल्डर में नेविगेट करें और स्रोत कोड चलाएं

सीडी एआईवाई-वॉयस-किट-पायथन

स्रोत एनवी/बिन/सक्रिय करें

सीडी स्रोत

फिर 'sudo nano' को 'assistant_grpc_demo.py' या 'assistant_library_demo.py' में इस्तेमाल करें

दो फाइलों के बीच अंतर यह है कि Assistant_grpc_demo.py Google सहायक को ट्रिगर करने के लिए बटन का उपयोग करता है और Assistant_library_demo.py Google सहायक को ट्रिगर करने के लिए सक्रियण शब्द "Ok, Google" का उपयोग करता है।

इन दोनों फाइलों के लिए आपको कोड की केवल एक लाइन जोड़ने की जरूरत है:

status_ui.set_trigger_sound_wave('/home/pi/googlestart.wav')

यह मानता है कि आपने अपनी प्रारंभ ध्वनि को /home/pi/ फ़ोल्डर में रखा है और इसे googlestart.wav नाम दिया है। आपने अपनी फ़ाइल को जो भी नाम दिया है और जहाँ भी आपने उसे स्थित किया है, उसके आधार पर इन्हें बदलें।

हम जिस कोड की तलाश कर रहे हैं वह नीचे है:

Status_ui.status ('सुनना')

हम कोड की उस पंक्ति से पहले कोड की अपनी नई पंक्ति जोड़ना चाहते हैं …

'assistant_library_demo.py' उदाहरण के लिए इसे यहां देखा जा सकता है:

elif event.type == EventType. ON_CONVERSATION_TURN_STARTED:

# और अब हमारा कोड जोड़ें status_ui.set_trigger_sound_wave('home/pi/googlestart.wav') status_ui.status('listing')

'assistant_grpc_demo.py' उदाहरण के लिए इसे यहां देखा जा सकता है:

बटन। प्रतीक्षा_के लिए_प्रेस ()

# और अब हमारा कोड जोड़ें status_ui.set_trigger_sound_wave('/home/pi/googlestart.wav') status_ui.status('listing')

यह मानता है कि आपने अपनी प्रारंभ ध्वनि को /home/pi/ फ़ोल्डर में रखा है और इसे googlestart.wav नाम दिया है। आपने अपनी फ़ाइल को जो भी नाम दिया है और जहाँ भी आपने उसे स्थित किया है, उसके आधार पर इन्हें बदलें।

सब कुछ बचाने के लिए CTRL-X और Y दबाएं।

***ध्यान दें: मैंने कुछ नासमझ पाया है। 'assistant_library_demo.py' के लिए ट्रिगर ध्वनि जोड़ने से वाक् पहचान के कार्य में कोई फ़र्क नहीं पड़ता है। हालांकि 'assistant_grpc_demo.py' के लिए, ऐसा लगता है कि जब आपके पास ट्रिगर ध्वनि लागू होती है तो यह आपके द्वारा कहे गए पहले शब्द या दो को काट देती है। बिल्कुल यकीन नहीं क्यों। अभी भी इसका पता लगाने की कोशिश की जा रही है।

चरण 4: चरण 4: कोड चलाएँ और सुनिश्चित करें कि सब कुछ अच्छा है

पीआई@रास्पबेरी: सीडी एआईवाई-वॉयस-किट-पायथन

और वर्चुअलएन्व लोड करें

pi@raspberry:~/AIY-voice-kit-python $source env/bin/active

और चलाओ!

(env) pi@raspberry:~/AIY-voice-kit-python $ src/assistant_library_demo.py

या

(env) pi@raspberry:~/AIY-voice-kit-python $ src/assistant_grpc_demo.py

अब "ओके, गूगल" कहें या उस बटन को दबाएं और देखें कि क्या यह काम करता है!

यदि आपकी अपनी कस्टम फ़ाइल है और आपकी.wav फ़ाइल के लिए उपयुक्त बिट और नमूना दरें हैं तो अगला पृष्ठ आपकी सहायता करेगा

चरण 5: चरण 5: अपनी खुद की.wav फ़ाइल बनाएं

चरण 5: अपनी खुद की.wav फ़ाइल बनाएं
चरण 5: अपनी खुद की.wav फ़ाइल बनाएं

यदि आप मानक Google होम प्रारंभ ध्वनि की मेरी.wav फ़ाइल का उपयोग करने में रुचि नहीं रखते हैं, तो आपको अपनी स्वयं की.wav फ़ाइल बनानी होगी। मेरे लिए काम करने के लिए सही बिट और नमूना दर प्राप्त करने में थोड़ा सा परीक्षण और त्रुटि हुई।

मैंने अपने सभी संपादन (चित्रित) करने के लिए लॉजिक प्रो एक्स का उपयोग किया, जो संगीत बनाने और उत्पादन करने के लिए एक पूर्ण विकसित डीएडब्ल्यू है। मैंने पाया है कि दो विकल्प उपयुक्त हो सकते हैं स्विच या मीडियाह्यूमन ऑडियो कन्वर्टर। मुझे लगता है कि अगर आपके पास मैक है तो आप गैराजबैंड के साथ ऐसा कर सकते हैं, लेकिन मैंने इसे आजमाया नहीं है।

आपकी फ़ाइल के तीन प्रमुख भाग हैं जिनकी आवश्यकता डेमो कोड के साथ काम करने के लिए होती है।

  1. एक मोनो ऑडियो फ़ाइल होनी चाहिए
  2. नमूना दर 32000. होनी चाहिए
  3. एक.wav फ़ाइल होनी चाहिए
  4. (वैकल्पिक) 16 बिट रिज़ॉल्यूशन ने मेरे लिए सबसे अच्छा काम किया है

चरण 6: चरण 6: पुष्टिकरण ध्वनि जोड़ना?

अगर किसी के पास कोई विचार है तो यह वह जगह है जहां मैं फंस गया हूं। यदि सिस्टम सामान्य Google होम की तरह ध्वनि इनपुट को पहचान लेता है, तो मुझे पुष्टिकरण शोर जोड़ना अच्छा लगेगा।

मैंने आपकी सुविधा के लिए नीचे स्टॉक पुष्टिकरण शोर संलग्न किया है।

आनंद लेना!

सिफारिश की: