विषयसूची:
- चरण 1: आवश्यक सामग्री और फ़ाइलें
- चरण 2: चरण 2: अधिक जानकारी के लिए Voicehat.py फ़ाइल देखें
- चरण 3: चरण 3: डेमो कोड में ट्रिगर साउंड कोड जोड़ें
- चरण 4: चरण 4: कोड चलाएँ और सुनिश्चित करें कि सब कुछ अच्छा है
- चरण 5: चरण 5: अपनी खुद की.wav फ़ाइल बनाएं
- चरण 6: चरण 6: पुष्टिकरण ध्वनि जोड़ना?
वीडियो: Google AIY Voice Kit में ट्रिगर स्टार्ट साउंड जोड़ें: 6 कदम (चित्रों के साथ)
2024 लेखक: John Day | [email protected]. अंतिम बार संशोधित: 2024-01-30 09:22
यह ट्यूटोरियल काफी सरल है। मैं वास्तव में Google AIY Voice Kit का आनंद ले रहा हूं, लेकिन वास्तव में मेरे सामान्य Google होम के शोर की तरह यह पुष्टि करने के लिए कि वे सक्रिय रूप से सुन रहे हैं। यह एआईवाई वॉयस किट छवि पर पहले से लोड किए गए किसी भी उदाहरण में डिफ़ॉल्ट रूप से सेटअप नहीं है।
मैं अपने ज़ूम रिकॉर्डर के साथ अपने वास्तविक Google होम से रिकॉर्ड किए गए स्टॉक स्टार्ट और कन्फर्म नॉइज़ का लिंक भी शामिल कर रहा हूं।
यहाँ हम जाते हैं-मेरी पहली शिक्षाप्रद!
चरण 1: आवश्यक सामग्री और फ़ाइलें
- पूरी तरह कार्यात्मक Google AIY Voice Kit-अपनी किट सेट करने के लिए आधिकारिक AIY Voice Kit पृष्ठ पर जाएं।
- एसएसएच, वीएनसी, या मॉनिटर और कीबोर्ड के माध्यम से अपने पीआई के टर्मिनल तक पहुंचने की क्षमता
- . Wav फ़ाइल जिसे आप तब चलाना चाहते हैं जब Pi ध्वनि इनपुट के लिए सुन रहा है-यदि कस्टम फ़ाइल का उपयोग नहीं कर रहा है, तो यहां मानक "सेंट आर्ट टॉकिंग" फ़ाइल डाउनलोड करें या संलग्न लिंक से डाउनलोड करें।
- (वैकल्पिक) ऑडियो संपादक जो फाइलों को परिवर्तित कर सकता है और उनकी बिट और नमूना दर बदल सकता है
चरण 2: चरण 2: अधिक जानकारी के लिए Voicehat.py फ़ाइल देखें
जरूरी
मैं अपनी वॉयस किट पर नवीनतम छवि का उपयोग नहीं कर रहा हूं जिसमें वॉयस और विज़न किट (यानी aiyprojects-2018-01-03.img) दोनों के लिए कोड शामिल है। मैं वॉयस किट शाखा से कोड का उपयोग कर रहा हूं जो Google AIY रास्पियन गिटहब पर पाया जा सकता है। मेरी निजी राय है कि वॉयस किट शाखा का उपयोग इसे सरल रखने के लिए करें और जब आप अपनी वॉयस किट के साथ काम कर रहे हों तो विज़न कोड से निपटने की आवश्यकता नहीं है।
आगे बढ़ते रहना…
यह कदम पूरी तरह से अनिवार्य नहीं है, लेकिन यह आपको दिखाएगा कि Google ने इसे काम करने के लिए निर्देशों को कहां दफन कर दिया है यदि आप इसे एक कदम आगे ले जाना चाहते हैं या यह समझना चाहते हैं कि मैं जो कोड जोड़ रहा हूं वह क्यों काम कर रहा है।
पीआई@रास्पबेरी: सीडी एआईवाई-वॉयस-किट-पायथन/src/aiy/
फिर हम उस फ़ोल्डर में Voicehat.py फ़ाइल की जाँच करने जा रहे हैं:
pi@raspberry: ~/AIY-voice-kit-python/src/aiy/sudo nano voicehat.py
संलग्न चित्र दिखाता है कि आप स्थिति UI के बारे में कहां से सीख सकते हैं और ट्रिगर के दौरान ध्वनि का उपयोग कैसे करें।
ठीक है, अब इस चीज़ को काम करने के लिए किसी एक उदाहरण फ़ाइल में कुछ कोड जोड़ते हैं।
चरण 3: चरण 3: डेमो कोड में ट्रिगर साउंड कोड जोड़ें
सबसे पहले, एआईवाई-वॉयस-किट-पायथन फ़ोल्डर में नेविगेट करें और स्रोत कोड चलाएं
सीडी एआईवाई-वॉयस-किट-पायथन
स्रोत एनवी/बिन/सक्रिय करें
सीडी स्रोत
फिर 'sudo nano' को 'assistant_grpc_demo.py' या 'assistant_library_demo.py' में इस्तेमाल करें
दो फाइलों के बीच अंतर यह है कि Assistant_grpc_demo.py Google सहायक को ट्रिगर करने के लिए बटन का उपयोग करता है और Assistant_library_demo.py Google सहायक को ट्रिगर करने के लिए सक्रियण शब्द "Ok, Google" का उपयोग करता है।
इन दोनों फाइलों के लिए आपको कोड की केवल एक लाइन जोड़ने की जरूरत है:
status_ui.set_trigger_sound_wave('/home/pi/googlestart.wav')
यह मानता है कि आपने अपनी प्रारंभ ध्वनि को /home/pi/ फ़ोल्डर में रखा है और इसे googlestart.wav नाम दिया है। आपने अपनी फ़ाइल को जो भी नाम दिया है और जहाँ भी आपने उसे स्थित किया है, उसके आधार पर इन्हें बदलें।
हम जिस कोड की तलाश कर रहे हैं वह नीचे है:
Status_ui.status ('सुनना')
हम कोड की उस पंक्ति से पहले कोड की अपनी नई पंक्ति जोड़ना चाहते हैं …
'assistant_library_demo.py' उदाहरण के लिए इसे यहां देखा जा सकता है:
elif event.type == EventType. ON_CONVERSATION_TURN_STARTED:
# और अब हमारा कोड जोड़ें status_ui.set_trigger_sound_wave('home/pi/googlestart.wav') status_ui.status('listing')
'assistant_grpc_demo.py' उदाहरण के लिए इसे यहां देखा जा सकता है:
बटन। प्रतीक्षा_के लिए_प्रेस ()
# और अब हमारा कोड जोड़ें status_ui.set_trigger_sound_wave('/home/pi/googlestart.wav') status_ui.status('listing')
यह मानता है कि आपने अपनी प्रारंभ ध्वनि को /home/pi/ फ़ोल्डर में रखा है और इसे googlestart.wav नाम दिया है। आपने अपनी फ़ाइल को जो भी नाम दिया है और जहाँ भी आपने उसे स्थित किया है, उसके आधार पर इन्हें बदलें।
सब कुछ बचाने के लिए CTRL-X और Y दबाएं।
***ध्यान दें: मैंने कुछ नासमझ पाया है। 'assistant_library_demo.py' के लिए ट्रिगर ध्वनि जोड़ने से वाक् पहचान के कार्य में कोई फ़र्क नहीं पड़ता है। हालांकि 'assistant_grpc_demo.py' के लिए, ऐसा लगता है कि जब आपके पास ट्रिगर ध्वनि लागू होती है तो यह आपके द्वारा कहे गए पहले शब्द या दो को काट देती है। बिल्कुल यकीन नहीं क्यों। अभी भी इसका पता लगाने की कोशिश की जा रही है।
चरण 4: चरण 4: कोड चलाएँ और सुनिश्चित करें कि सब कुछ अच्छा है
पीआई@रास्पबेरी: सीडी एआईवाई-वॉयस-किट-पायथन
और वर्चुअलएन्व लोड करें
pi@raspberry:~/AIY-voice-kit-python $source env/bin/active
और चलाओ!
(env) pi@raspberry:~/AIY-voice-kit-python $ src/assistant_library_demo.py
या
(env) pi@raspberry:~/AIY-voice-kit-python $ src/assistant_grpc_demo.py
अब "ओके, गूगल" कहें या उस बटन को दबाएं और देखें कि क्या यह काम करता है!
यदि आपकी अपनी कस्टम फ़ाइल है और आपकी.wav फ़ाइल के लिए उपयुक्त बिट और नमूना दरें हैं तो अगला पृष्ठ आपकी सहायता करेगा
चरण 5: चरण 5: अपनी खुद की.wav फ़ाइल बनाएं
यदि आप मानक Google होम प्रारंभ ध्वनि की मेरी.wav फ़ाइल का उपयोग करने में रुचि नहीं रखते हैं, तो आपको अपनी स्वयं की.wav फ़ाइल बनानी होगी। मेरे लिए काम करने के लिए सही बिट और नमूना दर प्राप्त करने में थोड़ा सा परीक्षण और त्रुटि हुई।
मैंने अपने सभी संपादन (चित्रित) करने के लिए लॉजिक प्रो एक्स का उपयोग किया, जो संगीत बनाने और उत्पादन करने के लिए एक पूर्ण विकसित डीएडब्ल्यू है। मैंने पाया है कि दो विकल्प उपयुक्त हो सकते हैं स्विच या मीडियाह्यूमन ऑडियो कन्वर्टर। मुझे लगता है कि अगर आपके पास मैक है तो आप गैराजबैंड के साथ ऐसा कर सकते हैं, लेकिन मैंने इसे आजमाया नहीं है।
आपकी फ़ाइल के तीन प्रमुख भाग हैं जिनकी आवश्यकता डेमो कोड के साथ काम करने के लिए होती है।
- एक मोनो ऑडियो फ़ाइल होनी चाहिए
- नमूना दर 32000. होनी चाहिए
- एक.wav फ़ाइल होनी चाहिए
- (वैकल्पिक) 16 बिट रिज़ॉल्यूशन ने मेरे लिए सबसे अच्छा काम किया है
चरण 6: चरण 6: पुष्टिकरण ध्वनि जोड़ना?
अगर किसी के पास कोई विचार है तो यह वह जगह है जहां मैं फंस गया हूं। यदि सिस्टम सामान्य Google होम की तरह ध्वनि इनपुट को पहचान लेता है, तो मुझे पुष्टिकरण शोर जोड़ना अच्छा लगेगा।
मैंने आपकी सुविधा के लिए नीचे स्टॉक पुष्टिकरण शोर संलग्न किया है।
आनंद लेना!
सिफारिश की:
Arduino ISP के रूप में -- AVR में बर्न हेक्स फ़ाइल -- एवीआर में फ्यूज -- प्रोग्रामर के रूप में Arduino: 10 कदम
Arduino ISP के रूप में || AVR में बर्न हेक्स फ़ाइल || एवीआर में फ्यूज || अरुडिनो प्रोग्रामर के रूप में:………………अधिक वीडियो के लिए कृपया मेरे YouTube चैनल को सब्सक्राइब करें……यह लेख आईएसपी के रूप में आर्डिनो के बारे में सब कुछ है। यदि आप हेक्स फ़ाइल अपलोड करना चाहते हैं या यदि आप एवीआर में अपना फ्यूज सेट करना चाहते हैं तो आपको प्रोग्रामर खरीदने की आवश्यकता नहीं है, आप कर सकते हैं
आई गार्जियन: साउंड ट्रिगर आई प्रोटेक्शन: 9 स्टेप्स (चित्रों के साथ)
आई गार्जियन: साउंड ट्रिगर आई प्रोटेक्शन: आई गार्जियन एक अरुडिनो पावर्ड, हाई-डेसीबल कंटीन्यूअस साउंड ट्रिगर आई प्रोटेक्शन वियर है। यह भारी उपकरण ध्वनि का पता लगाता है और उपकरण के उपयोग के दौरान सुरक्षात्मक आंखों के चश्मे को कम करता है। Outlineपहले चरण में, मैं प्रेरणा के बारे में बताऊंगा
GIMP में किसी भी चीज़ में लपटें कैसे जोड़ें: 15 कदम (चित्रों के साथ)
GIMP में किसी भी चीज़ में लपटें कैसे जोड़ें: इस तरह आप GIMP में कुछ हद तक यथार्थवादी आग बनाते हैं
Nikon Sc-28 Ttl केबल में एक पीसी सिंक जैक जोड़ें (कैमरा फ्लैश और ट्रिगर ऑफ कैमरा फ्लैश के लिए ऑटो सेटिंग्स का उपयोग करें !!): 4 कदम
Nikon Sc-28 Ttl केबल में एक पीसी सिंक जैक जोड़ें (कैमरा फ्लैश और ट्रिगर ऑफ कैमरा फ्लैश के लिए ऑटो सेटिंग्स का उपयोग करें !!): इस निर्देश में मैं आपको दिखाऊंगा कि उन pesky मालिकाना 3pin TTL कनेक्टरों में से एक को कैसे हटाया जाए Nikon SC-28 ऑफ कैमरा TTL केबल के किनारे और इसे एक मानक PC सिंक कनेक्टर से बदलें। यह आपको एक समर्पित फ्लैश का उपयोग करने की अनुमति देगा
पहले से बने कमरे में सराउंड साउंड कैसे जोड़ें: 5 कदम
पहले से बने कमरे में सराउंड साउंड कैसे जोड़ें: क्या आप एक कमरे में सराउंड साउंड जोड़ना चाहते हैं, लेकिन पाया कि आपको अपनी दीवारों को चीरना होगा या छत में छेद करना होगा? खैर यहाँ कोई भी बड़ा पुनर्निर्माण, या कोई भी किए बिना तारों को लगाने का कुछ आसान तरीका है