विषयसूची:

सेल्फ वॉकिंग रोबोट: 7 कदम
सेल्फ वॉकिंग रोबोट: 7 कदम

वीडियो: सेल्फ वॉकिंग रोबोट: 7 कदम

वीडियो: सेल्फ वॉकिंग रोबोट: 7 कदम
वीडियो: First step walking robot 7DOF Arduino 2024, जुलाई
Anonim
सेल्फ वॉकिंग रोबोट
सेल्फ वॉकिंग रोबोट

मैंने क्या बनाया?

एक बॉट जिसे विभिन्न सतहों पर चलने (आगे बढ़ने) के लिए प्रशिक्षित किया जा सकता है। बॉट में 4 'घुटने रहित' पैरों वाले एक साधारण प्राणी को दिखाया गया है जो आगे बढ़ने के लिए संघर्ष कर रहा है। यह जानता है कि यह प्रत्येक पैर को केवल 3 संभावित तरीकों से उन्मुख कर सकता है। अब इसे चलते रहने के लिए सर्वोत्तम संभव कदमों का पता लगाना होगा। चूंकि इसकी गति भी सतह के साथ घर्षण पर निर्भर करती है, हम मानते हैं कि प्रत्येक अलग सतह के लिए यह चलता है, इसके आगे बढ़ने के प्रयास को अधिकतम करने के लिए चरणों का एक अलग (जरूरी नहीं कि अद्वितीय लेकिन सबसे अधिक समान) चरणों का सेट होगा।

इसका क्या उपयोग है?

एआई रोबोट के लिए चलने के पैटर्न की कल्पना करने के लिए इसका सबसे अच्छा उपयोग किया जाता है।

चरण 1: प्रवाह आरेख

प्रवाह आरेख
प्रवाह आरेख

यहां पूरे प्रोजेक्ट का ब्रेकडाउन है। मोटे तौर पर यह परियोजना रोबोट की यांत्रिक संरचना के साथ 2 भागों इलेक्ट्रॉनिक्स में है और दूसरा पीसी पर चलने वाला एल्गोरिदम है और कोड आर्डिनो पर चल रहा है।

चरण 2: शामिल प्रमुख घटक:

इलेक्ट्रानिक्स

अरुडिनो यूएनओ (!)

अतिध्वनि संवेदक

सर्वो मोटर्स

ब्लूटूथ मॉड्यूल

कोडन

अरुडिनो आईडीई

टेराटर्म

जुपिटर नोटबुक

Q- लर्निंग एल्गोरिथम

चरण 3: मॉड्यूल V1:

मॉड्यूल V1
मॉड्यूल V1

सुदृढीकरण सीखना: एएनएन (कृत्रिम तंत्रिका नेटवर्क) का उपयोग करके हमने अपने रोबोट को प्रशिक्षित करने की योजना बनाई और हम दो संभावित तरीकों के साथ आए।

बाधाएं: प्रत्येक पैर (सर्वो मोटर) केवल 3 संभावित स्थिति 60, 90 और 120 डिग्री लेने के लिए विवश है। अनुमान: हम मानते हैं कि बॉट गति 4 राज्यों का गठन करेगी (एक राज्य सभी चार सर्वो का एक निश्चित अभिविन्यास है), यानी रोबोट के 4 अलग-अलग राज्य होंगे जिन्हें हम क्रमशः 4 चरणों के रूप में मानेंगे, जिससे हमें आंदोलन का एक चक्र मिलेगा। जिसे बॉट कुछ दूर आगे ले जाएगा। बॉट को गतिमान रखने के लिए इस चक्र को अनंत काल तक दोहराया जाएगा।

लेकिन केवल समस्या यह थी कि मूल्यांकन किए जाने वाले पुनरावृत्तियों की संख्या - हमारे पास प्रत्येक मोटर के लिए 3 संभावित अभिविन्यास हैं और 4 अलग-अलग मोटर हैं जो इसे 3 ^ 4 = 81 राज्य बनाते हैं जिसमें रोबोट एक चरण या राज्य में मौजूद हो सकता है। हमें एक जटिल गति को पूरा करने के लिए 4 अलग-अलग कदम उठाने होंगे, जिसका अर्थ है कि 81^4 = 43, 046, 721 संभावित संयोजनों को आंदोलन के एक चक्र के लिए अधिकतम दक्षता के लिए जांचा जाना है। मान लीजिए कि किसी एक राज्य को प्रशिक्षित करने में 5 सेकंड लगते हैं तो प्रशिक्षण पूरा करने में 6.8250 वर्ष लगेंगे!

चरण 4: मॉड्यूल V2:

क्यू-लर्निंग एल्गोरिदम

परिमित अवस्था वाली चीजों को प्रशिक्षित करने और सबसे छोटे रास्ते खोजने के लिए एक प्रारंभिक सुदृढीकरण सीखने का एल्गोरिदम विकसित किया गया। स्रोत:

एल्गोरिथम का गणित: प्रत्येक चरण के लिए 81 संभावित राज्य हैं जिनमें बॉट हो सकता है, हम इन राज्यों को 1 से 81 तक की संख्या के रूप में नाम देते हैं और अब हम जो जानना चाहते हैं वह संक्रमण मूल्य है, जिसका अर्थ है रोबोट की स्थिति में परिवर्तन (दूरी चली गई)) जबकि यह एक यादृच्छिक अवस्था s1 से किसी अन्य अवस्था s2 (s1, s2 उन 81 राज्यों से) में जाता है। हम इसे 81 पंक्तियों और 81 स्तंभों वाले एक मैट्रिक्स के रूप में देख सकते हैं, जहां मैट्रिक्स का एक तत्व उस दूरी के मान के बराबर होगा जो इसे अपनी पंक्ति और स्तंभ संख्या के अनुरूप स्थानांतरित करता है। वास्तविक शब्द में रोबोट की क्रिया के आधार पर ये मान सकारात्मक या नकारात्मक हो सकते हैं। अब हम राज्यों का एक बंद लूप पाएंगे जहां यह यात्रा की दूरी हमेशा सकारात्मक होती है, हम 81x81 मैट्रिक्स मानों का मूल्यांकन करेंगे जो 81 ^ 2 = 6561 हैं, अब अगर हम इन मानों को मैट्रिक्स में संग्रहीत करने के लिए 5 सेकंड लेते हैं तो यह होगा संपूर्ण मैट्रिक्स बनाने के लिए केवल 9.1125 घंटे का समय लें और फिर गतिमान दक्षता को अधिकतम करने के लिए चरणों का एक लूप आसानी से निकाला जा सकता है।

चरण 5: शामिल समस्याएं -

  1. कुछ राज्यों के लिए बॉट गति बहुत असमान थी और अल्ट्रासोनिक के सेंसर मूल्य को प्रभावित कर रही थी, बॉट झुक जाएगा और दूर की दीवार से दूरी उठाएगा।
  2. लैपटॉप से डिस्कनेक्शन और आर्डिनो को फिर से शुरू करने की समस्या इसे 0 मान से प्रशिक्षित करने के लिए बहुत परेशान कर रही थी।
  3. लगातार 5 घंटे तक रोबोट ट्रेन को देखना बहुत थकाऊ था।

चरण 6: मॉड्यूल A1 और A2:

  • यांत्रिक भाग में चार सर्वो के साथ चेसिस बोर्ड शामिल है। हमने पैर बनाने के लिए आइसक्रीम स्टिक का इस्तेमाल किया।
  • हमारा सिद्धांत कार्य - बॉट की प्रारंभिक स्थिति से दूरी का ट्रैक रखना।
  • हमारा पहला दृष्टिकोण गायरो सेंसर का उपयोग करना और बॉट के त्वरण का उपयोग करना था क्योंकि यह अपने वेग को निकालने के लिए आगे बढ़ता है और बाद में इसकी स्थिति।
  • समस्या - इसे लागू करना बहुत जटिल निकला! वैकल्पिक - हमने बॉट की गति को केवल 1 आयाम तक सीमित रखा और सामने की दीवार से दूरी मापने के लिए अल्ट्रासोनिक सेंसर का उपयोग किया।
  • HC05-ब्लूटूथ मॉड्यूल का उपयोग प्रशिक्षण अवधि के दौरान पीसी में दो चरणों के बीच दूरी संक्रमण दर संचारित करने के लिए किया गया था और वहां डेटा को एक मैट्रिक्स में संग्रहीत किया गया था।

चरण 7: वीडियो के लिए लिंक:

वीडियो के लिए लिंक
वीडियो के लिए लिंक

बेबी स्टेप्स:

प्रशिक्षण शॉट:

लगभग सीधा:

डांसिंग रोबोट वीडियो:

अंतिम वीडियो0:

सिफारिश की: