विषयसूची:
- चरण 1: परिचय
- चरण 2: प्रयुक्त संसाधन
- चरण 3:
- चरण 4: पूर्वापेक्षाएँ
- चरण 5: कंप्यूटर आवश्यकताएँ
- चरण 6: सेटअप योलो
- चरण 7: मेकफ़ाइल को संशोधित करें
- चरण 8: इसके पूरा होने की प्रतीक्षा करें
- चरण 9: उन कंप्यूटरों के लिए जो आवश्यकताओं से मेल नहीं खाते
- चरण 10: योलो V3
- चरण 11: योलो चल रहा है
- चरण 12: योलो V3 - छवि
- चरण 13: YOLO V3 - इनपुट छवि
- चरण 14: YOLO V3 - आउटपुट छवि
- चरण 15: YOLO V3 - एकाधिक छवियां
- चरण 16: योलो वी३ - वेब कैमरा
- चरण 17: योलो वी३ - वीडियो
- चरण 18: YOLO V3 - EXPO3D वीडियो 1
- चरण 19: YOLO V3 - वीडियो EXPO3D 2
- चरण 20: योलो वी३ - वीडियो एक्सपो३डी ३
- चरण 21: पीडीएफ डाउनलोड करने के लिए
वीडियो: अभ्यास में चेहरे की पहचान: २१ कदम
2024 लेखक: John Day | [email protected]. अंतिम बार संशोधित: 2024-01-30 09:20
यह एक ऐसा विषय है जिसके लिए मैं इतना मोहित हूं, कि यह मुझे नींद खो देता है: कंप्यूटर विजन, पूर्व-प्रशिक्षित मॉडल के माध्यम से वस्तुओं और लोगों का पता लगाना।
चरण 1: परिचय
हम एप्लिकेशन चलाने और प्रोजेक्ट चलाने के लिए YoloV3 एल्गोरिदम का उपयोग करेंगे।
मैंने 15 साल पहले तंत्रिका नेटवर्क के साथ काम किया था और मैं कह सकता हूं कि ये "कठिन" समय थे, उस समय उपलब्ध संसाधनों को देखते हुए।
चरण 2: प्रयुक्त संसाधन
लॉजिटेक C270 कैमरा
· संगणक
· NVIDIA GeForce GTX १६६०
चरण 3:
चरण 4: पूर्वापेक्षाएँ
डीप न्यूरल नेटवर्क (DNN) चलाने के लिए GPU के साथ समानांतर कंप्यूटिंग का उपयोग करना आवश्यक है।
तो आपको NVIDIA से एक शक्तिशाली वीडियो कार्ड की आवश्यकता होगी और CUDA API (GPU वर्चुअल इंस्ट्रक्शन सेट) का उपयोग करके एल्गोरिथ्म को चलाना होगा।
एल्गोरिथम चलाने के लिए आपके पास पहले निम्नलिखित पैकेज स्थापित होने चाहिए:
- NVIDIA वीडियो कार्ड ड्राइव
- कुडा
- CUDNN (CUDA डीप न्यूरल नेटवर्क लाइब्रेरी)
- ओपनसीवी
चरण 5: कंप्यूटर आवश्यकताएँ
चरण 6: सेटअप योलो
पूर्व-प्रशिक्षित मॉडल का उपयोग करके पता लगाना
टर्मिनल खोलें और उपरोक्त कमांड दर्ज करें।
चरण 7: मेकफ़ाइल को संशोधित करें
ऊपर दिए गए चित्र के अनुसार "मेकफाइल" फ़ाइल को संशोधित करें, क्योंकि हम GPU, CUDNN और OpenCV प्रसंस्करण का उपयोग करेंगे। संशोधित करने के बाद, 'मेक' कमांड चलाएँ।
चरण 8: इसके पूरा होने की प्रतीक्षा करें
चरण 7 में 'मेक' कमांड एल्गोरिदम द्वारा उपयोग के लिए सब कुछ संकलित करेगा, और इसे चलाने में कुछ समय लगता है।
चरण 9: उन कंप्यूटरों के लिए जो आवश्यकताओं से मेल नहीं खाते
यदि आपका कंप्यूटर और वीडियो कार्ड उतना शक्तिशाली नहीं है या आप बेहतर प्रदर्शन चाहते हैं, तो 'cfg /yolov3.cfg' फ़ाइल बदलें।
इस परियोजना में उपरोक्त विन्यास का उपयोग किया गया था।
चरण 10: योलो V3
डिटेक्शन सिस्टम आमतौर पर मॉडल को कई अलग-अलग स्थानों और पैमानों पर एक छवि पर लागू करते हैं।
YOLO पूरी छवि पर एक एकल तंत्रिका नेटवर्क लागू करता है। यह नेटवर्क छवि को क्षेत्रों में विभाजित करता है और प्रत्येक क्षेत्र के लिए बाउंडिंग बॉक्स और संभावनाएं प्रदान करता है।
योलो के कई फायदे हैं। यह छवि को समग्र रूप से देखता है, इसलिए इसकी भविष्यवाणियां छवि में वैश्विक संदर्भ द्वारा उत्पन्न होती हैं।
यह आर-सीएनएन के विपरीत, एकल नेटवर्क मूल्यांकन के साथ भविष्यवाणियां करता है, जो एक छवि के लिए हजारों आकलन करता है।
यह R-CNN से 1000 गुना तेज और Fast R-CNN से 100 गुना तेज है।
चरण 11: योलो चल रहा है
YOLO चलाने के लिए, बस "डार्कनेट" फ़ोल्डर में टर्मिनल खोलें और एक कमांड दर्ज करें।
आप YOLO को 4 तरीकों से चला सकते हैं:
· छवि
· एकाधिक छवियां
स्ट्रीमिंग (वेबकैम)
· वीडियो
चरण 12: योलो V3 - छवि
अपनी इच्छित छवि को डार्कनेट के अंदर "डेटा" फ़ोल्डर में रखें और उसके बाद छवि नाम को संशोधित करने के ऊपर कमांड चलाएं।
चरण 13: YOLO V3 - इनपुट छवि
चरण 14: YOLO V3 - आउटपुट छवि
चरण 15: YOLO V3 - एकाधिक छवियां
छवियों को किसी फ़ोल्डर में रखें, और छवि पथ प्रदान करने के बजाय, इसे खाली छोड़ दें और जैसा कि आप ऊपर देख सकते हैं (बाईं ओर) कमांड चलाएँ।
उसके बाद, दाईं ओर की आकृति जैसा कुछ दिखाई देगा, बस छवि पथ रखें और "एंटर" पर क्लिक करें और इन चरणों को कई छवियों के लिए दोहराएं।
चरण 16: योलो वी३ - वेब कैमरा
ऊपर कमांड चलाएँ और नेटवर्क लोड करने के बाद, वेबकैम दिखाई देगा।
चरण 17: योलो वी३ - वीडियो
अपने इच्छित वीडियो को "डेटा" फ़ोल्डर में डार्कनेट के अंदर रखें और उसके बाद वीडियो नाम को संशोधित करने के लिए ऊपर दिए गए कमांड को चलाएं।
चरण 18: YOLO V3 - EXPO3D वीडियो 1
चरण 19: YOLO V3 - वीडियो EXPO3D 2
चरण 20: योलो वी३ - वीडियो एक्सपो३डी ३
चरण 21: पीडीएफ डाउनलोड करने के लिए
पीडीएफ डाउनलोड करें (ब्राजील के पुर्तगाली में)
सिफारिश की:
गुप्त डिब्बे के साथ चेहरे की पहचान दर्पण: 15 कदम (चित्रों के साथ)
सीक्रेट कम्पार्टमेंट के साथ फेशियल रिकॉग्निशन मिरर: कहानियों, फिल्मों और इसी तरह के इस्तेमाल में आने वाले कभी-कभी रचनात्मक गुप्त डिब्बों से मुझे हमेशा से दिलचस्पी रही है। इसलिए, जब मैंने सीक्रेट कम्पार्टमेंट प्रतियोगिता देखी तो मैंने खुद इस विचार के साथ प्रयोग करने और एक साधारण दिखने वाला दर्पण बनाने का फैसला किया जो एक
चेहरे की पहचान दरवाज़ा बंद: 8 कदम
फेशियल रिकॉग्निशन डोर लॉक: बनाने में लगभग एक महीने, मैं फेशियल रिकग्निशन डोर लॉक पेश करता हूं! मैंने इसे जितना हो सके साफ-सुथरा बनाने की कोशिश की, लेकिन मैं केवल 13 साल की उम्र में ही इतना कर सकता हूं। यह फेशियल रिकग्निशन डोर लॉक रास्पबेरी पाई 4 द्वारा चलाया जाता है, जिसमें एक विशेष पोर्टेबल बैट
चेहरा पहचान और पहचान - ओपनसीवी पायथन और अरुडिनो का उपयोग करके Arduino फेस आईडी .: 6 कदम
चेहरा पहचान और पहचान | ओपनसीवी पायथन और अरुडिनो का उपयोग करते हुए Arduino फेस आईडी: चेहरे की पहचान AKA फेस आईडी आजकल मोबाइल फोन पर सबसे महत्वपूर्ण विशेषताओं में से एक है। तो, मेरा एक प्रश्न था "क्या मेरे पास अपने Arduino प्रोजेक्ट के लिए एक फेस आईडी हो सकता है" और इसका उत्तर हां है… मेरी यात्रा इस प्रकार शुरू हुई: चरण 1: हम तक पहुंच
रास्पबेरी पाई के साथ एक रेफ्रिजरेटर के लिए चेहरे की पहचान सुरक्षा प्रणाली: 7 कदम (चित्रों के साथ)
रास्पबेरी पाई के साथ एक रेफ्रिजरेटर के लिए चेहरे की पहचान सुरक्षा प्रणाली: इंटरनेट ब्राउज़िंग मैंने पाया है कि सुरक्षा प्रणालियों की कीमतें 150 डॉलर से 600 डॉलर और उससे अधिक तक भिन्न होती हैं, लेकिन सभी समाधान (यहां तक कि बहुत महंगे वाले) को अन्य के साथ एकीकृत नहीं किया जा सकता है आपके घर पर स्मार्ट उपकरण! उदाहरण के लिए, आप सेट नहीं कर सकते
चेहरा पहचान+पहचान: 8 कदम (चित्रों के साथ)
फेस डिटेक्शन + रिकग्निशन: यह एक कैमरे से ओपनसीवी के साथ फेस डिटेक्शन और रिकग्निशन चलाने का एक सरल उदाहरण है। नोट: मैंने इस परियोजना को सेंसर प्रतियोगिता के लिए बनाया है और मैंने कैमरे का उपयोग सेंसर के रूप में ट्रैक और पहचान के लिए किया है। तो, हमारा लक्ष्य इस सत्र में, 1. एनाकोंडा स्थापित करें