विषयसूची:
- चरण 1: इमेज प्रोसेसिंग क्या है?
- चरण 2: इमेज प्रोसेसिंग कैसे करें?
- चरण 3: पिक्सी द्वारा आरंभ करना
- चरण 4: आवश्यक हार्डवेयर
- चरण 5: पिक्सी द्वारा आरंभ करना
- चरण 6: "अंत" के बहुत करीब
वीडियो: इमेज प्रोसेसिंग का एक परिचय: पिक्सी और इसके विकल्प: 6 कदम
2024 लेखक: John Day | [email protected]. अंतिम बार संशोधित: 2024-01-30 09:22
इस लेख में, हम डिजिटल इमेज प्रोसेसिंग (डीआईपी) का अर्थ और तस्वीरों या वीडियो पर प्रक्रिया बनाने के लिए पिक्सी और अन्य टूल्स जैसे हार्डवेयर का उपयोग करने के कारणों की व्याख्या करेंगे। इस लेख के अंत में, आप सीखेंगे:
- डिजिटल इमेज कैसे बनती है।
- डिजिटल इमेज प्रोसेसिंग क्या है।
- छवि प्रसंस्करण के लिए उपकरण।
- पिक्सी क्या है और इसका इस्तेमाल कैसे करें।
चरण 1: इमेज प्रोसेसिंग क्या है?
फ़ोटो, वीडियो और आम तौर पर हमारी यादों के एक पल को बचाने के अलावा चित्रों में अन्य अनुप्रयोग भी होते हैं। हो सकता है कि आप सार्वजनिक स्थानों पर सुरक्षा कैमरे देखते हों या आप रोबोट को एक लाइन, ऑब्जेक्ट या अधिक उन्नत स्थिति को महसूस करते हुए देखते हैं, उत्पादन लाइन पर उत्पादों से अशुद्धियों को अलग करते हैं और बहुत सारे समान या समान अनुप्रयोग चित्रों पर कुछ गणनाओं के साथ कर रहे हैं और ये गणनाओं को इमेज प्रोसेसिंग नाम दिया गया है।
सर्वोत्तम समझ के लिए, छवि संरचना को जानना सहायक होता है। प्रत्येक छवि किसी भी बिंदु पर पिक्सेल मूल्यों के साथ एक संकेत है। (पिक्सेल एक डिजिटल छवि की मूल इकाई है जिसकी चमक और/या रंग के लिए अलग-अलग मान हो सकते हैं, इन मानों को "तीव्रता" कहा जाता है) सिग्नल दृश्य सेंसर द्वारा दिया गया निरंतर वोल्टेज सिग्नल है, यह सिग्नल डिजिटल में परिवर्तित हो जाएगा नमूनाकरण जैसी कुछ प्रक्रियाओं के साथ फॉर्म। इन डेटा का डिजिटल रूप एक द्वि-आयामी सरणी या मैट्रिक्स की तरह एक डिजिटल छवि बनाता है, इसलिए उनका रूप स्थान और मूल्य के लिए f (X, Y) है। मत भूलो कि हर वीडियो एक सेकंड में खेलने की एक विशिष्ट दर के साथ चलने वाली छवियों का एक सेट है।
एक छवि बनाने के बाद, प्रक्रिया शुरू हो जाएगी। किस उद्देश्य के लिए हमें एक प्रक्रिया की आवश्यकता है? अगर हमें किसी छवि से जानकारी चाहिए, तो हम कंप्यूटर विज़न का उपयोग करने जा रहे हैं। कंप्यूटर दृष्टि मानव दृष्टि के अनुकरण का एक तरीका है। मानव दृष्टि में दृश्य इनपुट से "सीखने" और डेटा देने की क्षमता है। कंप्यूटर दृष्टि मूल रूप से वह क्षेत्र है जिसने कंप्यूटर को वास्तविक समय के उपयोग के लिए भी डिजिटल छवियों या वीडियो से उच्च-स्तरीय समझ हासिल करने के लिए बनाया है; और डिजिटल इमेज प्रोसेसिंग उसी का एक हिस्सा है।
चरण 2: इमेज प्रोसेसिंग कैसे करें?
अगर हम इमेज प्रोसेसिंग के लिए रोबोटिक एप्लिकेशन के बारे में सोच रहे हैं, तो इसके दो तरीके हैं:
- एक सामान्य कैमरा मॉड्यूल चुनना (उस पर बिना किसी प्रसंस्करण के छवि प्रदान करना) और फिर उपयोगकर्ता द्वारा प्रोग्रामिंग और गणना का उपयोग करना।
- तेज और आसान उपयोग के लिए इस प्रक्रिया को करने वाले हार्ड वेयर का उपयोग करना; पिक्सी कैमरे की तरह…
पहला समाधान: पहले तरीके के लिए, MATLAB जैसे विभिन्न सॉफ्ट वेयर या कोडिंग के लिए OpenCV जैसे पुस्तकालय हैं। प्रसंस्करण उपकरण में अन्य नाम भी हैं; लेकिन इस प्रक्रिया को खोजने वाले लोकप्रिय नाम OpenCV और MATLAB हैं। आइए उनके बीच तेजी से तुलना देखें। MATLAB और OpenCV तुलना का चार्ट हमारी मदद करेगा।
दूसरा समाधान: एक विशेष हार्डवेयर का उपयोग करना! इमेज प्रोसेसिंग की क्षमता वाले कैमरों की तरह। उनके पास आमतौर पर एक यूजर इंटरफेस होता है और उन्हें कोडिंग की आवश्यकता नहीं होती है। यह आसान लगता है लेकिन किसी तरह सीमाएँ बनाता है और वे वही कर सकते हैं जो वे उसके लिए निर्दिष्ट करते हैं; उदाहरण के लिए, एक चेहरा पहचान कैमरा सामान्य रूप से रंग पहचान नहीं कर सकता (हो सकता है कि फर्मवेयर में कुछ बदलावों के साथ पहचान एल्गोरिदम बदल सकता है लेकिन यह एक कठिन और सामान्य तरीका नहीं है!) दो तरीके, लेकिन कौन सा बेहतर है?
दूसरा चार्ट दो तरीकों की तुलना है।
चरण 3: पिक्सी द्वारा आरंभ करना
PIXY इमेज प्रोसेसिंग के लिए निर्दिष्ट कैमरा मॉड्यूल में से एक है, मान्यता एल्गोरिथ्म रंग-आधारित फ़िल्टरिंग है। इस कैमरे का मुख्य उद्देश्य रंगों को पहचानना और उन्हें एक परिचित वस्तु के रूप में नाम देना है। यह कैमरा "सीख" सकता है कि आपने इसे पहले कौन से रंग "सोचा"।
अब जब आप जानते हैं कि पिक्सी क्या है, तो आइए देखें कि हम पिक्सी का उपयोग कैसे शुरू कर सकते हैं।
चरण 4: आवश्यक हार्डवेयर
पिक्सी CMUcam5 इमेज सेंसर
अरुडिनो यूएनओ आर३
चरण 5: पिक्सी द्वारा आरंभ करना
अब, अंत तक हमारे साथ कदम से कदम मिलाकर चलें:
पहला कदम:
एक पिक्सी खरीदना! नियमित PIXY और PIXY2 पिक्सी कैमरों के दो संस्करण हैं। नियमित प्रकार खरीदने के लिए ऊपर दिए गए लिंक पर क्लिक करें, जिसे हम इस बोर्ड का उपयोग करने के चरणों को जारी रखते हैं।
दूसरा:
इसे शक्ति दो। बोर्ड में पावर के लिए यूएसबी पोर्ट है। इसे कंप्यूटर यूएसबी पोर्ट से कनेक्ट करके संचालित किया जाएगा। इसे बोर्ड के पीछे दो पिनों के माध्यम से बैटरी (6-10v) के साथ संचालित किया जा सकता है।
तीसरा:
इसे यूएसबी केबल के जरिए कंप्यूटर से कनेक्ट करें। एक छोर कंप्यूटर के लिए और दूसरा PIXY के माइक्रो USB पोर्ट के लिए।
आगे:
अपने कैमरे का सॉफ्टवेयर यहां डाउनलोड करें। PIXY Mon Linux, Mac और Windows प्लेटफॉर्म के लिए PIXY का एप्लिकेशन है। यह ऐप जो कर सकता है वह कॉन्फ़िगरेशन है और दिखाता है कि PIXY क्या देख सकता है।
पांचवां:
इस बिंदु तक, कैमरे को माइक्रोकंट्रोलर या बोर्ड से आवश्यक रूप से कनेक्ट करने की आवश्यकता नहीं है यदि आपको किसी और चीज के बिना देखने और पहचानने की आवश्यकता है; मान्यता माइक्रो कनेक्शन पर निर्भर नहीं है। वैसे भी, सिखाने के लिए, विशिष्ट और अच्छे रंग के साथ एक वस्तु का चयन करें। रंग-आधारित रंग फ़िल्टरिंग मान्यता एल्गोरिथ्म के कारण, पर्यावरण का रंग और प्रकाश परिणाम को प्रभावित कर सकता है। तो, सफेद, काले या भूरे रंग की वस्तुओं का चयन न करें क्योंकि ये रंग रंग नहीं हैं!
छठा:
पढ़ाना शुरू करने के लिए पिक्सी के ऊपर बटन दबाएं। सबसे पहले, एलईडी झपकेगी और उसके बाद, एक आरजीबी एलईडी को दृष्टि क्षेत्र के मध्य भाग का रंग मिल जाएगा। कैमरे के सामने वस्तु उठाओ, अगर एलईडी ने सही रंग दिखाया तो यह सही लॉकिंग दिखाता है। लेंस और वस्तु के बीच की दूरी 6-20 इंच होनी चाहिए। दूसरा तरीका पिक्सी सोम का उपयोग कर रहा है; PIXY MON में ऑब्जेक्ट का एक बड़ा क्षेत्र चुना और फिर यह ऑब्जेक्ट का चयन करता है।
सातवां:
ऑब्जेक्ट का ग्रिड पिक्सी सोम में दिखाया जाएगा। देखें कि क्या ग्रिड वस्तु का सही क्षेत्र है जिसमें पृष्ठभूमि शामिल नहीं है। कॉन्फ़िगरेशन में स्लाइडर बेहतर क्षेत्र रखने में मदद कर सकते हैं।
आठवां:
अब प्रत्येक "रंग" के लिए, कैमरा एक नंबर सेट करेगा। 7 सिग्नेचर का मतलब 7 रंगों को पहचानना है। एक दूसरे के करीब रंगों का उपयोग करके, उदाहरण के लिए, लाल-गुलाबी-नीले रंग के रंगों वाला एक लेबल, आप कैमरे के लिए किसी वस्तु या स्थान को परिभाषित कर सकते हैं, उदाहरण के लिए, वह लेबल दरवाजे की जगह दिखाता है। यह इस कैमरे से हजारों वस्तुओं को पहचानने में मदद कर सकता है! रंगों के इस सेट को "रंग कोड" या सीसी कहा जाता है। CC सेट करने के लिए आपको PIXY mon का इस्तेमाल करना चाहिए और फिर इसे किसी भी सिग्नेचर की तरह इस्तेमाल किया जा सकता है।
नौवां:
एक सफल शिक्षण के बाद, यदि कोई माइक्रोकंट्रोलर या बोर्ड कैमरे से जुड़ा है, तो पिक्सी द्वारा पहचानी गई वस्तु को दे सकता है। यदि आप Arduino का उपयोग कर रहे हैं, तो कनेक्शन के लिए इस पिनआउट का उपयोग करें। (अधिक जानकारी के लिए यहां क्लिक करें), फिर यहां PIXY लाइब्रेरी डाउनलोड करें, स्केच की दिशा में Arduino के पुस्तकालयों में जोड़ें>लाइब्रेरी शामिल करें>ज़िप लाइब्रेरी जोड़ें। अब लाइब्रेरी की जिप फाइल को सेलेक्ट करें। हो गया है! अब PIXY के डिफ़ॉल्ट स्केच के साथ, यह वस्तु की X और Y (स्थान) और चौड़ाई और लंबाई (आकार) देगा। अन्य रेखाचित्रों का भी उपयोग किया जा सकता है; पैन और झुकाव की तरह। अन्य बोर्ड कनेक्शन के लिए, आप यहां देख सकते हैं।
नोट: शिक्षण के दो तरीके हैं जैसा कि हमने समझाया: 1. पिक्सी मोन के बिना पिक्सी का उपयोग करना, जैसे कि रोबोट क्या करते हैं और वे एक पीसी से जुड़े नहीं हैं। तरीका होगा लेकिन सिग्नेचर नंबर कैसे सेट करें? एलईडी अगर PIXY शिक्षण के पहले क्षणों में रंग बदल देगा, तो आप जिस रंग पर क्लिक करेंगे वह नंबर सेट करेगा; लाल अर्थ 1 से बैंगनी अर्थ 7. विधि 2 में, संख्या सेटिंग केवल आवेदन के साथ की जाएगी।
चरण 6: "अंत" के बहुत करीब
हमने समझाया कि चित्रों का उपयोग करने की क्या आवश्यकता है, डिजिटल इमेज प्रोसेसिंग क्या है और इसे कैसे किया जा सकता है। हमारे पास कौन से तरीके हैं और हार्डवेयर से जो वर्तमान में हमारी मदद कर सकते हैं, हमने स्पष्टीकरण के लिए PIXY को चुना। हमने समझाया कि यह कैसे काम करता है और अगर आप पिक्सी कैमरों के शुरुआती हैं तो क्या करें! अब आप अपने छोटे रोबोट के लिए इमेज प्रोसेसिंग शुरू कर सकते हैं और अपने कंप्यूटर के साथ तीसरी आंख का आनंद ले सकते हैं।
आप इस प्रोजेक्ट को ElectroPeak की आधिकारिक वेबसाइट:https://electropeak.com/learn/guides/introduction/ पर भी पढ़ सकते हैं।
सिफारिश की:
इमेज प्रोसेसिंग बेस्ड फायर रिकग्निशन एंड एक्सटिंगुइशर सिस्टम: 3 चरण
इमेज प्रोसेसिंग बेस्ड फायर रिकग्निशन एंड एक्सटिंगुइशर सिस्टम: हेलो दोस्तों यह एक इमेज प्रोसेसिंग आधारित फायर डिटेक्शन और एक्सटिंगुइशर सिस्टम है जिसमें Arduino का उपयोग किया जाता है
रास्पबेरी पाई के साथ इमेज प्रोसेसिंग: ओपनसीवी और इमेज कलर सेपरेशन स्थापित करना: 4 कदम
रास्पबेरी पाई के साथ इमेज प्रोसेसिंग: ओपनसीवी और इमेज कलर सेपरेशन स्थापित करना: यह पोस्ट कई इमेज प्रोसेसिंग ट्यूटोरियल्स में से पहला है जिसका पालन करना है। हम एक छवि बनाने वाले पिक्सेल पर करीब से नज़र डालते हैं, सीखते हैं कि रास्पबेरी पाई पर ओपनसीवी कैसे स्थापित करें और हम एक छवि को कैप्चर करने के लिए परीक्षण स्क्रिप्ट भी लिखते हैं और सी
जेस्चर हॉक: इमेज प्रोसेसिंग आधारित इंटरफेस का उपयोग करते हुए हैंड जेस्चर नियंत्रित रोबोट: 13 चरण (चित्रों के साथ)
जेस्चर हॉक: इमेज प्रोसेसिंग आधारित इंटरफेस का उपयोग करते हुए हैंड जेस्चर नियंत्रित रोबोट: टेकविंस 4.0 में जेस्चर हॉक को एक साधारण इमेज प्रोसेसिंग आधारित मानव-मशीन इंटरफेस के रूप में प्रदर्शित किया गया था। इसकी उपयोगिता इस तथ्य में निहित है कि रोबोट कार को नियंत्रित करने के लिए दस्ताने को छोड़कर किसी अतिरिक्त सेंसर या पहनने योग्य की आवश्यकता नहीं होती है जो अलग-अलग चलती है
मोयमोया इमेज प्रोसेसिंग: 8 कदम
मोयमोया इमेज प्रोसेसिंग: मोयामोया, "धुएं का झोंका," एक दुर्लभ बीमारी है जो बेसल गैन्ग्लिया में धमनियों के रुकावट के कारण होती है, जो मस्तिष्क के आधार पर एक क्षेत्र है। यह रोग एक प्रगतिशील मस्तिष्कवाहिकीय रोग है जो ज्यादातर बच्चों को प्रभावित करता है। सिम
क्वांटिमेट्रिक इमेज प्रोसेसिंग: 5 कदम
क्वांटिमेट्रिक इमेज प्रोसेसिंग: (उपरोक्त आंकड़ा क्वांटिमेट्रिक इमेज प्रोसेसिंग के साथ मौजूदा इमेज प्रोसेसिंग विधि की तुलना दिखाता है। बेहतर परिणाम पर ध्यान दें। शीर्ष दाहिनी छवि अजीब कलाकृतियों को दिखाती है जो गलत धारणा से आती हैं कि चित्र कुछ ऐसा मापते हैं