विषयसूची:

इमेज प्रोसेसिंग का एक परिचय: पिक्सी और इसके विकल्प: 6 कदम
इमेज प्रोसेसिंग का एक परिचय: पिक्सी और इसके विकल्प: 6 कदम

वीडियो: इमेज प्रोसेसिंग का एक परिचय: पिक्सी और इसके विकल्प: 6 कदम

वीडियो: इमेज प्रोसेसिंग का एक परिचय: पिक्सी और इसके विकल्प: 6 कदम
वीडियो: Region based segmentation in digital image processing 2024, नवंबर
Anonim
इमेज प्रोसेसिंग का एक परिचय: पिक्सी और इसके विकल्प
इमेज प्रोसेसिंग का एक परिचय: पिक्सी और इसके विकल्प

इस लेख में, हम डिजिटल इमेज प्रोसेसिंग (डीआईपी) का अर्थ और तस्वीरों या वीडियो पर प्रक्रिया बनाने के लिए पिक्सी और अन्य टूल्स जैसे हार्डवेयर का उपयोग करने के कारणों की व्याख्या करेंगे। इस लेख के अंत में, आप सीखेंगे:

  • डिजिटल इमेज कैसे बनती है।
  • डिजिटल इमेज प्रोसेसिंग क्या है।
  • छवि प्रसंस्करण के लिए उपकरण।
  • पिक्सी क्या है और इसका इस्तेमाल कैसे करें।

चरण 1: इमेज प्रोसेसिंग क्या है?

इमेज प्रोसेसिंग क्या है?
इमेज प्रोसेसिंग क्या है?

फ़ोटो, वीडियो और आम तौर पर हमारी यादों के एक पल को बचाने के अलावा चित्रों में अन्य अनुप्रयोग भी होते हैं। हो सकता है कि आप सार्वजनिक स्थानों पर सुरक्षा कैमरे देखते हों या आप रोबोट को एक लाइन, ऑब्जेक्ट या अधिक उन्नत स्थिति को महसूस करते हुए देखते हैं, उत्पादन लाइन पर उत्पादों से अशुद्धियों को अलग करते हैं और बहुत सारे समान या समान अनुप्रयोग चित्रों पर कुछ गणनाओं के साथ कर रहे हैं और ये गणनाओं को इमेज प्रोसेसिंग नाम दिया गया है।

सर्वोत्तम समझ के लिए, छवि संरचना को जानना सहायक होता है। प्रत्येक छवि किसी भी बिंदु पर पिक्सेल मूल्यों के साथ एक संकेत है। (पिक्सेल एक डिजिटल छवि की मूल इकाई है जिसकी चमक और/या रंग के लिए अलग-अलग मान हो सकते हैं, इन मानों को "तीव्रता" कहा जाता है) सिग्नल दृश्य सेंसर द्वारा दिया गया निरंतर वोल्टेज सिग्नल है, यह सिग्नल डिजिटल में परिवर्तित हो जाएगा नमूनाकरण जैसी कुछ प्रक्रियाओं के साथ फॉर्म। इन डेटा का डिजिटल रूप एक द्वि-आयामी सरणी या मैट्रिक्स की तरह एक डिजिटल छवि बनाता है, इसलिए उनका रूप स्थान और मूल्य के लिए f (X, Y) है। मत भूलो कि हर वीडियो एक सेकंड में खेलने की एक विशिष्ट दर के साथ चलने वाली छवियों का एक सेट है।

एक छवि बनाने के बाद, प्रक्रिया शुरू हो जाएगी। किस उद्देश्य के लिए हमें एक प्रक्रिया की आवश्यकता है? अगर हमें किसी छवि से जानकारी चाहिए, तो हम कंप्यूटर विज़न का उपयोग करने जा रहे हैं। कंप्यूटर दृष्टि मानव दृष्टि के अनुकरण का एक तरीका है। मानव दृष्टि में दृश्य इनपुट से "सीखने" और डेटा देने की क्षमता है। कंप्यूटर दृष्टि मूल रूप से वह क्षेत्र है जिसने कंप्यूटर को वास्तविक समय के उपयोग के लिए भी डिजिटल छवियों या वीडियो से उच्च-स्तरीय समझ हासिल करने के लिए बनाया है; और डिजिटल इमेज प्रोसेसिंग उसी का एक हिस्सा है।

चरण 2: इमेज प्रोसेसिंग कैसे करें?

इमेज प्रोसेसिंग कैसे करें?
इमेज प्रोसेसिंग कैसे करें?
इमेज प्रोसेसिंग कैसे करें?
इमेज प्रोसेसिंग कैसे करें?

अगर हम इमेज प्रोसेसिंग के लिए रोबोटिक एप्लिकेशन के बारे में सोच रहे हैं, तो इसके दो तरीके हैं:

  1. एक सामान्य कैमरा मॉड्यूल चुनना (उस पर बिना किसी प्रसंस्करण के छवि प्रदान करना) और फिर उपयोगकर्ता द्वारा प्रोग्रामिंग और गणना का उपयोग करना।
  2. तेज और आसान उपयोग के लिए इस प्रक्रिया को करने वाले हार्ड वेयर का उपयोग करना; पिक्सी कैमरे की तरह…

पहला समाधान: पहले तरीके के लिए, MATLAB जैसे विभिन्न सॉफ्ट वेयर या कोडिंग के लिए OpenCV जैसे पुस्तकालय हैं। प्रसंस्करण उपकरण में अन्य नाम भी हैं; लेकिन इस प्रक्रिया को खोजने वाले लोकप्रिय नाम OpenCV और MATLAB हैं। आइए उनके बीच तेजी से तुलना देखें। MATLAB और OpenCV तुलना का चार्ट हमारी मदद करेगा।

दूसरा समाधान: एक विशेष हार्डवेयर का उपयोग करना! इमेज प्रोसेसिंग की क्षमता वाले कैमरों की तरह। उनके पास आमतौर पर एक यूजर इंटरफेस होता है और उन्हें कोडिंग की आवश्यकता नहीं होती है। यह आसान लगता है लेकिन किसी तरह सीमाएँ बनाता है और वे वही कर सकते हैं जो वे उसके लिए निर्दिष्ट करते हैं; उदाहरण के लिए, एक चेहरा पहचान कैमरा सामान्य रूप से रंग पहचान नहीं कर सकता (हो सकता है कि फर्मवेयर में कुछ बदलावों के साथ पहचान एल्गोरिदम बदल सकता है लेकिन यह एक कठिन और सामान्य तरीका नहीं है!) दो तरीके, लेकिन कौन सा बेहतर है?

दूसरा चार्ट दो तरीकों की तुलना है।

चरण 3: पिक्सी द्वारा आरंभ करना

पिक्सी द्वारा आरंभ करना
पिक्सी द्वारा आरंभ करना

PIXY इमेज प्रोसेसिंग के लिए निर्दिष्ट कैमरा मॉड्यूल में से एक है, मान्यता एल्गोरिथ्म रंग-आधारित फ़िल्टरिंग है। इस कैमरे का मुख्य उद्देश्य रंगों को पहचानना और उन्हें एक परिचित वस्तु के रूप में नाम देना है। यह कैमरा "सीख" सकता है कि आपने इसे पहले कौन से रंग "सोचा"।

अब जब आप जानते हैं कि पिक्सी क्या है, तो आइए देखें कि हम पिक्सी का उपयोग कैसे शुरू कर सकते हैं।

चरण 4: आवश्यक हार्डवेयर

आवश्यक हार्डवेयर
आवश्यक हार्डवेयर

पिक्सी CMUcam5 इमेज सेंसर

अरुडिनो यूएनओ आर३

चरण 5: पिक्सी द्वारा आरंभ करना

पिक्सी द्वारा आरंभ करना
पिक्सी द्वारा आरंभ करना

अब, अंत तक हमारे साथ कदम से कदम मिलाकर चलें:

पहला कदम:

एक पिक्सी खरीदना! नियमित PIXY और PIXY2 पिक्सी कैमरों के दो संस्करण हैं। नियमित प्रकार खरीदने के लिए ऊपर दिए गए लिंक पर क्लिक करें, जिसे हम इस बोर्ड का उपयोग करने के चरणों को जारी रखते हैं।

दूसरा:

इसे शक्ति दो। बोर्ड में पावर के लिए यूएसबी पोर्ट है। इसे कंप्यूटर यूएसबी पोर्ट से कनेक्ट करके संचालित किया जाएगा। इसे बोर्ड के पीछे दो पिनों के माध्यम से बैटरी (6-10v) के साथ संचालित किया जा सकता है।

तीसरा:

इसे यूएसबी केबल के जरिए कंप्यूटर से कनेक्ट करें। एक छोर कंप्यूटर के लिए और दूसरा PIXY के माइक्रो USB पोर्ट के लिए।

आगे:

अपने कैमरे का सॉफ्टवेयर यहां डाउनलोड करें। PIXY Mon Linux, Mac और Windows प्लेटफॉर्म के लिए PIXY का एप्लिकेशन है। यह ऐप जो कर सकता है वह कॉन्फ़िगरेशन है और दिखाता है कि PIXY क्या देख सकता है।

पांचवां:

इस बिंदु तक, कैमरे को माइक्रोकंट्रोलर या बोर्ड से आवश्यक रूप से कनेक्ट करने की आवश्यकता नहीं है यदि आपको किसी और चीज के बिना देखने और पहचानने की आवश्यकता है; मान्यता माइक्रो कनेक्शन पर निर्भर नहीं है। वैसे भी, सिखाने के लिए, विशिष्ट और अच्छे रंग के साथ एक वस्तु का चयन करें। रंग-आधारित रंग फ़िल्टरिंग मान्यता एल्गोरिथ्म के कारण, पर्यावरण का रंग और प्रकाश परिणाम को प्रभावित कर सकता है। तो, सफेद, काले या भूरे रंग की वस्तुओं का चयन न करें क्योंकि ये रंग रंग नहीं हैं!

छठा:

पढ़ाना शुरू करने के लिए पिक्सी के ऊपर बटन दबाएं। सबसे पहले, एलईडी झपकेगी और उसके बाद, एक आरजीबी एलईडी को दृष्टि क्षेत्र के मध्य भाग का रंग मिल जाएगा। कैमरे के सामने वस्तु उठाओ, अगर एलईडी ने सही रंग दिखाया तो यह सही लॉकिंग दिखाता है। लेंस और वस्तु के बीच की दूरी 6-20 इंच होनी चाहिए। दूसरा तरीका पिक्सी सोम का उपयोग कर रहा है; PIXY MON में ऑब्जेक्ट का एक बड़ा क्षेत्र चुना और फिर यह ऑब्जेक्ट का चयन करता है।

सातवां:

ऑब्जेक्ट का ग्रिड पिक्सी सोम में दिखाया जाएगा। देखें कि क्या ग्रिड वस्तु का सही क्षेत्र है जिसमें पृष्ठभूमि शामिल नहीं है। कॉन्फ़िगरेशन में स्लाइडर बेहतर क्षेत्र रखने में मदद कर सकते हैं।

आठवां:

अब प्रत्येक "रंग" के लिए, कैमरा एक नंबर सेट करेगा। 7 सिग्नेचर का मतलब 7 रंगों को पहचानना है। एक दूसरे के करीब रंगों का उपयोग करके, उदाहरण के लिए, लाल-गुलाबी-नीले रंग के रंगों वाला एक लेबल, आप कैमरे के लिए किसी वस्तु या स्थान को परिभाषित कर सकते हैं, उदाहरण के लिए, वह लेबल दरवाजे की जगह दिखाता है। यह इस कैमरे से हजारों वस्तुओं को पहचानने में मदद कर सकता है! रंगों के इस सेट को "रंग कोड" या सीसी कहा जाता है। CC सेट करने के लिए आपको PIXY mon का इस्तेमाल करना चाहिए और फिर इसे किसी भी सिग्नेचर की तरह इस्तेमाल किया जा सकता है।

नौवां:

एक सफल शिक्षण के बाद, यदि कोई माइक्रोकंट्रोलर या बोर्ड कैमरे से जुड़ा है, तो पिक्सी द्वारा पहचानी गई वस्तु को दे सकता है। यदि आप Arduino का उपयोग कर रहे हैं, तो कनेक्शन के लिए इस पिनआउट का उपयोग करें। (अधिक जानकारी के लिए यहां क्लिक करें), फिर यहां PIXY लाइब्रेरी डाउनलोड करें, स्केच की दिशा में Arduino के पुस्तकालयों में जोड़ें>लाइब्रेरी शामिल करें>ज़िप लाइब्रेरी जोड़ें। अब लाइब्रेरी की जिप फाइल को सेलेक्ट करें। हो गया है! अब PIXY के डिफ़ॉल्ट स्केच के साथ, यह वस्तु की X और Y (स्थान) और चौड़ाई और लंबाई (आकार) देगा। अन्य रेखाचित्रों का भी उपयोग किया जा सकता है; पैन और झुकाव की तरह। अन्य बोर्ड कनेक्शन के लिए, आप यहां देख सकते हैं।

नोट: शिक्षण के दो तरीके हैं जैसा कि हमने समझाया: 1. पिक्सी मोन के बिना पिक्सी का उपयोग करना, जैसे कि रोबोट क्या करते हैं और वे एक पीसी से जुड़े नहीं हैं। तरीका होगा लेकिन सिग्नेचर नंबर कैसे सेट करें? एलईडी अगर PIXY शिक्षण के पहले क्षणों में रंग बदल देगा, तो आप जिस रंग पर क्लिक करेंगे वह नंबर सेट करेगा; लाल अर्थ 1 से बैंगनी अर्थ 7. विधि 2 में, संख्या सेटिंग केवल आवेदन के साथ की जाएगी।

चरण 6: "अंत" के बहुत करीब

हमने समझाया कि चित्रों का उपयोग करने की क्या आवश्यकता है, डिजिटल इमेज प्रोसेसिंग क्या है और इसे कैसे किया जा सकता है। हमारे पास कौन से तरीके हैं और हार्डवेयर से जो वर्तमान में हमारी मदद कर सकते हैं, हमने स्पष्टीकरण के लिए PIXY को चुना। हमने समझाया कि यह कैसे काम करता है और अगर आप पिक्सी कैमरों के शुरुआती हैं तो क्या करें! अब आप अपने छोटे रोबोट के लिए इमेज प्रोसेसिंग शुरू कर सकते हैं और अपने कंप्यूटर के साथ तीसरी आंख का आनंद ले सकते हैं।

आप इस प्रोजेक्ट को ElectroPeak की आधिकारिक वेबसाइट:https://electropeak.com/learn/guides/introduction/ पर भी पढ़ सकते हैं।

सिफारिश की: