विषयसूची:
- चरण 1: अपनी छवि या छवियों की गतिशील रेंज का विस्तार करें
- तर्क:
- चरण 2: छवियों को संसाधित करें, या कंप्यूटर विज़न, मशीन लर्निंग, या पसंद करें
- चरण 3: परिणाम की गतिशील रेंज को पुन: संपीड़ित करें
- चरण 4: आप कुछ अन्य विविधताओं का प्रयास करना चाह सकते हैं
- चरण 5: आगे जाना: अब इसे एचडीआर इमेज कंपोजिट के साथ आज़माएं
वीडियो: क्वांटिमेट्रिक इमेज प्रोसेसिंग: 5 कदम
2024 लेखक: John Day | [email protected]. अंतिम बार संशोधित: 2024-01-30 09:22
(उपरोक्त आंकड़ा क्वांटिमेट्रिक इमेज प्रोसेसिंग के साथ मौजूदा इमेज प्रोसेसिंग विधि की तुलना दिखाता है। बेहतर परिणाम पर ध्यान दें। शीर्ष दाहिनी छवि अजीब कलाकृतियों को दिखाती है जो गलत धारणा से आती हैं कि चित्र प्रकाश जैसे कुछ को मापते हैं। नीचे की दाहिनी छवि एक ही काम करके बेहतर परिणाम दिखाती है। मात्रात्मक रूप से।)
इस निर्देशयोग्य में आप सीखेंगे कि एक बहुत ही सरल अवधारणा का उपयोग करके मौजूदा इमेजिंग या विज़न सेंसिंग सिस्टम के प्रदर्शन को कैसे बेहतर बनाया जाए: क्वांटिमेट्रिक इमेज सेंसिंग।
क्वांटिमेट्रिक इमेज प्रोसेसिंग निम्नलिखित में से किसी पर बहुत सुधार करता है:
- मौजूदा इमेज प्रोसेसिंग जैसे इमेज डिब्लरिंग;
- मशीन लर्निंग, कंप्यूटर विज़न और पैटर्न-रिकग्निशन;
- पहनने योग्य चेहरा पहचानकर्ता (देखें https://wearcam.org/vmp.pdf), AI और HI आधारित दृष्टि, आदि।
मूल विचार छवियों को मात्रात्मक रूप से पूर्व-प्रक्रिया और बाद में संसाधित करना है, जैसा कि निम्नानुसार है:
- छवि या छवियों की गतिशील सीमा का विस्तार करें;
- छवि या छवियों को सामान्य रूप से संसाधित करें;
- छवि या छवियों की गतिशील श्रेणी को संपीड़ित करें (अर्थात चरण 1 को पूर्ववत करें)।
पिछले इंस्ट्रक्शंस में, मैंने एचडीआर (हाई डायनेमिक रेंज) सेंसिंग और क्वांटिमेट्रिक सेंसिंग के कुछ पहलुओं को पढ़ाया था, उदा। रैखिकता, सुपरपोजिशन, आदि।
आइए अब हम इस ज्ञान का उपयोग करें।
कोई भी मौजूदा प्रक्रिया लें जिसका आप उपयोग करना चाहते हैं। मैं जो उदाहरण दिखाऊंगा वह इमेज डिब्लरिंग है, लेकिन आप इसे किसी और चीज के लिए भी इस्तेमाल कर सकते हैं।
चरण 1: अपनी छवि या छवियों की गतिशील रेंज का विस्तार करें
(आंकड़े "इंटेलिजेंट इमेज प्रोसेसिंग", जॉन विले एंड संस इंटरसाइंस सीरीज़, स्टीव मान, नवंबर 2001 से अनुकूलित)
पहला कदम इनपुट छवि की गतिशील सीमा का विस्तार करना है।
आदर्श रूप से आपको पहले कैमरे के रिस्पॉन्स फंक्शन, f को निर्धारित करना चाहिए, और फिर इमेज पर व्युत्क्रम प्रतिक्रिया, f व्युत्क्रम लागू करना चाहिए।
विशिष्ट कैमरे डायनेमिक रेंज के कंप्रेसिव होते हैं, इसलिए हम आम तौर पर एक एक्सपेंसिव फंक्शन लागू करना चाहते हैं।
यदि आप प्रतिक्रिया फ़ंक्शन नहीं जानते हैं, तो कुछ सरल प्रयास करके शुरू करें जैसे छवि को एक छवि सरणी में लोड करना, चर को डेटा प्रकार जैसे (फ्लोट) या (डबल) में डालना, और प्रत्येक पिक्सेल मान को एक्सपोनेंट तक बढ़ाना, जैसे, उदाहरण के लिए, प्रत्येक पिक्सेल मान का वर्ग करना।
तर्क:
हम यह क्यों कर रहे हैं?
इसका उत्तर यह है कि अधिकांश कैमरे अपनी गतिशील रेंज को संपीड़ित करते हैं। उनके ऐसा करने का कारण यह है कि अधिकांश डिस्प्ले मीडिया डायनेमिक रेंज का विस्तार करता है। यह दुर्घटना से काफी है: कैथोड-रे ट्यूब टेलीविजन डिस्प्ले द्वारा उत्सर्जित प्रकाश की मात्रा लगभग 2.22 के एक्सपोनेंट तक उठाए गए वोल्टेज के बराबर होती है, ताकि जब वीडियो वोल्टेज इनपुट लगभग आधा हो, तो उत्सर्जित प्रकाश की मात्रा अधिक हो आधे से भी कम।
फोटोग्राफिक मीडिया भी डायनेमिक-रेंज एक्सपेंसिव हैं। उदाहरण के लिए, एक फोटोग्राफिक "तटस्थ" ग्रे कार्ड घटना प्रकाश का 18% (घटना प्रकाश का 50% नहीं) उत्सर्जित करता है। इतना प्रकाश (18%) प्रतिक्रिया के बीच में माना जाता है। तो जैसा कि आप देख सकते हैं, अगर हम इनपुट के एक फ़ंक्शन के रूप में आउटपुट के ग्राफ को देखते हैं, तो डिस्प्ले मीडिया ऐसा व्यवहार करता है जैसे कि वे आदर्श रैखिक डिस्प्ले होते हैं जिनमें आदर्श रैखिक प्रतिक्रिया से पहले एक गतिशील रेंज विस्तारक होता है।
ऊपर की आकृति में, आप एक बिंदीदार रेखा के साथ बॉक्स में प्रदर्शित प्रदर्शन देख सकते हैं, और यह आदर्श रैखिक प्रदर्शन से पहले एक विस्तारक होने के बराबर है।
चूंकि डिस्प्ले स्वाभाविक रूप से विस्तृत होते हैं, इसलिए कैमरों को कंप्रेसिव होने के लिए डिज़ाइन करने की आवश्यकता होती है ताकि मौजूदा डिस्प्ले पर छवियां अच्छी दिखें।
पुराने दिनों में जब हजारों टेलीविजन रिसीवर डिस्प्ले और सिर्फ एक या दो प्रसारण स्टेशन (जैसे सिर्फ एक या दो टेलीविजन कैमरे) थे, तो सभी टीवी को वापस बुलाने की तुलना में कैमरे में एक कंप्रेसिव नॉनलाइनरिटी डालना एक आसान फिक्स था। प्रत्येक टेलीविजन रिसीवर में एक लगाएं।
दुर्घटना से इसने शोर को कम करने में भी मदद की। ऑडियो में हम इसे "डॉल्बी" ("कंपैंडिंग") कहते हैं और इसके लिए एक पेटेंट प्रदान करते हैं। वीडियो में यह पूरी तरह से दुर्घटना से हुआ। स्टॉकहैम ने प्रस्तावित किया कि हमें छवियों को संसाधित करने से पहले उनका लघुगणक लेना चाहिए, और फिर एंटीलॉग लेना चाहिए। उन्हें इस बात का अहसास नहीं था कि ज्यादातर कैमरे और डिस्प्ले पहले से ही ऐसा संयोग से करते हैं। इसके बजाय, मैंने जो प्रस्तावित किया वह यह है कि हम स्टॉकहैम द्वारा प्रस्तावित के ठीक विपरीत करते हैं। (देखें "इंटेलिजेंट इमेज प्रोसेसिंग", जॉन विले एंड संस इंटरसाइंस सीरीज़, पेज 109-111।)
नीचे की तस्वीर में, आप प्रस्तावित एंटी-होमोमोर्फिक (क्वांटिमेट्रिक) इमेज प्रोसेसिंग देखते हैं, जहां हमने डायनेमिक रेंज के विस्तार और संपीड़न के चरण को जोड़ा है।
चरण 2: छवियों को संसाधित करें, या कंप्यूटर विज़न, मशीन लर्निंग, या पसंद करें
दूसरा चरण, गतिशील रेंज विस्तार के बाद, छवियों को संसाधित करना है।
मेरे मामले में, मैंने ब्लर फंक्शन, यानी इमेज डिब्लरिंग के साथ छवि का एक डीकोनवोल्यूशन किया, जैसा कि आमतौर पर पूर्व कला में जाना जाता है।
क्वांटिमेट्रिक इमेज सेंसिंग की दो व्यापक श्रेणियां हैं:
- लोगों को देखने में मदद करना;
- मशीनों को देखने में मदद करना।
अगर हम लोगों को यह देखने में मदद करने की कोशिश कर रहे हैं (जो उदाहरण मैं यहां दिखा रहा हूं), हमने अभी तक नहीं किया है: हमें संसाधित परिणाम को वापस इमेजस्पेस में लेने की आवश्यकता है।
अगर हम मशीनों को देखने में मदद कर रहे हैं (उदाहरण के लिए चेहरा पहचान), तो अब हम कर चुके हैं (चरण 3 पर जाने की कोई आवश्यकता नहीं है)।
चरण 3: परिणाम की गतिशील रेंज को पुन: संपीड़ित करें
जब हम विस्तारित डायनामिक रेंज में काम कर रहे होते हैं, तो हमें "लाइटस्पेस" (क्वांटिमेट्रिक इमेजस्पेस) में कहा जाता है।
चरण 2 के अंत में, हम लाइटस्पेस में हैं, और हमें इमेजस्पेस पर वापस जाने की आवश्यकता है।
तो यह चरण 3 इमेजस्पेस पर वापस जाने के बारे में है।
चरण 3 को निष्पादित करने के लिए, चरण 2 के आउटपुट की गतिशील रेंज को बस संपीड़ित करें।
यदि आप कैमरे के प्रतिक्रिया कार्य को जानते हैं, तो परिणाम प्राप्त करने के लिए, f(p(q)) बस इसे लागू करें।
यदि आप कैमरे के प्रतिक्रिया कार्य को नहीं जानते हैं, तो बस एक अच्छा अनुमान लगाएं।
यदि आपने चरण 1 में छवि पिक्सेल को चुकता किया है, तो छवि स्थान के बारे में अपने अनुमान पर वापस जाने के लिए प्रत्येक छवि पिक्सेल का वर्गमूल लेने का समय आ गया है।
चरण 4: आप कुछ अन्य विविधताओं का प्रयास करना चाह सकते हैं
डिब्लरिंग कई संभावित उदाहरणों में से एक है। उदाहरण के लिए, एकाधिक एक्सपोज़र के संयोजन पर विचार करें।
मेरे ऊपर जो दो चित्र हैं, उनमें से कोई भी दो चित्र लें। एक को दिन में और दूसरे को रात में लिया गया।
उन्हें मिलाकर शाम के समान चित्र बनाएं।
यदि आप उन्हें एक साथ औसत करते हैं तो यह कचरा जैसा दिखता है। इसे स्वयं आजमाएं!
लेकिन अगर आप पहले प्रत्येक छवि की गतिशील सीमा का विस्तार करते हैं, फिर उन्हें जोड़ते हैं, और फिर योग की गतिशील सीमा को संपीड़ित करते हैं, तो यह बहुत अच्छा लगता है।
क्वांटिमेट्रिक इमेज प्रोसेसिंग (विस्तार, जोड़ना और फिर संपीड़ित करना) के साथ इमेज प्रोसेसिंग (छवियों को जोड़ना) की तुलना करें।
आप मेरा कोड और अधिक उदाहरण सामग्री यहां से डाउनलोड कर सकते हैं:
चरण 5: आगे जाना: अब इसे एचडीआर इमेज कंपोजिट के साथ आज़माएं
(ऊपर की छवि: एचडीआर वेल्डिंग हेलमेट संवर्धित वास्तविकता ओवरले के लिए क्वांटिमेट्रिक इमेज प्रोसेसिंग का उपयोग करता है। स्लैशगियर 2012 सितंबर 12 देखें।)
सारांश:
एक छवि कैप्चर करें, और निम्न चरणों को लागू करें:
- छवि की गतिशील सीमा का विस्तार करें;
- छवि को संसाधित करें;
- परिणाम की गतिशील सीमा को संपीड़ित करें।
और यदि आप और भी बेहतर परिणाम चाहते हैं, तो निम्न प्रयास करें:
अलग-अलग उजागर छवियों की बहुलता पर कब्जा;
- एचडीआर पर मेरे पिछले इंस्ट्रक्शनल के अनुसार, डायनेमिक रेंज को लाइटस्पेस में विस्तारित करें;
- परिणामी मात्रात्मक छवि को संसाधित करें, q, लाइटस्पेस में;
- टोनमैपिंग के माध्यम से डायनेमिक रेंज को कंप्रेस करें।
मज़े करें और कृपया "मैंने इसे बनाया" पर क्लिक करें और अपने परिणाम पोस्ट करें, और मुझे टिप्पणी करने या कुछ रचनात्मक सहायता प्रदान करने में खुशी होगी।
सिफारिश की:
इमेज प्रोसेसिंग बेस्ड फायर रिकग्निशन एंड एक्सटिंगुइशर सिस्टम: 3 चरण
इमेज प्रोसेसिंग बेस्ड फायर रिकग्निशन एंड एक्सटिंगुइशर सिस्टम: हेलो दोस्तों यह एक इमेज प्रोसेसिंग आधारित फायर डिटेक्शन और एक्सटिंगुइशर सिस्टम है जिसमें Arduino का उपयोग किया जाता है
रास्पबेरी पाई के साथ इमेज प्रोसेसिंग: ओपनसीवी और इमेज कलर सेपरेशन स्थापित करना: 4 कदम
रास्पबेरी पाई के साथ इमेज प्रोसेसिंग: ओपनसीवी और इमेज कलर सेपरेशन स्थापित करना: यह पोस्ट कई इमेज प्रोसेसिंग ट्यूटोरियल्स में से पहला है जिसका पालन करना है। हम एक छवि बनाने वाले पिक्सेल पर करीब से नज़र डालते हैं, सीखते हैं कि रास्पबेरी पाई पर ओपनसीवी कैसे स्थापित करें और हम एक छवि को कैप्चर करने के लिए परीक्षण स्क्रिप्ट भी लिखते हैं और सी
जेस्चर हॉक: इमेज प्रोसेसिंग आधारित इंटरफेस का उपयोग करते हुए हैंड जेस्चर नियंत्रित रोबोट: 13 चरण (चित्रों के साथ)
जेस्चर हॉक: इमेज प्रोसेसिंग आधारित इंटरफेस का उपयोग करते हुए हैंड जेस्चर नियंत्रित रोबोट: टेकविंस 4.0 में जेस्चर हॉक को एक साधारण इमेज प्रोसेसिंग आधारित मानव-मशीन इंटरफेस के रूप में प्रदर्शित किया गया था। इसकी उपयोगिता इस तथ्य में निहित है कि रोबोट कार को नियंत्रित करने के लिए दस्ताने को छोड़कर किसी अतिरिक्त सेंसर या पहनने योग्य की आवश्यकता नहीं होती है जो अलग-अलग चलती है
इमेज प्रोसेसिंग का एक परिचय: पिक्सी और इसके विकल्प: 6 कदम
इमेज प्रोसेसिंग का एक परिचय: पिक्सी और इसके विकल्प: इस लेख में, हम डिजिटल इमेज प्रोसेसिंग (डीआईपी) का अर्थ और पिक्सी और अन्य टूल्स जैसे हार्डवेयर का उपयोग करने के कारणों को चित्रों या वीडियो पर एक प्रक्रिया बनाने के लिए समझाएंगे। इस लेख के अंत में, आप सीखेंगे: डिजिटल छवि कैसे बनती है।
मोयमोया इमेज प्रोसेसिंग: 8 कदम
मोयमोया इमेज प्रोसेसिंग: मोयामोया, "धुएं का झोंका," एक दुर्लभ बीमारी है जो बेसल गैन्ग्लिया में धमनियों के रुकावट के कारण होती है, जो मस्तिष्क के आधार पर एक क्षेत्र है। यह रोग एक प्रगतिशील मस्तिष्कवाहिकीय रोग है जो ज्यादातर बच्चों को प्रभावित करता है। सिम