विषयसूची:

क्वांटिमेट्रिक इमेज प्रोसेसिंग: 5 कदम
क्वांटिमेट्रिक इमेज प्रोसेसिंग: 5 कदम

वीडियो: क्वांटिमेट्रिक इमेज प्रोसेसिंग: 5 कदम

वीडियो: क्वांटिमेट्रिक इमेज प्रोसेसिंग: 5 कदम
वीडियो: Угрюм-река (1969) (1 серия) фильм 2024, नवंबर
Anonim
क्वांटिमेट्रिक इमेज प्रोसेसिंग
क्वांटिमेट्रिक इमेज प्रोसेसिंग
क्वांटिमेट्रिक इमेज प्रोसेसिंग
क्वांटिमेट्रिक इमेज प्रोसेसिंग
क्वांटिमेट्रिक इमेज प्रोसेसिंग
क्वांटिमेट्रिक इमेज प्रोसेसिंग
क्वांटिमेट्रिक इमेज प्रोसेसिंग
क्वांटिमेट्रिक इमेज प्रोसेसिंग

(उपरोक्त आंकड़ा क्वांटिमेट्रिक इमेज प्रोसेसिंग के साथ मौजूदा इमेज प्रोसेसिंग विधि की तुलना दिखाता है। बेहतर परिणाम पर ध्यान दें। शीर्ष दाहिनी छवि अजीब कलाकृतियों को दिखाती है जो गलत धारणा से आती हैं कि चित्र प्रकाश जैसे कुछ को मापते हैं। नीचे की दाहिनी छवि एक ही काम करके बेहतर परिणाम दिखाती है। मात्रात्मक रूप से।)

इस निर्देशयोग्य में आप सीखेंगे कि एक बहुत ही सरल अवधारणा का उपयोग करके मौजूदा इमेजिंग या विज़न सेंसिंग सिस्टम के प्रदर्शन को कैसे बेहतर बनाया जाए: क्वांटिमेट्रिक इमेज सेंसिंग।

क्वांटिमेट्रिक इमेज प्रोसेसिंग निम्नलिखित में से किसी पर बहुत सुधार करता है:

  • मौजूदा इमेज प्रोसेसिंग जैसे इमेज डिब्लरिंग;
  • मशीन लर्निंग, कंप्यूटर विज़न और पैटर्न-रिकग्निशन;
  • पहनने योग्य चेहरा पहचानकर्ता (देखें https://wearcam.org/vmp.pdf), AI और HI आधारित दृष्टि, आदि।

मूल विचार छवियों को मात्रात्मक रूप से पूर्व-प्रक्रिया और बाद में संसाधित करना है, जैसा कि निम्नानुसार है:

  1. छवि या छवियों की गतिशील सीमा का विस्तार करें;
  2. छवि या छवियों को सामान्य रूप से संसाधित करें;
  3. छवि या छवियों की गतिशील श्रेणी को संपीड़ित करें (अर्थात चरण 1 को पूर्ववत करें)।

पिछले इंस्ट्रक्शंस में, मैंने एचडीआर (हाई डायनेमिक रेंज) सेंसिंग और क्वांटिमेट्रिक सेंसिंग के कुछ पहलुओं को पढ़ाया था, उदा। रैखिकता, सुपरपोजिशन, आदि।

आइए अब हम इस ज्ञान का उपयोग करें।

कोई भी मौजूदा प्रक्रिया लें जिसका आप उपयोग करना चाहते हैं। मैं जो उदाहरण दिखाऊंगा वह इमेज डिब्लरिंग है, लेकिन आप इसे किसी और चीज के लिए भी इस्तेमाल कर सकते हैं।

चरण 1: अपनी छवि या छवियों की गतिशील रेंज का विस्तार करें

अपनी छवि या छवियों की गतिशील रेंज का विस्तार करें
अपनी छवि या छवियों की गतिशील रेंज का विस्तार करें
अपनी छवि या छवियों की गतिशील रेंज का विस्तार करें
अपनी छवि या छवियों की गतिशील रेंज का विस्तार करें

(आंकड़े "इंटेलिजेंट इमेज प्रोसेसिंग", जॉन विले एंड संस इंटरसाइंस सीरीज़, स्टीव मान, नवंबर 2001 से अनुकूलित)

पहला कदम इनपुट छवि की गतिशील सीमा का विस्तार करना है।

आदर्श रूप से आपको पहले कैमरे के रिस्पॉन्स फंक्शन, f को निर्धारित करना चाहिए, और फिर इमेज पर व्युत्क्रम प्रतिक्रिया, f व्युत्क्रम लागू करना चाहिए।

विशिष्ट कैमरे डायनेमिक रेंज के कंप्रेसिव होते हैं, इसलिए हम आम तौर पर एक एक्सपेंसिव फंक्शन लागू करना चाहते हैं।

यदि आप प्रतिक्रिया फ़ंक्शन नहीं जानते हैं, तो कुछ सरल प्रयास करके शुरू करें जैसे छवि को एक छवि सरणी में लोड करना, चर को डेटा प्रकार जैसे (फ्लोट) या (डबल) में डालना, और प्रत्येक पिक्सेल मान को एक्सपोनेंट तक बढ़ाना, जैसे, उदाहरण के लिए, प्रत्येक पिक्सेल मान का वर्ग करना।

तर्क:

हम यह क्यों कर रहे हैं?

इसका उत्तर यह है कि अधिकांश कैमरे अपनी गतिशील रेंज को संपीड़ित करते हैं। उनके ऐसा करने का कारण यह है कि अधिकांश डिस्प्ले मीडिया डायनेमिक रेंज का विस्तार करता है। यह दुर्घटना से काफी है: कैथोड-रे ट्यूब टेलीविजन डिस्प्ले द्वारा उत्सर्जित प्रकाश की मात्रा लगभग 2.22 के एक्सपोनेंट तक उठाए गए वोल्टेज के बराबर होती है, ताकि जब वीडियो वोल्टेज इनपुट लगभग आधा हो, तो उत्सर्जित प्रकाश की मात्रा अधिक हो आधे से भी कम।

फोटोग्राफिक मीडिया भी डायनेमिक-रेंज एक्सपेंसिव हैं। उदाहरण के लिए, एक फोटोग्राफिक "तटस्थ" ग्रे कार्ड घटना प्रकाश का 18% (घटना प्रकाश का 50% नहीं) उत्सर्जित करता है। इतना प्रकाश (18%) प्रतिक्रिया के बीच में माना जाता है। तो जैसा कि आप देख सकते हैं, अगर हम इनपुट के एक फ़ंक्शन के रूप में आउटपुट के ग्राफ को देखते हैं, तो डिस्प्ले मीडिया ऐसा व्यवहार करता है जैसे कि वे आदर्श रैखिक डिस्प्ले होते हैं जिनमें आदर्श रैखिक प्रतिक्रिया से पहले एक गतिशील रेंज विस्तारक होता है।

ऊपर की आकृति में, आप एक बिंदीदार रेखा के साथ बॉक्स में प्रदर्शित प्रदर्शन देख सकते हैं, और यह आदर्श रैखिक प्रदर्शन से पहले एक विस्तारक होने के बराबर है।

चूंकि डिस्प्ले स्वाभाविक रूप से विस्तृत होते हैं, इसलिए कैमरों को कंप्रेसिव होने के लिए डिज़ाइन करने की आवश्यकता होती है ताकि मौजूदा डिस्प्ले पर छवियां अच्छी दिखें।

पुराने दिनों में जब हजारों टेलीविजन रिसीवर डिस्प्ले और सिर्फ एक या दो प्रसारण स्टेशन (जैसे सिर्फ एक या दो टेलीविजन कैमरे) थे, तो सभी टीवी को वापस बुलाने की तुलना में कैमरे में एक कंप्रेसिव नॉनलाइनरिटी डालना एक आसान फिक्स था। प्रत्येक टेलीविजन रिसीवर में एक लगाएं।

दुर्घटना से इसने शोर को कम करने में भी मदद की। ऑडियो में हम इसे "डॉल्बी" ("कंपैंडिंग") कहते हैं और इसके लिए एक पेटेंट प्रदान करते हैं। वीडियो में यह पूरी तरह से दुर्घटना से हुआ। स्टॉकहैम ने प्रस्तावित किया कि हमें छवियों को संसाधित करने से पहले उनका लघुगणक लेना चाहिए, और फिर एंटीलॉग लेना चाहिए। उन्हें इस बात का अहसास नहीं था कि ज्यादातर कैमरे और डिस्प्ले पहले से ही ऐसा संयोग से करते हैं। इसके बजाय, मैंने जो प्रस्तावित किया वह यह है कि हम स्टॉकहैम द्वारा प्रस्तावित के ठीक विपरीत करते हैं। (देखें "इंटेलिजेंट इमेज प्रोसेसिंग", जॉन विले एंड संस इंटरसाइंस सीरीज़, पेज 109-111।)

नीचे की तस्वीर में, आप प्रस्तावित एंटी-होमोमोर्फिक (क्वांटिमेट्रिक) इमेज प्रोसेसिंग देखते हैं, जहां हमने डायनेमिक रेंज के विस्तार और संपीड़न के चरण को जोड़ा है।

चरण 2: छवियों को संसाधित करें, या कंप्यूटर विज़न, मशीन लर्निंग, या पसंद करें

दूसरा चरण, गतिशील रेंज विस्तार के बाद, छवियों को संसाधित करना है।

मेरे मामले में, मैंने ब्लर फंक्शन, यानी इमेज डिब्लरिंग के साथ छवि का एक डीकोनवोल्यूशन किया, जैसा कि आमतौर पर पूर्व कला में जाना जाता है।

क्वांटिमेट्रिक इमेज सेंसिंग की दो व्यापक श्रेणियां हैं:

  • लोगों को देखने में मदद करना;
  • मशीनों को देखने में मदद करना।

अगर हम लोगों को यह देखने में मदद करने की कोशिश कर रहे हैं (जो उदाहरण मैं यहां दिखा रहा हूं), हमने अभी तक नहीं किया है: हमें संसाधित परिणाम को वापस इमेजस्पेस में लेने की आवश्यकता है।

अगर हम मशीनों को देखने में मदद कर रहे हैं (उदाहरण के लिए चेहरा पहचान), तो अब हम कर चुके हैं (चरण 3 पर जाने की कोई आवश्यकता नहीं है)।

चरण 3: परिणाम की गतिशील रेंज को पुन: संपीड़ित करें

जब हम विस्तारित डायनामिक रेंज में काम कर रहे होते हैं, तो हमें "लाइटस्पेस" (क्वांटिमेट्रिक इमेजस्पेस) में कहा जाता है।

चरण 2 के अंत में, हम लाइटस्पेस में हैं, और हमें इमेजस्पेस पर वापस जाने की आवश्यकता है।

तो यह चरण 3 इमेजस्पेस पर वापस जाने के बारे में है।

चरण 3 को निष्पादित करने के लिए, चरण 2 के आउटपुट की गतिशील रेंज को बस संपीड़ित करें।

यदि आप कैमरे के प्रतिक्रिया कार्य को जानते हैं, तो परिणाम प्राप्त करने के लिए, f(p(q)) बस इसे लागू करें।

यदि आप कैमरे के प्रतिक्रिया कार्य को नहीं जानते हैं, तो बस एक अच्छा अनुमान लगाएं।

यदि आपने चरण 1 में छवि पिक्सेल को चुकता किया है, तो छवि स्थान के बारे में अपने अनुमान पर वापस जाने के लिए प्रत्येक छवि पिक्सेल का वर्गमूल लेने का समय आ गया है।

चरण 4: आप कुछ अन्य विविधताओं का प्रयास करना चाह सकते हैं

आप कुछ अन्य विविधताओं का प्रयास करना चाह सकते हैं
आप कुछ अन्य विविधताओं का प्रयास करना चाह सकते हैं
आप कुछ अन्य विविधताओं का प्रयास करना चाह सकते हैं
आप कुछ अन्य विविधताओं का प्रयास करना चाह सकते हैं
आप कुछ अन्य विविधताओं का प्रयास करना चाह सकते हैं
आप कुछ अन्य विविधताओं का प्रयास करना चाह सकते हैं
आप कुछ अन्य विविधताओं का प्रयास करना चाह सकते हैं
आप कुछ अन्य विविधताओं का प्रयास करना चाह सकते हैं

डिब्लरिंग कई संभावित उदाहरणों में से एक है। उदाहरण के लिए, एकाधिक एक्सपोज़र के संयोजन पर विचार करें।

मेरे ऊपर जो दो चित्र हैं, उनमें से कोई भी दो चित्र लें। एक को दिन में और दूसरे को रात में लिया गया।

उन्हें मिलाकर शाम के समान चित्र बनाएं।

यदि आप उन्हें एक साथ औसत करते हैं तो यह कचरा जैसा दिखता है। इसे स्वयं आजमाएं!

लेकिन अगर आप पहले प्रत्येक छवि की गतिशील सीमा का विस्तार करते हैं, फिर उन्हें जोड़ते हैं, और फिर योग की गतिशील सीमा को संपीड़ित करते हैं, तो यह बहुत अच्छा लगता है।

क्वांटिमेट्रिक इमेज प्रोसेसिंग (विस्तार, जोड़ना और फिर संपीड़ित करना) के साथ इमेज प्रोसेसिंग (छवियों को जोड़ना) की तुलना करें।

आप मेरा कोड और अधिक उदाहरण सामग्री यहां से डाउनलोड कर सकते हैं:

चरण 5: आगे जाना: अब इसे एचडीआर इमेज कंपोजिट के साथ आज़माएं

आगे जाना: अब इसे एचडीआर इमेज कंपोजिट के साथ आज़माएं
आगे जाना: अब इसे एचडीआर इमेज कंपोजिट के साथ आज़माएं

(ऊपर की छवि: एचडीआर वेल्डिंग हेलमेट संवर्धित वास्तविकता ओवरले के लिए क्वांटिमेट्रिक इमेज प्रोसेसिंग का उपयोग करता है। स्लैशगियर 2012 सितंबर 12 देखें।)

सारांश:

एक छवि कैप्चर करें, और निम्न चरणों को लागू करें:

  1. छवि की गतिशील सीमा का विस्तार करें;
  2. छवि को संसाधित करें;
  3. परिणाम की गतिशील सीमा को संपीड़ित करें।

और यदि आप और भी बेहतर परिणाम चाहते हैं, तो निम्न प्रयास करें:

अलग-अलग उजागर छवियों की बहुलता पर कब्जा;

  1. एचडीआर पर मेरे पिछले इंस्ट्रक्शनल के अनुसार, डायनेमिक रेंज को लाइटस्पेस में विस्तारित करें;
  2. परिणामी मात्रात्मक छवि को संसाधित करें, q, लाइटस्पेस में;
  3. टोनमैपिंग के माध्यम से डायनेमिक रेंज को कंप्रेस करें।

मज़े करें और कृपया "मैंने इसे बनाया" पर क्लिक करें और अपने परिणाम पोस्ट करें, और मुझे टिप्पणी करने या कुछ रचनात्मक सहायता प्रदान करने में खुशी होगी।

सिफारिश की: