Artificial Intelligence

तंत्रिका नेटवर्क हवाई छवियों से बादलों को हटाने में मदद करते हैं

Updated on दिसम्बर 9/2022

ओसाका विश्वविद्यालय में सतत ऊर्जा और पर्यावरण इंजीनियरिंग प्रभाग के शोधकर्ता और वैज्ञानिक जेनरेटिव एडवरसैरियल नेटवर्क (जीएएन) का उपयोग करके हवाई छवियों से बादलों को डिजिटल रूप से हटाने में सक्षम थे। परिणामी डेटा के साथ, वे स्वचालित रूप से छवि मास्क के निर्माण के सटीक डेटासेट उत्पन्न कर सकते हैं।

में शोध प्रकाशित हुआ था उन्नत इंजीनियरिंग सूचना विज्ञान.

टीम ने डेटा गुणवत्ता में सुधार के लिए दो कृत्रिम बुद्धिमत्ता (एआई) नेटवर्क को एक-दूसरे के सामने रखा, और इसके लिए पहले से लेबल की गई छवियों की आवश्यकता नहीं थी। टीम के अनुसार, इन नए विकासों का उपयोग सिविल इंजीनियरिंग जैसे क्षेत्रों में किया जा सकता है, जहां कंप्यूटर विज़न तकनीक महत्वपूर्ण है।

छवियों की मरम्मत के लिए मशीन लर्निंग

मशीन लर्निंग का उपयोग अक्सर अस्पष्ट छवियों को ठीक करने के लिए किया जाता है, जैसे बादलों द्वारा अस्पष्ट इमारतों की हवाई छवियां। यह कार्य मैन्युअल रूप से किया जा सकता है, लेकिन इसमें समय लगता है और यह मशीन लर्निंग एल्गोरिदम जितना प्रभावी नहीं है। यहां तक कि पहले से उपलब्ध एल्गोरिदम के लिए भी प्रशिक्षण छवियों के एक बड़े सेट की आवश्यकता होती है, इसलिए तकनीक को और आगे बढ़ाना महत्वपूर्ण है।

ओसाका विश्वविद्यालय के शोधकर्ताओं ने यही किया जब उन्होंने जेनेरिक प्रतिकूल नेटवर्क लागू किया। एक नेटवर्क "जेनरेटिव नेटवर्क" है और यह बादलों के बिना पुनर्निर्मित छवियों का प्रस्ताव करता है। इस नेटवर्क को एक "भेदभावपूर्ण नेटवर्क" के विरुद्ध रखा गया है, जो डिजिटल रूप से मरम्मत की गई तस्वीरों और बादलों के बिना वास्तविक छवियों के बीच अंतर करने के लिए एक दृढ़ तंत्रिका नेटवर्क पर निर्भर करता है।

जैसे-जैसे नेटवर्क इस प्रक्रिया से आगे बढ़ते हैं, वे दोनों तेजी से बेहतर होते जाते हैं, जो उन्हें डिजिटल रूप से मिटाए गए बादलों के साथ अत्यधिक यथार्थवादी छवियां बनाने में सक्षम बनाता है।

कज़ुनोसुके इकेनो पेपर के पहले लेखक हैं।

इकेनो कहते हैं, "विभेदक नेटवर्क को किसी छवि को वास्तविक समझने के लिए 'मूर्ख' बनाने के लिए जेनरेटिव नेटवर्क को प्रशिक्षित करके, हम पुनर्निर्मित छवियां प्राप्त करते हैं जो अधिक आत्मनिर्भर होती हैं।"

छवि: 2021 कज़ुनोसुके इकेनो एट अल।, उन्नत इंजीनियरिंग सूचना विज्ञान

सिस्टम का प्रशिक्षण

टीम ने ओपन-सोर्स डेटासेट से ली गई तस्वीरों के साथ 3डी वर्चुअल मॉडल पर भरोसा किया और इसे इनपुट के रूप में इस्तेमाल किया गया। इसने सिस्टम को स्वचालित रूप से डिजिटल "मास्क" उत्पन्न करने में सक्षम बनाया जो क्लाउड पर पुनर्निर्मित इमारतों को कवर करता है।

तोमोहिरो फुकुदा शोध के वरिष्ठ लेखक हैं।

फुकुदा कहते हैं, "यह विधि लेबल किए गए प्रशिक्षण डेटा के बिना क्षेत्रों में इमारतों का पता लगाना संभव बनाती है।"

प्रशिक्षित मॉडल 0.651 के "इंटरसेक्शन ओवर यूनियन" मान वाली इमारतों का पता लगाने में सक्षम था। यह मान इस बात का माप है कि पुनर्निर्मित क्षेत्र वास्तविक क्षेत्र से कितना सटीक रूप से मेल खाता है।

टीम के अनुसार, यह विधि अस्पष्ट छवियों वाले अन्य डेटासेट की गुणवत्ता में सुधार कर सकती है, बस इसे विस्तारित करने की आवश्यकता है। इसमें स्वास्थ्य देखभाल जैसे विभिन्न क्षेत्रों की छवियां शामिल हो सकती हैं, जहां इसका उपयोग चिकित्सा इमेजिंग को बेहतर बनाने के लिए किया जा सकता है।

संबंधित विषय:AI कृत्रिम बुद्धिमत्ता Computer Vision

अगला

माइक्रोस्केल अवतल इंटरफेस स्वायत्त वाहनों की मदद कर सकते हैं

मिस न करें

भाषण और हावभाव संश्लेषण को एकीकृत करना

एलेक्स मैकफ़ारलैंड

एलेक्स मैकफ़ारलैंड एक एआई पत्रकार और लेखक हैं जो कृत्रिम बुद्धिमत्ता में नवीनतम विकास की खोज कर रहे हैं। उन्होंने दुनिया भर में कई एआई स्टार्टअप और प्रकाशनों के साथ सहयोग किया है।