Artificial Intelligence
तंत्रिका नेटवर्क हवाई छवियों से बादलों को हटाने में मदद करते हैं
ओसाका विश्वविद्यालय में सतत ऊर्जा और पर्यावरण इंजीनियरिंग प्रभाग के शोधकर्ता और वैज्ञानिक जेनरेटिव एडवरसैरियल नेटवर्क (जीएएन) का उपयोग करके हवाई छवियों से बादलों को डिजिटल रूप से हटाने में सक्षम थे। परिणामी डेटा के साथ, वे स्वचालित रूप से छवि मास्क के निर्माण के सटीक डेटासेट उत्पन्न कर सकते हैं।
में शोध प्रकाशित हुआ था उन्नत इंजीनियरिंग सूचना विज्ञान.
टीम ने डेटा गुणवत्ता में सुधार के लिए दो कृत्रिम बुद्धिमत्ता (एआई) नेटवर्क को एक-दूसरे के सामने रखा, और इसके लिए पहले से लेबल की गई छवियों की आवश्यकता नहीं थी। टीम के अनुसार, इन नए विकासों का उपयोग सिविल इंजीनियरिंग जैसे क्षेत्रों में किया जा सकता है, जहां कंप्यूटर विज़न तकनीक महत्वपूर्ण है।
छवियों की मरम्मत के लिए मशीन लर्निंग
मशीन लर्निंग का उपयोग अक्सर अस्पष्ट छवियों को ठीक करने के लिए किया जाता है, जैसे बादलों द्वारा अस्पष्ट इमारतों की हवाई छवियां। यह कार्य मैन्युअल रूप से किया जा सकता है, लेकिन इसमें समय लगता है और यह मशीन लर्निंग एल्गोरिदम जितना प्रभावी नहीं है। यहां तक कि पहले से उपलब्ध एल्गोरिदम के लिए भी प्रशिक्षण छवियों के एक बड़े सेट की आवश्यकता होती है, इसलिए तकनीक को और आगे बढ़ाना महत्वपूर्ण है।
ओसाका विश्वविद्यालय के शोधकर्ताओं ने यही किया जब उन्होंने जेनेरिक प्रतिकूल नेटवर्क लागू किया। एक नेटवर्क "जेनरेटिव नेटवर्क" है और यह बादलों के बिना पुनर्निर्मित छवियों का प्रस्ताव करता है। इस नेटवर्क को एक "भेदभावपूर्ण नेटवर्क" के विरुद्ध रखा गया है, जो डिजिटल रूप से मरम्मत की गई तस्वीरों और बादलों के बिना वास्तविक छवियों के बीच अंतर करने के लिए एक दृढ़ तंत्रिका नेटवर्क पर निर्भर करता है।
जैसे-जैसे नेटवर्क इस प्रक्रिया से आगे बढ़ते हैं, वे दोनों तेजी से बेहतर होते जाते हैं, जो उन्हें डिजिटल रूप से मिटाए गए बादलों के साथ अत्यधिक यथार्थवादी छवियां बनाने में सक्षम बनाता है।
कज़ुनोसुके इकेनो पेपर के पहले लेखक हैं।
इकेनो कहते हैं, "विभेदक नेटवर्क को किसी छवि को वास्तविक समझने के लिए 'मूर्ख' बनाने के लिए जेनरेटिव नेटवर्क को प्रशिक्षित करके, हम पुनर्निर्मित छवियां प्राप्त करते हैं जो अधिक आत्मनिर्भर होती हैं।"
सिस्टम का प्रशिक्षण
टीम ने ओपन-सोर्स डेटासेट से ली गई तस्वीरों के साथ 3डी वर्चुअल मॉडल पर भरोसा किया और इसे इनपुट के रूप में इस्तेमाल किया गया। इसने सिस्टम को स्वचालित रूप से डिजिटल "मास्क" उत्पन्न करने में सक्षम बनाया जो क्लाउड पर पुनर्निर्मित इमारतों को कवर करता है।
तोमोहिरो फुकुदा शोध के वरिष्ठ लेखक हैं।
फुकुदा कहते हैं, "यह विधि लेबल किए गए प्रशिक्षण डेटा के बिना क्षेत्रों में इमारतों का पता लगाना संभव बनाती है।"
प्रशिक्षित मॉडल 0.651 के "इंटरसेक्शन ओवर यूनियन" मान वाली इमारतों का पता लगाने में सक्षम था। यह मान इस बात का माप है कि पुनर्निर्मित क्षेत्र वास्तविक क्षेत्र से कितना सटीक रूप से मेल खाता है।
टीम के अनुसार, यह विधि अस्पष्ट छवियों वाले अन्य डेटासेट की गुणवत्ता में सुधार कर सकती है, बस इसे विस्तारित करने की आवश्यकता है। इसमें स्वास्थ्य देखभाल जैसे विभिन्न क्षेत्रों की छवियां शामिल हो सकती हैं, जहां इसका उपयोग चिकित्सा इमेजिंग को बेहतर बनाने के लिए किया जा सकता है।