कृत्रिम बुद्धिमत्ता

योलोव8 का अनपैकिंग: अल्ट्रालिटिक्स की वायरल कंप्यूटर विजन मास्टरपीस

प्रकाशित 13 जनवरी 2024

अपडेट किया गया 22 मई 2026

Haziqa Sajid

अब तक, कंप्यूटर विजन मॉडल का उपयोग करके छवियों में वस्तु का पता लगाने में कुछ सेकंड की देरी के कारण एक बड़ा रोडब्लॉक था, जो प्रोसेसिंग समय के कारण था। यह देरी स्वायत्त ड्राइविंग जैसे उपयोग के मामलों में व्यावहारिक अपनाने में बाधा उत्पन्न करती थी। हालांकि, अल्ट्रालिटिक्स द्वारा योलोव8 कंप्यूटर विजन मॉडल की रिलीज़ ने प्रोसेसिंग देरी को तोड़ दिया है। नया मॉडल असाधारण सटीकता और गति के साथ वास्तविक समय में वस्तुओं का पता लगा सकता है, जिससे यह कंप्यूटर विजन स्पेस में लोकप्रिय हो गया है।

यह लेख योलोव8, इसकी क्षमताओं और अपने खुद के मॉडल को फ़ाइन-ट्यून और बनाने के लिए इसके ओपन-सोर्स गिटहब रिपॉजिटरी के माध्यम से जानकारी देता है।

योलोव8 की व्याख्या

YOLO (You Only Live Once) एक लोकप्रिय कंप्यूटर विजन मॉडल है जो छवियों में वस्तुओं का पता लगाने और खंडित करने में सक्षम है। मॉडल को कई अद्यतन मिले हैं, जिनमें योलोव8 8वीं संस्करण है।

जैसा कि यह खड़ा है, योलोव8 पिछले संस्करणों की क्षमताओं पर बनाता है और नए शक्तिशाली सुविधाओं और सुधारों को पेश करता है। यह छवि और वीडियो डेटा में वास्तविक समय में वस्तुओं का पता लगाने की अनुमति देता है जिसमें सुधारित सटीकता और सटीकता होती है।

व1 से व8 तक: एक संक्षिप्त इतिहास

Yolov1: 2015 में जारी किया गया, योलो का पहला संस्करण एक एकल-चरण वस्तु का पता लगाने वाला मॉडल के रूप में पेश किया गया था। इसमें मॉडल को पूरी छवि पढ़ने और एक मूल्यांकन में प्रत्येक बाउंडिंग बॉक्स की भविष्यवाणी करने की सुविधा शामिल थी।

Yolov2: अगला संस्करण, 2016 में जारी किया गया, पास्कल वโอसी और कोको जैसे बेंचमार्क पर शीर्ष प्रदर्शन प्रस्तुत किया और उच्च गति (67-40 एफपीएस) पर संचालित होता है। यह 9000 से अधिक वस्तु वर्गों का पता लगा सकता है, यहां तक कि सीमित विशिष्ट पता लगाने वाले डेटा के साथ भी।

Yolov3: 2018 में लॉन्च किया गया, योलोव3 में नए सुविधाएं शामिल थीं जैसे कि एक अधिक प्रभावी बैकबोन नेटवर्क, मल्टीपल एंकर, और स्पेशल पाइरामिड पूलिंग के लिए मल्टी-स्केल फीचर एक्सट्रैक्शन।

Yolov4: योलोव4 के 2020 में रिलीज़ होने के साथ, नए मोज़ेक डेटा ऑगमेंटेशन तकनीक को पेश किया गया, जो बेहतर प्रशिक्षण क्षमता प्रदान करता है।

Yolov5: 2021 में रिलीज़ हुई, योलोव5 में शक्तिशाली नए सुविधाएं जोड़ी गईं, जिनमें हाइपरपैरामीटर ऑप्टिमाइजेशन और एकीकृत प्रयोग ट्रैकिंग शामिल हैं।

Yolov6: 2022 में रिलीज़ होने के साथ, मॉडल को ओपन-सोर्स किया गया ताकि समुदाय-निर्देशित विकास को बढ़ावा मिल सके। नए सुविधाएं पेश की गईं, जिनमें एक नई स्व-ज्ञान सтрैटजी और एंकर-एडेड ट्रेनिंग (एएटी) स्ट्रैटजी शामिल हैं।

Yolov7:同 वर्ष 2022 में रिलीज़ हुई, योलोव7 ने मौजूदा मॉडल को गति और सटीकता में सुधार किया और उस समय रिलीज़ होने पर यह सबसे तेज़ वस्तु-पता लगाने वाला मॉडल था।

योलोव8 को क्या अलग बनाता है?

Image showing vehicle detection

योलोव8 की असाधारण सटीकता और उच्च गति इसे पिछले संस्करणों से अलग बनाती है। यह एक महत्वपूर्ण उपलब्धि है क्योंकि वस्तुओं का पता लगाना अब वास्तविक समय में किया जा सकता है बिना किसी देरी के।

लेकिन इसके अलावा, योलोव8 में शक्तिशाली सुविधाएं हैं जिनमें शामिल हैं:

कस्टमाइज़बल आर्किटेक्चर: योलोव8 एक लचीली आर्किटेक्चर प्रदान करता है जिसे डेवलपर्स अपनी विशिष्ट आवश्यकताओं के अनुसार अनुकूलित कर सकते हैं।
अनुकूल प्रशिक्षण: योलोव8 की नई अनुकूल प्रशिक्षण क्षमताएं, जैसे कि प्रशिक्षण के दौरान नुकसान कार्य संतुलन और तकनीकें, सीखने की दर में सुधार करती हैं। एडम जैसे तकनीकों का उपयोग बेहतर सटीकता, तेज़ अभिसरण, और समग्र बेहतर मॉडल प्रदर्शन में योगदान करता है।
उन्नत छवि विश्लेषण: नए सेमांटिक सेगमेंटेशन और वर्ग भविष्यवाणी क्षमताओं के माध्यम से, मॉडल वस्तुओं के बीच संबंधों के अलावा गतिविधियों, रंग, बनावट का पता लगा सकता है।
डेटा ऑगमेंटेशन: नए डेटा ऑगमेंटेशन तकनीकें वास्तविक दुनिया की वस्तु का पता लगाने की स्थितियों में छवि भिन्नताओं जैसे कम रिज़ॉल्यूशन, ऑक्लूज़न आदि से निपटने में मदद करती हैं।
बैकबोन समर्थन: योलोव8 में कई बैकबोन के लिए समर्थन है, जिनमें सीएसपीडार्कनेट (डिफ़ॉल्ट बैकबोन), एफिसिएन्टनेट (लाइटवेट बैकबोन), और रेसनेट (क्लासिक बैकबोन) शामिल हैं, जिन्हें उपयोगकर्ता चुन सकते हैं।

उपयोगकर्ता सीएसपीडार्कनेट53 को किसी अन्य सीएनएन आर्किटेक्चर से बदलकर बैकबोन को अनुकूलित कर सकते हैं जो योलोव8 के इनपुट और आउटपुट आयामों के साथ संगत है।

योलोव8 को प्रशिक्षित और फ़ाइन-ट्यून करना

योलोव8 मॉडल को या तो कुछ उपयोग के मामलों के लिए फ़ाइन-ट्यून किया जा सकता है या पूरी तरह से शुरू से प्रशिक्षित किया जा सकता है ताकि एक विशेष मॉडल बनाया जा सके। प्रशिक्षण प्रक्रियाओं के बारे में अधिक जानकारी आधिकारिक दस्तावेज़ में पाई जा सकती है।

आइए देखें कि आप दोनों ऑपरेशन कैसे कर सकते हैं।

कस्टम डेटासेट के साथ योलोव8 को फ़ाइन-ट्यून करना

फ़ाइन-ट्यूनिंग ऑपरेशन एक मौजूदा मॉडल को लोड करता है और इसके डिफ़ॉल्ट वजन को प्रशिक्षण के लिए शुरुआती बिंदु के रूप में उपयोग करता है।直観 की बात के रूप में, मॉडल अपने सभी पिछले ज्ञान को याद रखता है, और फ़ाइन-ट्यूनिंग ऑपरेशन नए ज्ञान को जोड़ता है जो वजन को ट्वीक करके करता है।

योलोव8 मॉडल को पाइथन कोड के माध्यम से या कमांड लाइन इंटरफ़ेस (सीएलआई) के माध्यम से फ़ाइन-ट्यून किया जा सकता है।

1. पाइथन का उपयोग करके योलोव8 मॉडल को फ़ाइन-ट्यून करना

शुरू करने के लिए, अपने कोड में अल्ट्रालिटिक्स पैकेज आयात करें। फिर, निम्नलिखित कोड का उपयोग करके प्रशिक्षित करने के लिए कस्टम मॉडल लोड करें:

सबसे पहले, आधिकारिक वितरण से अल्ट्रालिटिक्स लाइब्रेरी स्थापित करें।

# अल्ट्रालिटिक्स पैकेज को पिपी से स्थापित करें
pip install ultralytics

इसके बाद, निम्नलिखित कोड को एक पाइथन फ़ाइल में निष्पादित करें:

from ultralytics import YOLO

# मॉडल लोड करें
model = YOLO(‘yolov8n.pt’) # प्री-ट्रेन्ड मॉडल लोड करें (प्रशिक्षण के लिए अनुशंसित)

# मॉडल को एमएस कोको डेटासेट पर प्रशिक्षित करें
results = model.train(data=’coco128.yaml’, epochs=100, imgsz=640)

डिफ़ॉल्ट रूप से, कोड कोको डेटासेट का उपयोग करके मॉडल को 100 एपोक्स के लिए प्रशिक्षित करेगा। हालांकि, आप इन सेटिंग्स को एक यामल फ़ाइल में भी कॉन्फ़िगर कर सकते हैं।

एक बार जब आप मॉडल को अपनी सेटिंग्स और डेटा पथ के साथ प्रशिक्षित कर लेते हैं, तो प्रगति की निगरानी करें, मॉडल का परीक्षण करें और इसे फिर से प्रशिक्षित करें जब तक कि आपको वांछित परिणाम न मिल जाएं।

2. सीएलआई का उपयोग करके योलोव8 मॉडल को फ़ाइन-ट्यून करना

मॉडल को सीएलआई का उपयोग करके प्रशिक्षित करने के लिए, निम्नलिखित स्क्रिप्ट को कमांड लाइन में चलाएं:

yolo train model=yolov8n.pt data=coco8.yaml epochs=100 imgsz=640

सीएलआई कमांड प्री-ट्रेन्ड `yolov8n.pt` मॉडल को लोड करता है और इसे `coco8.yaml` फ़ाइल में परिभाषित डेटासेट पर और अधिक प्रशिक्षित करता है।

योलोव8 के साथ अपना खुद का मॉडल बनाना

योलोव8 के साथ एक कस्टम मॉडल बनाने के मूल रूप से दो तरीके हैं:

शुरू से प्रशिक्षण: यह दृष्टिकोण आपको पूर्व-निर्धारित योलोव8 आर्किटेक्चर का उपयोग करने की अनुमति देता है लेकिन किसी भी पूर्व-प्रशिक्षित वजन का उपयोग नहीं करेगा। प्रशिक्षण शुरू से होगा।
कस्टम आर्किटेक्चर: आप डिफ़ॉल्ट योलो आर्किटेक्चर को ट्वीक करते हैं और नए संरचना को शुरू से प्रशिक्षित करते हैं।

दोनों विधियों का कार्यान्वयन समान रहता है। एक योलो मॉडल को शुरू से प्रशिक्षित करने के लिए, निम्नलिखित पाइथन कोड चलाएं:

from ultralytics import YOLO

# मॉडल लोड करें
model = YOLO(‘yolov8n.yaml’) # एक नए मॉडल को यामल से बनाएं

# मॉडल को प्रशिक्षित करें
results = model.train(data=’coco128.yaml’, epochs=100, imgsz=640)

नोटिस कि इस बार, हमने एक `.yaml` फ़ाइल को लोड किया है, न कि एक `.pt` फ़ाइल। यामल फ़ाइल में मॉडल के लिए आर्किटेक्चर जानकारी होती है, और कोई वजन लोड नहीं किया जाता है। प्रशिक्षण कमांड मॉडल को शुरू से प्रशिक्षित करना शुरू कर देगा।

एक कस्टम आर्किटेक्चर को प्रशिक्षित करने के लिए, आपको एक `.yaml` फ़ाइल में कस्टम संरचना को परिभाषित करना होगा, जैसे कि ऊपर दिखाया गया `yolov8n.yaml`। फिर, आप उस फ़ाइल को लोड करें और उसी कोड का उपयोग करके मॉडल को प्रशिक्षित करें जैसा कि ऊपर दिखाया गया है।

कंप्यूटर विजन का उपयोग करके वस्तु का पता लगाने और नवीनतम एआई रुझानों के बारे में अधिक जानने के लिए, unite.ai पर जाएँ।