tunggul YOLOv7: Algoritma Deteksi Objék Paling Canggih? - Ngahiji.AI
Connect with kami

Kacerdasan buatan

YOLOv7: Algoritma Deteksi Objék Paling Canggih?

mm

dimuat

 on

6 Juli 2022 bakal ditandaan salaku landmark dina sajarah AI sabab dina dinten ieu YOLOv7 dileupaskeun. Ti saprak diluncurkeun, YOLOv7 parantos janten topik anu paling panas dina komunitas pamekar Computer Vision, sareng alesan anu leres. YOLOv7 parantos dianggap salaku tonggak penting dina industri deteksi obyék. 

Teu lila saatosna Makalah YOLOv7 diterbitkeun, éta janten modél deteksi bantahan anu paling gancang sareng paling akurat. Tapi kumaha YOLOv7 outcompete nu miheulaan na? Naon ngajadikeun YOLOv7 jadi efisien dina ngajalankeun tugas visi komputer? 

Dina tulisan ieu urang bakal nyobian nganalisis modél YOLOv7, sareng nyobian milarian jawaban naha YOLOv7 ayeuna janten standar industri? Tapi sateuacan urang tiasa ngajawab éta, urang kedah ningali sajarah ringkes deteksi objék. 

Naon Deteksi Objék?

Deteksi objék mangrupikeun cabang dina visi komputer anu ngaidentipikasi sareng mendakan objék dina gambar, atanapi file video. Deteksi obyék mangrupikeun blok wangunan seueur aplikasi kalebet mobil nyetir mandiri, panjagaan anu diawaskeun, bahkan robotika. 

Modél deteksi objék bisa digolongkeun kana dua kategori béda, detéktor single-shot, jeung detéktor multi-shot. 

Real Time Objék Deteksi

Pikeun leres-leres ngartos kumaha jalanna YOLOv7, penting pikeun urang ngartos tujuan utama YOLOv7, "Deteksi Objék Waktu Nyata". Deteksi Objék Waktu Nyata mangrupikeun komponén konci visi komputer modern. Model Deteksi Objék Waktu Nyata nyobian ngaidentipikasi & milarian objék anu dipikaresep sacara real waktos. Modél Deteksi Objék Real Time ngajantenkeun éfisién pikeun pamekar pikeun ngalacak objék anu dipikaresep dina pigura anu gerak sapertos pidéo, atanapi input panjagaan langsung. 

Modél Deteksi Objék Waktu Nyata dina dasarna mangrupikeun léngkah payun ti modél deteksi gambar konvensional. Samentawis anu baheula dianggo pikeun ngalacak objék dina file video, anu terakhir mendakan & ngidentipikasi objék dina pigura anu cicing sapertos gambar. 

Hasilna, model Deteksi Objék Waktu Nyata éfisién pikeun analitik pidéo, kendaraan otonom, cacah obyék, tracking multi-obyek, sareng seueur deui. 

Naon ari YOLO?

YOLO atawa "Anjeun Ngan Tingali Sakali"mangrupakeun kulawarga model deteksi obyék real-time. Konsép YOLO munggaran diwanohkeun dina 2016 ku Joseph Redmon, sareng éta mangrupikeun omongan kota ampir langsung kusabab éta langkung gancang, sareng langkung akurat tibatan algoritma deteksi obyék anu tos aya. Teu lami sateuacan algoritma YOLO janten standar dina industri visi komputer. 

Konsep dasar anu diusulkeun ku algoritma YOLO nyaéta ngagunakeun jaringan neural tungtung-ka-tungtung nganggo kotak wates & probabiliti kelas pikeun ngadamel prediksi sacara real waktos. YOLO éta béda ti modél deteksi objék saméméhna dina harti yén éta diusulkeun pendekatan béda pikeun ngalakukeun deteksi objék ku repurposing classifiers. 

Parobahan dina pendekatan digawé salaku YOLO geura-giru jadi standar industri salaku gap kinerja antara dirina, sarta séjén real time algoritma deteksi objék éta signifikan. Tapi naon sababna YOLO éfisién? 

Lamun dibandingkeun jeung YOLO, algoritma deteksi obyék harita dipaké Region Proposal Networks pikeun ngadeteksi kamungkinan wewengkon dipikaresep. Prosés pangakuan ieu lajeng dipigawé dina unggal wewengkon misah. Hasilna, model ieu mindeng dipigawé sababaraha iterasi dina gambar anu sarua, sarta ku kituna kurangna akurasi, sarta waktu palaksanaan luhur. Di sisi anu sanés, algoritma YOLO nganggo lapisan tunggal anu disambungkeun pinuh pikeun ngalakukeun prediksi sakaligus. 

Kumaha Dupi YOLO Gawé?

Aya tilu léngkah anu ngajelaskeun kumaha algoritma YOLO jalan. 

Reframing Deteksi Objék salaku Masalah Regression Tunggal

nu Algoritma YOLO nyoba reframe deteksi obyék salaku masalah regression tunggal, kaasup piksel gambar, ka probabiliti kelas, sarta koordinat kotak wates. Lantaran kitu, algoritma kedah ningali gambar ngan sakali pikeun ngaduga & maluruh objék target dina gambar. 

Alesan Gambar Global

Saterusna, lamun algoritma YOLO nyieun prediksi, eta alesan gambar global. Beda sareng téknik ngageser dumasar kana usulan daérah, sabab algoritma YOLO ningali gambar lengkep nalika latihan & uji dina set data, sareng tiasa ngodekeun inpormasi kontekstual ngeunaan kelas, sareng kumaha aranjeunna muncul. 

Sateuacan YOLO, Fast R-CNN mangrupikeun salah sahiji algoritma deteksi obyék anu pang populerna anu henteu tiasa ningali kontéks anu langkung ageung dina gambar kusabab éta sering nyalahkeun patch latar tukang dina gambar pikeun objék. Upami dibandingkeun sareng algoritma Fast R-CNN, YOLO 50% langkung akurat lamun datang ka kasalahan tukang. 

Generalizes ngagambarkeun objék

Tungtungna, algoritma YOLO ogé boga tujuan pikeun ngageneralisasi representasi objék dina hiji gambar. Hasilna, nalika algoritma YOLO dijalankeun dina dataset kalawan gambar alam, sarta diuji pikeun hasilna, YOLO outperformed model R-CNN aya ku margin lega. Éta sabab YOLO tiasa digeneralisasikeun pisan, kamungkinan éta ngarecah nalika dilaksanakeun dina input anu teu kaduga atanapi domain énggal éta langsing. 

YOLOv7: Naon Anyar?

Ayeuna urang gaduh pamahaman dasar naon model deteksi obyék real-time, sarta naon algoritma YOLO, éta waktu ngabahas algoritma YOLOv7. 

Ngaoptimalkeun Prosés Pelatihan

Algoritma YOLOv7 henteu ngan ukur nyobian ngaoptimalkeun arsitéktur modél, tapi ogé tujuanana pikeun ngaoptimalkeun prosés pelatihan. Tujuanana ngagunakeun modul & metode optimasi pikeun ningkatkeun akurasi deteksi obyék, nguatkeun biaya latihan, bari ngajaga biaya gangguan. modul optimasi ieu bisa disebut salaku a kantong trainable tina freebies. 

Tugas Label Dipandu Kasar nepi ka Halus

Algoritma YOLOv7 ngarencanakeun ngagunakeun Tugas Label Dipandu Kasar nepi ka Halus anyar tinimbang anu konvensional. Tugas Label dinamis. Éta sababna kalayan ngerjakeun labél dinamis, ngalatih modél nganggo sababaraha lapisan kaluaran nyababkeun sababaraha masalah, anu paling umum nyaéta kumaha cara napelkeun target dinamis pikeun cabang anu béda sareng kaluaranna. 

Model Re-Parameterization

Model ulang parametrization mangrupa konsép penting dina deteksi obyék, sarta pamakéan na umumna dituturkeun ku sababaraha masalah salila latihan. Algoritma YOLOv7 ngarencanakeun ngagunakeun konsép jalur rambatan gradién pikeun nganalisis kawijakan ulang parametrization model lumaku pikeun lapisan béda dina jaringan. 

Manjangkeun sareng Skala Sanyawa

Algoritma YOLOv7 ogé ngenalkeun métode skala nambahan jeung sanyawa pikeun ngamangpaatkeun tur éféktif ngagunakeun parameter & komputasi pikeun deteksi objék real-time. 

YOLOv7 : Gawé Patali

Real Time Objék Deteksi

YOLO ayeuna standar industri, sarta lolobana detéktor obyék real-time nyebarkeun algoritma YOLO, sarta FCOS (Fully Convolutional One-Stage Object-Detection). Hiji kaayaan seni detektor objék real-time biasana mibanda ciri di handap ieu

  • Arsitéktur jaringan anu langkung kuat & langkung gancang. 
  • Hiji métode integrasi fitur éféktif. 
  • Métode deteksi obyék anu akurat. 
  • Hiji fungsi leungitna mantap. 
  • Hiji métode ngerjakeun labél efisien. 
  • Hiji métode latihan efisien. 

Algoritma YOLOv7 henteu nganggo metode diajar & distilasi mandiri anu sering ngabutuhkeun data anu ageung. Sabalikna, algoritma YOLOv7 ngagunakeun metode bag-of-freebies anu tiasa dilatih. 

Model Re-Parameterization

Téhnik re-parameterization modél dianggap salaku téknik ensemble anu ngagabungkeun sababaraha modul komputasi dina tahap interferensi. Téhnik bisa dibagi deui jadi dua kategori, ensemble tingkat modél, jeung ensemble tingkat modul. 

Ayeuna, pikeun meunangkeun modél interferensi ahir, téhnik reparameterisasi tingkat modél ngagunakeun dua prakték. Prakték munggaran ngagunakeun data latihan béda pikeun ngalatih sababaraha model idéntik, lajeng averages beurat model dilatih. Alternatipna, prakték séjén rata-rata beurat model salila iterasi béda. 

Parameterisasi tingkat modul ayeuna-ayeuna janten popularitas anu ageung sabab ngabagi modul kana cabang modul anu béda, atanapi cabang idéntik anu béda salami fase latihan, teras teraskeun ngahijikeun cabang anu béda ieu kana modul anu sarimbag bari gangguan. 

Nanging, téknik paraméterisasi ulang teu tiasa diterapkeun kana sagala jinis arsitéktur. Éta alesan naha éta Algoritma YOLOv7 ngagunakeun téknik parameterisasi modél énggal pikeun ngarancang strategi anu aya hubunganana cocog pikeun arsitéktur béda. 

Skala modél

Skala modél nyaéta prosés skala kaluhur atanapi kahandap model anu tos aya supados pas dina alat komputasi anu béda. Skala modél umumna ngagunakeun sababaraha faktor sapertos jumlah lapisan (jerona), ukuran gambar input(resolusi), jumlah piramida fitur (panggung), jeung jumlah saluran (rubak). Faktor-faktor ieu maénkeun peran anu penting dina mastikeun perdagangan anu saimbang pikeun parameter jaringan, kacepetan interferensi, komputasi, sareng akurasi modél. 

Salah sahiji metodeu skala anu paling sering dianggo nyaéta NAS atanapi Network Arsitéktur Search anu otomatis milarian faktor skala anu cocog tina mesin pencari tanpa aya aturan anu rumit. Kelemahan utama ngagunakeun NAS nyaéta yén éta mangrupikeun pendekatan anu mahal pikeun milarian faktor skala anu cocog. 

Ampir unggal model model ulang parameterization nganalisa faktor skala individu & unik sacara mandiri, komo deui ngaoptimalkeun faktor ieu sacara mandiri. Éta sabab arsitéktur NAS tiasa dianggo sareng faktor skala anu henteu aya hubunganana. 

Eta sia noting yén model dumasar-concatenation kawas VoVNet or DenseNet ngarobah lebar input sababaraha lapisan nalika jero model diskalakeun. YOLOv7 dianggo dina arsitéktur dumasar concatenation diusulkeun, sarta ku kituna ngagunakeun métode skala sanyawa.

Sosok didadarkeun di luhur compares nu jaringan aggregation lapisan efisien nambahan (E-ELAN) model béda. Metodeu E-ELAN anu diusulkeun ngajaga jalur transmisi gradién tina arsitéktur asli, tapi tujuanana pikeun ningkatkeun kardinalitas fitur tambahan nganggo konvolusi grup. Prosésna tiasa ningkatkeun pitur anu diajarkeun ku peta anu béda, sareng tiasa ngajantenkeun pamakean itungan & parameter langkung éfisién. 

YOLOv7 Arsitéktur

Modél YOLOv7 ngagunakeun modél YOLOv4, YOLO-R, sareng Scaled YOLOv4 salaku dasarna. YOLOv7 mangrupikeun hasil tina percobaan anu dilakukeun dina modél ieu pikeun ningkatkeun hasil, sareng ngajantenkeun modél langkung akurat. 

Ngalegaan Jaringan Aggregation Lapisan Cekap atanapi E-ELAN

E-ELAN mangrupikeun blok wangunan dasar tina modél YOLOv7, sareng éta diturunkeun tina modél anu parantos aya dina efisiensi jaringan, utamina ELAN. 

Pertimbangan utama nalika ngarancang arsitéktur efisien nyaéta jumlah parameter, kapadetan komputasi, sareng jumlah komputasi. Modél séjén ogé nganggap faktor-faktor sapertos pangaruh rasio saluran input/output, cabang dina jaringan arsitéktur, laju gangguan jaringan, jumlah elemen dina tensor jaringan konvolusional, sareng seueur deui. 

nu CSPVoNet model teu ukur mertimbangkeun parameter di luhur-disebutkeun, tapi ogé nganalisa jalur gradién pikeun neuleuman fitur leuwih beragam ku sangkan beurat lapisan béda. Pendekatan ieu ngamungkinkeun interferensi janten langkung gancang, sareng akurat. The MOMENTUM Arsitéktur boga tujuan pikeun ngarancang jaringan anu épisién pikeun ngontrol jalur gradién anu pangpanjangna pondok supados jaringan tiasa langkung efektif dina diajar, sareng konvergen. 

ELAN parantos ngahontal tahap anu stabil henteu paduli jumlah tumpukan blok komputasi, sareng panjang jalur gradién. Kaayaan stabil tiasa musnah upami blok komputasi ditumpuk tanpa wates, sareng tingkat panggunaan parameter bakal ngirangan. The arsitéktur E-ELAN anu diusulkeun tiasa ngabéréskeun masalah sabab ngagunakeun ékspansi, shuffling, sareng ngahijikeun kardinalitas. pikeun terus ningkatkeun kamampuan diajar jaringan bari ngajaga jalur gradién asli. 

Salaku tambahan, nalika ngabandingkeun arsitektur E-ELAN sareng ELAN, hijina bédana aya dina blok komputasi, sedengkeun arsitéktur lapisan transisi teu robah. 

E-ELAN ngusulkeun pikeun ngalegaan kardinalitas blok komputasi, sareng ngalegaan saluran ku ngagunakeun konvolusi grup. Peta fitur lajeng bakal diitung, sarta shuffled kana grup nurutkeun parameter grup, lajeng bakal concatenated babarengan. Jumlah saluran dina unggal grup bakal tetep sarua jeung dina arsitektur aslina. Anu pamungkas, grup peta fitur bakal ditambahkeun pikeun ngalakukeun cardinality. 

Skala Model pikeun Concatenation Dumasar Models

Skala model mantuan dina nyaluyukeun atribut model nu mantuan dina ngahasilkeun model sakumaha per sarat, sarta skala béda pikeun minuhan speeds interferensi béda. 

Angka éta nyarioskeun ngeunaan skala modél pikeun modél dumasar-concatenation anu béda. Sakumaha anjeun tiasa tingali dina gambar (a) sareng (b), lebar kaluaran blok komputasi ningkat kalayan paningkatan skala jero modél. Hasilna, lebar input tina lapisan transmisi ngaronjat. Upami metodeu ieu dilaksanakeun dina arsitéktur dumasar-concatenation, prosés skala dilaksanakeun sacara jero, sareng éta digambarkeun dina gambar (c). 

Ku kituna bisa dicindekkeun yén teu mungkin pikeun nganalisis faktor skala sacara mandiri pikeun modél dumasar-concatenation, sareng aranjeunna kedah dipertimbangkeun atanapi dianalisis babarengan. Ku kituna, pikeun model dumasar concatenation, Éta cocog pikeun nganggo metode skala modél sanyawa anu cocog. Salaku tambahan, nalika faktor jero diskalakeun, saluran kaluaran blok ogé kedah diskalakeun. 

Kantong Trainable tina Freebies 

Kantong gratis mangrupikeun istilah anu dianggo ku pamekar pikeun ngajelaskeun susunan métode atawa téhnik nu bisa ngarobah strategi latihan atawa biaya dina usaha naekeun akurasi model. Janten naon kantong gratis anu tiasa dilatih ieu di YOLOv7? Hayu urang tingali. 

Rencanana ulang Parameterized Convolution

Algoritma YOLOv7 ngagunakeun jalur rambatan aliran gradién pikeun nangtukeun kumaha idéal ngagabungkeun jaringan jeung convolution ulang parameterized. Pendekatan ieu ku YOLov7 mangrupikeun usaha pikeun ngalawan Algoritma RepConv yén sanajan geus dipigawé serenely dina model VGG, ngalakukeun kirang lamun dilarapkeun langsung ka model DenseNet na ResNet. 

Pikeun ngaidentipikasi sambungan dina lapisan convolutional, éta Algoritma RepConv ngagabungkeun 3 × 3 konvolusi, sareng 1 × 1 konvolusi. Lamun urang analisa algoritma, kinerja na, sarta arsitéktur urang bakal niténan yén RepConv ngancurkeun concatenation di DenseNet, sarta residual di ResNet

Gambar di luhur depicts model ulang parameterized rencanana. Ieu bisa ditempo yén algoritma YOLov7 kapanggih yén lapisan dina jaringan kalawan concatenation atawa sambungan residual teu kudu boga sambungan identitas dina algoritma RepConv. Hasilna, éta tiasa ditampi pikeun ngalih sareng RepConvN tanpa sambungan identitas. 

Kasar pikeun Bantu jeung Denda pikeun Lead Loss

Pangawasan jero mangrupakeun cabang dina elmu komputer anu mindeng manggihan pamakéan na dina prosés latihan jaringan jero. Prinsip dasar pangawasan jero nyaéta yén éta nambihan sirah tambahan tambahan dina lapisan tengah jaringan sapanjang kalawan beurat jaringan deet kalawan leungitna asisten salaku pituduh na. Algoritma YOLOv7 ngarujuk kana kapala anu tanggung jawab pikeun kaluaran ahir salaku kapala kalungguhan, sareng kapala bantu nyaéta kapala anu ngabantosan dina latihan. 

Pindah sapanjang, YOLOv7 ngagunakeun métode béda pikeun ngerjakeun labél. Conventionally, ngerjakeun labél geus dipaké pikeun ngahasilkeun labél ku ngarujuk langsung ka bebeneran taneuh, sarta dina dasar hiji set tina aturan. Nanging, dina taun-taun ayeuna, distribusi, sareng kualitas input prediksi maénkeun peran anu penting pikeun ngahasilkeun labél anu dipercaya. YOLOv7 ngahasilkeun labél lemes obyék ku ngagunakeun prediksi kotak wates sareng bebeneran taneuh. 

Salajengna, metode tugas labél anyar tina algoritma YOLOv7 ngagunakeun prediksi kapala kalungguhan pikeun nungtun kalungguhan sareng kapala bantu. Métode ngerjakeun labél gaduh dua strategi anu diusulkeun. 

Kalungguhan Kepala Dipandu Label Assigner

strategi ngajadikeun itungan dina dasar hasil prediksi lulugu urang, sarta bebeneran taneuh, lajeng ngagunakeun optimasi pikeun ngahasilkeun labél lemes. labél lemes ieu lajeng dipaké salaku modél latihan pikeun duanana sirah kalungguhan, sarta sirah bantu. 

Strategina dianggo dina asumsi yén kusabab kapala kalungguhan gaduh kamampuan diajar anu langkung ageung, labél anu dibangkitkeun kedah langkung representatif, sareng ngahubungkeun antara sumber sareng udagan. 

Kasar-ka-Halus Kepala Dipandu Label Assigner

strategi ieu ogé nyieun itungan dina dasar hasil prediksi sirah kalungguhan urang, jeung bebeneran taneuh, lajeng ngagunakeun optimasi pikeun ngahasilkeun labél lemes. Nanging, aya bédana konci. Dina strategi ieu, aya dua sét labél lemes, tingkat kasar, jeung labél rupa. 

Labél kasar dibangkitkeun ku cara ngémutan konstrain tina sampel positip

prosés ngerjakeun nu Ngaruwat leuwih grids salaku target positif. Éta dilakukeun pikeun ngahindarkeun résiko kaleungitan inpormasi kusabab kakuatan diajar anu langkung lemah sirah bantu. 

Angka di luhur ngécéskeun panggunaan kantong gratis anu tiasa dilatih dina algoritma YOLOv7. Éta ngagambarkeun kasar pikeun sirah bantu, sareng rupa pikeun sirah kalungguhan. Lamun urang ngabandingkeun Modél kalawan Kepala bantu (b) jeung Modél Normal (a), urang bakal niténan yén schema dina (b) boga sirah bantu, bari teu di (a). 

Gambar (c) ngagambarkeun assigner labél bebas umum sedengkeun angka (d) & angka (e) masing-masing ngagambarkeun Assigner Dipandu Lead, jeung Assigner Dipandu Lead-toFine anu digunakeun ku YOLOv7.  

Kantong Trainable séjén tina Freebies

Salian anu didadarkeun di luhur, algoritma YOLOv7 nganggo kantong tambahan gratis, sanaos aranjeunna henteu diusulkeun ku aranjeunna. Maranéhna nyaéta

  • Normalisasi angkatan dina Téknologi Konv-Bn-Aktivasi: Strategi ieu dipaké pikeun nyambungkeun lapisan convolutional langsung ka lapisan normalisasi bets. 
  • Pangaweruh implisit dina YOLOR: YOLOv7 ngagabungkeun strategi sareng peta fitur Convolutional. 
  • Modél EMA: Modél EMA dipaké salaku modél rujukan ahir dina YOLOv7 najan pamakéan utamana nyaéta pikeun dipaké dina métode guru mean. 

YOLOv7 : Ékspérimén

Setup ékspérimén

Algoritma YOLOv7 ngagunakeun Dataset Microsoft COCO pikeun latihan sareng validasi model deteksi obyék maranéhanana, sarta henteu sakabéh percobaan ieu ngagunakeun modél pre-dilatih. Pamekar ngagunakeun set data karéta 2017 pikeun latihan, sareng nganggo set data validasi 2017 pikeun milih hyperparameters. Tungtungna, kinerja hasil deteksi obyék YOLOv7 dibandingkeun jeung kaayaan tina algoritma seni pikeun deteksi obyék. 

Pamekar dirancang model dasar pikeun GPU tepi (YOLOv7-leutik), GPU normal (YOLOv7), sareng GPU awan (YOLOv7-W6). Saterusna, algoritma YOLOv7 ogé ngagunakeun modél dasar pikeun skala model sakumaha per syarat jasa béda, sarta meunang model béda. Pikeun algoritma YOLOv7 tumpukan skala dipigawé dina beuheung, sarta sanyawa diusulkeun dipaké pikeun upscale jero & rubak model. 

Garis dasar

Algoritma YOLOv7 ngagunakeun model YOLO saméméhna, sarta algoritma deteksi obyék YOLOR salaku dasarna.

Angka di luhur ngabandingkeun garis dasar modél YOLOv7 sareng modél deteksi obyék anu sanés, sareng hasilna cukup jelas. Lamun dibandingkeun jeung Algoritma YOLOv4, YOLOv7 teu ngan ngagunakeun 75% kirang parameter, tapi ogé ngagunakeun 15% kirang komputasi, sarta boga 0.4% akurasi luhur. 

Babandingan jeung State of the Art Objék Detektor Modél

Angka di luhur nunjukkeun hasil nalika YOLOv7 dibandingkeun sareng modél deteksi objék seni pikeun mobile & GPU umum. Ieu tiasa dititénan yén métode anu diusulkeun ku algoritma YOLOv7 gaduh skor trade-off akurasi-gancang anu pangsaéna. 

Studi Ablasi: Usul Metode Skala Sanyawa

Angka anu dipidangkeun di luhur ngabandingkeun hasil tina ngagunakeun strategi anu béda pikeun skala modél. Strategi skala dina modél YOLOv7 ngagedekeun jero blok komputasi ku 1.5 kali, sareng skala lebar ku 1.25 kali. 

Lamun dibandingkeun jeung model nu ukur skala nepi ka jero, model YOLOv7 kinerja hadé ku 0.5% bari ngagunakeun kirang parameter, sarta kakuatan komputasi. Di sisi anu sanés, upami dibandingkeun sareng modél anu ngan ukur ngagedekeun jerona, akurasi YOLOv7 ningkat ku 0.2%, tapi jumlah parameter kedah diskalakeun ku 2.9%, sareng komputasi ku 1.2%. 

Diusulkeun rencanana ulang Parameterized Modél

Pikeun pariksa umumna model ulang parameterized na, éta Algoritma YOLOv7 ngagunakeun éta dumasar kana sésa-sésa, sareng modél dumasar-concatenation pikeun verifikasi. Pikeun prosés verifikasi, algoritma YOLOv7 ngagunakeun 3-tumpuk ELAN pikeun modél dumasar-concatenation, sarta CSPDarknet pikeun modél basis residual. 

Pikeun modél dumasar-concatenation, algoritma ngagantikeun 3 × 3 lapisan convolutional dina 3-tumpuk ELAN kalawan RepConv. Gambar di handap nembongkeun konfigurasi detil rupa Planned RepConv, sareng 3-tumpuk ELAN. 

Saterusna, nalika nungkulan model basis residual, algoritma YOLOv7 ngagunakeun blok poék dibalikkeun sabab blok poék aslina teu boga blok konvolusi 3 × 3. Gambar di handap ieu nunjukkeun arsitéktur Reversed CSPDarknet anu ngabalikeun posisi 3 × 3 sareng lapisan convolutional 1 × 1. 

Diajukeun Karugian Asisten pikeun Kepala Bantu

Pikeun leungitna asisten pikeun sirah bantu, model YOLOv7 ngabandingkeun tugas labél bebas pikeun sirah bantu & métode sirah kalungguhan. 

Gambar di luhur ngandung hasil ulikan ngeunaan sirah bantu diusulkeun. Ieu bisa ditempo yén kinerja sakabéh modél naek kalawan paningkatan dina leungitna asisten. Salajengna, tugas labél dipandu kalungguhan anu diajukeun ku modél YOLOv7 ngalaksanakeun langkung saé tibatan strategi ngerjakeun kalungguhan bebas. 

YOLOv7 Hasilna

Dumasar kana percobaan di luhur, ieu hasil tina kinerja YOLov7 lamun dibandingkeun jeung algoritma deteksi objék séjén. 

Angka di luhur ngabandingkeun modél YOLOv7 sareng algoritma deteksi obyék anu sanés, sareng tiasa ditingali sacara jelas yén YOLOv7 ngaleuwihan modél deteksi bantahan sanés dina hal Rata Precision (AP) v / gangguan bets s

Saterusna, inohong di handap ngabandingkeun kinerja YOLOv7 v / s séjén real time algoritma deteksi bantahan. Sakali deui, YOLOv7 ngagentos model anu sanés dina hal kinerja, akurasi, sareng efisiensi. 

Ieu sababaraha observasi tambahan tina hasil & pagelaran YOLOv7. 

  1. YOLOv7-Tiny mangrupikeun modél pangleutikna dina kulawarga YOLO, kalayan langkung ti 6 juta parameter. YOLOv7-Tiny boga Precision Rata-rata 35.2%, sarta outperforms model YOLOv4-Tiny kalawan parameter comparable. 
  2. Modél YOLOv7 gaduh langkung ti 37 juta parameter, sareng éta langkung saé tibatan modél kalayan parameter anu langkung luhur sapertos YOLov4. 
  3. Modél YOLOv7 gaduh peta sareng laju FPS pangluhurna dina rentang 5 dugi ka 160 FPS. 

kacindekan

YOLO atanapi You Only Look Once mangrupikeun kaayaan modél deteksi objék seni dina visi komputer modern. Algoritma YOLO dipikanyaho pikeun akurasi anu luhur, sareng efisiensi, sareng salaku hasilna, éta mendakan aplikasi anu éksténsif dina industri deteksi objék sacara real-time. Ti saprak algoritma YOLO munggaran diwanohkeun deui dina 2016, percobaan parantos ngamungkinkeun para pamekar ningkatkeun modél sacara terus-terusan. 

Modél YOLOv7 mangrupikeun tambahan panganyarna dina kulawarga YOLO, sareng éta algoritma YOLO anu paling kuat dugi ka ayeuna. Dina tulisan ieu, kami parantos nyarioskeun dasar-dasar YOLOv7, sareng nyobian ngajelaskeun naon anu ngajantenkeun YOLOv7 langkung efisien. 

"Insinyur ku profési, panulis ku haté". Kunal mangrupikeun panulis téknis anu mikanyaah sareng pamahaman anu jero ngeunaan AI sareng ML, didédikasikeun pikeun nyederhanakeun konsép anu kompleks dina widang ieu ngaliwatan dokuméntasi anu pikaresepeun sareng informatif.