Kecerdasan buatan

YOLOv7: Algoritma Deteksi Objek Paling Maju?

Diterbitkan 24 Juli 2023

Diperbarui 23 Mei 2026

Oleh

Kunal Kejriwal

6 Juli 2022 akan menjadi hari bersejarah dalam sejarah AI karena pada hari itu YOLOv7 dirilis. Sejak peluncurannya, YOLOv7 telah menjadi topik hangat di komunitas pengembang Computer Vision, dan dengan alasan yang tepat. YOLOv7 sudah dianggap sebagai tonggak dalam industri deteksi objek.

Segera setelah makalah YOLOv7 dipublikasikan, itu muncul sebagai model deteksi objek waktu nyata tercepat dan paling akurat. Tapi bagaimana YOLOv7 mengungguli pendahulunya? Apa yang membuat YOLOv7 sangat efisien dalam melakukan tugas penglihatan komputer?

Dalam artikel ini, kita akan mencoba menganalisis model YOLOv7 dan mencoba menemukan jawaban mengapa YOLOv7 sekarang menjadi standar industri? Tapi sebelum kita bisa menjawab itu, kita harus melihat sejarah singkat deteksi objek.

Apa itu Deteksi Objek?

Deteksi objek adalah cabang dalam penglihatan komputer yang mengidentifikasi dan melokalisasi objek dalam gambar atau file video. Deteksi objek adalah blok bangunan dari berbagai aplikasi termasuk mobil otonom, pengawasan, dan bahkan robotika.

Model deteksi objek dapat diklasifikasikan menjadi dua kategori yang berbeda, detektor tembakan tunggal, dan detektor tembakan banyak.

Deteksi Objek Waktu Nyata

Untuk memahami bagaimana YOLOv7 bekerja, sangat penting bagi kita untuk memahami tujuan utama YOLOv7, “Deteksi Objek Waktu Nyata”. Deteksi objek waktu nyata adalah komponen kunci dalam penglihatan komputer modern. Model deteksi objek waktu nyata mencoba mengidentifikasi dan melokalisasi objek yang menarik dalam waktu nyata. Model deteksi objek waktu nyata membuatnya sangat efisien bagi pengembang untuk melacak objek yang menarik dalam bingkai yang bergerak seperti video atau input pengawasan langsung.

Model deteksi objek waktu nyata pada dasarnya adalah langkah lebih maju dari model deteksi gambar konvensional. Sementara yang pertama digunakan untuk melacak objek dalam file video, yang terakhir melokalisasi dan mengidentifikasi objek dalam bingkai yang diam seperti gambar.

Sebagai hasilnya, model deteksi objek waktu nyata sangat efisien untuk analisis video, kendaraan otonom, penghitungan objek, pelacakan objek banyak, dan banyak lagi.

Apa itu YOLO?

YOLO atau “Kamu Hanya Melihat Sekali” adalah keluarga model deteksi objek waktu nyata. Konsep YOLO pertama kali diperkenalkan pada tahun 2016 oleh Joseph Redmon, dan itu menjadi pembicaraan kota hampir seketika karena itu jauh lebih cepat dan lebih akurat daripada algoritma deteksi objek yang ada. Tidak lama sebelum algoritma YOLO menjadi standar dalam industri penglihatan komputer.

Konsep dasar yang diusulkan oleh algoritma YOLO adalah menggunakan jaringan saraf end-to-end yang menggunakan kotak pembatas dan kemungkinan kelas untuk membuat prediksi dalam waktu nyata. YOLO berbeda dari model deteksi objek sebelumnya dalam hal itu mengusulkan pendekatan yang berbeda untuk melakukan deteksi objek dengan memanfaatkan kembali pengklasifikasi.

Perubahan pendekatan itu berhasil karena YOLO segera menjadi standar industri karena kesenjangan kinerja antara dirinya dan algoritma deteksi objek waktu nyata lainnya sangat signifikan. Tapi apa yang membuat YOLO sangat efisien?

Ketika dibandingkan dengan YOLO, algoritma deteksi objek sebelumnya menggunakan Jaringan Proposal Wilayah untuk mendeteksi wilayah yang mungkin menarik. Proses pengenalan kemudian dilakukan pada setiap wilayah secara terpisah. Sebagai hasilnya, model-model ini sering melakukan beberapa iterasi pada gambar yang sama, dan karenanya kekurangan akurasi dan waktu eksekusi yang lebih tinggi. Di sisi lain, algoritma YOLO menggunakan lapisan yang sepenuhnya terhubung untuk melakukan prediksi sekaligus.

Bagaimana YOLO Bekerja?

Ada tiga langkah yang menjelaskan bagaimana algoritma YOLO bekerja.

Membingkai Deteksi Objek sebagai Satu Masalah Regresi

Algoritma YOLO mencoba membingkai deteksi objek sebagai satu masalah regresi, termasuk piksel gambar, hingga kemungkinan kelas, dan koordinat kotak pembatas. Oleh karena itu, algoritma harus melihat gambar hanya sekali untuk memprediksi dan melokalisasi objek target dalam gambar.

Alasan Gambar Secara Global

Selanjutnya, karena algoritma YOLO membuat prediksi, itu mempertimbangkan gambar secara global. Ini berbeda dari teknik berbasis proposal wilayah dan teknik geser karena algoritma YOLO melihat gambar lengkap selama pelatihan dan pengujian pada dataset, dan dapat mengkodekan informasi kontekstual tentang kelas dan bagaimana mereka muncul.

Sebelum YOLO, Fast R-CNN adalah salah satu algoritma deteksi objek paling populer yang tidak bisa melihat konteks yang lebih besar dalam gambar karena itu menggunakan latar belakang patch dalam gambar untuk objek. Ketika dibandingkan dengan algoritma Fast R-CNN, YOLO 50% lebih akurat ketika datang ke kesalahan latar belakang.

Memgeneralisasi Representasi Objek

Terakhir, algoritma YOLO juga bertujuan untuk memgeneralisasi representasi objek dalam gambar. Sebagai hasilnya, ketika algoritma YOLO dijalankan pada dataset dengan gambar alami dan diuji untuk hasilnya, YOLO mengungguli model R-CNN yang ada dengan margin yang luas. Ini karena YOLO sangat dapat digeneralisasi, kemungkinan itu akan rusak ketika diimplementasikan pada input yang tidak terduga atau domain baru sangat kecil.

YOLOv7: Apa yang Baru?

Sekarang kita memiliki pemahaman dasar tentang apa itu model deteksi objek waktu nyata dan apa itu algoritma YOLO, saatnya untuk membahas algoritma YOLOv7.

Mengoptimalkan Proses Pelatihan

Algoritma YOLOv7 tidak hanya mencoba mengoptimalkan arsitektur model, tetapi juga bertujuan untuk mengoptimalkan proses pelatihan. Ini bertujuan untuk menggunakan modul dan metode optimasi untuk meningkatkan akurasi deteksi objek, memperkuat biaya pelatihan, sambil mempertahankan biaya interferensi. Modul optimasi ini dapat disebut sebagai tas yang dapat dilatih gratis.

Coarse to Fine Lead Guided Label Assignment

Algoritma YOLOv7 berencana untuk menggunakan Coarse to Fine Lead Guided Label Assignment baru sebagai gantinya Penugasan Label Dinamis. Ini karena dengan penugasan label dinamis, melatih model dengan beberapa lapisan output menyebabkan beberapa masalah, yang paling umum adalah bagaimana menugaskan target dinamis untuk cabang yang berbeda dan outputnya.

Re-Parameterisasi Model

Re-parameterisasi model adalah konsep penting dalam deteksi objek, dan penggunaannya umumnya diikuti dengan beberapa masalah selama pelatihan. Algoritma YOLOv7 berencana untuk menggunakan konsep jalur propagasi gradien untuk menganalisis kebijakan re-parameterisasi model yang berlaku untuk lapisan yang berbeda dalam jaringan.

Perluasan dan Penggandaan Skala

Algoritma YOLOv7 juga memperkenalkan metode perluasan dan penggandaan skala untuk memanfaatkan dan menggunakan parameter dan perhitungan untuk deteksi objek waktu nyata.

YOLOv7: Karya Terkait

Deteksi Objek Waktu Nyata

YOLO saat ini adalah standar industri, dan sebagian besar detektor objek waktu nyata menggunakan algoritma YOLO dan FCOS (Fully Convolutional One-Stage Object-Detection). Detektor objek waktu nyata canggih biasanya memiliki karakteristik berikut

Arsitektur jaringan yang lebih kuat dan lebih cepat.
Metode integrasi fitur yang efektif.
Metode deteksi objek yang akurat.
Fungsi kerugian yang kuat.
Metode penugasan label yang efisien.
Metode pelatihan yang efisien.

Algoritma YOLOv7 tidak menggunakan pembelajaran mandiri dan distilasi yang sering memerlukan sejumlah besar data. Sebaliknya, algoritma YOLOv7 menggunakan metode tas yang dapat dilatih gratis.

Re-Parameterisasi Model

Teknik re-parameterisasi model dianggap sebagai teknik ensemble yang menggabungkan beberapa modul komputasi dalam tahap interferensi. Teknik ini dapat dibagi menjadi dua kategori, ensemble tingkat model, dan ensemble tingkat modul.

Sekarang, untuk mendapatkan model interferensi akhir, teknik re-parameterisasi tingkat model menggunakan dua praktik. Praktik pertama menggunakan data pelatihan yang berbeda untuk melatih beberapa model yang identik, dan kemudian merata-ratakan bobot model yang dilatih. Alternatifnya, praktik lainnya merata-ratakan bobot model selama iterasi yang berbeda.

Re-parameterisasi tingkat modul mendapatkan popularitas besar baru-baru ini karena itu membagi modul menjadi beberapa cabang modul, atau cabang identik yang berbeda selama fase pelatihan, dan kemudian melanjutkan untuk mengintegrasikan cabang-cabang ini menjadi modul yang setara selama interferensi.

Namun, teknik re-parameterisasi tidak dapat diterapkan pada semua jenis arsitektur. Itulah mengapa algoritma YOLOv7 menggunakan teknik re-parameterisasi model baru untuk merancang strategi yang terkait yang sesuai untuk arsitektur yang berbeda.

Skala Model

Skala model adalah proses mengubah atribut model yang membantu menghasilkan model sesuai dengan kebutuhan dan skala yang berbeda untuk memenuhi kecepatan interferensi yang berbeda.

Gambar di atas membandingkan jaringan agregasi lapisan efisien yang diperluas (E-ELAN) dari model yang berbeda. Metode E-ELAN yang diusulkan mempertahankan jalur transmisi gradien dari arsitektur asli, tetapi bertujuan untuk meningkatkan kardinalitas fitur yang ditambahkan menggunakan konvolusi grup. Proses ini dapat meningkatkan fitur yang dipelajari oleh peta yang berbeda dan dapat membuat penggunaan perhitungan dan parameter lebih efisien.

Arsitektur YOLOv7

Model YOLOv7 menggunakan YOLOv4, YOLO-R, dan Scaled YOLOv4 sebagai basisnya. YOLOv7 adalah hasil dari eksperimen yang dilakukan pada model ini untuk meningkatkan hasil dan membuat model lebih akurat.

Jaringan Agregasi Lapisan Efisien yang Diperluas atau E-ELAN

E-ELAN adalah blok bangunan dasar dari model YOLOv7, dan itu berasal dari model yang ada sebelumnya pada efisiensi jaringan, terutama ELAN.

Pertimbangan utama saat merancang arsitektur yang efisien adalah jumlah parameter, kepadatan komputasi, dan jumlah komputasi. Model lain juga mempertimbangkan faktor seperti pengaruh rasio saluran input/output, cabang dalam jaringan arsitektur, kecepatan interferensi jaringan, jumlah elemen dalam tensor jaringan konvolusi, dan lain-lain.

Model CSPVoNet tidak hanya mempertimbangkan parameter di atas, tetapi juga menganalisis jalur gradien untuk mempelajari fitur yang lebih beragam dengan mengaktifkan bobot lapisan yang berbeda. Pendekatan ini memungkinkan interferensi untuk menjadi lebih cepat dan akurat. Arsitektur ELAN bertujuan untuk merancang jaringan yang efisien untuk mengontrol jalur gradien terpanjang sehingga jaringan dapat lebih efektif dalam mempelajari dan mengkonvergen.

ELAN telah mencapai tahap yang stabil terlepas dari jumlah tumpukan blok komputasi, dan panjang jalur gradien. Keadaan stabil mungkin akan hancur jika blok komputasi ditumpuk tanpa batas, dan tingkat pemanfaatan parameter akan menurun. Arsitektur E-ELAN yang diusulkan dapat menyelesaikan masalah ini karena itu menggunakan ekspansi, pengacakan, dan penggabungan kardinalitas untuk terus meningkatkan kemampuan belajar jaringan sambil mempertahankan jalur gradien asli.

Selanjutnya, ketika membandingkan arsitektur E-ELAN dengan ELAN, perbedaan hanya ada di blok komputasi, sementara arsitektur lapisan transisi tidak berubah.

E-ELAN mengusulkan untuk memperluas kardinalitas blok komputasi, dan memperluas saluran dengan menggunakan konvolusi grup. Peta fitur kemudian dihitung dan diacak menjadi grup sesuai dengan parameter grup, dan kemudian dikonkatenasi bersama. Jumlah saluran di setiap grup akan tetap sama dengan arsitektur asli. Terakhir, grup peta fitur akan ditambahkan untuk melakukan kardinalitas.

Skala Model untuk Model Berbasis Konkatenasi

Skala model membantu dalam menyesuaikan atribut model yang membantu menghasilkan model sesuai dengan kebutuhan dan skala yang berbeda untuk memenuhi kecepatan interferensi yang berbeda.

Gambar di atas membahas skala model untuk model berbasis konkatenasi yang berbeda. Seperti yang dapat dilihat di gambar (a) dan (b), lebar output blok komputasi meningkat dengan peningkatan kedalaman skala model. Hasilnya, lebar input lapisan transmisi meningkat. Jika metode ini diterapkan pada arsitektur berbasis konkatenasi, proses skala dilakukan dalam kedalaman, dan digambarkan dalam gambar (c).

Dapat disimpulkan bahwa tidak mungkin untuk menganalisis faktor skala secara independen untuk model berbasis konkatenasi, dan sebaliknya harus dianalisis bersama. Oleh karena itu, untuk model berbasis konkatenasi, metode skala model gabungan yang sesuai untuk digunakan. Selain itu, ketika faktor kedalaman discala, saluran output blok harus discala juga.

Tas yang Dapat Dilatih

Tas yang dapat dilatih adalah istilah yang digunakan oleh pengembang untuk menggambarkan sebuah set metode atau teknik yang dapat mengubah strategi pelatihan atau biaya dalam upaya untuk meningkatkan akurasi model. Jadi apa tas yang dapat dilatih dalam YOLOv7? Mari kita lihat.

Konvolusi yang Diperparameterisasi dengan Rencana

Algoritma YOLOv7 menggunakan jalur propagasi gradien untuk menentukan bagaimana menggabungkan jaringan dengan konvolusi yang diperparameterisasi. Pendekatan ini oleh YOLOv7 adalah upaya untuk mengatasi algoritma RepConv yang meskipun telah berperforma sangat baik pada model VGG, berperforma buruk ketika diterapkan langsung pada model DenseNet dan ResNet.

Untuk mengidentifikasi koneksi dalam lapisan konvolusi, algoritma RepConv menggabungkan konvolusi 3×3 dan konvolusi 1×1. Jika kita menganalisis algoritma, kinerjanya, dan arsitektur, kita akan melihat bahwa RepConv menghancurkan konkatenasi dalam DenseNet dan residu dalam ResNet.

Gambar di atas menggambarkan model yang diperparameterisasi dengan rencana. Dapat dilihat bahwa algoritma YOLOv7 menemukan bahwa lapisan dalam jaringan dengan koneksi konkatenasi atau residu tidak boleh memiliki koneksi identitas dalam algoritma RepConv. Hasilnya, dapat diterima untuk beralih ke RepConvN tanpa koneksi identitas.

Kasar untuk Bantuan dan Halus untuk Kerugian Utama

Pengawasan dalam adalah cabang dalam ilmu komputer yang sering digunakan dalam proses pelatihan jaringan dalam. Prinsip dasar pengawasan dalam adalah bahwa itu menambahkan kepala bantuan tambahan di lapisan tengah jaringan bersama dengan bobot jaringan yang dangkal dengan kerugian asisten sebagai panduan. Algoritma YOLOv7 mengacu pada kepala yang bertanggung jawab untuk output akhir sebagai kepala utama, dan kepala bantuan adalah kepala yang membantu dalam pelatihan.

Selanjutnya, YOLOv7 menggunakan metode yang berbeda untuk penugasan label. Secara konvensional, penugasan label telah digunakan untuk menghasilkan label dengan merujuk langsung ke kebenaran dasar, dan berdasarkan pada himpunan aturan yang diberikan. Namun, dalam beberapa tahun terakhir, distribusi dan kualitas input prediksi memainkan peran penting dalam menghasilkan label yang dapat diandalkan. YOLOv7 menghasilkan label lembut objek dengan menggunakan prediksi kotak pembatas dan kebenaran dasar.

Selanjutnya, metode penugasan label baru dari algoritma YOLOv7 menggunakan prediksi kepala utama untuk memandu baik kepala utama dan kepala bantuan. Metode penugasan label memiliki dua strategi yang diusulkan.

Pemandu Label Kepala Utama

Strategi ini membuat perhitungan berdasarkan hasil prediksi kepala utama, dan kebenaran dasar, dan kemudian menggunakan optimasi untuk menghasilkan label lembut. Label lembut ini kemudian digunakan sebagai model pelatihan untuk kepala utama dan kepala bantuan.

Strategi ini bekerja berdasarkan asumsi bahwa karena kepala utama memiliki kemampuan belajar yang lebih besar, label yang dihasilkannya harus lebih representatif, dan berkorelasi antara sumber dan target.

Kasar-ke-Halus Pemandu Label Kepala Utama

Strategi ini juga membuat perhitungan berdasarkan hasil prediksi kepala utama, dan kebenaran dasar, dan kemudian menggunakan optimasi untuk menghasilkan label lembut. Namun, ada perbedaan kunci. Dalam strategi ini, ada dua set label lembut, kasar, dan halus.

Label kasar dihasilkan dengan melepaskan kembali proses penugasan sampel positif yang mengobati lebih banyak grid sebagai target positif. Ini dilakukan untuk menghindari risiko kehilangan informasi karena kekuatan belajar kepala bantuan yang lebih lemah.

Gambar di atas menjelaskan penggunaan tas yang dapat dilatih dalam algoritma YOLOv7. Ini menggambarkan kasar untuk kepala bantuan, dan halus untuk kepala utama. Ketika kita membandingkan Model dengan Kepala Bantuan (b) dengan Model Normal (a), kita akan melihat bahwa skema di (b) memiliki kepala bantuan, sementara itu tidak ada di (a).

Gambar (c) menggambarkan penugasan label independen umum, sementara gambar (d) dan (e) masing-masing mewakili Pemandu Label Kepala Utama, dan Kasar-ke-Halus Pemandu Label Kepala Utama yang digunakan oleh YOLOv7.

Tas yang Dapat Dilatih Lainnya

Selain yang disebutkan di atas, algoritma YOLOv7 menggunakan tas yang dapat dilatih tambahan, meskipun mereka tidak diusulkan oleh mereka secara asli. Mereka adalah

Normalisasi Batch dalam Teknologi Konvolusi-Bn-Aktivasi: Strategi ini digunakan untuk menghubungkan lapisan konvolusi langsung ke lapisan normalisasi batch.
Pengetahuan Implisit dalam YOLOR: Algoritma YOLOv7 menggabungkan strategi dengan peta fitur konvolusi.
Model EMA: Model EMA digunakan sebagai model referensi akhir dalam YOLOv7, meskipun penggunaan utamanya adalah untuk digunakan dalam metode guru rata-rata.

YOLOv7: Eksperimen

Pengaturan Eksperimen

Algoritma YOLOv7 menggunakan dataset Microsoft COCO untuk pelatihan dan validasi model deteksi objek, dan tidak semua eksperimen ini menggunakan model pra-dilatih. Pengembang menggunakan dataset pelatihan 2017 untuk pelatihan, dan menggunakan dataset validasi 2017 untuk memilih hiperparameter. Terakhir, kinerja hasil deteksi objek YOLOv7 dibandingkan dengan algoritma deteksi objek canggih.

Pengembang merancang model dasar untuk GPU tepi (YOLOv7-tiny), GPU normal (YOLOv7), dan GPU awan (YOLOv7-W6). Selain itu, algoritma YOLOv7 juga menggunakan model dasar untuk skala model sesuai dengan kebutuhan layanan yang berbeda, dan mendapatkan model yang berbeda. Untuk algoritma YOLOv7, skala tumpukan dilakukan pada leher, dan senyawa yang diusulkan digunakan untuk meningkatkan kedalaman dan lebar model.

Garisan

Algoritma YOLOv7 menggunakan model YOLO sebelumnya, dan algoritma deteksi objek YOLOR sebagai garisannya.

Gambar di atas membandingkan garis dasar model YOLOv7 dengan model deteksi objek lainnya, dan hasilnya sangat jelas. Ketika dibandingkan dengan algoritma YOLOv4, YOLOv7 tidak hanya menggunakan 75% parameter yang lebih sedikit, tetapi juga menggunakan 15% perhitungan yang lebih sedikit, dan memiliki akurasi 0,4% yang lebih tinggi.

Perbandingan dengan Model Deteksi Objek Canggih

Gambar di atas menunjukkan hasil ketika YOLOv7 dibandingkan dengan model deteksi objek canggih untuk GPU seluler dan umum. Dapat dilihat bahwa metode yang diusulkan oleh algoritma YOLOv7 memiliki skor perdagangan kecepatan-akurasi terbaik.

Studi Ablasi: Metode Skala Gabungan yang Diusulkan

Gambar di atas membandingkan hasil menggunakan strategi yang berbeda untuk meningkatkan model. Strategi skala dalam model YOLOv7 meningkatkan kedalaman blok komputasi sebesar 1,5 kali, dan meningkatkan lebar sebesar 1,25 kali.

Ketika dibandingkan dengan model yang hanya meningkatkan kedalaman, model YOLOv7 berperforma lebih baik sebesar 0,5% sementara menggunakan parameter yang lebih sedikit dan daya komputasi yang lebih sedikit. Di sisi lain, ketika dibandingkan dengan model yang hanya meningkatkan kedalaman, akurasi YOLOv7 ditingkatkan sebesar 0,2%, tetapi jumlah parameter perlu ditingkatkan sebesar 2,9%, dan perhitungan sebesar 1,2%.

Model yang Diperparameterisasi dengan Rencana yang Diusulkan

Untuk memverifikasi keumuman model yang diperparameterisasi yang diusulkan, algoritma YOLOv7 menggunakan model ini pada model berbasis residu dan berbasis konkatenasi untuk verifikasi. Untuk proses verifikasi, algoritma YOLOv7 menggunakan 3-tumpukan ELAN untuk model berbasis konkatenasi, dan CSPDarknet untuk model berbasis residu.

Untuk model berbasis konkatenasi, algoritma menggantikan lapisan konvolusi 3×3 dalam 3-tumpukan ELAN dengan RepConv. Gambar di bawah menunjukkan konfigurasi rinci dari RepConv yang diperparameterisasi dengan rencana, dan 3-tumpukan ELAN.

Selanjutnya, ketika menangani model berbasis residu, algoritma YOLOv7 menggunakan blok gelap terbalik karena blok gelap asli tidak memiliki lapisan konvolusi 3×3. Gambar di bawah menunjukkan arsitektur CSPDarknet yang terbalik, yang membalik posisi lapisan konvolusi 3×3 dan lapisan konvolusi 1×1.

Asisten Kerugian yang Diusulkan untuk Kepala Bantuan

Untuk kerugian asisten untuk kepala bantuan, model YOLOv7 membandingkan penugasan label independen untuk kepala bantuan dan kepala utama.

Gambar di atas berisi hasil studi tentang asisten kepala bantuan yang diusulkan. Dapat dilihat bahwa kinerja keseluruhan model meningkat dengan peningkatan kerugian asisten. Selain itu, penugasan label yang dipandu oleh kepala utama yang diusulkan oleh YOLOv7 berperforma lebih baik daripada strategi penugasan label independen.

Hasil YOLOv7

Berdasarkan eksperimen di atas, berikut adalah hasil kinerja YOLOv7 dibandingkan dengan algoritma deteksi objek lainnya.

Gambar di atas membandingkan model YOLOv7 dengan algoritma deteksi objek lainnya, dan dapat dilihat dengan jelas bahwa YOLOv7 mengungguli model deteksi objek lainnya dalam hal Presisi Rata-Rata (AP) vs interferensi batch.

Selanjutnya, gambar di bawah membandingkan kinerja YOLOv7 vs algoritma deteksi objek waktu nyata lainnya. Sekali lagi, YOLOv7 mengungguli model lainnya dalam hal kinerja keseluruhan, akurasi, dan efisiensi.

Berikut adalah beberapa pengamatan tambahan dari hasil YOLOv7 dan kinerjanya.

YOLOv7-Tiny adalah model terkecil dalam keluarga YOLO, dengan lebih dari 6 juta parameter. YOLOv7-Tiny memiliki Presisi Rata-Rata sebesar 35,2%, dan mengungguli model YOLOv4-Tiny dengan parameter yang setara.
Model YOLOv7 memiliki lebih dari 37 juta parameter, dan mengungguli model dengan parameter yang lebih tinggi seperti YOLov4.
Model YOLOv7 memiliki mAP dan tingkat FPS tertinggi dalam rentang 5 hingga 160 FPS.

Kesimpulan

YOLO atau “Kamu Hanya Melihat Sekali” adalah model deteksi objek canggih dalam penglihatan komputer modern. Algoritma YOLO dikenal karena akurasi dan efisiensinya yang tinggi, dan sebagai hasilnya, menemukan aplikasi yang luas dalam industri deteksi objek waktu nyata. Sejak algoritma YOLO pertama kali diperkenalkan pada tahun 2016, eksperimen telah memungkinkan pengembang untuk terus meningkatkan model. Model YOLOv7 adalah tambahan terbaru dalam keluarga YOLO, dan merupakan algoritma YOLO paling kuat hingga saat ini. Dalam artikel ini, kita telah membahas dasar-dasar YOLOv7 dan mencoba menjelaskan apa yang membuat YOLOv7 sangat efisien.

YOLOv7 adalah model deteksi objek canggih yang menawarkan kinerja yang lebih baik daripada model deteksi objek lainnya. Dengan kemampuan untuk mendeteksi objek dalam waktu nyata, YOLOv7 memiliki potensi untuk digunakan dalam berbagai aplikasi, seperti pengawasan, kendaraan otonom, dan robotika.

Kunal Kejriwal

Seorang insinyur oleh profesi, seorang penulis oleh hati. Kunal adalah seorang penulis teknis dengan cinta yang mendalam & pemahaman tentang AI dan ML, yang didedikasikan untuk menyederhanakan konsep-konsep kompleks dalam bidang ini melalui dokumentasi yang menarik dan informatif.