výhonek YOLOv7: Nejpokročilejší algoritmus detekce objektů? - Spojte se.AI
Spojte se s námi

Umělá inteligence

YOLOv7: Nejpokročilejší algoritmus detekce objektů?

mm

Zveřejněno

 on

6. červenec 2022 bude označen jako mezník v historii umělé inteligence, protože právě v tento den byl vydán YOLOv7. Již od svého uvedení na trh je YOLOv7 nejžhavějším tématem ve vývojářské komunitě Computer Vision, a to ze správných důvodů. YOLOv7 je již považován za milník v oboru detekce objektů. 

Krátce po Byl zveřejněn papír YOLOv7, ukázal se jako nejrychlejší a nejpřesnější model detekce námitek v reálném čase. Jak ale YOLOv7 předčí své předchůdce? Proč je YOLOv7 tak efektivní při provádění úloh počítačového vidění? 

V tomto článku se pokusíme analyzovat model YOLOv7 a pokusíme se najít odpověď na to, proč se nyní YOLOv7 stává průmyslovým standardem? Ale než na to budeme moci odpovědět, budeme se muset podívat na stručnou historii detekce objektů. 

Co je to detekce objektů?

Detekce objektů je odvětvím počítačového vidění který identifikuje a lokalizuje objekty na obrázku nebo video souboru. Detekce objektů je stavebním kamenem mnoha aplikací včetně samořídících automobilů, monitorovaného sledování a dokonce i robotiky. 

Model detekce objektů lze rozdělit do dvou různých kategorií, jednorázové detektory, a víceranné detektory. 

Detekce objektů v reálném čase

Abychom skutečně pochopili, jak YOLOv7 funguje, je pro nás nezbytné porozumět hlavnímu cíli YOLOv7, “Detekce objektů v reálném čase". Detekce objektů v reálném čase je klíčovou součástí moderního počítačového vidění. Modely detekce objektů v reálném čase se snaží identifikovat a lokalizovat objekty zájmu v reálném čase. Díky modelům detekce objektů v reálném čase bylo pro vývojáře skutečně efektivní sledovat objekty zájmu v pohyblivém snímku, jako je video nebo živý sledovací vstup. 

Modely detekce objektů v reálném čase jsou v podstatě o krok napřed oproti konvenčním modelům detekce obrazu. Zatímco první se používá ke sledování objektů ve video souborech, druhý vyhledává a identifikuje objekty ve stacionárním snímku jako obrázek. 

Výsledkem je, že modely detekce objektů v reálném čase jsou skutečně účinné pro analýzu videa, autonomní vozidla, počítání objektů, sledování více objektů a mnoho dalšího. 

Co je YOLO?

YOLO nebo “Podíváš se jen jednou“ je rodina modelů detekce objektů v reálném čase. Koncept YOLO poprvé představil v roce 2016 Joseph Redmon a začalo se o něm mluvit téměř okamžitě, protože byl mnohem rychlejší a mnohem přesnější než stávající algoritmy detekce objektů. Netrvalo dlouho a algoritmus YOLO se stal standardem v průmyslu počítačového vidění. 

Základní koncept, který algoritmus YOLO navrhuje, je použití end-to-end neuronové sítě využívající ohraničující rámečky a třídní pravděpodobnosti k předpovědi v reálném čase. YOLO se lišil od předchozího modelu detekce objektů v tom smyslu, že navrhoval jiný přístup k provádění detekce objektů přepracováním klasifikátorů. 

Změna v přístupu fungovala, protože YOLO se brzy stalo průmyslovým standardem, protože mezi ním a dalšími algoritmy detekce objektů v reálném čase byly významné rozdíly ve výkonu. Ale jaký byl důvod, proč bylo YOLO tak efektivní? 

Ve srovnání s YOLO používaly tehdy algoritmy detekce objektů k detekci možných zájmových oblastí sítě pro návrh regionů. Proces rozpoznávání byl poté proveden pro každou oblast zvlášť. Výsledkem je, že tyto modely často prováděly více iterací na stejném obrázku, a proto byla nedostatečná přesnost a delší doba provádění. Na druhou stranu, algoritmus YOLO používá jednu plně propojenou vrstvu k provedení predikce najednou. 

Jak YOLO funguje?

Existují tři kroky, které vysvětlují, jak funguje algoritmus YOLO. 

Přerámování detekce objektů jako problém jediné regrese

Projekt Algoritmus YOLO se pokouší přerámovat detekci objektů jako jeden regresní problém, včetně obrazových bodů, pravděpodobnosti tříd a souřadnic ohraničovacího rámečku. Algoritmus se tedy musí podívat na obrázek pouze jednou, aby předpověděl a lokalizoval cílové objekty v obrázcích. 

Globální důvody pro obrázek

Kromě toho, když algoritmus YOLO dělá předpovědi, zdůvodňuje obraz globálně. Je to odlišné od technik založených na návrhu regionu a posuvných technikách, protože algoritmus YOLO vidí kompletní obraz během školení a testování na datové sadě a je schopen zakódovat kontextové informace o třídách a o tom, jak vypadají. 

Před YOLO byl Fast R-CNN jedním z nejpopulárnějších algoritmů detekce objektů, který nedokázal vidět větší kontext v obrázku, protože zaměňoval záplaty na pozadí v obrázku za objekt. Ve srovnání s rychlým algoritmem R-CNN je YOLO o 50 % přesnější pokud jde o chyby na pozadí. 

Zobecňuje reprezentaci objektů

A konečně, algoritmus YOLO se také zaměřuje na zobecnění reprezentací objektů v obrázku. Výsledkem bylo, že když byl algoritmus YOLO spuštěn na datové sadě s přirozenými obrázky a testován na výsledky, YOLO výrazně překonalo stávající modely R-CNN. Je to proto, že YOLO je vysoce zobecnitelné a šance, že se porouchá při implementaci na neočekávané vstupy nebo nové domény, byla malá. 

YOLOv7: Co je nového?

Nyní, když máme základní znalosti o tom, co jsou modely detekce objektů v reálném čase a co je algoritmus YOLO, je čas diskutovat o algoritmu YOLOv7. 

Optimalizace tréninkového procesu

Algoritmus YOLOv7 se snaží nejen optimalizovat architekturu modelu, ale zaměřuje se také na optimalizaci tréninkového procesu. Jeho cílem je použití optimalizačních modulů a metod ke zlepšení přesnosti detekce objektů, zvýšení nákladů na školení při zachování nákladů na rušení. Tyto optimalizační moduly lze označit jako a trénovatelná taška zdarma. 

Přiřazení štítků s vedením od hrubého k jemnému

Algoritmus YOLOv7 plánuje místo konvenčního přidělování štítků používat nové řízené přiřazování olova od hrubého k jemnému. Dynamické přiřazení štítků. Je tomu tak proto, že při dynamickém přiřazování štítků způsobuje trénování modelu s více výstupními vrstvami určité problémy, z nichž nejčastější je, jak přiřadit dynamické cíle pro různé větve a jejich výstupy. 

Reparametrizace modelu

Reparametrizace modelu je důležitým konceptem v detekci objektů a její použití je obecně sledováno s určitými problémy během školení. Algoritmus YOLOv7 plánuje použití konceptu cesta šíření gradientu pro analýzu politik reparametrizace modelu aplikovatelné na různé vrstvy v síti. 

Rozšíření a složené škálování

Algoritmus YOLOv7 také zavádí rozšířené a složené metody škálování využívat a efektivně využívat parametry a výpočty pro detekci objektů v reálném čase. 

YOLOv7 : Související práce

Detekce objektů v reálném čase

YOLO je v současné době průmyslovým standardem a většina detektorů objektů v reálném čase využívá algoritmy YOLO a FCOS (Fully Convolutional One-Stage Object-Detection). Nejmodernější detektor objektů v reálném čase má obvykle následující vlastnosti

  • Silnější a rychlejší síťová architektura. 
  • Efektivní metoda integrace funkcí. 
  • Přesná metoda detekce objektů. 
  • Robustní ztrátová funkce. 
  • Efektivní metoda přiřazení štítků. 
  • Efektivní tréninková metoda. 

Algoritmus YOLOv7 nepoužívá metody učení a destilace s vlastním dohledem, které často vyžadují velké množství dat. Algoritmus YOLOv7 naopak používá trénovatelnou metodu bag-of-freebies. 

Reparametrizace modelu

Techniky reparametrizace modelu jsou považovány za souborovou techniku, která spojuje více výpočetních modulů ve fázi interference. Techniku ​​lze dále rozdělit do dvou kategorií, soubor na úrovni modelu, a soubor na úrovni modulů. 

Nyní, abychom získali konečný interferenční model, používá technika reparametrizace na úrovni modelu dva postupy. První cvičení používá různá tréninková data k tréninku mnoha identických modelů a poté zprůměruje hmotnosti trénovaných modelů. Alternativně jiný postup zprůměruje váhy modelů během různých iterací. 

Reparametrizace na úrovni modulů získává v poslední době obrovskou popularitu, protože rozděluje modul na různé větve modulů nebo různé identické větve během trénovací fáze a poté pokračuje v integraci těchto různých větví do ekvivalentního modulu, zatímco dochází k interferenci. 

Techniky reparametrizace však nelze aplikovat na všechny druhy architektury. To je důvod, proč Algoritmus YOLOv7 využívá nové techniky reparametrizace modelu k návrhu souvisejících strategií vhodné pro různé architektury. 

Měřítko modelu

Škálování modelu je proces zvětšování nebo zmenšování existujícího modelu tak, aby vyhovoval různým výpočetním zařízením. Měřítko modelu obecně používá různé faktory, jako je počet vrstev (hloubka), velikost vstupních obrázků (řešení), počet pyramid prvků(fáze), a počet kanálů (šířka). Tyto faktory hrají klíčovou roli při zajišťování vyváženého kompromisu pro síťové parametry, rychlost rušení, výpočty a přesnost modelu. 

Jednou z nejčastěji používaných metod škálování je NAS nebo Network Architecture Search který automaticky vyhledává vhodné škálovací faktory z vyhledávačů bez složitých pravidel. Hlavní nevýhodou používání NAS je to, že je to drahý přístup k hledání vhodných škálovacích faktorů. 

Téměř každý model reparametrizace modelu analyzuje jednotlivé a jedinečné škálovací faktory nezávisle a navíc tyto faktory nezávisle optimalizuje. Je to proto, že architektura NAS pracuje s nekorelovanými škálovacími faktory. 

Stojí za zmínku, že modely založené na zřetězení jako VoVNet or DenseNet změnit vstupní šířku několika vrstev, když se změní hloubka modelů. YOLOv7 pracuje na navržené architektuře založené na zřetězení, a proto používá metodu složeného škálování.

Výše uvedený obrázek porovnává rozšířené efektivní vrstvy agregační sítě (E-ELAN) různých modelů. Navrhovaná metoda E-ELAN zachovává gradientní přenosovou cestu původní architektury, ale zaměřuje se na zvýšení mohutnosti přidaných funkcí pomocí skupinové konvoluce. Proces může vylepšit vlastnosti naučené různými mapami a může dále zefektivnit použití výpočtů a parametrů. 

Architektura YOLOv7

Model YOLOv7 využívá jako základ modely YOLOv4, YOLO-R a Scaled YOLOv4. YOLOv7 je výsledkem experimentů provedených na těchto modelech za účelem zlepšení výsledků a zpřesnění modelu. 

Extended Efficient Layer Aggregation Network nebo E-ELAN

E-ELAN je základním stavebním kamenem modelu YOLOv7 a je odvozen z již existujících modelů pro efektivitu sítě, zejména ELÁN. 

Hlavními faktory při navrhování efektivní architektury jsou počet parametrů, výpočetní hustota a množství výpočtů. Jiné modely také berou v úvahu faktory jako vliv poměru vstupních/výstupních kanálů, větvení v architektuře sítě, rychlost rušení sítě, počet prvků v tenzorech konvoluční sítě a další. 

Projekt CSPVoNet model nejen bere v úvahu výše uvedené parametry, ale také analyzuje cestu gradientu, aby se naučil rozmanitější vlastnosti tím, že povolí váhy různých vrstev. Tento přístup umožňuje, aby interference byly mnohem rychlejší a přesnější. The ELÁN architektura si klade za cíl navrhnout efektivní síť pro řízení nejkratší nejdelší gradientní cesty, aby síť mohla být efektivnější při učení a konvergování. 

ELAN již dosáhl stabilní fáze bez ohledu na počet výpočtových bloků a délku přechodové cesty. Stabilní stav může být zničen, pokud jsou výpočetní bloky naskládány neomezeně, a míra využití parametrů se sníží. The navrhovaná architektura E-ELAN může tento problém vyřešit, protože využívá mohutnost expanze, míchání a slučování neustále zlepšovat schopnost sítě učit se při zachování původní dráhy gradientu. 

Dále, když porovnáváme architekturu E-ELAN s ELAN, jediný rozdíl je ve výpočetním bloku, zatímco architektura přechodové vrstvy je nezměněna. 

E-ELAN navrhuje rozšířit mohutnost výpočetních bloků a rozšířit kanál použitím skupinová konvoluce. Mapa prvků se pak vypočítá a zamíchá do skupin podle parametru skupiny a poté se spojí dohromady. Počet kanálů v každé skupině zůstane stejný jako v původní architektuře. Nakonec budou přidány skupiny map objektů, aby zajistily mohutnost. 

Měřítko modelu pro modely založené na zřetězení

Škálování modelu pomáhá nastavení atributů modelů což pomáhá při generování modelů podle požadavků a různých měřítek pro splnění různých rychlostí interference. 

Obrázek hovoří o škálování modelu pro různé modely založené na zřetězení. Jak můžete vidět na obrázku (a) a (b), výstupní šířka výpočetního bloku se zvětšuje s rostoucím měřítkem hloubky modelů. V důsledku toho se zvětší vstupní šířka přenosových vrstev. Pokud jsou tyto metody implementovány na architektuře založené na zřetězení, proces škálování se provádí do hloubky a je znázorněn na obrázku (c). 

Lze tedy dojít k závěru, že není možné analyzovat škálovací faktory samostatně pro modely založené na zřetězení a spíše je třeba je posuzovat nebo analyzovat společně. Proto pro model založený na zřetězení je vhodné použít odpovídající metodu škálování složeného modelu. Navíc, když se změní měřítko faktoru hloubky, výstupní kanál bloku musí být také zmenšen. 

Trénovatelná taška s dárky 

Bag of freebies je termín, který vývojáři používají k popisu soubor metod nebo technik, které mohou změnit strategii školení nebo náklady ve snaze zvýšit přesnost modelu. Jaké jsou tedy tyto trénovatelné pytle s zadarmo v YOLOv7? Pojďme se podívat. 

Plánovaná přeparametrizovaná konvoluce

Algoritmus YOLOv7 používá k určení cesty šíření toku gradientu jak ideálně zkombinovat síť s přeparametrizovanou konvolucí. Tento přístup YOLov7 je pokusem čelit Algoritmus RepConv že ačkoliv na modelu VGG fungoval klidně, funguje špatně, když je aplikován přímo na modely DenseNet a ResNet. 

Pro identifikaci spojení v konvoluční vrstvě, Algoritmus RepConv kombinuje konvoluci 3×3 a konvoluci 1×1. Pokud analyzujeme algoritmus, jeho výkon a architekturu, zjistíme, že RepConv ničí zřetězení v DenseNet a zbytek v ResNet

Obrázek výše znázorňuje plánovaný přeparametrizovaný model. Je vidět, že algoritmus YOLov7 zjistil, že vrstva v síti se zřetězením nebo zbytkovými připojeními by neměla mít v algoritmu RepConv spojení identity. V důsledku toho je přijatelné přepínat pomocí RepConvN bez připojení identity. 

Hrubé pro pomocné a jemné pro ztrátu olova

Hluboký dohled je obor v informatice, který často nachází uplatnění v tréninkovém procesu hlubokých sítí. Základním principem hlubokého dohledu je, že ano přidává další pomocnou hlavu ve středních vrstvách sítě spolu s mělkými síťovými závažími se ztrátou asistenta jako vodítkem. Algoritmus YOLOv7 označuje hlavu, která je zodpovědná za konečný výstup, jako vedoucí hlavu a pomocná hlava je hlava, která pomáhá při tréninku. 

YOLOv7 používá pro přiřazení štítků jinou metodu. Obvykle se přiřazování štítků používá ke generování štítků přímým odkazem na základní pravdu a na základě dané sady pravidel. V posledních letech však distribuce a kvalita předpovědních vstupů hraje důležitou roli při vytváření spolehlivého štítku. YOLOv7 vygeneruje měkký štítek objektu pomocí předpovědí ohraničujícího rámečku a základní pravdy. 

Kromě toho nová metoda přiřazení štítků algoritmu YOLOv7 využívá předpovědi vodicí hlavy k vedení vodicí i pomocné hlavice. Metoda přiřazení štítků má dvě navržené strategie. 

Přidělovač štítků vedených vedoucí hlavou

Strategie provádí výpočty na základě výsledků predikce vedoucí hlavy a základní pravdy a poté využívá optimalizaci ke generování měkkých štítků. Tyto měkké štítky se pak používají jako tréninkový model pro vodicí hlavu i pomocnou hlavu. 

Strategie vychází z předpokladu, že protože vedoucí vedoucí má větší schopnost učení, štítky, které vytváří, by měly být reprezentativnější a měly by korelovat mezi zdrojem a cílem. 

Přidělovač štítků s vedením s hrubým až jemným vedením

Tato strategie také provádí výpočty na základě výsledků predikce vedoucí hlavy a základní pravdy a poté využívá optimalizaci ke generování měkkých štítků. Je tu však zásadní rozdíl. V této strategii existují dvě sady měkkých štítků, hrubá úroveň, a jemný štítek. 

Hrubá značka je generována uvolněním omezení pozitivního vzorku

proces přiřazení, který považuje více mřížek za pozitivní cíle. Je to děláno, aby se zabránilo riziku ztráty informací kvůli slabší schopnosti učení pomocné hlavy. 

Výše uvedený obrázek vysvětluje použití trénovatelného pytle s drobnými předměty v algoritmu YOLOv7. Zobrazuje hrubé pro pomocnou hlavu a jemné pro vedoucí hlavu. Když porovnáme model s pomocnou hlavou(b) s normálním modelem (a), zjistíme, že schéma v (b) má pomocnou hlavu, zatímco v (a) není. 

Obrázek (c) znázorňuje společného nezávislého přiřazovače štítků, zatímco obrázek (d) a obrázek (e) v tomto pořadí představují přiřazovatel s vedením vedeným přiřazovatelem a přiřazovač s vedením s hrubým až jemným vedením používaný YOLOv7.  

Další trénovatelná taška zdarma

Algoritmus YOLOv7 kromě výše zmíněných používá další sáčky s dárkem, ačkoli původně nebyly navrženy. Oni jsou

  • Dávková normalizace v technologii Conv-Bn-Activation: Tato strategie se používá k připojení konvoluční vrstvy přímo k vrstvě normalizace dávky. 
  • Implicitní znalost v YOLOR: YOLOv7 kombinuje strategii s mapou funkcí Convolutional. 
  • Model EMA: Model EMA je použit jako finální referenční model v YOLOv7, ačkoli jeho primární použití má být použito v metodě středního učitele. 

YOLOv7 : Experimenty

Experimentální nastavení

Algoritmus YOLOv7 používá Datový soubor Microsoft COCO pro školení a ověřování jejich model detekce objektů a ne všechny tyto experimenty používají předem trénovaný model. Vývojáři použili datovou sadu vlaků z roku 2017 pro školení a pro výběr hyperparametrů použili sadu dat pro ověření z roku 2017. Nakonec je výkon výsledků detekce objektů YOLOv7 porovnán s nejmodernějšími algoritmy pro detekci objektů. 

Vývojáři navrhli základní model pro edge GPU (YOLOv7-tiny), normální GPU (YOLOv7) a cloud GPU (YOLOv7-W6). Algoritmus YOLOv7 navíc také používá základní model pro škálování modelu podle požadavků různých služeb a získává různé modely. U algoritmu YOLOv7 se škálování zásobníku provádí na krku a navržené sloučeniny se používají ke zvětšení hloubky a šířky modelu. 

Základní linie

Algoritmus YOLOv7 využívá předchozí modely YOLO a algoritmus detekce objektů YOLOR je jeho základní linií.

Výše uvedený obrázek porovnává základní linii modelu YOLOv7 s jinými modely detekce objektů a výsledky jsou zcela evidentní. Při srovnání s Algoritmus YOLOv4, YOLOv7 nejen využívá o 75 % méně parametrů, ale také využívá o 15 % méně výpočtů a má o 0.4 % vyšší přesnost. 

Srovnání s nejmodernějšími modely detektorů objektů

Výše uvedený obrázek ukazuje výsledky při porovnání YOLOv7 s nejmodernějšími modely detekce objektů pro mobilní a obecné GPU. Lze pozorovat, že metoda navržená algoritmem YOLOv7 má nejlepší kompromisní skóre mezi rychlostí a přesností. 

Ablační studie: Navrhovaná metoda škálování sloučeniny

Výše uvedený obrázek porovnává výsledky použití různých strategií pro zvětšení modelu. Strategie škálování v modelu YOLOv7 zvětšuje hloubku výpočetního bloku 1.5krát a šířku 1.25krát. 

Ve srovnání s modelem, který pouze zvětšuje hloubku, má model YOLOv7 lepší výkon o 0.5 % při menším využití parametrů a výpočetního výkonu. Na druhou stranu, ve srovnání s modely, které pouze zvětšují hloubku, se přesnost YOLOv7 zlepšila o 0.2 %, ale počet parametrů je třeba zvětšit o 2.9 % a výpočet o 1.2 %. 

Navrhovaný plánovaný přeparametrizovaný model

Pro ověření obecnosti navrhovaného reparametrizovaného modelu, Algoritmus YOLOv7 jej pro ověření používá na modelech založených na zbytcích a na zřetězení. Pro proces ověření používá algoritmus YOLOv7 3-skládaný ELAN pro model založený na zřetězení a CSPDarknet pro model založený na zbytcích. 

U modelu založeného na zřetězení algoritmus nahrazuje 3×3 konvoluční vrstvy ve 3-skládaném ELAN za RepConv. Obrázek níže ukazuje detailní konfiguraci Planned RepConv a 3-stacked ELAN. 

Navíc při práci s modelem založeným na zbytcích používá algoritmus YOLOv7 obrácený tmavý blok, protože původní tmavý blok nemá konvoluční blok 3×3. Níže uvedený obrázek ukazuje architekturu Reversed CSPDarknet, která převrací pozice konvoluční vrstvy 3×3 a 1×1. 

Navrhovaná ztráta asistenta pro pomocnou hlavu

Pro ztrátu asistenta pro pomocnou hlavici model YOLOv7 porovnává nezávislé přiřazení štítků pro metody pomocné hlavice a hlavice elektrody. 

Výše uvedený obrázek obsahuje výsledky studie navržené pomocné hlavice. Je vidět, že celkový výkon modelu se zvyšuje s nárůstem ztráty asistenta. Kromě toho přidělování štítků s průvodcem navržené modelem YOLOv7 funguje lépe než strategie přiřazování nezávislých zájemců. 

Výsledky YOLOv7

Na základě výše uvedených experimentů je zde výsledek výkonu YOLov7 ve srovnání s jinými algoritmy detekce objektů. 

Výše uvedený obrázek porovnává model YOLOv7 s jinými algoritmy detekce objektů a lze jasně pozorovat, že YOLOv7 překonává ostatní modely detekce objektů, pokud jde o Průměrná přesnost (AP) v/s dávkové rušení

Kromě toho níže uvedený obrázek porovnává výkon YOLOv7 v/s jiných algoritmů detekce námitek v reálném čase. YOLOv7 opět následuje ostatní modely, pokud jde o celkový výkon, přesnost a efektivitu. 

Zde jsou některé další postřehy z výsledků a výkonů YOLOv7. 

  1. YOLOv7-Tiny je nejmenší model z rodiny YOLO s více než 6 miliony parametrů. YOLOv7-Tiny má průměrnou přesnost 35.2 % a se srovnatelnými parametry překonává modely YOLOv4-Tiny. 
  2. Model YOLOv7 má přes 37 milionů parametrů a překonává modely s vyššími parametry, jako je YOLov4. 
  3. Model YOLOv7 má nejvyšší rychlost mAP a FPS v rozsahu 5 až 160 FPS. 

Proč investovat do čističky vzduchu?

YOLO nebo You Only Look Once je nejmodernější model detekce objektů v moderním počítačovém vidění. Algoritmus YOLO je známý svou vysokou přesností a účinností, a proto nachází rozsáhlé uplatnění v průmyslu detekce objektů v reálném čase. Od té doby, co byl v roce 2016 představen první algoritmus YOLO, experimenty umožnily vývojářům neustále vylepšovat model. 

Model YOLOv7 je nejnovějším přírůstkem do rodiny YOLO a je to dosud nejvýkonnější algoritmus YOLO. V tomto článku jsme hovořili o základech YOLOv7 a pokusili jsme se vysvětlit, proč je YOLOv7 tak efektivní. 

„Povoláním inženýr, srdcem spisovatel“. Kunal je technický spisovatel s hlubokou láskou a porozuměním AI a ML, který se věnuje zjednodušování složitých konceptů v těchto oblastech prostřednictvím své poutavé a informativní dokumentace.