Umělá inteligence

Nový nástroj může výzkumníkům ukázat, co GANy vynechávají z obrázku

aktualizováno on 9. prosince 2022

Nedávno tým výzkumníků z MIT-IBM Watson AI Lab vytvořil metodu zobrazení toho, co Generative Adversarial Network vynechává z obrázku, když je požádán o generování obrázků. Studie byla dabována Podívejte se, co GAN nemůže generovata nedávno byl představen na Mezinárodní konferenci o počítačovém vidění.

Generativní Adversarial Networks se v posledních letech staly robustnějšími, sofistikovanějšími a široce používanými. Stali se docela dobrými ve vykreslování obrázků plných detailů, pokud je tento obrázek omezen na relativně malou plochu. Když se však GAN používají ke generování obrázků větších scén a prostředí, mají tendenci nefungovat tak dobře. Ve scénářích, kde jsou GANy požádány, aby vykreslily scény plné mnoha objektů a předmětů, jako je rušná ulice, GAN často vynechávají mnoho důležitých aspektů obrazu.

Podle MIT News, výzkum částečně vyvinul David Bau, postgraduální student na katedře elektrotechniky a informatiky na MIT. Bau vysvětlil, že výzkumníci se obvykle soustředí na upřesnění toho, čemu systémy strojového učení věnují pozornost, a na zjištění, jak lze určité vstupy mapovat na určité výstupy. Bau však také vysvětlil, že pochopení toho, jaká data jsou ignorována modely strojového učení, pokud jsou často stejně důležitá, a že výzkumný tým doufá, že jejich nástroje inspirují výzkumníky, aby věnovali pozornost ignorovaným datům.

Bauův zájem o GANy byl podnícen skutečností, že by mohly být použity ke zkoumání černé skříňky neuronových sítí a k získání intuice, jak by sítě mohly uvažovat. Bau dříve pracoval na nástroji, který by dokázal identifikovat specifické shluky umělých neuronů a označil je jako zodpovědné za reprezentaci objektů reálného světa, jako jsou knihy, mraky a stromy. Bau měl také zkušenosti s nástrojem nazvaným GANPaint, který umělcům umožňuje odstraňovat a přidávat specifické funkce z fotografií pomocí GAN. Podle Baua aplikace GANPaint odhalila potenciální problém s GAN, problém, který se ukázal, když Bau analyzoval obrázky. Jak Bau řekl MIT News:

„Můj poradce nás vždy povzbuzoval, abychom se dívali za čísla a zkoumali skutečné obrázky. Když jsme se podívali, fenomén vyskočil přímo na povrch: Lidé byli vyřazeni selektivně.“

Zatímco systémy strojového učení jsou navrženy tak, aby extrahovaly vzory z obrázků, mohou také skončit ignorováním relevantních vzorů. Bau a další výzkumníci experimentovali s trénováním GAN na různých vnitřních a venkovních scénách, ale ve všech různých typech scén GANy vynechávaly důležité detaily ve scénách, jako jsou auta, dopravní značky, lidé, kola atd. To platilo, i když vynechané předměty byly pro danou scénu důležité.

Výzkumný tým předpokládal, že když je GAN trénován na obrázcích, může být pro GAN snazší zachytit vzory obrázku, které se snadněji reprezentují, jako jsou velké stacionární objekty, jako jsou krajiny a budovy. Učí se tyto vzorce přes jiné, obtížněji interpretovatelné vzorce, jako jsou auta a lidé. Je všeobecně známo, že GANy při generování obrázků často opomíjejí důležité a smysluplné detaily, ale studie týmu MIT může být prvním případem, kdy byly GANy demonstrovány na vynechání celých tříd objektů v rámci obrázku.

Výzkumný tým poznamenává, že je možné, aby GANy dosáhly svých numerických cílů, i když vynechají objekty, o které se lidé při pohledu na obrázky zajímají. Pokud budou obrázky generované GANS použity k trénování složitých systémů jako autonomní vozidla, obrazová data by měla být pečlivě prozkoumána, protože existuje skutečná obava, že kritické objekty, jako jsou značky, lidé a další auta, mohou být na snímcích vynechány. Bau vysvětlil, že jejich výzkum ukazuje, proč by výkon modelu neměl být založen pouze na přesnosti:

"Musíme pochopit, co sítě dělají a co nedělají, abychom se ujistili, že dělají rozhodnutí, která chceme, aby dělaly."

Související témata:hluboké učení GAN Generativní Adversarial Networks

Nahoru Další

Některé základní knihy o AI jsou k dispozici online zdarma

Nenechte si ujít

Umělá inteligence se sama učí fyzikálním zákonům

Daniel Nelson

Blogerka a programátorka se specializací v Strojové učení a Hluboké učení témata. Daniel doufá, že pomůže ostatním využívat sílu AI pro společenské dobro.