Stumm Neit Tool kann Fuerscher weisen wat GANs aus engem Bild verloossen - Unite.AI
Connect mat eis

Kënschtlech Intelligenz

Neit Tool kann Fuerscher weisen wat GANs aus engem Bild verloossen

mm
aktualiséiert on

Viru kuerzem huet en Team vu Fuerscher vum MIT-IBM Watson AI Lab eng Method erstallt fir ze weisen wat e Generative Adversarial Network aus engem Bild léisst wann se gefrot gi fir Biller ze generéieren. D'Etude gouf dubbed Gesinn Wat e GAN Net Generéiere kann, an et gouf viru kuerzem op der Internationaler Konferenz iwwer Computer Visioun presentéiert.

Generativ Adversarial Netzwierker sinn an de leschte Jore méi robust, raffinéiert a wäit benotzt ginn. Si sinn zimlech gutt ginn fir Biller voller Detailer ze maachen, soulaang dat Bild op e relativ klenge Gebitt agespaart ass. Wéi och ëmmer, wann GANs benotzt gi fir Biller vu méi grousse Szenen an Ëmfeld ze generéieren, tendéieren se net sou gutt. An Szenarie wou GANs gefrot ginn Szenen voller Objeten an Elementer ze maachen, wéi eng beschäftegt Strooss, verloossen GANs dacks vill wichteg Aspekter vum Bild eraus.

Laut MIT News, d'Fuerschung gouf deelweis vum David Bau entwéckelt, e Graduéierter Student am Departement Elektrotechnik a Computerwëssenschaften am MIT. De Bau huet erkläert datt d'Fuerscher normalerweis op d'Verfeinerung konzentréieren op wat Maschinnléieresystemer oppassen an z'erkennen wéi verschidden Inputen op bestëmmten Ausgänge kartéiert kënne ginn. Wéi och ëmmer, de Bau huet och erkläert datt d'Verstoe vu wéi eng Donnéeën duerch Maschinnléiermodeller ignoréiert ginn, wann dacks grad esou wichteg ass an datt d'Fuerschungsteam hofft datt hir Tools d'Fuerscher inspiréiere fir op déi ignoréiert Donnéeën opzepassen.

Dem Bau säin Interesse fir GANs gouf gestierzt duerch d'Tatsaach datt se benotzt kënne fir d'Black-Box Natur vun neuralen Netzwierker z'ënnersichen an eng Intuition ze kréien wéi d'Netzwierker kéinte begrënnen. De Bau huet virdru un engem Tool geschafft dat spezifesch Stärekéip vu kënschtlechen Neuronen identifizéiere konnt, se als verantwortlech fir d'Representatioun vun real-Welt Objete wéi Bicher, Wolleken a Beem bezeechnen. De Bau hat och Erfarung mat engem Tool deen GANPaint genannt gëtt, wat et Kënschtler erméiglecht fir spezifesch Features vu Fotoen ze läschen an ze addéieren andeems se GANs benotzen. Laut Bau huet d'GANPaint Applikatioun e potenzielle Problem mat de GANs opgedeckt, e Problem deen däitlech gouf wéi de Bau d'Biller analyséiert huet. Wéi de Bau sot zu MIT News:

"Mäi Beroder huet eis ëmmer encouragéiert iwwer d'Zuelen ze kucken an déi aktuell Biller ze iwwerpréiwen. Wa mir gekuckt hunn, ass de Phänomen direkt erausgesprongen: D'Leit goufen selektiv erausgefall.

Wärend Maschinnléiere Systemer entwéckelt sinn fir Mustere vu Biller ze extrahieren, kënnen se och ophalen relevant Mustere ignoréieren. De Bau an aner Fuerscher hunn experimentéiert mat Training GANs op verschiddenen Indoor an Outdoor Szenen, awer an all de verschiddenen Zorte vu Szenen hunn d'GANs wichteg Detailer an de Szenen wéi Autoen, Stroosseschëlder, Leit, Vëloen, etc. d'Objeten, déi ewech gelooss goufen, ware wichteg fir déi betreffend Zeen.

D'Fuerschungsteam huet hypothetiséiert datt wann de GAN op Biller trainéiert gëtt, kann de GAN et méi einfach fannen d'Mustere vum Bild z'erreechen déi méi einfach ze representéieren sinn, sou wéi grouss stationär Objete wéi Landschaften a Gebaier. Et léiert dës Mustere iwwer aner, méi schwéier ze interpretéieren Musteren, wéi Autoen a Leit. Et war allgemeng Wësse datt GANs dacks wichteg, sënnvoll Detailer ausléisen wann se Biller generéieren, awer d'Etude vum MIT Team ass vläicht déi éischte Kéier datt GANs bewisen goufen datt se ganz Objektklassen an engem Bild ausgoen.

D'Fuerschungsteam bemierkt datt et méiglech ass fir GANs hir numeresch Ziler z'erreechen, och wann se Objeten ausléisen, déi d'Mënsche këmmeren wann se Biller kucken. Wann Biller generéiert vu GANS gi benotzt fir komplex Systemer ze trainéieren wéi autonom Gefierer, sollen d'Bilddaten genee iwwerpréift ginn, well et wierklech Suergen ass datt kritesch Objete wéi Schëlder, Leit an aner Autoen aus de Biller gelooss kënne ginn. De Bau huet erkläert datt hir Fuerschung weist firwat d'Leeschtung vun engem Modell net nëmmen op Genauegkeet soll baséieren:

"Mir musse verstoen wat d'Netzwierker sinn an net maachen fir sécherzestellen datt se d'Wieler maachen, déi mir wëllen datt se maachen."

Blogger a Programméierer mat Spezialitéiten am Machine Learning an Deep Learning Themen. Den Daniel hofft anerer ze hëllefen d'Kraaft vun der AI fir sozial Gutt ze benotzen.