stub Teadlased kasutavad tehisintellekti, et uurida, kuidas erinevad peegeldused originaalpiltidest – Unite.AI
Ühenda meile

Tehisintellekt

Teadlased kasutavad tehisintellekti, et uurida, kuidas erinevad peegeldused originaalpiltidest

mm
Ajakohastatud on

Cornelli ülikooli teadlased kasutasid hiljuti masinõppesüsteeme, et uurida, kuidas piltide peegeldused erinevad algsetest piltidest. Nagu teatas ScienceDaily, leidsid teadlaste meeskonna loodud algoritmid, et esinesid märguandemärgid, erinevused esialgsest pildist, et pilt oli ümber pööratud või peegeldunud.

Cornell Techi arvutiteaduse dotsent Noah Snavely oli uuringu vanemautor. Snavely sõnul sai uurimisprojekt alguse sellest, et teadlasi hakkas huvitama, kuidas pildid olid peegeldumisel erinevad nii ilmselgelt kui ka peenelt. Snavely selgitas, et isegi esmapilgul väga sümmeetrilistena tunduvaid asju saab tavaliselt uurides peegeldusena eristada. Mind huvitavad avastused, mida saate teha uute teabe kogumise viisidega, ”ütles Snavely ScienceDaily teatel.

Teadlased keskendusid inimeste piltidele, kasutades neid oma algoritmide treenimiseks. Seda tehti seetõttu, et näod ei tundu ilmselgelt asümmeetrilised. Õppides andmetega, mis eristasid ümberpööratud pilte algsetest piltidest, saavutas AI väidetavalt 60–90% täpsuse erinevat tüüpi kujutiste puhul.

Paljud ümberpööratud pildi visuaalsed tunnused, mille AI õppis, on üsna peened ja inimestel on pööratud pilte vaadates raske neid ära tunda. Selleks, et paremini tõlgendada funktsioone, mida AI kasutas pööratud ja originaalpiltide eristamiseks, koostasid teadlased soojuskaardi. Soojuskaart näitas pildi piirkondi, millele AI kippus keskenduma. Teadlaste sõnul oli üks levinumaid vihjeid, mida tehisintellekt ümberpööratud piltide eristamiseks kasutas, tekst. See polnud üllatav ja teadlased eemaldasid oma koolitusandmetest teksti sisaldavad pildid, et saada parem ülevaade ümberpööratud ja originaalpiltide peenematest erinevustest.

Pärast teksti sisaldavate piltide eemaldamist treeningkomplektist leidsid teadlased, et AI klassifikaator keskendus piltide funktsioonidele, nagu särk helistajad, mobiiltelefonid, käekellad ja näod. Mõnel neist funktsioonidest on ilmsed ja usaldusväärsed mustrid, mida AI saab lihvida, näiteks asjaolu, et inimesed kannavad sageli mobiiltelefone paremas käes ja särgikraede nupud on sageli vasakul. Kuid näojooned on tavaliselt väga sümmeetrilised, erinevused on väikesed ja neid on vaatlejal väga raske tuvastada.

Teadlased lõid veel ühe soojuskaardi, mis tõi esile näopiirkonnad, millele tehisintellekt keskendus. Tehisintellekt kasutas ümberpööratud piltide tuvastamiseks sageli inimeste silmi, juukseid ja habet. Ebaselgetel põhjustel vaatavad inimesed sageli veidi vasakule, kui nad on neist fotosid teinud. Selle kohta, miks juuksed ja habe on ümberpööratud piltide näitajad, pole teadlased kindlad, kuid nad väidavad, et inimese käepärasust võib paljastada viis, kuidas nad raseerivad või kammivad. Kuigi need näitajad võivad olla ebausaldusväärsed, võivad teadlased mitme näitaja kombineerimisel saavutada suuremat usaldust ja täpsust.

Sellega seoses tuleb teha rohkem uuringuid, kuid kui tulemused on järjepidevad ja usaldusväärsed, võib see aidata teadlastel leida tõhusamaid viise masinõppe algoritmide koolitamiseks. Arvutinägemist tehisintellekti treenitakse sageli piltide peegelduste abil, kuna see on tõhus ja kiire viis saadaolevate treeningandmete hulga suurendamiseks. Võimalik, et peegeldunud piltide erinevuse analüüsimine võib aidata masinõppe teadlastel paremini mõista masinõppemudelites esinevaid eelarvamusi, mis võivad põhjustada piltide ebatäpset klassifitseerimist.

Nagu Snavely oli tsiteeritud ScienceDailyst:

"See viib arvutinägemise kogukonna jaoks lahtise küsimuseni, milleks on, millal on see õige andmestiku täiendamiseks seda ümberpööramist teha ja millal see pole OK? Loodan, et see paneb inimesed nendele küsimustele rohkem mõtlema ja hakkavad välja töötama tööriistu, et mõista, kuidas see algoritmi kallutab.