Umjetna inteligencija
Projiciranje klimatskih promjena u fotografije s generativnim kontradiktornim mrežama
Tim istraživača iz Kanade i SAD-a razvio je metodu strojnog učenja za superponiranje katastrofalnih učinaka klimatskih promjena u stvarne fotografije koristeći Generative Adversarial Networks (GAN), s ciljem smanjenja 'distanciranja' – naše nesposobnost povezivanja na hipotetske ili apstraktne scenarije u vezi s klimatskim promjenama.
Korištenje električnih romobila ističe projekt, Pod naslovom ClimateGAN, dio je šireg istraživačkog napora za razvoj interaktivnih okruženja u kojima korisnici mogu istraživati predviđene svjetove koji su bili pogođeni poplavama, ekstremnim vrućinama i drugim ozbiljnim posljedicama klimatskih promjena.
Raspravljajući o motivaciji iza inicijative, istraživači navode:
'Klimatske promjene velika su prijetnja čovječanstvu, a radnje potrebne za sprječavanje njihovih katastrofalnih posljedica uključuju promjene u donošenju politika i ponašanju pojedinaca. Međutim, poduzimanje radnji zahtijeva razumijevanje učinaka klimatskih promjena, iako se oni mogu činiti apstraktnima i dalekima.
'Projiciranje potencijalnih posljedica ekstremnih klimatskih događaja kao što su poplave na poznatim mjestima može pomoći da se apstraktni utjecaji klimatskih promjena konkretiziraju i potaknu djelovanje.'
Osnovni cilj inicijative je omogućiti sustav u kojem korisnik može unijeti svoju adresu (ili bilo koju adresu) i vidjeti verziju odgovarajuće slike pogođenu klimatskim promjenama s Google Street Viewa. Međutim, algoritmi transformacije koji stoje iza ClimateGAN-a zahtijevaju određeno znanje o procijenjenoj visini za stavke na fotografiji, što nije uključeno u metapodatke koje Google pruža za Street View, pa dobivanje takve procjene algoritamskim putem ostaje stalni izazov.
Podaci i arhitektura
ClimateGAN koristi nenadzirani cjevovod za prevođenje slike u sliku s dvije faze: masker sloj, koji procjenjuje gdje bi ravna površina vode teoretski postojala na ciljanoj slici; i modul Painter za realistično prikazivanje vode unutar granica utvrđene maske, te uzima u obzir refleksiju preostale nezasjenjene geometrije iznad vodene linije.
Većina podataka o obuci odabrana je iz CityScapes i Mapilarno skupovi podataka. Međutim, budući da su postojeći podaci o slikama poplava relativno rijetki, istraživači su kombinirali postojeće dostupne skupove podataka s novim 'virtualnim svijetom' razvijenim s Unity3D motorom za igre.
Unity3D svijet sadrži oko 1.5 km terena, a uključuje urbana, prigradska i ruralna područja, koja su istraživači 'preplavili'. To je omogućilo generiranje slika 'prije' i 'poslije' za dodatnu temeljnu istinu za okvir ClimateGAN.
Jedinica Masker prilagođava 2018 DOLAZAK kod za obuku, dodajući dodatne podatke u skladu s nalazima francuske istraživačke inicijative iz 2019 DADA. Istraživači su također dodali segmentacijski dekoder kako bi jedinici Masker dali dodatne informacije u vezi sa semantikom ulazne slike (tj. označene informacije koje označavaju domenu, kao što je 'zgrada').
Flood Mask Decoder izračunava izvedivu vodenu liniju, a pokreće ga iznimno popularan NVIDIA MAČEVA unutarslikarski okvir.
Iako su istraživači koristili NVIDIA GauGAN, koji pokreće SPADE, za modul Painter, bilo je potrebno uvjetovati GauGAN na izlazu Maskera, a ne na generaliziranoj semantičkoj mapi segmentacije, kao što se događa u normalnoj uporabi, budući da su slike morale biti transformirane u skladu s vodenom linijom razgraničenja, umjesto da bude predmet širokih, općih transformacija.
Ocjenjivanje kvalitete
Mjerni podaci za procjenu kvalitete dobivenih slika olakšani su označavanjem testnog skupa od 180 Google Street View slika različitih vrsta, uključujući urbane scene i ruralnije slike s različitih geografskih lokacija. Slike su ručno označene kao ne može-biti-poplavljen, mora biti poplavljeni može-biti-poplavljen.
To je omogućilo formuliranje tri metrike: stopa pogreške (percipirana područja predviđanja prema veličini u transformiranoj slici), F05 Postićii rubna koherencija. Za usporedbu, istraživači su testirali podatke o prethodnim modelima prevođenja slike u sliku (IIT), uključujući InstaGAN, CiklusGANi MUNIT.
Istraživači priznaju da nedostatak podataka o visini u izvornim slikama otežava proizvoljno nametanje visina vodene linije na slikama, ako korisnik želi malo povećati 'faktor Roland Emmerich'. Oni također priznaju da su učinci poplava pretjerano ograničeni na poplavno područje i namjeravaju istražiti metode pomoću kojih bi se višestruke razine poplava (tj. nakon recesije početnog potopa) mogle dodati metodologiji.
ClimateGAN-ov kod je bio dostupan na GitHubu, zajedno s dodatnim primjerima prikazanih slika.