intervjuud

Gil Elbaz, Datageni intervjuusarja kaasasutaja ja tehnoloogiajuht

Ajakohastatud on Oktoober 1, 2021

Gil Elbaz on Datageni oma Tehnikadirektor ja kaasasutaja, mis asub Tel Avivis. Ta omandas bakalaureusekraadi ja magistrikraadi Technionist. Gili lõputöö keskendus 3D-arvutinägemisele ja see on avaldatud maailma tipptasemel arvutinägemise uuringute konverentsil CVPR. Datagen on teerajaja uues simuleeritud andmete valdkonnas, mis on sünteetiliste andmete alamhulk, mis keskendub meid ümbritseva maailma fotorealistlikule taasloomisele. Ettevõte alustas 18. aasta märtsis vargsi, rahastades rohkem kui 2021 miljonit dollarit, ja teeb nüüd koostööd mitme Fortune 100 ettevõttega liit-/virtuaalreaalsuse, robootika ja autotööstuse valdkonnas, sealhulgas enamiku USA tipptehnoloogiahiiglastega.

Mis teid alguses robootika ja masinõppe juures köitis?

Ulmeraamatud, nagu Isaac Asimovi sihtasutuse sari ja iRobot, panid mind alati mõtlema tulevikule, kus robotid on meie igapäevaelu lahutamatu osa. Inimesed teevad nii palju igavaid, korduvaid ülesandeid; Teadsin, et ma ei taha neid teha, ja ma ei kujutanud ette, et keegi teine seda tahaks. Arvestades, et robootika on tehnoloogiline paratamatus, arvasin, et selles suunas liikumine oleks tark, “tulevikukindel” karjääriotsus.

Niisiis lähenesin valdkonnale algselt aine füüsilistele aspektidele ja omandasin masinaehituse kraadi Iisraelis Haifas asuvast Technionist. Oma kraadiõppe lõpupoole hakkasin sukelduma sügavale CAD-tööriistade ja võimaluste maailma. Need on tööriistad, mis võimaldavad mehaanikainseneridel projekteerida konstruktsioone ja mehaanilisi seadmeid (sillast autoni). Nägin tohutut võimalust avaldada suurt mõju ilma füüsilise maailma aeglaste iteratsioonidega tegelemata. Praktikas oli nendesse programmidesse väga vähe integreeritud masinõppe / arvutinägemise võimalusi, kui üldse, mis aitas inseneridel luua lihtsamaid, odavamaid ja stabiilsemaid mehaanilisi süsteeme (see juhtus 2015. aastal). Asusin süvaõppega 3D-andmete Computer Visioni suunas (siis väga uus), eesmärgiga teha nutikamaid CAD-programme. Kaasaegse süvaõppe algusaegadel töötades tundus, et oleksite osaline millestki, mis võib olla tõeliselt suur – sarnaselt Internetiga.

Praktikas oli minu uurimus esimene, mis tõi süvaõppe revolutsiooni meie Technioni õppejõududeni. Sellest sai hiljem ettekanne, mis võeti vastu maailma tipptasemel Computer Vision konverentsil CVPR ja ma lendasin Hawaiile CVPR 2017. Oma ettekande esitlemine ja inimestega kohtumine avas mu silmad arvutinägemise kogukonna ulatusele (mis täna on). on vähemalt 10 korda suurem), tuhanded osalejad töötavad kirglikult selle valdkonna teadustöö kallal. See sündmus kinnitas minu suunda, näidates mulle arvutinägemise jõudu ja potentsiaali, mis ootab avamist.

Kas saaksite jagada Datageni tekkelugu?

Datagen asutati 2018. aastal eesmärgiga muuta seda, kuidas meeskonnad saavad oma andmeid arvutinägemise võrgukoolituse jaoks. Aasta varem nägime Oculus Rifti demo, mis koosnes VR-peakomplektist ja käeshoitavast kaugjuhtimisseadmest. Pärast demo avastasime end mõtlemast: "Miks oli peakomplekti sisseehitatud keerukate kaamerate puhul vaja pihuseadet virtuaalse ruumi ühendamiseks füüsilise ruumiga (st käe liikumise jälgimiseks)?" Närvivõrgud olid juba piisavalt arenenud, et sellega hakkama saada, nii et milles oli probleem? Ja siis kustus pirn – Andmed! Nägime kohe tohutut võimalust lahendada 3D-ruumilise kohaloleku väljakutseid täiustatud arvutinägemise ja 3D-metaandmete abil. Selle asemel, et keskenduda ainult VR/AR-ile, võtsime kasutusele terviklikuma lähenemisviisi, keskendudes näiliselt lahendamatule probleemile piisavate (ja täpsete) koolitusandmete genereerimisel, et võimaldada reaalseid 3D AI-rakendusi.

Keskendudes inimestele ning inimese ja keskkonna interaktsioonile, on Datagen teerajaja uues simuleeritud andmete valdkonnas, sünteetiliste andmete alamhulgas, mis keskendub meid ümbritseva maailma fotorealistlikule taasloomisele. Täna teeme koostööd maailma kõige uuenduslikumate ettevõtetega, et nende arvutinägemust arendada ja kiirendada, ning neid toetavad mõned valdkonna kõige lugupeetud investorid.

Kas te võiksite võõrastele lugejatele selgitada, mis on sünteetilised andmed?

Sünteetilised andmed on mis tahes koolitusandmed, mis – selle asemel, et koguda tegeliku maailma otsese mõõtmise või vaatlemise teel – genereeritakse kas algoritmiliselt või simulatsiooni teel. Arvutinägemise kontekstis on sünteetilised andmed arvutiga loodud kujutised koos tehisintellekti treenimiseks vajalike metaandmetega. Kuna privaatsusprobleemid ning reaalsete pildiandmete füüsilised ja majanduslikud piirangud on väga reaalsed, on sünteetiliste andmete tähtsust masinõppes ja tehisintellektis raske üle hinnata. Hiljutises aruandes Gartner ennustas, et 2024. aastaks luuakse suurem osa tehisintellekti valdkonnas kasutatavatest andmetest nendel põhjustel kunstlikult.

Millised on sünteetiliste andmete eelised võrreldes käsitsi andmete hankimisega?

Lühike vastus on, et mõelge käsitsi andmete hankimise kõikidele ebasoovitavatele aspektidele ja eemaldage need protsessist – need on sünteetiliste andmete eelised.

Arvutinägemise koolituse jaoks mitmekesiste andmekogumite mastaabis loomine on kulukas ja aeganõudev protsess ning erinevust piirab väga ainuüksi tõsiasi, et inimeste paigutamine kindlatesse kohtadesse ja nende pildistamine on keeruline protsess – palju keerulisem ja kulukam kui seda teha simuleeritud keskkond. Teine oluline eelis on tõhusalt kõrvaldada vajadus käsitsi märkuste järele, mis on tüütu, aeganõudev ja inimlike vigade oht.

Datagen viitab simuleeritud andmetele kui sünteetiliste andmete alamhulgale. Kas saaksite täpsustada, mis on simuleeritud andmed?

Simuleeritud andmed on sünteetilised andmed, mis genereeritakse simulatsiooni teel. Me kasutame GAN-e (nagu ka mõningaid muid tipptasemel masinõppemeetodeid), et luua 3D-objekte ja paigutada need reaalse maailma ülimalt realistlikesse 3-D-simulatsioonidesse. See näeb välja esimese isiku "virtuaalse pildistamise" protsess, mis toimib fotorealistlikus füüsikapõhises süsteemis. Need simulatsioonid toodavad visuaalseid andmeid (justkui need oleksid kogutud reaalses maailmas) koos paljude annotatsioonidega (füüsika, valgustus jne). Seega on simuleeritud andmed sünteetilised andmed, mis on fotorealistlikud, kontekstipõhiselt loodud 3D-kujutised, mis on kogutud simuleeritud keskkonda.

Kuidas Datagen genereerib kohandatud simuleeritud andmeid?

Datageni tehnoloogia genereerib simuleeritud andmeid, mis on nii kergesti skaleeritavad kui ka käsitsi kohandatud, et rahuldada iga kliendi konkreetse rakenduse ainulaadseid vajadusi. Teeme seda, võttes arvesse iga projekti kõiki aspekte – alates kasutatavast arvutinägemissüsteemist kuni selle piirkonna demograafilise struktuurini, kus see toimib. Ükskõik, kas töötame otse oma klientidega või lubame lihtsalt oma inseneridele, algab Datageni protsess põhiparameetrite kehtestamisega iga konkreetse kasutusjuhtumi jaoks, nagu objektiivi spetsifikatsioonid, valgustus, keskkond, demograafiline jaotus ja nii edasi. Datagen kasutab GAN-e ja muid tipptasemel tööriistu ja tehnikaid, et luua tohutult erinevaid varasid, sealhulgas kõike alates dünaamiliste näoilmetega inimpeadest kuni tehisintellekti treenimiseni emotsioonide analüüsiks, kuni sõidukite interjöörini salongi reisijate jälgimiseks ja kodukeskkonda videote jaoks. konverentsirakendused, kui nimetada vaid mõnda. Datagen tutvustab iga varatüübi puhul dispersiooni lugematul arvul diskreetsetel telgedel (alates nahatoonist ja kulmude kõrgusest kuni majamööbli suuruse, värvi ja kujuni), kasutades parameetreid, mis on peenhäälestatud vastavalt konkreetsele rakendusele.

Tänu nendele võimalustele ei ole Datageni andmestikud mitte ainult suured ja väga mitmekesised, vaid ka optimeeritud unikaalse süsteemi väljaõpetamiseks, et täita unikaalset ülesannet (või ülesannete kogumit) ainulaadses keskkonnas või keskkonnas, kus seda kasutatakse. seda kõike ilma mastaapimisvõimet kahjustamata. Samuti võtame arvesse iga rakenduse spetsiifilisi märkuste/metaandmete nõudeid.

Millised on mõned näited lahendustest robootikas, kus kasutatakse sünteetilisi ja/või simuleeritud andmeid?

Simuleeritud andmete robootikas kasutamise üks suurimaid eeliseid on võime genereerida pilte veel arendusjärgus olevast riistvarast. Nii saab teie roboti aju (AI) ja keha (riistvara) arendada kõrvuti. Nüüd saab koolitus areneda vastavalt spetsifikatsioonidele, selle asemel, et oodata, kuni lõpptoote prototüüp on täielikult valminud, enne kui saate sellest fotosid teha ja AI arendamist alustada.

Kuna simuleeritud andmeid genereeritakse kontekstis, saate oma roboti ja selle keskkonna vahelist suhtlust palju hõlpsamini arvesse võtta. Seega, kui kujutate ette robotit, mis haarab kokku ja eemaldab defektsed tooted koosteliinilt, võimaldavad simuleeritud andmed mitte ainult genereerida andmeid iga toote füüsilise defekti kohta, vaid ka roboti vaatenurgast, et jäädvustada robotkäe kogu ulatus. liikumisest, selle vastasmõjust haaratava objektiga. Veelgi enam, 3D-metaandmed tähendavad, et pole vaja pilti pildi järel hoolsalt märkmeid teha, et robot saaks õigesti tuvastada toote, defektid, selle käe või midagi muud oma vaateväljas.

Millised on mõned kasutusjuhud simuleeritud andmete kasutamiseks nutikates autodes?

Nutikate autode arendamise simuleeritud andmed muudavad konkreetsete automudelite jaoks projekteerimise ajal andmekogude väljatöötamise lõputult lihtsamaks, kordudes koos auto endaga, kui see projekteerimise ja tootmise eri etappides edeneb. Simuleeritud pildiandmete abil saavad insenerid kasutada ka salongisisese nägemist tõhusamalt, et tuvastada uniseid või hajutatud juhte, kui juht on käe roolilt ära võtnud, või suvalise arvu servajuhtumeid, et võtta arvesse juhi ohutust. Samuti võimaldab see inseneridel arvestada juhtide ja kaasreisijate suurema mitmekesisusega ning tuua sisse erinevusi pildi nurga ja valgustuse näol – seda kõike ilma tegelike inimeste privaatsust rikkumata.

Hiljuti teatas Datagen paljudest uusi põnevaid töötajaid, mida see ettevõtte tuleviku jaoks tähendab?

Hiljutised täiendused meie nõuandekogusse ja tegevjuhtkonda hõlmavad mõningaid AI ja arvutinägemise valdkonna säravamaid ja saavutatumaid spetsialiste. Nende teadmised, arusaam ja kogemused aitavad orienteeruda ja kiirendada Datageni kasvu, kui navigeerime tööstuses, mis on veel noor ja täis võimalusi. Valdkonnas, kus on nii palju tundmatuid, pole miski väärtuslikum kui teadmised.

Kas soovite Datageni kohta veel midagi jagada?

Tel Avivist väljas asuv Datagen on osa palju suuremast majanduslikust ja kultuurilisest nihkest, mis on toimunud Iisraelis, ja me oleme uhked, et saame sellest osa. Lühikese aja jooksul on Iisraelist (eriti Tel Aviv) kasvanud suur ülemaailmne tehnoloogiakeskus, kus on edukas startup-ökosüsteem ja energiline investeerimiskogukond. Kuigi Iisraeli peetakse sageli küberturvalisusele keskenduvaks tehnoloogiakeskuseks, on AI ja andmekeskne tehnoloogia siin viimastel aastatel hüppeliselt kasvanud. Tänaseks on Iisraelis enam kui 680 tehisintellekti ettevõtet, mis on kogunud ühiselt 4.5 miljardit dollarit. See viimaste aastate plahvatuslik kasv on osaliselt tingitud inseneride ja Iisraeli maailmakuulsate ülikoolide suurest kontsentratsioonist. Need akadeemilised institutsioonid pakuvad ruumis juurdepääsu talentidele ja tipptasemel uue tehnoloogia arendamisele. Viimase kahe kuu jooksul on Datagen palganud üle 20 töötaja ning plaanib müügi- ja turundus-, tarkvara- ja DevOpsi- ning tooteosakondadesse kaasata täiendavaid meeskonnaliikmeid.

Täname suurepärase intervjuu eest, lugejad, kes soovivad rohkem teada saada, peaksid külastama Datagen.