rozhovory

Yashar Behzadi, generálny riaditeľ spoločnosti Synthesis AI – Interview Series

uverejnené

Pred 2 rokov

Februára 7, 2022

Yashar Behzadi PhD je generálnym riaditeľom a zakladateľom spoločnosti Syntéza AI. Je skúseným podnikateľom, ktorý vybudoval transformačné podniky na trhoch AI, medicínskych technológií a internetu vecí. Posledných 14 rokov strávil v Silicon Valley budovaním a rozširovaním technologických spoločností zameraných na dáta. Yashar má viac ako 30 patentov a patentov v konaní a Ph.D. z UCSD so zameraním na priestorovo-časové modelovanie funkčného zobrazovania mozgu.

Syntéza AI je startup na priesečníku hlbokého učenia a CGI, ktorý vytvára novú paradigmu pre vývoj modelov počítačového videnia. Umožňujú zákazníkom vyvíjať lepšie modely za zlomok času a nákladov oproti tradičným prístupom založeným na ľudských anotáciách.

Ako ste sa na začiatku dostali k informatike a AI?

Získal som titul Ph.D. z UCSD v roku 2006 sa zameral na počítačové videnie a priestorové a časové modelovanie údajov zo zobrazovania mozgu. Nasledujúcich 16 rokov som potom pracoval v Silicon Valley na priesečníku senzorov, dát a strojového učenia naprieč odvetviami. Cítim sa veľmi šťastný, že mám príležitosť pracovať na niektorých pozoruhodných technológiách a mám viac ako 30 vydaných alebo podaných patentov zameraných na spracovanie signálov, strojové učenie a vedu o údajoch.

Mohli by ste sa podeliť o príbeh genézy Synthesis AI?

Pred založením Synthesis AI v roku 2019 som viedol globálnu spoločnosť poskytujúcu služby AI zameranú na vývoj modelov počítačového videnia pre popredné technologické podniky. Bez ohľadu na veľkosť spoločnosti som zistil, že sme extrémne limitovaní kvalitou a množstvom označených tréningových údajov. Ako sa spoločnosti geograficky rozširovali, rozširovali svoju zákaznícku základňu alebo vyvíjali nové modely a nový hardvér, boli potrebné nové školiace údaje, aby sa zabezpečilo, že modely fungujú primerane. Taktiež sa ukázalo, že budúcnosť počítačového videnia nebude úspešná s dnešnou paradigmou anotácií typu human-in-the-loop. Vznikajúce aplikácie počítačového videnia v autonómii, robotike a aplikáciách AR/VR/metaverse vyžadujú bohatú sadu 3D štítkov, informácií o hĺbke, materiálových vlastnostiach, detailnej segmentácii atď., ktoré ľudia nemôžu označiť. Bola potrebná nová paradigma, ktorá by poskytla potrebnú bohatú sadu označení na trénovanie týchto nových modelov. Okrem technických faktorov sme boli svedkami zvýšenej spotrebiteľskej a regulačnej kontroly týkajúcej sa etických otázok súvisiacich so zaujatosťou modelov a súkromím spotrebiteľov.

Založil som Synthesis AI s úmyslom transformovať paradigmu počítačového videnia. Syntetická platforma spoločnosti na generovanie údajov umožňuje generovanie fotorealistických obrazových údajov na požiadanie s rozšírenou sadou 3D štítkov s dokonalými pixelmi. Naším poslaním je propagovať syntetické dátové technológie, ktoré umožnia etický vývoj schopnejších modelov.

Pre čitateľov, ktorým tento pojem nie je známy, by ste mohli definovať, čo sú syntetické dáta?

Syntetické údaje sú údaje generované počítačom, ktoré slúžia ako alternatíva k údajom z reálneho sveta. Syntetické údaje sa vytvárajú v simulovaných digitálnych svetoch a nie sú zhromažďované alebo merané v reálnom svete. Kombináciou nástrojov zo sveta vizuálnych efektov a CGI s generatívnymi modelmi AI umožňuje Synthesis AI spoločnostiam vytvárať obrovské množstvá fotorealistických, rôznorodých údajov na požiadanie na trénovanie modelov počítačového videnia. Platforma spoločnosti na generovanie údajov znížila náklady a rýchlosť získania vysokokvalitných obrazových údajov rádovo pri zachovaní súkromia.

Mohli by ste diskutovať o tom, ako sa generujú syntetické údaje?

Súbor syntetických údajov sa vytvára umelo a nie prostredníctvom údajov z reálneho sveta. Technológie z odvetvia vizuálnych efektov sú spojené s generatívnymi neurónovými sieťami na vytváranie rozsiahlych, rôznorodých a fotorealisticky označených obrazových údajov. Syntetické dáta umožňujú vytvárať tréningové dáta za zlomok nákladov a času oproti súčasným prístupom.

Ako využitie syntetických údajov vytvára konkurenčnú výhodu?

V súčasnosti väčšina systémov AI využíva „učenie pod dohľadom“, kde ľudia označujú kľúč priradený na obrázkoch a potom trénujú algoritmy AI na interpretáciu obrázkov. Ide o proces náročný na zdroje a čas a je obmedzený tým, čo ľudia dokážu presne označiť. Okrem toho sa zosilnili obavy z demografickej zaujatosti AI a súkromia spotrebiteľov, čo sťažuje získavanie reprezentatívnych údajov o ľuďoch.

Naším prístupom je vytvárať fotorealistické digitálne svety, ktoré syntetizujú komplexné obrazové dáta. Keďže generujeme dáta, vieme všetko o scénach, vrátane nikdy predtým dostupných informácií o 3D umiestnení objektov a ich komplexných interakciách medzi sebou a prostredím. Získanie a označenie tohto množstva údajov pomocou súčasných prístupov by trvalo mesiace, ak nie roky. Táto nová paradigma umožní 100-násobné zlepšenie efektívnosti a nákladov a povedie k novej triede schopnejších modelov.

Keďže syntetické údaje sa generujú umelo, eliminuje to mnohé predsudky a obavy o súkromie pri tradičnom zhromažďovaní súborov údajov z reálneho sveta.

Ako umožňuje generovanie údajov na požiadanie zrýchlené škálovanie?

Zachytenie a príprava reálnych údajov pre modelový tréning je dlhý a únavný proces. Nasadenie potrebného hardvéru môže byť neúmerne drahé pre komplikované systémy počítačového videnia, ako sú autonómne vozidlá, robotika alebo satelitné snímky. Po zachytení údajov ľudia označia a anotujú základné funkcie. Tento proces je náchylný na chyby a ľudia majú obmedzenú schopnosť označiť kľúčové informácie, ako je 3D poloha potrebná pre mnohé aplikácie.

Syntetické údaje sú rádovo rýchlejšie a lacnejšie ako tradičné prístupy k skutočným údajom anotovaným človekom a urýchlia nasadenie nových a schopnejších modelov v rôznych odvetviach.

Ako syntetické údaje umožňujú znížiť alebo zabrániť skresleniu AI?

Systémy AI sú všadeprítomné, ale môžu obsahovať prirodzené predsudky, ktoré môžu ovplyvniť skupiny ľudí. Množiny údajov môžu byť nevyvážené s určitými triedami údajov a buď nadbytočnými alebo nedostatočne zastúpenými skupinami ľudí. Budovanie systémov zameraných na človeka môže často viesť k rodovým, etnickým a vekovým predsudkom. Naproti tomu tréningové dáta generované dizajnom sú správne vyvážené a chýbajú im ľudské predsudky.

Syntetické údaje by sa mohli stať robustným riešením pri riešení problému skreslenia AI. Syntetické údaje sú generované čiastočne alebo úplne umelo a nie merané alebo extrahované z udalostí alebo javov v reálnom svete. Ak súbor údajov nie je rôznorodý alebo dostatočne veľký, údaje generované AI môžu vyplniť diery a vytvoriť nezaujatý súbor údajov. Najlepšia časť? Manuálne vytváranie týchto množín údajov môže tímom trvať niekoľko mesiacov alebo rokov. Keď sa navrhne so syntetickými údajmi, dá sa to urobiť cez noc.

Aké sú niektoré budúce potenciálne prípady použitia syntetických údajov mimo počítačového videnia?

Okrem množstva prípadov použitia počítačového videnia súvisiacich so spotrebnými produktmi, autonómiou, robotikou, AR/VR/metaverse a ďalšími, ovplyvnia syntetické údaje aj iné spôsoby údajov. Už sme svedkami toho, ako spoločnosti využívajú syntetické dátové prístupy na spracovanie štruktúrovaných tabuľkových dát, hlasu a prirodzeného jazyka. Základné technológie a generačné kanály sa líšia pre každú modalitu av blízkej budúcnosti očakávame multimodálne systémy (napr. video + hlas).

Je ešte niečo, o čo by ste sa chceli podeliť o Synthesis AI?

Koncom minulého roka sme vydali HumanAPI, významné rozšírenie syntetických dátových schopností Synthesis AI umožňujúce programové generovanie miliónov jedinečných, vysokokvalitných 3D digitálnych ľudí. Toto oznámenie prichádza niekoľko mesiacov po uvedení produktu FaceAPI syntetických údajov ako služby, ktorý priniesol viac ako 10 miliónov označených obrázkov tváre pre popredné smartfóny, telekonferencie, automobilové a technologické spoločnosti. HumanAPI je ďalším krokom na ceste spoločnosti k podpore pokročilých aplikácií počítačového videnia umelej inteligencie (AI).

HumanAPI tiež umožňuje našim zákazníkom nespočetné množstvo nových príležitostí, vrátane inteligentných asistentov AI, virtuálnych fitness trénerov a samozrejme sveta metaverse aplikácií.

Vytvorením digitálneho dvojníka skutočného sveta umožní metaverse nové aplikácie od prepracovaných sociálnych sietí, zážitkov zo zábavy, telekonferencií, hier a ďalších. Umelá inteligencia počítačového videnia bude základom toho, ako je skutočný svet zachytený a znovu vytvorený s vysokou vernosťou v digitálnej sfére. Fotorealistickí, expresívni a behaviorálne presní ľudia budú základnou súčasťou budúcnosti aplikácií počítačového videnia. HumanAPI je prvým produktom, ktorý umožňuje spoločnostiam vytvárať obrovské množstvá perfektne označených celotelových údajov na požiadanie s cieľom zostaviť schopnejšie modely AI, vrátane odhadu pozície, rozpoznávania emócií, charakterizácie aktivity a správania, rekonštrukcie tváre a ďalších.

Ďakujeme za skvelý rozhovor, čitatelia, ktorí sa chcú dozvedieť viac, by mali navštíviť Syntéza AI.