rozhovory

Yashar Behzadi, generální ředitel společnosti Synthesis AI – Interview Series

Zveřejněno

Před 2 let

Února 7, 2022

Yashar Behzadi PhD je generální ředitel a zakladatel společnosti Syntéza AI. Je to zkušený podnikatel, který vybudoval transformační podniky na trzích AI, lékařských technologií a internetu věcí. Posledních 14 let strávil v Silicon Valley budováním a škálováním technologických společností zaměřených na data. Yashar má více než 30 patentů a patentů v řízení a Ph.D. z UCSD se zaměřením na prostorově-časové modelování funkčního zobrazování mozku.

Syntéza AI je startup na pomezí hlubokého učení a CGI, který vytváří nové paradigma pro vývoj modelů počítačového vidění. Umožňují zákazníkům vyvíjet lepší modely za zlomek času a nákladů oproti tradičním přístupům založeným na lidských anotacích.

Jak jste se původně dostal k informatice a umělé inteligenci?

Získal jsem titul Ph.D. z UCSD v roce 2006 se zaměřil na počítačové vidění a prostorové a časové modelování dat zobrazování mozku. Poté jsem dalších 16 let pracoval v Silicon Valley na křižovatce senzorů, dat a strojového učení napříč průmyslovými odvětvími. Cítím se velmi šťastný, že mám příležitost pracovat na některých pozoruhodných technologiích a mám více než 30 vydaných nebo přihlášených patentů zaměřených na zpracování signálů, strojové učení a datovou vědu.

Mohl byste se podělit o příběh geneze Synthesis AI?

Před založením Synthesis AI v roce 2019 jsem vedl globální společnost poskytující služby AI zaměřenou na vývoj modelů počítačového vidění pro přední technologické podniky. Bez ohledu na velikost společnosti jsem zjistil, že jsme byli extrémně omezeni kvalitou a množstvím označených školicích dat. Jak se společnosti geograficky rozšiřovaly, rozšiřovaly svou zákaznickou základnu nebo vyvíjely nové modely a nový hardware, byla zapotřebí nová školicí data, aby bylo zajištěno, že modely fungují adekvátně. Také se ukázalo, že budoucnost počítačového vidění nebude úspěšná s dnešním paradigmatem anotací typu human-in-the-loop. Rozvíjející se aplikace počítačového vidění v autonomii, robotice a aplikacích AR/VR/metaverse vyžadují bohatou sadu 3D štítků, informací o hloubce, materiálových vlastnostech, detailní segmentaci atd., které lidé nemohou označit. Bylo zapotřebí nové paradigma, které by poskytlo nezbytnou bohatou sadu štítků pro výcvik těchto nových modelů. Kromě technických ovladačů jsme byli svědky rostoucí spotřebitelské a regulační kontroly ohledně etických problémů souvisejících s předpojatostí modelů a soukromí spotřebitelů.

Založil jsem Synthesis AI s úmyslem transformovat paradigma počítačového vidění. Platforma společnosti pro syntetické generování dat umožňuje generování fotorealistických obrazových dat na vyžádání s rozšířenou sadou 3D štítků s dokonalými pixely. Naším posláním je propagovat syntetické datové technologie, které umožní etický vývoj schopnějších modelů.

Mohl byste pro čtenáře, kteří tento pojem neznají, definovat, co jsou syntetická data?

Syntetická data jsou počítačem generovaná data, která slouží jako alternativa k reálným datům. Syntetická data jsou vytvářena v simulovaných digitálních světech, nikoli shromažďována nebo měřena v reálném světě. Kombinací nástrojů ze světa vizuálních efektů a CGI s generativními modely umělé inteligence umožňuje Synthesis AI společnostem vytvářet obrovské množství fotorealistických, různorodých dat na vyžádání pro trénování modelů počítačového vidění. Platforma společnosti pro generování dat řádově snížila náklady a rychlost získávání vysoce kvalitních obrazových dat při zachování soukromí.

Mohl byste probrat, jak se generují syntetická data?

Syntetická datová sada je vytvořena uměle spíše než prostřednictvím reálných dat. Technologie z odvětví vizuálních efektů jsou spojeny s generativními neuronovými sítěmi a vytvářejí rozsáhlá, různorodá a fotorealisticky značená obrazová data. Syntetická data umožňují vytvářet tréninková data za zlomek nákladů a času oproti současným přístupům.

Jak využití syntetických dat vytváří konkurenční výhodu?

V současnosti většina systémů umělé inteligence využívá „učení pod dohledem“, kdy lidé označují klíč přiřazený na obrázcích a poté trénují algoritmy umělé inteligence k interpretaci obrázků. Jedná se o proces náročný na zdroje a čas a je omezen tím, co lidé mohou přesně označit. Navíc se zesílily obavy z demografického zkreslení umělé inteligence a soukromí spotřebitelů, takže je stále obtížnější získat reprezentativní data o lidech.

Naším přístupem je vytvářet fotorealistické digitální světy, které syntetizují komplexní obrazová data. Protože generujeme data, víme o scénách vše, včetně nikdy dříve dostupných informací o 3D umístění objektů a jejich komplexních interakcích mezi sebou a prostředím. Získání a označení tohoto množství dat pomocí současných přístupů by trvalo měsíce, ne-li roky. Toto nové paradigma umožní 100násobné zlepšení efektivity a nákladů a povede k nové třídě schopnějších modelů.

Vzhledem k tomu, že syntetická data jsou generována uměle, eliminuje to mnoho zkreslení a obav o soukromí při tradičním shromažďování souborů dat z reálného světa.

Jak umožňuje generování dat na vyžádání zrychlené škálování?

Zachycování a příprava reálných dat pro modelování je dlouhý a únavný proces. Nasazení potřebného hardwaru může být neúměrně drahé pro komplikované systémy počítačového vidění, jako jsou autonomní vozidla, robotika nebo satelitní snímky. Jakmile jsou data zachycena, lidé označí a označí základní prvky. Tento proces je náchylný k chybám a lidé jsou omezeni ve své schopnosti označit klíčové informace, jako je 3D poloha požadovaná pro mnoho aplikací.

Syntetická data jsou řádově rychlejší a levnější než tradiční přístupy k reálným datům anotovaným člověkem a urychlí zavádění nových a schopnějších modelů napříč odvětvími.

Jak syntetická data umožňují snížení nebo prevenci zkreslení AI?

Systémy umělé inteligence jsou všudypřítomné, ale mohou obsahovat vrozené předsudky, které mohou ovlivnit skupiny lidí. Datové sady mohou být nevyvážené s určitými třídami dat a s nadměrně nebo nedostatečně zastoupenými skupinami lidí. Budování systémů zaměřených na člověka může často vést k genderovým, etnickým a věkovým předsudkům. Naproti tomu tréninková data generovaná designem jsou správně vyvážená a postrádají lidské předsudky.

Syntetická data by se mohla stát robustním řešením při řešení problému zkreslení AI. Syntetická data jsou generována částečně nebo zcela uměle, spíše než měřena nebo extrahována z událostí nebo jevů reálného světa. Pokud datová sada není různorodá nebo dostatečně velká, data generovaná umělou inteligencí mohou vyplnit díry a vytvořit nezaujatou datovou sadu. Nejlepší část? Manuální vytváření těchto datových sad může týmům trvat několik měsíců nebo let. Když je navrženo se syntetickými daty, lze to provést přes noc.

Jaké jsou některé budoucí možné případy použití syntetických dat mimo počítačové vidění?

Kromě mnoha případů použití počítačového vidění souvisejících se spotřebními produkty, autonomií, robotikou, AR/VR/metaverse a dalšími ovlivní syntetická data také další datové modality. Již nyní jsme svědky toho, jak společnosti využívají syntetické datové přístupy pro zpracování strukturovaných tabulkových dat, hlasu a přirozeného jazyka. Základní technologie a generační kanály se pro každou modalitu liší a v blízké budoucnosti očekáváme multimodální systémy (např. video + hlas).

Je ještě něco, o co byste se chtěli podělit o Synthesis AI?

Koncem loňského roku jsme vydali HumanAPI, významné rozšíření schopností syntetických dat Synthesis AI umožňující programové generování milionů jedinečných, vysoce kvalitních 3D digitálních lidí. Toto oznámení přichází měsíce po uvedení produktu FaceAPI syntetických dat jako služby, který poskytl více než 10 milionů označených snímků obličeje pro přední smartphony, telekonference, automobilové a technologické společnosti. HumanAPI je dalším krokem na cestě společnosti k podpoře aplikací pokročilého počítačového vidění umělé inteligence (AI).

HumanAPI také umožňuje našim zákazníkům nespočet nových příležitostí, včetně chytrých asistentů AI, virtuálních fitness trenérů a samozřejmě světa metaverse aplikací.

Vytvořením digitálního dvojníka skutečného světa umožní metaverse nové aplikace od přepracovaných sociálních sítí, zábavy, telekonferencí, her a dalších. Umělá inteligence počítačového vidění bude základem toho, jak je skutečný svět zachycen a znovu vytvořen s vysokou věrností v digitální oblasti. Fotorealističtí, expresivní a behaviorálně přesní lidé budou nezbytnou součástí budoucnosti aplikací počítačového vidění. HumanAPI je prvním produktem, který umožňuje společnostem vytvářet obrovské množství perfektně označených celotělových dat na vyžádání, aby mohly vytvářet schopnější modely umělé inteligence, včetně odhadu pozice, rozpoznávání emocí, charakterizace aktivity a chování, rekonstrukce obličeje a další.

Děkuji za skvělý rozhovor, čtenáři, kteří se chtějí dozvědět více, by měli navštívit Syntéza AI.