Rozhovory

Yashar Behzadi, generální ředitel Synthesis AI – Interview Series

Published February 7, 2022

Updated April 28, 2026

Antoine Tardif, CEO & Founder of Unite.AI

Yashar Behzadi PhD je generálním ředitelem a zakladatelem Synthesis AI. Je zkušeným podnikatelem, který vybudoval transformační podniky v oblasti AI, medicínské technologie a IoT trhů. Strávil posledních 14 let v Silicon Valley budováním a škálováním datově orientovaných technologických společností. Yashar má více než 30 patentů a patentů ve stavu podání a doktorát z UCSD se zaměřením na prostorově-časové modelování funkční mozkové zobrazování.

Synthesis AI je startup na rozhraní hlubokého učení a CGI, který vytváří nový paradigm pro vývoj modelů počítačového vidění. Umožňují zákazníkům vyvíjet lepší modely za zlomek času a nákladů tradičních přístupů založených na lidské anotaci.

Jak jste se最初 zapojil do počítačové vědy a AI?

Získal jsem doktorát z UCSD v roce 2006 se zaměřením na počítačové vidění a prostorově-časové modelování dat mozkové zobrazování. Poté jsem pracoval v Silicon Valley na rozhraní senzorů, dat a strojového učení napříč odvětvími po dobu 16 let. Pociťuji se velmi šťastným, že jsem měl příležitost pracovat na některých pozoruhodných technologiích, a mám více než 30 patentů vydaných nebo podaných se zaměřením na zpracování signálů, strojové učení a datové vědy.

Můžete sdílet příběh vzniku Synthesis AI?

Předtím, než jsem založil Synthesis AI v roce 2019, vedl jsem globální společnost AI služeb zaměřenou na vývoj modelů počítačového vidění pro přední technologické podniky. Bez ohledu na velikost společnosti jsme byli extrémně omezeni kvalitou a množstvím označených trénovacích dat. Jakmile se společnosti rozšířily geograficky, zvětšily svou zákaznickou základnu nebo vyvinuly nové modely a nové hardwarové vybavení, vyžadovala se nová trénovací data, aby modely fungovaly adekvátně. Také se stalo zřejmým, že budoucnost počítačového vidění nebude úspěšná s dnešním paradigmatem lidské anotace. Nové počítačové vidění aplikací v autonomii, robotice a AR/VR/metaverse aplikacích vyžadují bohatý soubor 3D popisků, hloubkové informace, materiálové vlastnosti, podrobnou segmentaci atd., které lidé nemohou označit. Byl zapotřebí nový paradigm, aby poskytl nezbytný bohatý soubor popisků pro výuku těchto nových modelů. Kromě technických hnacích sil jsme viděli rostoucí spotřebitelskou a regulační kontrolu kolem etických otázek souvisejících s modelovou předpojatostí a spotřebitelskou ochranou soukromí.

Založil jsem Synthesis AI s cílem transformovat paradigm počítačového vidění. Společnostní platforma pro generování syntetických dat umožňuje generovat na vyžádání fotorealistická obrazová data s rozšířeným souborem 3D pixel-perfect popisků. Naší misí je průkopnický rozvoj syntetických datových technologií, aby umožnily etický vývoj schopnějších modelů.

Pro čtenáře, kteří nejsou seznámeni s tímto termínem, můžete definovat, co je syntetická data?

Syntetická data jsou počítačově generovaná data, která slouží jako alternativa k datům z reálného světa. Syntetická data jsou vytvářena v simulovaných digitálních světech, spíše než shromažďována nebo měřena v reálném světě. Kombinací nástrojů ze světa vizuálních efektů a CGI s generativními modely AI, Synthesis AI umožňuje společnostem vytvářet obrovská množství fotorealistických, rozmanitých dat na vyžádání pro výuku modelů počítačového vidění. Společnostní platforma pro generování dat snížila náklady a rychlost získání vysoce kvalitních obrazových dat o několik řádů, zatímco zachovala soukromí.

Můžete diskutovat, jak se syntetická data generují?

Soubor syntetických dat je vytvořen uměle, spíše než prostřednictvím reálných dat. Technologie ze světa vizuálních efektů jsou spojeny s generativními neuronovými sítěmi, aby vytvořily obrovská, rozmanitá a fotorealistická označená obrazová data. Syntetická data umožňují vytvářet trénovací data za zlomek nákladů a času současné přístupy.

Jak využívání syntetických dat vytváří konkurenční výhodu?

V současné době většina systémů AI využívá “dozorované učení”, kde lidé označují klíčové atributy v obrazech a poté trénují algoritmy AI, aby interpretovaly obrázky. Tento proces je zdrojově a časově náročný a je omezen tím, co lidé mohou přesně označit. Kromě toho se obavy s AI demografickou předpojatostí a spotřebitelskou ochranou soukromí zesílily, což činí stále obtížnější získat reprezentativní lidská data.

Náš přístup spočívá ve vytváření fotorealistických digitálních světů, které syntetizují komplexní obrazová data. Protože generujeme data, víme vše o scénách, včetně dříve nedostupných informací o 3D umístění objektů a jejich složitých interakcích s ostatními objekty a prostředím. Získání a označení tohoto množství dat pomocí současných přístupů by trvalo měsíce, pokud ne roky. Tento nový paradigm umožní 100x zlepšení efektivity a nákladů a povede k nové třídě schopnějších modelů.

Jelikož jsou syntetická data generována uměle, eliminuje se mnoho předpojatostí a problémů s ochranou soukromí spojených s tradičním shromažďováním dat ze skutečného světa.

Jak generování dat na vyžádání ermögňuje urychlené škálování?

Zachycení a příprava reálných dat pro trénování modelů je dlouhý a únavný proces. Nasazení nezbytného hardwaru může být pro komplikované systémy počítačového vidění, jako jsou autonomní vozidla, robotika nebo satelitní zobrazování, prohibitivně drahé. Jakmile jsou data zachycena, lidé označují a anotují podstatné funkce. Tento proces je náchylný k chybám a lidé jsou omezeni ve své schopnosti označit klíčové informace, jako je 3D poloha vyžadovaná pro mnoho aplikací.

Syntetická data jsou o několik řádů rychlejší a levnější než tradiční přístupy založené na lidské anotaci a urychlí nasazení nových a schopnějších modelů napříč odvětvími.

Jak syntetická data umožňují snížení nebo prevenci AI předpojatosti?

Systémy AI jsou všudypřítomné, ale mohou obsahovat vrozené předpojatosti, které mohou ovlivnit skupiny lidí. Datové sady mohou být nevyvážené s určitými třídami dat a buď nadměrně nebo podměrně reprezentovanými skupinami lidí. Budování lidských systémů může často vést k pohlavním, etnickým a věkovým předpojatostem. Naopak designem generovaná trénovací data jsou správně vyvážená a postrádají lidské předpojatosti.

Syntetická data by mohla být robustním řešením problému předpojatosti AI. Syntetická data jsou generována částečně nebo úplně uměle, spíše než měřena nebo extrahována z reálných událostí nebo jevů. Pokud je datová sada nedostatečně rozmanitá nebo velká, AI generovaná data mohou vyplnit mezery a vytvořit nevyváženou datovou sadu. Nejlepší část? Ruční vytváření těchto datových sad může trvat týmy několik měsíců nebo let. Když jsou navržena se syntetickými daty, může být provedena přes noc.

Mimo počítačové vidění, jaké jsou některé budoucí potenciální použití syntetických dat?

Kromě mnohých počítačových vidění použití souvisejících s spotřebitelskými produkty, autonomií, robotikou, AR/VR/metaverse a více, syntetická data budou mít také dopad na další datové modality. Už vidíme, jak společnosti využívají syntetická data pro strukturovaná tabulková data, hlas a zpracování přirozeného jazyka. Základní technologie a generovací potrubí se liší pro každou modalitu a v blízké budoucnosti očekáváme vidět multimodální systémy (například video + hlas).

Je něco jiného, co byste rádi sdíleli o Synthesis AI?

Na konci loňského roku jsme vydali HumanAPI, významné rozšíření syntetických datových schopností Synthesis AI, které umožňuje programové generování milionů unikátních, vysoce kvalitních 3D digitálních lidí. Toto oznámení přichází měsíce po spuštění produktu FaceAPI syntetických dat jako služby, který dodal více než 10 milionů označených obličejových obrazů pro přední smartphony, telekonferenční, automobilové a technologické společnosti. HumanAPI je další krok v cestě společnosti pro podporu pokročilých počítačových vidění aplikací AI.

HumanAPI také ermögňuje řadu nových příležitostí pro naše zákazníky, včetně chytrých AI asistentů, virtuálních fitness trenérů a samozřejmě světa metaverse aplikací.

Vytvořením digitální kopie skutečného světa umožní metaverse nové aplikace, od reimaginovaných sociálních sítí, zábavních zkušeností, telekonferencí, her a více. Počítačové vidění AI bude фундаментální pro to, jak se skutečný svět zachytí a rekreuje s vysokou fidelitou v digitálním světě. Fotorealistické, expresivní a behaviorálně přesné lidi budou nezbytnou součástí budoucnosti počítačového vidění aplikací. HumanAPI je prvním produktem, který ermögňuje společnostem vytvářet obrovská množství dokonale označených celkových dat na vyžádání pro sestrojení schopnějších AI modelů, včetně odhadu postoje, rozpoznání emocí, charakterizace aktivity a chování, rekonstrukce obličeje a více.

Děkuji za skvělý rozhovor, čtenáři, kteří chtějí se dozvědět více, by měli navštívit Synthesis AI.

Unite.AI

Yashar Behzadi, generální ředitel Synthesis AI – Interview Series

You may like