Anslut dig till vårt nätverk!

Intervjuer

Yashar Behzadi, VD för Synthesis AI – Interview Series

mm

publicerade

 on

Yashar Behzadi PhD är VD och grundare av Syntes AI. Han är en erfaren entreprenör som har byggt upp transformativa företag inom AI, medicinteknik och IoT-marknader. Han har tillbringat de senaste 14 åren i Silicon Valley med att bygga och skala datacentrerade teknikföretag. Yashar har över 30 patent och patentsökta och en Ph.D. från UCSD med fokus på spatial-temporal modellering av funktionell hjärnavbildning.

Syntes AI är en startup i skärningspunkten mellan djupinlärning och CGI, som skapar ett nytt paradigm för utveckling av datorseendemodeller. De gör det möjligt för kunder att utveckla bättre modeller till en bråkdel av tiden och kostnaden för traditionella anteckningsbaserade metoder.

Hur engagerade du dig från början i datavetenskap och AI?

Jag tog en doktorsexamen. från UCSD 2006 fokuserade på datorseende och rumslig och tidsmässig modellering av hjärnavbildningsdata. Jag arbetade sedan i Silicon Valley i skärningspunkten mellan sensorer, data och maskininlärning över branscher under de kommande 16 åren. Jag känner mig väldigt lyckligt lottad som har möjligheten att arbeta med några anmärkningsvärda teknologier, och jag har över 30 patent utfärdade eller inlämnade med fokus på signalbehandling, maskininlärning och datavetenskap.

Kan du dela med dig av uppkomstberättelsen om Synthesis AI?

Innan jag grundade Synthesis AI 2019 ledde jag ett globalt AI-tjänsteföretag fokuserat på att utveckla datorseendemodeller för ledande teknikföretag. Oavsett företagets storlek upptäckte jag att vi var extremt begränsade av kvaliteten och mängden märkta träningsdata. När företag expanderade geografiskt, växte sin kundbas eller utvecklade nya modeller och ny hårdvara, krävdes ny utbildningsdata för att säkerställa att modellerna fungerade på ett adekvat sätt. Det blev också tydligt att framtiden för datorseende inte skulle bli framgångsrik med dagens mänskliga-i-slingan-annoteringsparadigm. Framväxande datorseendeapplikationer inom autonomi, robotik och AR/VR/metaverse-applikationer kräver en rik uppsättning 3D-etiketter, djupinformation, materialegenskaper, detaljerad segmentering, etc., som människor inte kan märka. Ett nytt paradigm behövdes för att tillhandahålla den nödvändiga rika uppsättningen etiketter för att träna dessa nya modeller. Förutom tekniska drivkrafter såg vi en ökad konsument- och regulatorisk granskning kring etiska frågor relaterade till modellbias och konsumenternas integritet.

Jag etablerade Synthesis AI med avsikt att transformera datorvisionsparadigmet. Företagets plattform för syntetisk datagenerering möjliggör generering av fotorealistisk bilddata på begäran med en utökad uppsättning etiketter som är perfekta för 3D-pixlar. Vårt uppdrag är att banbryta syntetisk datateknik för att möjliggöra en etisk utveckling av mer kapabla modeller.

För läsare som inte är bekanta med denna term, kan du definiera vad syntetisk data är?

Syntetisk data är datorgenererad data som fungerar som ett alternativ till verklig data. Syntetisk data skapas i simulerade digitala världar snarare än samlas in från eller mäts i den verkliga världen. Genom att kombinera verktyg från en värld av visuella effekter och CGI med generativa AI-modeller, gör Synthesis AI det möjligt för företag att skapa stora mängder fotorealistiska, varierande data på begäran för att träna datorseendemodeller. Företagets datagenereringsplattform minskade kostnaden och hastigheten för att få högkvalitativ bilddata i storleksordningar samtidigt som integriteten bevarades.

Kan du diskutera hur syntetisk data genereras?

En syntetisk datauppsättning skapas artificiellt snarare än genom verklig data. Teknologier från industrin för visuella effekter kombineras med generativa neurala nätverk för att skapa stora, mångsidiga och fotorealistiska märkta bilddata. Syntetisk data gör det möjligt att skapa träningsdata till en bråkdel av kostnaden och tiden för nuvarande tillvägagångssätt.

Hur skapar utnyttjande av syntetisk data en konkurrensfördel?

För närvarande utnyttjar de flesta AI-system "övervakat lärande" där människor märker nyckel som tillskrivs i bilder och sedan tränar AI-algoritmer att tolka bilder. Detta är en resurs- och tidskrävande process och begränsas av vad människor kan märka korrekt. Dessutom har oron för demografisk snedvridning och konsumenternas integritet förstärkts, vilket gör det allt svårare att få fram representativa mänskliga data.

Vårt tillvägagångssätt är att skapa fotorealistiska digitala världar som syntetiserar komplex bilddata. Eftersom vi genererar data vet vi allt om scenerna, inklusive aldrig tidigare tillgänglig information om 3D-placering av objekt och deras komplexa interaktion med varandra och miljön. Att skaffa och märka denna mängd data med nuvarande metoder skulle ta månader, om inte år. Detta nya paradigm kommer att möjliggöra en 100x förbättring av effektivitet och kostnad och driva en ny klass av mer kapabla modeller.

Eftersom syntetisk data genereras på konstgjord väg, eliminerar detta många fördomar och integritetsproblem med traditionellt insamling av datamängder från den verkliga världen.

Hur möjliggör on-demand datagenerering accelererad skalning?

Att fånga och förbereda verkliga data för modellträning är en lång och omständlig process. Att installera den nödvändiga hårdvaran kan vara oöverkomligt dyrt för komplicerade datorseendesystem som autonoma fordon, robotteknik eller satellitbilder. När data väl har samlats in märker och kommenterar människor viktiga funktioner. Denna process är benägen att misstag, och människor är begränsade i sin förmåga att märka nyckelinformation som 3D-positionen som krävs för många applikationer.

Syntetisk data är storleksordningar snabbare och billigare än traditionella tillvägagångssätt för realdata och kommer att påskynda utbyggnaden av nya och mer kapabla modeller inom olika branscher.

Hur möjliggör syntetisk data en minskning eller förhindrande av AI-bias?

AI-system är allestädes närvarande men kan innehålla inneboende fördomar som kan påverka grupper av människor. Datauppsättningar kan vara obalanserade med vissa klasser av data och antingen över- eller underrepresenterade grupper av människor. Att bygga människocentrerade system kan ofta leda till fördomar kring kön, etnicitet och ålder. Däremot är designgenererade träningsdata korrekt balanserade och saknar mänskliga fördomar.

Syntetisk data kan bli en robust lösning för att lösa AI:s fördomsproblem. Syntetisk data genereras delvis eller helt artificiellt snarare än mäts eller extraheras från verkliga händelser eller fenomen. Om datauppsättningen inte är mångsidig eller tillräckligt stor kan AI-genererad data fylla i hålen och bilda en opartisk datauppsättning. Den bästa delen? Att manuellt skapa dessa datamängder kan ta flera månader eller år för team att slutföra. När det är designat med syntetisk data kan det göras över natten.

Utanför datorseende, vilka är några framtida andra potentiella användningsfall för syntetisk data?

Förutom de många användningsfallen för datorseende relaterade till konsumentprodukter, autonomi, robotik, AR/VR/metaverse och mer, kommer syntetisk data också att påverka andra datamodaliteter. Vi ser redan att företag använder syntetiska datametoder för strukturerad tabelldata, röst- och naturligt språkbehandling. De underliggande teknologierna och generationspipelinesna skiljer sig åt för varje modalitet, och inom en snar framtid förväntar vi oss att se multimodala system (t.ex. video + röst).

Finns det något mer du skulle vilja dela med dig av om Synthesis AI?

I slutet av förra året släppte vi HumanAPI, en betydande utökning av Synthesis AI:s funktioner för syntetiska data som möjliggör programmatisk generering av miljontals unika, högkvalitativa 3D-digitala människor. Detta tillkännagivande kommer månader efter lanseringen av FaceAPI-produkten för syntetisk data-som-en-tjänst, som har levererat över 10 miljoner märkta ansiktsbilder för ledande smartphone-, telekonferens-, bil- och teknikföretag. HumanAPI är nästa steg i företagets resa för att stödja avancerade datorseende Artificial Intelligence (AI)-applikationer.

HumanAPI möjliggör också en myriad av nya möjligheter för våra kunder, inklusive smarta AI-assistenter, virtuella träningscoacher och naturligtvis världen av metaverse-applikationer.

Genom att skapa en digital dubbelgång av den verkliga världen kommer metaverset att möjliggöra nya applikationer, allt från omarbetade sociala nätverk, underhållningsupplevelser, telekonferenser, spel och mer. Computer vision AI kommer att vara grundläggande för hur den verkliga världen fångas och återskapas med high-fidelity i den digitala sfären. Fotorealistiska, uttrycksfulla och beteendemässigt korrekta människor kommer att vara en viktig komponent i framtiden för datorseendeapplikationer. HumanAPI är den första produkten som gör det möjligt för företag att skapa stora mängder perfekt märkt helkroppsdata på begäran för att bygga mer kapabla AI-modeller, inklusive ställningsuppskattning, känslomässig igenkänning, aktivitets- och beteendekarakterisering, ansiktsrekonstruktion och mer.

Tack för den fina intervjun, läsare som vill veta mer bör besöka Syntes AI.

En av grundarna av unite.AI och en medlem av Forbes Technology Council, Antoine är en futurist som brinner för framtiden för AI och robotik.

Han är också grundare av Securities.io, en webbplats som fokuserar på att investera i disruptiv teknik.