Connect with us

Intervjuer

Yashar Behzadi, administrerende direktør i Synthesis AI – Intervju-serie

mm

Yashar Behzadi PhD er administrerende direktør og grunnlegger av Synthesis AI. Han er en erfaren entrepreneur som har bygget transformative bedrifter i AI, medisinsk teknologi og IoT-markeder. Han har tilbragt de siste 14 årene i Silicon Valley med å bygge og skale data-sentriske teknologiselskaper. Yashar har over 30 patenter og patenter under behandling og en PhD fra UCSD med fokus på romlig-tidslig modellering av funksjonell hjernebilde.

Synthesis AI er et startup-selskap på grensen mellom dyp læring og CGI, som skaper en ny paradigme for utvikling av datamodeller for datamaskinsyn. De muliggjør at kundene kan utvikle bedre modeller til en brøkdel av tiden og kostnadene sammenlignet med tradisjonelle menneske-baserte tilnærminger.

Hvordan ble du først involvert i datavitenskap og AI?

Jeg tok en PhD fra UCSD i 2006 med fokus på datamaskinsyn og romlig-tidslig modellering av hjernebilde-data. Deretter arbeidet jeg i Silicon Valley på grensen mellom sensorer, data og maskinlæring over flere bransjer i løpet av de neste 16 årene. Jeg føler meg veldig heldig å ha hatt muligheten til å arbeide med noen bemerkelsesverdige teknologier, og jeg har over 30 patenter tatt ut eller innlevert med fokus på signalbehandling, maskinlæring og datavitenskap.

Kan du dele opphavsfortellingen om Synthesis AI?

Før jeg grunnla Synthesis AI i 2019, ledet jeg et globalt AI-tjenesteselskap som var fokusert på å utvikle datamodeller for datamaskinsyn for ledende teknologiselskaper. Uansett selskapets størrelse, fant jeg at vi var ekstremt begrenset av kvaliteten og mengden av merket treningdata. Når selskapene utvidet geografisk, økte kundebasen eller utviklet nye modeller og nytt hårdtware, var ny treningdata nødvendig for å sikre at modellene fungerte tilfredsstillende. Det ble også klart at fremtiden for datamaskinsyn ikke ville være suksessfull med dagens menneske-i-løkken annoteringsparadigme. Fremvoksende datamaskinsyn-applikasjoner i autonomi, robotikk og AR/VR/metaverse-applikasjoner krever en rik samling av 3D-merker, dybdeinformasjon, materialeegenskaper, detaljert segmentering osv., som mennesker ikke kan merke. Et nytt paradigme var nødvendig for å tilby den nødvendige rike samlingen av merker for å trene disse nye modellene. I tillegg til tekniske drivere, så vi økende forbruker- og regulatorisk skråning rundt etiske problemer relatert til modellforvrengning og forbrukerprivatliv.

Jeg etablerte Synthesis AI med intensjonen å transformere datamaskinsyn-paradigmet. Selskapets syntetisk data-genereringsplattform muliggjør på-demand-generering av fotorealistiske bilde-data med en utvidet samling av 3D-piksel-perfekte merker. Vårt mål er å bane vei for syntetisk data-teknologier for å tillate den etiske utviklingen av mer kapable modeller.

For lesere som er ukyndige i denne betegnelsen, kan du definere hva syntetisk data er?

Syntetisk data er datamaskin-generert data som tjener som en alternativ til virkelige verdensdata. Syntetisk data blir skapt i simulerete digitale verdener heller enn samlet inn fra eller målt i den virkelige verden. Ved å kombinere verktøy fra den visuelle effekt-verden med generative AI-modeller, muliggjør Synthesis AI at selskaper kan skape store mengder fotorealistiske, diverse data på-demand for å trene datamaskinsyn-modeller. Selskapets data-genereringsplattform reduserte kostnaden og hastigheten til å få høykvalitets bilde-data med flere størrelsesordener samtidig som det bevarte privatliv.

Kan du diskutere hvordan syntetisk data genereres?

En syntetisk datasett blir skapt kunstig heller enn gjennom virkelige verdensdata. Teknologier fra den visuelle effekt-industrien blir koblet med generative neurale nettverk for å skape store, diverse og fotorealistiske merkte bilde-data. Syntetisk data muliggjør å skape treningdata til en brøkdel av kostnaden og tiden sammenlignet med nåværende menneske-baserte tilnærminger.

Hvordan skaper utnyttelsen av syntetisk data en konkurransefordel?

For tiden utnytter de fleste AI-systemer “overvåket læring” hvor mennesker merker nøkkel-attributter i bilder og deretter trener AI-algoritmer til å tolke bilder. Dette er en ressurs- og tidkrevende prosess og er begrenset av hva mennesker kan nøyaktig merke. I tillegg har bekymringer om AI-demografisk forvrengning og forbrukerprivatliv økt, og gjort det vanskeligere å få representativt menneske-data.

Vår tilnærmning er å skape fotorealistiske digitale verdener som syntetiserer komplekse bilde-data. Ettersom vi genererer data, vet vi alt om scenene, inkludert informasjon som aldri før har vært tilgjengelig om 3D-plasseringen av objekter og deres komplekse interaksjoner med hverandre og miljøet. Å skaffe og merke denne mengden data ved hjelp av nåværende tilnærminger ville ta måneder, hvis ikke år. Dette nye paradigmet vil muliggjøre en 100-ganger forbedring i effisiens og kostnad og drive en ny klasse mer kapable modeller.

Ettersom syntetisk data genereres kunstig, eliminerer dette mange forvrengninger og privatlivsproblemer forbundet med innsamling av data fra den virkelige verden.

Hvordan muliggjør på-demand-data-generering akselerert skaling?

Innsamling og forberedelse av virkelige verdensdata for modell-trening er en lang og kjedelig prosess. Utrolig av nødvendig hårdtware kan være forbudt dyrt for kompliserte datamaskinsyn-systemer som autonome kjøretøy, robotikk eller satellitt-bilder. Når dataene er samlet inn, merker og annoterer mennesker essensielle funksjoner. Denne prosessen er utsatt for feil, og mennesker er begrenset i deres evne til å merke nøkkel-informasjon som 3D-plasseringen som kreves for mange applikasjoner.

Syntetisk data er flere størrelsesordener raskere og billigere enn tradisjonelle menneske-merkede virkelige data-tilnærminger og vil komme til å akselerere utrullingen av nye og mer kapable modeller over industrier.

Hvordan muliggjør syntetisk data en reduksjon eller forebygging av AI-forvrengning?

AI-systemer er alltid til stede, men kan inneholde innebygde forvrengninger som kan påvirke grupper av mennesker. Datasett kan være ubalansert med bestemte klasser av data og enten over- eller under-representere grupper av mennesker. Bygging av menneske-sentriske systemer kan ofte føre til kjønn, etniske og alders-forvrengninger. I motsetning er design-generert treningdata ordentlig balansert og mangler menneske-forvrengninger.

Syntetisk data kan bli en robust løsning for å løse AI-forvrengningsproblemet. Syntetisk data genereres delvis eller fullstendig kunstig heller enn målt eller ekstrahert fra virkelige verdenshendelser eller fenomener. Hvis datasettet ikke er divers eller stort nok, kan AI-generert data fylle hullene og danne et upartisk datasett. Det beste delen? Manuelt å skape disse datasettene kan ta lag flere måneder eller år å fullføre. Når designet med syntetisk data, kan det gjøres over natten.

Utenfor datamaskinsyn, hva er noen fremtidige potensielle bruksområder for syntetisk data?

I tillegg til de mange datamaskinsyn-bruksområdene relatert til forbrukerprodukter, autonomi, robotikk, AR/VR/metaverse og mer, vil syntetisk data også påvirke andre data-modaler. Vi ser allerede selskaper som utnytter syntetisk data-tilnærminger for strukturert tabell-data, stemme og naturlig språkbehandling. De underliggende teknologiene og genererings-pipelinene forskjeller for hver modalitet, og i den nære fremtiden forventer vi å se multi-modale systemer (f.eks. video + stemme).

Er det noe annet du ønsker å dele om Synthesis AI?

For noen måneder siden, lanserte vi HumanAPI, en betydelig utvidelse av Synthesis AI sine syntetiske data-kapabiliteter som muliggjør den programmatisk genereringen av millioner av unike, høykvalitets 3D digitale mennesker. Denne annonseringen kommer måneder etter lanseringen av FaceAPI syntetisk data-til-tjeneste-produktet, som har levert over 10 millioner merkte ansiktsbilder for ledende smarttelefon-, telekonferanse-, bil- og teknologiselskaper. HumanAPI er det neste skrittet i selskapets reise for å støtte avanserte datamaskinsyn kunstig intelligens-applikasjoner.

HumanAPI muliggjør også en mengde nye muligheter for våre kunder, inkludert smarte AI-assistenter, virtuelle fitness-trener og selvfølgelig metaverse-applikasjoner.

Ved å skape en digital kopi av den virkelige verden, vil metaverse muliggjøre nye applikasjoner som omfatter nytenkte sosiale nettverk, underholdnings-erfaringer, telekonferanser, spill og mer. Datamaskinsyn AI vil være fundamentalt for hvordan den virkelige verden blir fanget og rekonstruert med høy trofasthet i den digitale verden. Fotorealistiske, uttrykksfulle og atferdsmessig nøyaktige mennesker vil være en essensiell komponent i fremtiden for datamaskinsyn-applikasjoner. HumanAPI er det første produktet som muliggjør at selskaper kan skape store mengder perfekt merket helkropps-data på-demand for å bygge mer kapable AI-modeller, inkludert posisjons-estimering, emosjons-gjenkjenning, aktivitet og atferd-karakterisering, ansikts-rekonstruksjon og mer.

Takk for det flotte intervjuet, lesere som ønsker å lære mer bør besøke Synthesis AI.

Antoine er en visjonær leder og grunnleggende partner i Unite.AI, drevet av en urokkelig lidenskap for å forme og fremme fremtiden for AI og robotikk. En seriegründer, han tror at AI vil være like disruptiv for samfunnet som elektrisitet, og blir ofte tatt i å tale om potensialet for disruptiv teknologi og AGI.
Som en futurist, er han dedikert til å utforske hvordan disse innovasjonene vil forme vår verden. I tillegg er han grunnleggeren av Securities.io, en plattform som fokuserer på å investere i banebrytende teknologier som omdefinerer fremtiden og omformer hele sektorer.