Connect with us

Yashar Behzadi, administrerende direktør for Synthesis AI – Intervju-serie

Interviews

Yashar Behzadi, administrerende direktør for Synthesis AI – Intervju-serie

mm

Yashar Behzadi PhD er administrerende direktør og grundlægger af Synthesis AI. Han er en erfaren iværksætter, der har opbygget transformative forretninger inden for AI, medicinsk teknologi og IoT-markeder. Han har brugt de sidste 14 år i Silicon Valley med at opbygge og skala data-centrerede teknologivirksomheder. Yashar har over 30 patenter og patenter under anmeldelse og en ph.d. fra UCSD med fokus på spatial-temporalt modellering af funktionel hjernescanning.

Synthesis AI er en startup, der ligger i skæringspunktet mellem dyb læring og CGI, og som skaber en ny paradigm for udvikling af computer vision-modeller. De giver kunderne mulighed for at udvikle bedre modeller til en brøkdel af den tid og omkostning, der er forbundet med traditionelle menneske-baserede tilgange.

Hvordan kom du initialt i gang med computervidenskab og AI?

Jeg fik en ph.d. fra UCSD i 2006 med fokus på computer vision og spatial & temporal modellering af hjernescanningdata. Derefter arbejdede jeg i Silicon Valley i skæringspunktet mellem sensorer, data og maskinlæring på tværs af brancher i de næste 16 år. Jeg føler mig meget heldig at have haft muligheden for at arbejde med nogle bemærkelsesværdige teknologier, og jeg har over 30 patenter udstedt eller anmeldt med fokus på signalbehandling, maskinlæring og datavidenskab.

Kan du dele den genesis-historie om Synthesis AI?

Før jeg grundlagde Synthesis AI i 2019, ledede jeg en global AI-servicevirksomhed, der var fokuseret på udvikling af computer vision-modeller for førende teknologivirksomheder. Uanset virksomhedens størrelse, fandt jeg, at vi var ekstremt begrænsede af kvaliteten og mængden af labeled træningsdata. Da virksomhederne udvidede sig geografisk, voksede deres kundebase eller udviklede nye modeller og nye hardware, var der behov for nye træningsdata for at sikre, at modellerne fungerede tilfredsstillende. Det blev også klart, at fremtiden for computer vision ikke ville være succesfuld med i dag’s menneske-i-løkken-annoteringsparadigme. Fremkomende computer vision-anvendelser i autonomi, robotteknologi og AR/VR/metaverse-anvendelser kræver en rig samling af 3D-mærker, dybdeinformation, materialeegenskaber, detaljeret segmentering osv., som mennesker ikke kan mærke. Der var behov for en ny paradigm for at give den nødvendige rig samling af mærker til at træne disse nye modeller. Ud over tekniske drivere så vi en øget forbruger- og regulatorisk skærping omkring etiske spørgsmål i forbindelse med model-forvrængning og forbrugerprivatliv.

Jeg etablerede Synthesis AI med det formål at transformere computer vision-paradigmet. Virksomhedens syntetisk data-genereringsplatform giver mulighed for påkrævet generering af fotorealistiske billeddata med en udvidet samling af 3D-pixel-perfekte mærker. Vores mission er at bane vejen for syntetisk data-teknologier for at tillade en etisk udvikling af mere kapable modeller.

For læsere, der ikke er fortrolige med denne betegnelse, kan du definere, hvad syntetisk data er?

Syntetisk data er computer-genereret data, der fungerer som en alternativ til virkelige data. Syntetisk data er skabt i simulerede digitale verdener i stedet for at blive indsamlet fra eller målt i den virkelige verden. Ved at kombinere værktøjer fra verden af visuelle effekter og CGI med generative AI-modeller giver Synthesis AI virksomheder mulighed for at skabe enorme mængder af fotorealistiske, diverse data påkrævet for at træne computer vision-modeller. Virksomhedens data-genereringsplatform reducerer omkostningerne og hastigheden for at opnå højkvalitets billeddata med flere størrelsesordener, samtidig med at privatlivet bevares.

Kan du diskutere, hvordan syntetisk data genereres?

En syntetisk dataserie er skabt kunstigt i stedet for gennem virkelige data. Teknologier fra den visuelle effektindustri er kombineret med generative neurale netværk for at skabe enorme, diverse og fotorealistiske mærkede billeddata. Syntetisk data giver mulighed for at skabe træningsdata til en brøkdel af omkostningerne og tiden for nuværende tilgange.

Hvordan giver udnyttelse af syntetisk data en konkurrencemæssig fordel?

I øjeblikket udnytter de fleste AI-systemer “overvåget læring”, hvor mennesker mærker nøgleattributter i billeder og derefter træner AI-algoritmer for at fortolke billeder. Dette er en ressource- og tidskrævende proces og er begrænset af, hvad mennesker kan nøjagtigt mærke. Derudover er bekymringer om AI-demografisk forvrængning og forbrugerprivatliv forstærket, hvilket gør det stadig mere vanskeligt at opnå repræsentativt menneske-data.

Vores tilgang er at skabe fotorealistiske digitale verdener, der syntetiserer komplekse billeddata. Da vi genererer data, ved vi alt om scenerne, herunder hidtil utilgængelig information om 3D-placeringen af objekter og deres komplekse interaktioner med hinanden og miljøet. At opnå og mærke denne mængde data ved hjælp af nuværende tilgange ville tage måneder, hvis ikke år. Denne nye paradigm vil give mulighed for en 100-gangs forbedring af effektivitet og omkostning og drive en ny klasse af mere kapable modeller.

Da syntetisk data er genereret kunstigt, eliminerer dette mange forvrængninger og privatlivsproblemer i forbindelse med traditionel indsamling af data fra den virkelige verden.

Hvordan giver påkrævet data-generering mulighed for accelereret skala?

At indsamle og forberede virkelige data til model-træning er en lang og kedelig proces. At udruste den nødvendige hardware kan være forbudt dyrt for komplekse computer vision-systemer som autonome køretøjer, robotteknologi eller satellitbilleder. Når data er indsamlet, mærker og annoterer mennesker essentielle funktioner. Denne proces er fejlbehæftet, og mennesker er begrænsede i deres evne til at mærke nøgleinformation som 3D-placering, der kræves til mange anvendelser.

Syntetisk data er flere størrelsesordener hurtigere og billigere end traditionelle menneske-mærkede virkelige data-tilgange og vil komme til at accelerere udrulningen af nye og mere kapable modeller på tværs af brancher.

Hvordan giver syntetisk data mulighed for en reduktion eller forebyggelse af AI-forvrængning?

AI-systemer er allestedsnærværende, men kan indeholde indbyggede forvrængninger, der kan påvirke grupper af mennesker. Dataserier kan være ubalancerede med visse klasser af data og enten over- eller underrepræsenterer grupper af mennesker. At bygge menneske-centrerede systemer kan ofte føre til køns-, etnisk- og aldersforvrængning. I modsætning hertil er design-genereret træningsdata ordentligt balanceret og mangler menneske-forvrængning.

Syntetisk data kan blive en robust løsning for at løse AI’s forvrængningsproblem. Syntetisk data er genereret delvist eller fuldstændigt kunstigt i stedet for at blive målt eller udtrukket fra virkelige begivenheder eller fænomener. Hvis dataserien ikke er divers eller stor nok, kan AI-genereret data udfylde hullerne og danne en upartisk dataserie. Det bedste? At manuelt skabe disse dataserier kan tage hold flere måneder eller år at fuldføre. Når designet med syntetisk data, kan det gøres om natten.

Uden for computer vision, hvad er nogle fremtidige potentielle anvendelser af syntetisk data?

Ud over de mange computer vision-anvendelser i forbindelse med forbrugerprodukter, autonomi, robotteknologi, AR/VR/metaverse og mere vil syntetisk data også påvirke andre data-modi. Vi ser allerede virksomheder udnytte syntetisk data-tilgange for struktureret tabel-data, tale og naturlig sprogbehandling. De underliggende teknologier og genererings-rører er forskellige for hver modus, og i den nærmeste fremtid forventer vi at se multi-modale systemer (f.eks. video + tale).

Er der noget andet, du gerne vil dele om Synthesis AI?

Sidst på året udgav vi HumanAPI, en betydelig udvidelse af Synthesis AI’s syntetiske data-kapaciteter, der giver mulighed for programmatisk generering af millioner af unikke, højkvalitets 3D-digitale mennesker. Denne meddelelse kommer måneder efter lanceringen af FaceAPI-syntetisk data-as-a-service-produktet, der har leveret over 10 millioner mærkede ansigtsbilleder til førende smartphone-, videokonference-, bil- og teknologivirksomheder. HumanAPI er det næste skridt i virksomhedens rejse for at støtte avancerede computer vision kunstig intelligens (AI)-anvendelser.

HumanAPI giver også mulighed for en mangfoldighed af nye muligheder for vores kunder, herunder intelligente AI-assistenter, virtuelle fitness-coaches og selvfølgelig verden af metaverse-anvendelser.

Ved at skabe en digital kopi af den virkelige verden giver metaverset mulighed for nye anvendelser, herunder genopfundne sociale netværk, underholdningsoplevelser, videokonference, spil og mere. Computer vision AI vil være fundamentalt for, hvordan den virkelige verden bliver fanget og genskabt med høj tilgængelighed i den digitale verden. Fotorealistiske, udtryksfulde og adfærds-mæssigt nøjagtige mennesker vil være en afgørende komponent i fremtiden for computer vision-anvendelser. HumanAPI er det første produkt, der giver virksomheder mulighed for at skabe enorme mængder af perfekt mærkede hele-krops-data påkrævet for at bygge mere kapable AI-modeller, herunder pose-estimation, emotion-genkendelse, aktivitet- og adfærdskarakterisering, ansigts-rekonstruktion og mere.

Tak for det gode interview, læsere, der ønsker at lære mere, skal besøge Synthesis AI.

Antoine er en visionær leder og medstifter af Unite.AI, drevet af en urokkelig passion for at forme og fremme fremtiden for AI og robotteknologi. En serieiværksætter, han tror, at AI vil være lige så omvæltende for samfundet som elektricitet, og bliver ofte fanget i at tale begejstret om potentialet for omvæltende teknologier og AGI.

Som en futurist, er han dedikeret til at udforske, hvordan disse innovationer vil forme vores verden. Derudover er han grundlægger af Securities.io, en platform, der fokuserer på at investere i skærende teknologier, der gendefinerer fremtiden og omformer hele sektorer.