Intervjuer
Yubei Chen, medgrunnlegger av Aizip Inc – Intervju-serie

Yubei Chen er medgrunnlegger av Aizip inc., et selskap som bygger verdens minste og mest effektive AI-modeller. Han er også assistant professor i ECE-avdelingen ved University of California, Davis. Chens forskning befinner seg i skjæringspunktet mellom komputasjonsnevrovitenskap og dyp usupervisert (selv-supervisert) læring, og forbedrer vår forståelse av de komputasjonsmessige prinsippene som styrer usupervisert representasjonslæring i både hjerner og maskiner, og omdefinere vår innsikt i naturlig signalstatistikk.
Før han begynte ved UC Davis, gjorde Chen sin postdoktor-studie med Prof. Yann LeCun ved NYU Center for Data Science (CDS) og Meta Fundamental AI Research (FAIR). Han fullførte sin Ph.D. ved Redwood Center for Theoretical Neuroscience og Berkeley AI Research (BAIR), UC Berkeley, under veiledning av Prof. Bruno Olshausen.
Aizip utvikler ultra-effektive AI-løsninger optimalisert for edge-enheter, og tilbyr kompakte modeller for visjon, audio, tidsserie, språk og sensorfusjonsapplikasjoner. Deres produkter muliggjør oppgaver som ansikt- og objektgjenkjenning, nøkkelordsgjenkjenning, ECG/EEG-analyse og on-device chatbots, alle drevet av TinyML. Gjennom sin AI-nanofabrikkplattform, Aizipline, akselerer selskapet modellutvikling ved å bruke grunnmodeller og generative modeller for å drive mot full AI-designautomatisering. Aizips Gizmo-serie av små språkmodeller (300M–2B parametre) støtter en rekke enheter, og bringer intelligente egenskaper til kanten.
Du gjorde din postdoktor med Yann LeCun ved NYU og Meta FAIR. Hvordan påvirkte arbeidet med ham og din forskning ved UC Berkeley din tilnærming til å bygge virkelige AI-løsninger?
Ved Berkeley var min arbeid dypt rotfestet i vitenskapelig undersøkelse og matematisk strenghet. Min Ph.D.-forskning, som kombinerte elektroingeniør, datavitenskap og komputasjonsnevrovitenskap, fokuserte på å forstå AI-systemer fra en “white-box”-perspektiv, eller utvikle metoder for å avsløre de underliggende strukturer av data og læremodeller. Jeg arbeidet med å bygge tolkbare, høy-ytelses AI-modeller og visualiseringsteknikker som hjalp å åpne opp svarte boks AI-systemer.
Ved Meta FAIR var fokuset på å bygge AI-systemer for å oppnå state-of-the-art-ytelse i stor skala. Med tilgang til verdensklasse komputasjonsressurser, utforsket jeg grensene for selv-supervisert læring og bidro til det vi nå kaller “verdensmodeller” — AI-systemer som lærer fra data og forestiller seg mulige miljøer. Denne doble erfaringen — vitenskapelig forståelse ved Berkeley og ingeniør-drevet skala ved Meta — har gitt meg en omfattende perspektiv på AI-utvikling. Det har understreket viktigheten av både teoretisk innsikt og praktisk implementering når du utvikler AI-løsninger for virkelige applikasjoner.
Ditt arbeid kombinerer komputasjonsnevrovitenskap med AI. Hvordan påvirker innsikt fra nevrovitenskap måten du utvikler AI-modeller på?
I komputasjonsnevrovitenskap studerer vi hvordan hjernen prosesserer informasjon ved å måle dens respons på ulike stimuli, på samme måte som vi tester AI-modeller for å forstå deres interne mekanismer. Tidlig i min karriere utviklet jeg visualiseringsteknikker for å analysere ord-embeddings — å bryte ned ord som “eple” i deres konstituerende semantiske elementer, som “frukt” og “teknologi”. Senere utvidet denne tilnærmingen seg til mer komplekse AI-modeller som transformatorer og store språkmodeller, som hjalp å avsløre hvordan de prosesserer og lagrer kunnskap.
Disse metodene paralleliserer faktisk teknikker i nevrovitenskap, som å bruke elektroder eller fMRI til å studere hjernaktivitet. Å teste en AI-modells interne representasjoner gjør det mulig å forstå dens resonnementstrategier og detektere emergente egenskaper, som konseptnevroner som aktiveres for bestemte ideer (som Golden Gate Bridge-egenskapen Anthropic fant da de kartla Claude). Denne forskningsretningen er nå vidt akseptert i industrien fordi den har vist seg å kunne aktivere både tolkbarhet og praktiske inngrep, og fjerne fordommer fra modellene. Så nevrovitenskapsinspirerte tilnærminger hjelper oss å gjøre AI mer forklarbar, pålitelig og effektiv.
Hva inspirerte deg til å co-grunnlegge Aizip? Kan du dele reisen fra konsept til selskapslansering?
Som en grunnleggende AI-forsker var mye av mitt arbeid teoretisk, men jeg ønsket å brygge gapet mellom forskning og virkelige applikasjoner. Jeg co-grunnla Aizip for å bringe fremtredende AI-innovasjoner i praktisk bruk, særlig i ressursbegrensede miljøer. I stedet for å bygge store grunnmodeller, fokuserte vi på å utvikle verdens minste og mest effektive AI-modeller som ville være optimalisert for edge-enheter.
Reisen begynte grundig med en nøkkelobservasjon: Mens AI-fremgang var raskt skalerende, krevde virkelige applikasjoner ofte motsatt — høy effisiens, lav strømforbruk og minimal forsinkelse. Vi så en lukket marked for AI-løsninger som kunne levere sterk ytelse samtidig som de opererte innen ekstreme ressursbegrensninger.
Vi erkjente at det ikke bare var unødvendig for hver AI-applikasjon å kjøre på massive modeller, men at det heller ikke ville være skalerbart å avhenge av modeller av den størrelsen for alt. I stedet fokuserte vi på å optimere algoritmer for å oppnå maksimal effisiens samtidig som vi opprettholdt nøyaktighet. Ved å designe AI-modeller tilpasset edge-applikasjoner — enten i smarte sensorer, wearables eller industriell automatisering — muliggjorde vi AI å kjøre på steder hvor tradisjonelle modeller ville være upraktiske. Vår tilnærming gjorde AI mer tilgjengelig, skalerbart og energi-effektivt, og åpnet opp nye muligheter for AI-drevet innovasjon utenfor skyen.
Aizip spesialiserer seg på små AI-modeller for edge-enheter. Hva gap i markedet så du som førte til denne fokuseringen?
AI-industrien har hovedsakelig fokusert på å skalerer opp modeller, men virkelige applikasjoner krever ofte motsatt — høy effisiens, lav strømforbruk og minimal forsinkelse. Mange AI-modeller i dag er for komputasjonskrevende for å bli deployert på små, innebygde enheter. Vi så et gap i markedet for AI-løsninger som kunne levere sterk ytelse samtidig som de opererte innen ekstreme ressursbegrensninger.
Vi erkjente at det ikke bare var unødvendig for hver AI-applikasjon å kjøre på massive modeller, men at det heller ikke ville være skalerbart å avhenge av modeller av den størrelsen for alt. I stedet fokuserte vi på å optimere algoritmer for å oppnå maksimal effisiens samtidig som vi opprettholdt nøyaktighet. Ved å designe AI-modeller tilpasset edge-applikasjoner — enten i smarte sensorer, wearables eller industriell automatisering — muliggjorde vi AI å kjøre på steder hvor tradisjonelle modeller ville være upraktiske. Vår tilnærming gjorde AI mer tilgjengelig, skalerbart og energi-effektivt, og åpnet opp nye muligheter for AI-drevet innovasjon utenfor skyen.
Aizip har vært i fremtredende stilling i utviklingen av små språkmodeller (SLM). Hvordan ser du på at SLM komplementerer eller konkurrerer med større modeller som GPT-4?
SLM og større modeller som GPT-4 er ikke nødvendigvis i direkte konkurranse fordi de tjener forskjellige behov. Større modeller er kraftfulle i terms av generalisering og dyp resonnering, men krever betydelige komputasjonsressurser. SLM er designet for effisiens og deployering på lavkrafts edge-enheter. De komplementerer store modeller ved å aktivere AI-kapasiteter i virkelige applikasjoner hvor beregningskraft, forsinkelse og kostnadsbegrensninger teller — som i IoT-enheter, wearables og industriell automatisering. Etterhvert som AI-adoptsjon vokser, ser vi en hybridtilnærming fremme, hvor store, sky-baserte modeller håndterer komplekse spørsmål samtidig som SLM gir sanntids, lokal intelligens på kanten.
Hva er de største tekniske utfordringene i å gjøre AI-modeller effektive nok for lavkrafts edge-enheter?
En av de grunnleggende utfordringene er mangelen på en fullstendig teoretisk forståelse av hvordan AI-modeller fungerer. Uten en klar teoretisk grunn, er optimeringsinnsatsene ofte empiriske, og begrensninger i effisiensgevinst. I tillegg skjer menneskelig læring på mangfoldige måter som nåværende maskinlæringsparadigmer ikke fullt ut fanger, og gjør det vanskelig å designe modeller som etterligner menneskelig effisiens.
Fra et ingeniørperspektiv krever å skyve AI til å fungere innen ekstreme begrensninger innovative løsninger i modellkomprimering, kvantisering og arkitekturdesign. En annen utfordring er å skape AI-modeller som kan tilpasse seg en rekke enheter og miljøer samtidig som de opprettholder robusthet. Etterhvert som AI stadig interagerer med den fysiske verden gjennom IoT og sensorer, blir behovet for naturlige og effektive grensesnitt — som tale, gest og andre ikke-tradisjonelle innganger — kritisk. AI på kanten handler om å omdefinere hvordan brukere interagerer med den digitale verden på en sømløs måte.
Kan du dele noen detaljer om Aizips arbeid med selskaper som Softbank?
Vi nylig inngikk et samarbeid med SoftBank på et akvakulturprosjekt som vant en CES Innovation Award — en vi er spesielt stolte av. Vi utviklet en effektiv, edge-basert AI-modell for en fiske-telling-applikasjon som kan brukes av akvakultur-operatører for fiskefarmene. Denne løsningen adresserer en kritisk utfordring i fiskefarmene som kan skape bærekraft, matavfall og lønnsomhetsproblemer. Industrien har vært langsom til å adoptere AI som en løsning på grunn av upålitelig kraft og tilkobling til havs, som gjør sky-baserte AI-løsninger upraktiske.
For å løse dette, utviklet vi en løsning basert på enheten. Vi kombinerte SoftBanks datagrafikk-simuleringer for treningdata med våre kompakte AI-modeller og skapte et høyt nøyaktig system som kjører på smarttelefoner. I undervannsfelttester oppnådde det en 95% gjenkjenningssrate, og dramatisk forbedret fiske-telling-nøyaktigheten. Dette tillot farmerne å optimere lagringsforhold, bestemme om fisk skulle transporteres levende eller frosne, og detektere potensielle sykdommer eller andre helseproblemer hos fiskene.
Denne gjennombruddet forbedrer effisiens, reduserer kostnader og minsker avhengighet av manuelt arbeid. Mer bredt sett viser det hvordan AI kan ha en konkret innvirkning på virkelige problemer.
Aizip har introdusert et “AI-nanofabrikk”-konsept. Kan du forklare hva det betyr og hvordan det automatiserer AI-modellutvikling?
AI-nanofabrikken er vår interne AI-designautomatiseringspipeline, inspirert av Electronic Design Automation (EDA) i halvlederproduksjon. Tidlig utvikling i noen fremvoksende teknologifelt innebærer mye manuelt arbeid, så automatisering blir nøkkel til å akselerere fremgang og skalerer løsninger når feltet modnes.
I stedet for å bare bruke AI til å akselerere andre industrier, spurte vi, kan AI akselerere sin egen utvikling? AI-nanofabrikken automatiserer hver fase av AI-modellutvikling fra dataprosessering til arkitekturdesign, modellvalg, trening, kvantisering, deployering og feilsøking. Ved å bruke AI til å optimere seg selv, har vi kunnet redusere utviklingstiden for nye modeller med en gjennomsnittsfaktor på 10. I noen tilfeller, med over 1 000 ganger. Dette betyr at en modell som en gang tok over ett år å utvikle, nå kan skapes på bare noen få timer.
En annen fordel er at denne automatiseringen også sikrer at AI-løsningene er økonomisk viable for en rekke applikasjoner, og gjør virkelige AI-deployeringer mer tilgjengelige og skalerbare.
Hvordan ser du på rollen til edge AI utvikle seg de neste fem årene?
Edge AI lover å transformere hvordan vi interagerer med teknologi, på samme måte som smarttelefoner revolusjonerte internett-tilgang. De fleste AI-applikasjoner i dag er sky-baserte, men dette begynner å skifte når AI flytter nærmere sensorer og enheter som interagerer med den fysiske verden. Denne skiftet understreker en kritisk behov for effektiv, sanntidsprosessering på kanten.
De neste fem årene forventer vi at edge AI vil aktivere mer naturlige menneske-datamaskin-interaksjoner, som tale- og gest-gjenkjenning og andre intuitive grensesnitt, som vil fjerne avhengighet av tradisjonelle barrierer som tastatur og berørings-skjermer. AI vil også bli mer innbygd i hverdagsmiljøer som smarte hjem eller industriell automatisering for å aktivere sanntids-beslutning med minimal forsinkelse.
En annen nøkkel-trend vil være den økende autonomien til edge AI-systemer. AI-modeller vil bli mer selv-optimerende og tilpasningsdyktige takket være fremgang i AI-nanofabrikk-automatisering, så de vil kunne redusere behovet for menneskelig inngripen i deployering og vedlikehold. Dette vil åpne opp nye muligheter over en rekke industrier som helse, bil og landbruk.
Hva er noen kommende AI-drevne enheter fra Aizip som du er mest spente på?
Vi jobber for å utvide bruksområdene for våre modeller i nye industrier, og en vi er spesielt spente på er en AI-agent for bilsektoren. Det er en økende momentum, særlig blant kinesiske bilprodusenter, for å utvikle tale-assistenter drevet av språkmodeller som føles mer som ChatGPT inne i kupéen. Utfordringen er at de fleste nåværende assistenter fortsatt avhenger av skyen, særlig for naturlig, fleksibel dialog. Bare grunnleggende kommando- og kontroll-oppgaver (som “slå på AC” eller “åpne bagasjerommet”) kjører vanligvis lokalt på kjøretøyet, og de rigide kommandoene kan bli en distraksjon for sjåfører hvis de ikke har dem memorert med full nøyaktighet.
Vi har utviklet en serie ultra-effektive, SLM-drevne AI-agenter kalt Gizmo som for øyeblikket brukes i en rekke applikasjoner for ulike industrier, og vi jobber for å deployere dem som co-piloter i kjøretøy også. Gizmo er trent til å forstå intensjon på en mer nyansert måte, og når de tjener som en bilens AI-agent, kunne de utføre kommandoer gjennom konversasjonell, fritt språk. For eksempel kunne agenten justere kupéens temperatur hvis en sjåfør bare sa “Jeg er kald”, eller svare på en prompt som “Jeg kjører til Boston i morgen, hva skal jeg ha på meg?” ved å sjekke været og tilby et forslag.
Fordi de kjører lokalt og ikke avhenger av skyen, fortsetter disse agentene å fungere i døde soner eller områder med dårlig tilkobling, som tunneler, fjell eller landsbygda. De forbedrer også sikkerheten ved å gi sjåfører fullstendig tale-basert kontroll uten å ta bort deres oppmerksomhet fra veien. Og, på en separat og lettere note, mente jeg også å nevne at vi for øyeblikket er i prosessen med å sette en AI-drevet karaoke-modell for kjøretøy og Bluetooth-høyttalere i produksjon, som kjører lokalt som co-piloten. Grunnleggende tar den inn enhver lyd-inngang og fjerner menneskestemmer fra den, som tillater deg å skape en karaoke-versjon av enhver sang i sanntid. Så, foruten å hjelpe kundene med å håndtere kontrollene i bilen på en tryggere måte, ser vi også etter måter å gjøre opplevelsen mer morsom på.
Disse typene løsninger, de som gjør en meningsfull forskjell i menneskers hverdagsliv, er de vi er mest stolte av.
Aizip utvikler ultra-effektive AI-løsninger optimalisert for edge-enheter, og tilbyr kompakte modeller for visjon, audio, tidsserie, språk og sensorfusjonsapplikasjoner. Deres produkter muliggjør oppgaver som ansikt- og objektgjenkjenning, nøkkelordsgjenkjenning, ECG/EEG-analyse og on-device chatbots, alle drevet av TinyML. Gjennom sin AI-nanofabrikkplattform, Aizipline, akselerer selskapet modellutvikling ved å bruke grunnmodeller og generative modeller for å drive mot full AI-designautomatisering. Aizips Gizmo-serie av små språkmodeller (300M–2B parametre) støtter en rekke enheter, og bringer intelligente egenskaper til kanten.
Takk for det flotte intervjuet, lesere som ønsker å lære mer bør besøke Aizip.












