Connect with us

Eric Landau, medgrundare och VD för Encord – Intervjuserie

Intervjuer

Eric Landau, medgrundare och VD för Encord – Intervjuserie

mm

Eric Landau är VD och medgrundare av Encord, en aktiv inlärningsplattform för datorseende. Eric var den ledande kvantitativa forskaren på en global aktie delta-en-skiva, som satte tusentals modeller i produktion. Innan Encord tillbringade han nästan ett decennium inom high-frequency trading på DRW. Han har en S.M. i tillämpad fysik från Harvard University, M.S. i elektroteknik och B.S. i fysik från Stanford University.

På sin fritid tycker Eric om att leka med ChatGPT och stora språkmodeller och hantverkscocktailmaking.

Vad inspirerade dig att medgrundade Encord, och hur har din erfarenhet inom partikelfysik och kvantitativ finans påverkat din approach för att lösa “dataproblemet” inom AI?

Jag började först tänka på maskinlärning medan jag arbetade inom partikelfysik och hanterade mycket stora datamängder under min tid på Stanford Linear Accelerator Center (SLAC). Jag använde programvara som var utformad för fysiker av fysiker, vilket är att säga att det fanns mycket att önska i fråga om en behaglig användarupplevelse. Med lättare verktyg skulle jag ha kunnat köra analyser mycket snabbare.

Senare, när jag arbetade inom kvantitativ finans på DRW, var jag ansvarig för att skapa tusentals modeller som distribuerades till produktion. Liksom min erfarenhet inom fysik upptäckte jag att högkvalitetsdata var avgörande för att skapa precisa modeller och att hantera komplexa, storskaliga data är svårt. Ulrik hade en liknande erfarenhet med att visualisera stora bildatasets för datorseende.

När jag hörde om hans ursprungliga idé för Encord var jag omedelbart ombord och förstod vikten. Tillsammans såg Ulrik och jag en enorm möjlighet att bygga en plattform för att automatisera och effektivisera AI-datuvecklingsprocessen, vilket gör det lättare för team att få den bästa datan till modellerna och bygga tillförlitliga AI-system.

Kan du utveckla visionen bakom Encord och hur den jämför med de tidiga dagarna av datorer eller internet i fråga om potential och utmaningar?

Encords vision är att vara den grundläggande plattformen som företag förlitar sig på för att omvandla sin data till fungerande AI-modeller. Vi är skiktet mellan ett företags data och deras AI.

På många sätt speglar AI tidigare paradigm-skiften som persondatorer och internet, eftersom det kommer att bli en integrerad del av arbetsflöden för varje individ, företag, nation och bransch. Till skillnad från tidigare tekniska revolutioner, som i stor utsträckning har varit begränsade av Moores lag om sammansatt beräkningsväxt på 30 gånger varje 10 år, har AI-utveckling haft nytta av samtidiga innovationer. Det rör sig därför i en mycket snabbare takt. I NVIDIA:s Jensen Huangs ord: “För första gången ser vi sammansatta exponentiella… Vi sammansätter en miljon gånger varje tio år. Inte hundra gånger, inte tusen gånger, en miljon gånger.” Utan överdrift är vi vittnen till den snabbast rörliga tekniken i mänsklighetens historia.

Potentialen här är enorm: genom att automatisera och skala hanteringen av högkvalitetsdata för AI, hanterar vi en flaskhals som förhindrar en bredare AI-antagande. Utmaningarna påminner om tidiga dagars hinder i tidigare tekniska epoker: silos, brist på bästa metoder, begränsningar för icke-tekniska användare och en brist på väldefinierade abstraktioner.

Encord Index positioneras som ett nyckelverktyg för att hantera och kurera AI-data. Hur skiljer det sig från andra datahanteringsplattformar som för närvarande är tillgängliga?

Det finns några sätt som Encord Index sticker ut:

Index är skalbart: Tillåter användare att hantera miljarder, inte miljoner, datapunkter. Andra verktyg möter skalbarhetsproblem för ostrukturerad data och är begränsade till att konsolidera all relevant data i en organisation.

Index är flexibelt: Integrerar direkt med privat data lagring och moln lagringsleverantörer som AWS, GCP och Azure. Till skillnad från andra verktyg som är begränsade till en enda molnleverantör eller intern lagringssystem, är Index oberoende av var datan är belagd. Det låter dig hantera data från många källor med lämplig styrning och åtkomstkontroll som tillåter dem att utveckla säkra och regelefterlevande AI-applikationer.

Index är multimodalt: Stöder multimodalt AI, hanterar data i form av bilder, videor, ljud, text, dokument och mer. Index är inte begränsad till en enda form av data som många LLM-verktyg idag. Mänsklig kognition är multimodal, och vi tror att multimodalt AI kommer att ligga till grund för den kommande vågen av AI-framsteg, som kommer att ersätta chatbots och LLM.

På vilka sätt förbättrar Encord Index processen för att välja rätt data för AI-modeller, och vilken påverkan har detta på modellens prestanda?

Encord Index förbättrar dataurvalet genom att automatisera kureringen av stora datamängder, vilket hjälper team att identifiera och behålla endast den mest relevanta datan medan de tar bort oinformativ eller partisk data. Denna process reducerar inte bara storleken på datamängderna utan förbättrar också avsevärt kvaliteten på den data som används för att träna AI-modeller. Våra kunder har sett en förbättring på upp till 20 % i sina modeller samtidigt som de uppnår en 35 % minskning av datamängdens storlek och sparar hundratusentals dollar i beräknings- och mänsklig annoteringskostnader.

Med den snabba integrationen av banbrytande tekniker som Meta’s Segment Anything Model, hur håller Encord jämna steg med den snabbt utvecklande AI-landskapet?

Vi byggde avsiktligt plattformen för att kunna anpassa sig till nya tekniker snabbt. Vi fokuserar på att tillhandahålla ett skalbart, programvaruförst-tilvägagångssätt som enkelt inkorporerar framsteg som SAM, vilket säkerställer att våra användare alltid är utrustade med de senaste verktygen för att hålla jämna steg.

Vi planerar att hålla jämna steg genom att fokusera på multimodalt AI. Encord-plattformen kan redan hantera komplexa datatyper som bilder, videor och text, så när fler framsteg inom multimodalt AI kommer vår väg, är vi redo.

Vilka är de vanligaste utmaningarna som företag möter när de hanterar AI-data, och hur hjälper Encord till att hantera dessa?

Det finns 3 huvudsakliga utmaningar som företag möter:

  • Dålig dataorganisation och kontroll: När företag förbereder sig för att implementera AI-lösningar, möts de ofta av verkligheten att data är siloade och oorganiserade och inte är AI-klara. Denna data saknar ofta stark styrning runt den, vilket begränsar mycket av den från att användas i AI-system.
  • Brist på mänskliga experter: När AI-modeller hanterar alltmer komplexa problem, kommer det snart att finnas en brist på mänskliga domänexperter för att förbereda och validera data. När ett företags AI-krav ökar, är det svårt och dyrt att skala den mänskliga arbetsstyrkan.
  • Oskaalbara verktyg: Presterande AI-modeller är mycket datahungriga när det gäller data som behövs för finjustering, validering, RAG och andra arbetsflöden. Föregående generationens verktyg är inte utrustade för att hantera den mängd data och typer av data som krävs för dagens produktionsklassmodeller.

Encord löser dessa problem genom att automatisera processen för att kurera data i stor skala, vilket gör det lätt att identifiera effektiv data från problematisk data och säkerställa skapandet av effektiva tränings- och valideringsdataset. Det använder ett programvaruförst-tillvägagångssätt som är lätt att skala upp eller ned när datahanteringsbehoven ändras. Våra AI-assisterade annoteringsverktyg ger mänskliga experter möjlighet att maximera arbetsflödeseffektiviteten. Denna process är särskilt viktig i branscher som finansiella tjänster och hälsovård, där AI-tränare är dyra. Vi gör det lätt att hantera och förstå all ostrukturerad data i en organisation, vilket minskar behovet av manuellt arbete.

Hur hanterar Encord frågan om datafördomar och underrepresenterade områden inom datamängder för att säkerställa rättvisa och balanserade AI-modeller?

Att hantera datafördomar är ett kritiskt fokus för oss på Encord. Vår plattform identifierar automatiskt och ytor områden där data kan vara partiskt, vilket tillåter AI-team att hantera dessa frågor innan de påverkar modellprestanda. Vi säkerställer också att underrepresenterade områden inom datamängder är ordentligt inkluderade, vilket hjälper till att utveckla rättvisare och mer balanserade AI-modeller. Genom att använda våra kureringverktyg kan team vara säkra på att deras modeller är tränade på diversifierad och representativ data.

Encord har nyligen säkrat 30 miljoner dollar i Series B-finansiering. Hur kommer denna finansiering att accelerera er produktvägkarta och expansionsplaner?

De 30 miljoner dollar i Series B-finansiering kommer att användas för att drastiskt öka storleken på vårt produkt-, ingenjörs- och AI-forsknings-team under de kommande sex månaderna och accelerera utvecklingen av Encord Index och andra nya funktioner. Vi utökar också vår närvaro i San Francisco med ett nytt kontor, och denna finansiering kommer att hjälpa oss att skala vår verksamhet för att stödja vår växande kundbas.

Som den yngsta AI-företaget från Y Combinator att höja en Series B, vad tillskriver du Encords snabba tillväxt och framgång?

En av anledningarna till att vi har kunnat växa snabbt är att vi har antagit en extremt kundcentrerad fokus i alla områden av företaget. Vi kommunicerar ständigt med kunder, lyssnar noga på deras problem och “bear hugger” dem för att komma till lösningar. Genom att hyperfokusera på kundbehov snarare än hype, har vi skapat en plattform som resoneras med top AI-team över olika branscher. Våra kunder har varit instrumentala för att få oss till där vi är idag. Vår förmåga att skala snabbt och effektivt hantera komplexiteten i AI-data har gjort oss till en attraktiv lösning för företag.

Vi är också skyldiga mycket av vår framgång till våra teammedlemmar, partners och investerare, som alla har arbetat outtröttligt för att främja Encord. Att arbeta med världsklass produkt-, ingenjörs- och go-to-market-team har varit enormt inflytelserikt i vår tillväxt.

Med den ökande betydelsen av data i AI, hur ser du rollen för AI-dataplattformar som Encord utvecklas under de kommande fem åren?

När AI-applikationer växer i komplexitet, kommer behovet av effektiva och skalbara datahanteringslösningar att öka. Jag tror att varje företag kommer att ha en AI-avdelning, liknande hur IT-avdelningar finns idag. Encord kommer att vara den enda plattformen de behöver för att hantera den enorma mängd data som krävs för AI och få modeller till produktion snabbt.

Tack för den underbara intervjun, läsare som vill lära sig mer bör besöka Encord.

Antoine är en visionär ledare och medgrundare av Unite.AI, driven av en outtröttlig passion för att forma och främja framtiden för AI och robotik. En serieentreprenör, han tror att AI kommer att vara lika omstörtande för samhället som elektricitet, och fångas ofta i extas över potentialen för omstörtande teknologier och AGI. Som en futurist, är han dedikerad till att utforska hur dessa innovationer kommer att forma vår värld. Dessutom är han grundare av Securities.io, en plattform som fokuserar på att investera i banbrytande teknologier som omdefinierar framtiden och omformar hela sektorer.