Interviews
Eric Landau, Co-Founder & CEO van Encord – Interview Series

Eric Landau is de CEO & Co-Founder van Encord, een actief leerplatform voor computer vision. Eric was de leidende kwantitatieve onderzoeker op een wereldwijde equity delta-one desk, waar hij duizenden modellen in productie bracht. Voordat hij bij Encord kwam, werkte hij bijna een decennium in high-frequency trading bij DRW. Hij heeft een S.M. in Toegepaste Fysica van de Harvard University, een M.S. in Elektrotechniek en een B.S. in Fysica van de Stanford University.
In zijn vrije tijd houdt Eric van het spelen met ChatGPT en grote taalmodellen en het maken van craft cocktails.
Wat inspireerde je om Encord mede op te richten, en hoe heeft je ervaring in deeltjesfysica en kwantitatieve financiering je benadering van het oplossen van het “dataprobleem” in AI gevormd?
Ik begon voor het eerst na te denken over machine learning toen ik in de deeltjesfysica werkte en te maken had met zeer grote datasets tijdens mijn tijd bij het Stanford Linear Accelerator Center (SLAC). Ik gebruikte software die was ontwikkeld voor natuurkundigen door natuurkundigen, wat wil zeggen dat er veel te wensen overbleef op het gebied van gebruikerservaring. Met eenvoudigere tools had ik analyses veel sneller kunnen uitvoeren.
Later, toen ik in de kwantitatieve financiering bij DRW werkte, was ik verantwoordelijk voor het creëren van duizenden modellen die in productie werden genomen. Net als bij mijn ervaring in de fysica, ontdekte ik dat hoge kwaliteit data essentieel was om accurate modellen te maken en dat het beheren van complexe, grote datasets moeilijk was. Ulrik had een soortgelijke ervaring met het visualiseren van grote beeld datasets voor computer vision.
Toen ik over zijn eerste idee voor Encord hoorde, was ik meteen aan boord en begreep ik het belang. Samen zagen Ulrik en ik een enorme kans om een platform te bouwen om het AI-data-ontwikkelingsproces te automatiseren en te stroomlijnen, waardoor het voor teams gemakkelijker wordt om de beste data in modellen te krijgen en betrouwbare AI-systemen te bouwen.
Kunt u de visie achter Encord toelichten en hoe deze zich verhoudt tot de vroege dagen van computing of het internet in termen van potentieel en uitdagingen?
De visie van Encord is om het fundamentale platform te zijn waarop bedrijven vertrouwen om hun data om te zetten in functionele AI-modellen. Wij zijn de laag tussen de data van een bedrijf en hun AI.
Op veel manieren spiegelt AI eerdere paradigma’s zoals personal computing en het internet, in die zin dat het een integraal onderdeel zal worden van workflows voor elk individu, bedrijf, natie en industrie. In tegenstelling tot eerdere technologische revoluties, die grotendeels werden beperkt door Moore’s law van samengestelde computatiegroei van 30x elk decennium, heeft AI-ontwikkeling geprofiteerd van gelijktijdige innovaties. Het beweegt zich dus met een veel snellere snelheid. In de woorden van NVIDIA’s Jensen Huang: “Voor het eerst zien we samengestelde exponentiële groei… We zijn een miljoen keer sneller elk decennium. Niet honderd keer, niet duizend keer, een miljoen keer.” Zonder enige overdrijving zijn we getuige van de snelst bewegende technologie in de menselijke geschiedenis.
Het potentieel is hier enorm: door het beheer van hoge kwaliteit data voor AI te automatiseren en op te schalen, lossen we een bottleneck op die een bredere adoptie van AI verhindert. De uitdagingen zijn herinneringen aan vroege obstakels in eerdere technologische tijdperken: silo’s, gebrek aan best practices, beperkingen voor niet-technische gebruikers en een tekort aan goed gedefinieerde abstracties.
Encord Index wordt gepositioneerd als een sleutelinstrument voor het beheren en cureren van AI-data. Hoe onderscheidt het zich van andere databeheerplatforms die momenteel beschikbaar zijn?
Er zijn een paar manieren waarop Encord Index zich onderscheidt:
Index is schaalbaar: Staat gebruikers toe om miljarden, niet miljoenen, datapunten te beheren. Andere tools hebben schaalproblemen voor ongestructureerde data en zijn beperkt in het consolideren van alle relevante data in een organisatie.
Index is flexibel: Integreert rechtstreeks met privé data-opslag en cloud-opslagproviders zoals AWS, GCP en Azure. In tegenstelling tot andere tools die beperkt zijn tot één cloud-provider of intern opslagsysteem, is Index onafhankelijk van de locatie van de data. Het laat je toe om data van veel bronnen te beheren met passende governance en toegangscontroles die het mogelijk maken om beveiligde en compliant AI-toepassingen te ontwikkelen.
Index is multimodaal: Ondersteunt multimodale AI, waardoor het mogelijk is om data in de vorm van afbeeldingen, video’s, audio, tekst, documenten en meer te beheren. Index is niet beperkt tot één type data, zoals veel LLM-tools vandaag. Het menselijk cognitief vermogen is multimodaal, en we geloven dat multimodale AI het hart zal vormen van de volgende golf van AI-vooruitgang, die chatbots en LLM’s zal vervangen.
Op welke manieren verbetert Encord Index het proces van het selecteren van de juiste data voor AI-modellen, en wat is het effect hiervan op de prestaties van modellen?
Encord Index verbetert dataselectie door de curatie van grote datasets te automatiseren, waardoor teams alleen de meest relevante data kunnen identificeren en behouden, terwijl oninformatieve of bevooroordeelde data worden verwijderd. Dit proces vermindert niet alleen de grootte van datasets, maar verbetert ook aanzienlijk de kwaliteit van de data die wordt gebruikt voor het trainen van AI-modellen. Onze klanten hebben tot 20% verbetering in hun modellen gezien, terwijl ze een vermindering van 35% in de grootte van de dataset en een besparing van honderdduizenden dollars in compute- en menselijke annotatiekosten behaalden.
Hoe blijft Encord voorop in de snel evoluerende AI-landschap, met name met de recente integratie van baanbrekende technologieën zoals Meta’s Segment Anything Model?
We hebben het platform met opzet zo gebouwd dat het snel kan worden aangepast aan nieuwe technologieën. We focussen op het bieden van een schaalbare, software-georiënteerde aanpak die gemakkelijk innovaties zoals SAM incorporeert, waardoor onze gebruikers altijd zijn uitgerust met de laatste tools om concurrerend te blijven.
We plannen om voorop te blijven door ons te focussen op multimodale AI. Het Encord-platform kan al complexe datatypen zoals afbeeldingen, video’s en tekst beheren, dus als er meer vooruitgang wordt geboekt in multimodale AI, zijn we klaar.
Wat zijn de meest voorkomende uitdagingen waar bedrijven mee te maken krijgen bij het beheren van AI-data, en hoe helpt Encord deze aan te pakken?
Er zijn drie hoofduitdagingen waar bedrijven mee te maken krijgen:
- Slechte data-organisatie en -controle: Als bedrijven AI-oplossingen willen implementeren, worden ze vaak geconfronteerd met de realiteit van gesiloëerde en ongeorganiseerde data die niet AI-ready is. Deze data ontbeert vaak sterke governance, waardoor veel ervan niet kan worden gebruikt in AI-systemen.
- Gebrek aan menselijke experts: Naarmate AI-modellen complexere problemen aanpakken, zal er binnenkort een tekort zijn aan menselijke domeinexperts om data voor te bereiden en te valideren. Naarmate de AI-eisen van een bedrijf toenemen, is het schalen van die menselijke workforce een uitdaging en kostbaar.
- Onschaalbare tooling: Prestatiegerichte AI-modellen zijn zeer data-hongerig in termen van data die nodig is voor fine-tuning, validatie, RAG en andere workflows. De vorige generatie tools is niet in staat om de hoeveelheid data en typen data te beheren die nodig zijn voor productieklare modellen van vandaag.
Encord lost deze problemen op door het proces van datacuratie op schaal te automatiseren, waardoor het gemakkelijk wordt om impactvolle data van problematische data te onderscheiden en effectieve trainings- en validatiedatasets te creëren. Het gebruikt een software-georiënteerde aanpak die gemakkelijk kan worden opgeschaald of afgeschaald naarmate de databeheerbehoeften veranderen. Onze AI-geassisteerde annotatietools empoweren menselijke experts in de loop om de workflow-efficiëntie te maximaliseren. Dit proces is vooral cruciaal in branches zoals financiële dienstverlening en gezondheidszorg, waar AI-trainers duur zijn. We maken het gemakkelijk om alle ongestructureerde data van een organisatie te beheren en te begrijpen, waardoor de behoefte aan handmatige arbeid wordt verminderd.
Hoe gaat Encord om met het probleem van data-bias en ondervertegenwoordigde gebieden binnen datasets om eerlijke en evenwichtige AI-modellen te garanderen?
Het aanpakken van data-bias is een kritisch aandachtspunt voor ons bij Encord. Ons platform identificeert en brengt automatisch naar boven gebieden waar data mogelijk bevooroordeeld is, waardoor AI-teams deze kwesties kunnen aanpakken voordat ze de modelprestaties beïnvloeden. We zorgen er ook voor dat ondervertegenwoordigde gebieden binnen datasets goed worden opgenomen, wat helpt bij het ontwikkelen van eerlijkere en meer evenwichtige AI-modellen. Door onze curatietools te gebruiken, kunnen teams erop vertrouwen dat hun modellen worden getraind op diverse en representatieve data.
Encord heeft onlangs 30 miljoen dollar aan Series B-financiering veiliggesteld. Hoe zal deze financiering uw productroadmap en expansieplannen versnellen?
De 30 miljoen dollar aan Series B-financiering zal worden gebruikt om de omvang van ons product-, engineering- en AI-onderzoeksteam drastisch te vergroten in de komende zes maanden en de ontwikkeling van Encord Index en andere nieuwe functies te versnellen. We breiden ook onze aanwezigheid in San Francisco uit met een nieuw kantoor, en deze financiering zal ons helpen om onze operaties op te schalen om onze groeiende klantenbasis te ondersteunen.
Als het jongste AI-bedrijf van Y Combinator dat een Series B heeft opgehaald, wat schrijf je de snelle groei en het succes van Encord aan toe?
Een van de redenen waarom we snel hebben kunnen groeien, is dat we een extreem klantgerichte focus hebben aangenomen in alle gebieden van het bedrijf. We communiceren constant met klanten, luisteren nauw naar hun problemen en “omhelzen” hen om oplossingen te vinden. Door ons te focussen op klantbehoeften in plaats van hype, hebben we een platform gecreëerd dat resoneert met top AI-teams in verschillende branches. Onze klanten zijn instrumenteel geweest in het brengen van ons waar we vandaag zijn. Ons vermogen om snel op te schalen en de complexiteit van AI-data effectief te beheren, heeft ons een aantrekkelijke oplossing gemaakt voor ondernemingen.
We zijn ook veel van ons succes verschuldigd aan onze teamleden, partners en investeerders, die allemaal hard hebben gewerkt om Encord te promoten. Samenwerken met wereldklasse product-, engineering- en go-to-market teams heeft een enorme impact gehad op onze groei.
Hoe zie je de rol van AI-data-platforms zoals Encord evolueren in de komende vijf jaar, gezien de toenemende belangstelling voor data in AI?
Naarmate AI-toepassingen complexer worden, zal de behoefte aan efficiënte en schaalbare databeheeroplossingen alleen maar toenemen. Ik geloof dat elk bedrijf uiteindelijk een AI-afdeling zal hebben, net zoals er vandaag IT-afdelingen bestaan. Encord zal het enige platform zijn dat ze nodig hebben om de enorme hoeveelheden data te beheren die nodig zijn voor AI en om modellen snel in productie te krijgen.
Bedankt voor het geweldige interview, lezers die meer willen leren, moeten Encord bezoeken.












