Interviews
Eric Landau, Co-Founder & CEO von Encord – Interviewreihe

Eric Landau ist der CEO & Co-Founder von Encord, einer aktiven Lernplattform für Computer-Vision. Eric war der leitende quantitative Forscher auf einem globalen Equity-Delta-One-Schreibtisch und brachte Tausende von Modellen in die Produktion. Bevor er zu Encord kam, verbrachte er fast ein Jahrzehnt im Hochfrequenzhandel bei DRW. Er hält einen S.M. in Angewandter Physik von der Harvard University, einen M.S. in Elektrotechnik und einen B.S. in Physik von der Stanford University.
In seiner Freizeit genießt Eric es, mit ChatGPT und großen Sprachmodellen zu spielen und Craft-Cocktails zu mischen.
Was hat Sie dazu inspiriert, Encord mitzubegründen, und wie hat Ihre Erfahrung in der Teilchenphysik und der quantitativen Finanzwirtschaft Ihre Herangehensweise an die Lösung des “Datenproblems” im Bereich KI geprägt?
Ich begann erstmalig, über maschinelles Lernen nachzudenken, als ich in der Teilchenphysik arbeitete und mit sehr großen Datensätzen während meiner Zeit am Stanford Linear Accelerator Center (SLAC) konfrontiert war. Ich verwendete Software, die von Physikern für Physiker entwickelt worden war, was bedeutet, dass es viel zu wünschen übrig ließ, was die Benutzerfreundlichkeit anging. Mit einfacheren Tools hätte ich Analysen viel schneller durchführen können.
Später, als ich in der quantitativen Finanzwirtschaft bei DRW arbeitete, war ich für die Erstellung von Tausenden von Modellen verantwortlich, die in die Produktion gebracht wurden. Ähnlich wie bei meiner Erfahrung in der Physik stellte ich fest, dass hochwertige Daten für die Erstellung genauer Modelle von entscheidender Bedeutung waren und dass die Verwaltung komplexer, großer Datensätze schwierig ist. Ulrik hatte eine ähnliche Erfahrung bei der Visualisierung großer Bild-Datensätze für die Computer-Vision.
Als ich von seiner ursprünglichen Idee für Encord hörte, war ich sofort dabei und verstand die Bedeutung. Zusammen sahen Ulrik und ich eine enorme Chance, eine Plattform aufzubauen, um den KI-Datenentwicklungsprozess zu automatisieren und zu straffen, damit Teams die besten Daten in Modelle einbringen und vertrauenswürdige KI-Systeme aufbauen können.
Können Sie die Vision hinter Encord erläutern und wie sie im Vergleich zu den Anfängen des Computings oder des Internets in Bezug auf Potenzial und Herausforderungen steht?
Die Vision von Encord ist es, die grundlegende Plattform zu sein, auf die Unternehmen angewiesen sind, um ihre Daten in funktionsfähige KI-Modelle umzuwandeln. Wir sind die Schicht zwischen den Daten eines Unternehmens und seiner KI.
In vielen Aspekten spiegelt KI frühere Paradigmenwechsel wie die Personalcomputer und das Internet wider, da sie integraler Bestandteil der Arbeitsabläufe für jeden Einzelnen, jedes Unternehmen, jede Nation und jede Branche werden wird. Im Gegensatz zu früheren technologischen Revolutionen, die in erster Linie durch Moores Gesetz des komprimierten Rechenwachstums um das 30-fache alle 10 Jahre eingeschränkt waren, hat die KI-Entwicklung von gleichzeitigen Innovationen profitiert. Sie bewegt sich daher mit einem viel schnelleren Tempo. In den Worten von NVIDIA’s Jensen Huang: “Für das erste Mal sehen wir komprimierte Exponentialfunktionen… Wir komprimieren um den Faktor einer Million alle zehn Jahre. Nicht um den Faktor hundert, nicht um den Faktor tausend, um den Faktor einer Million.” Ohne Übertreibung sind wir Zeugen der am schnellsten sich bewegenden Technologie in der Menschheitsgeschichte.
Das Potenzial ist hier enorm: Durch die Automatisierung und Skalierung der Verwaltung hochwertiger Daten für KI gehen wir ein Engpass an, der eine breitere KI-Adoption verhindert. Die Herausforderungen sind ähnlich wie die Hürden in früheren technologischen Epochen: Silos, mangelnde Best Practices, Einschränkungen für nicht-technische Benutzer und ein Mangel an gut definierten Abstraktionen.
Encord Index wird als wichtiges Werkzeug für die Verwaltung und Kuratierung von KI-Daten positioniert. Wie unterscheidet es sich von anderen Datenmanagement-Plattformen, die derzeit verfügbar sind?
Es gibt einige Möglichkeiten, wie sich Encord Index abhebt:
Index ist skalierbar: Ermöglicht es Benutzern, Milliarden und nicht nur Millionen von Datenpunkten zu verwalten. Andere Tools haben Skalierungsprobleme bei unstrukturierten Daten und sind begrenzt bei der Konsolidierung aller relevanten Daten in einer Organisation.
Index ist flexibel: Integriert sich direkt mit privaten Daten-Speicher- und Cloud-Speicher-Anbietern wie AWS, GCP und Azure. Im Gegensatz zu anderen Tools, die auf einen einzelnen Cloud-Anbieter oder ein internes Speichersystem beschränkt sind, ist Index unabhängig von der Speicherort der Daten. Es ermöglicht es Ihnen, Daten aus vielen Quellen mit geeigneten Governance- und Zugriffskontrollen zu verwalten, die es Ihnen ermöglichen, sichere und konforme KI-Anwendungen zu entwickeln.
Index ist multimodal: Unterstützt multimodale KI, indem es Daten in Form von Bildern, Videos, Audio, Text, Dokumenten und mehr verwaltet. Index ist nicht auf eine einzige Form von Daten wie viele LLM-Tools heute beschränkt. Die menschliche Kognition ist multimodal, und wir glauben, dass multimodale KI im Herzen der nächsten Welle von KI-Fortschritten stehen wird, die Chatbots und LLMs ablösen werden.
Wie verbessert Encord Index den Prozess der Auswahl der richtigen Daten für KI-Modelle, und welche Auswirkungen hat dies auf die Modellleistung?
Encord Index verbessert die Datenauswahl, indem es die Kuratierung großer Datensätze automatisiert, Teams hilft, nur die relevantesten Daten zu identifizieren und zu behalten, und uninformative oder voreingenommene Daten entfernt. Dieser Prozess reduziert nicht nur die Größe der Datensätze, sondern verbessert auch erheblich die Qualität der Daten, die für die Schulung von KI-Modellen verwendet werden. Unsere Kunden haben bis zu 20 % Verbesserung ihrer Modelle gesehen, während sie eine 35-prozentige Reduzierung der Datensatzgröße und eine Einsparung von Hunderttausenden von Dollar bei Rechen- und menschlicher Annotationskosten erzielt haben.
Wie bleibt Encord mit der schnellen Integration von Spitzen-Technologien wie Meta’s Segment Anything Model Schritt?
Wir haben die Plattform absichtlich so konzipiert, dass sie sich schnell an neue Technologien anpassen kann. Wir konzentrieren uns darauf, einen skalierbaren, software-basierten Ansatz zu bieten, der es uns ermöglicht, Fortschritte wie SAM einfach zu integrieren, sodass unsere Benutzer immer mit den neuesten Tools ausgestattet sind, um wettbewerbsfähig zu bleiben.
Wir planen, indem wir uns auf multimodale KI konzentrieren, voranzukommen. Die Encord-Plattform kann bereits komplexe Datentypen wie Bilder, Videos und Text verwalten, sodass wir bereit sind, wenn weitere Fortschritte in der multimodalen KI vor uns liegen.
Welche sind die häufigsten Herausforderungen, denen Unternehmen bei der Verwaltung von KI-Daten gegenüberstehen, und wie hilft Encord dabei, diese anzugehen?
Es gibt drei Haupt-Herausforderungen, denen Unternehmen gegenüberstehen:
- Schlechte Datenorganisation und -kontrollen: Wenn Unternehmen bereit sind, KI-Lösungen umzusetzen, stoßen sie oft auf die Realität von siloartigen und unorganisierten Daten, die nicht KI-fähig sind. Diese Daten haben oft keine starken Governance-Strukturen, was die Nutzung in KI-Systemen einschränkt.
- Mangel an menschlichen Experten: Da KI-Modelle komplexere Probleme angehen, wird es bald einen Mangel an menschlichen Domänen-Experten geben, um Daten zu prüfen und zu validieren. Wenn die KI-Anforderungen eines Unternehmens steigen, ist es schwierig und teuer, diese menschliche Arbeitskraft zu skalieren.
- Unskalierbare Werkzeuge: Leistungsstarke KI-Modelle sind sehr daten-hungrig in Bezug auf die für Feinabstimmung, Validierung, RAG und andere Workflows erforderlichen Daten. Die vorherige Generation von Tools ist nicht in der Lage, die Menge an Daten und die Arten von Daten zu verwalten, die für heutige Produktions-Modelle erforderlich sind.
Encord löst diese Probleme, indem es den Prozess der Kuratierung von Daten im großen Maßstab automatisiert, es einfach macht, wirksame Daten von problematischen Daten zu identifizieren, und die Erstellung effektiver Trainings- und Validierungs-Datensätze sicherstellt. Es verwendet einen software-basierten Ansatz, der einfach zu skalieren ist, wenn sich die Anforderungen an die Datenverwaltung ändern. Unsere KI-gestützten Annotations-Tools ermöglichen es menschlichen Experten, die Effizienz der Workflows zu maximieren. Dieser Prozess ist insbesondere in Branchen wie Finanzdienstleistungen und Gesundheitswesen von entscheidender Bedeutung, wo KI-Trainer teuer sind. Wir machen es einfach, alle unstrukturierten Daten einer Organisation zu verwalten und zu verstehen, was den Bedarf an manueller Arbeit reduziert.
Wie geht Encord das Problem der Daten-Voreingenommenheit und unterrepräsentierter Bereiche innerhalb von Datensätzen an, um faire und ausgewogene KI-Modelle sicherzustellen?
Die Bekämpfung von Daten-Voreingenommenheit ist ein wichtiger Schwerpunkt für uns bei Encord. Unsere Plattform identifiziert und zeigt automatisch Bereiche, in denen Daten möglicherweise voreingenommen sind, sodass KI-Teams diese Probleme angehen können, bevor sie die Modellleistung beeinträchtigen. Wir stellen auch sicher, dass unterrepräsentierte Bereiche innerhalb von Datensätzen ordnungsgemäß einbezogen werden, was dazu beiträgt, fairere und ausgewogenere KI-Modelle zu entwickeln. Durch die Verwendung unserer Kuratierungstools können Teams sicherstellen, dass ihre Modelle auf vielfältigen und repräsentativen Daten trainiert werden.
Encord hat kürzlich 30 Millionen Dollar in Series-B-Finanzierung gesichert. Wie wird diese Finanzierung den Produkt-Roadmap und die Expansionspläne vorantreiben?
Die 30 Millionen Dollar in Series-B-Finanzierung werden verwendet, um die Größe unseres Produkt-, Engineering- und KI-Forschungsteams in den nächsten sechs Monaten drastisch zu erhöhen und die Entwicklung von Encord Index und anderen neuen Funktionen zu beschleunigen. Wir erweitern auch unsere Präsenz in San Francisco mit einem neuen Büro, und diese Finanzierung wird uns helfen, unsere Betriebe zu skalieren, um unsere wachsende Kundenbasis zu unterstützen.
Als jüngstes KI-Unternehmen von Y Combinator, das eine Series-B-Finanzierung aufgenommen hat, was tragen Sie dem schnellen Wachstum und Erfolg von Encord zu?
Einer der Gründe, warum wir schnell wachsen konnten, ist, dass wir in allen Bereichen des Unternehmens einen extrem kundenorientierten Fokus verfolgt haben. Wir kommunizieren ständig mit Kunden, hören ihnen genau zu und “umarmen” sie, um Lösungen zu finden. Indem wir uns auf die Bedürfnisse der Kunden konzentrieren und nicht auf die Hype, haben wir eine Plattform geschaffen, die bei den besten KI-Teams in verschiedenen Branchen Anklang findet. Unsere Kunden haben maßgeblich dazu beigetragen, uns dorthin zu bringen, wo wir heute sind. Unsere Fähigkeit, schnell zu skalieren und die Komplexität von KI-Daten effektiv zu verwalten, hat uns zu einer attraktiven Lösung für Unternehmen gemacht.
Wir verdanken viel von unserem Erfolg auch unseren Teammitgliedern, Partnern und Investoren, die alle unermüdlich daran gearbeitet haben, Encord zu fördern. Die Zusammenarbeit mit weltklasse-Produkt-, Engineering- und Go-to-Market-Teams hat sich enorm auf unser Wachstum ausgewirkt.
Angesichts der zunehmenden Bedeutung von Daten in KI, wie sehen Sie die Rolle von KI-Daten-Plattformen wie Encord in den nächsten fünf Jahren?
Da KI-Anwendungen komplexer werden, wird der Bedarf an effizienten und skalierbaren Datenmanagement-Lösungen nur zunehmen. Ich glaube, dass jedes Unternehmen schließlich eine KI-Abteilung haben wird, ähnlich wie es heute IT-Abteilungen gibt. Encord wird die einzige Plattform sein, die sie benötigen, um die riesigen Mengen an Daten zu verwalten, die für KI erforderlich sind, und Modelle schnell in die Produktion zu bringen.
Vielen Dank für das großartige Interview. Leser, die mehr erfahren möchten, sollten Encord besuchen.












