Interviews
Chester Leung, Co-Founder und Head of AI-Plattform bei OPAQUE – Interview-Serie

Chester Leung ist Co-Founder und Head of Platform Architecture bei OPAQUE, einem Series-A-Startup, das eine vertrauliche Daten- und KI-Plattform aufbaut, die Teams ermöglicht, ihre Unternehmensdatenpipelines mit einer vertraulichen Schicht zu erweitern, um schneller Erkenntnisse mit weniger Aufwand und überprüfbarer Privatsphäre und Kontrolle zu gewinnen.
Zuvor war Chester als Informatik-Student an der UC Berkeley, wo er begutachtete Artikel auf Top-Konferenzen veröffentlichte und auch als Lead-Maintainer des Open-Source-Projekts MC2 für sichere kollaborative Analytics und maschinelles Lernen tätig war.
Sie haben Opaque nach Ihrer Zeit am RISELab der UC Berkeley gegründet, wo Ihre Arbeit KI und sichere Systeme verband. Welche spezifische Lücke in der Unternehmensdateninfrastruktur haben Sie gesehen, die zur Gründung von OPAQUE führte, und wie hat Ihre akademische Erfahrung die Richtung des Unternehmens beeinflusst?
Zu dieser Zeit gab es eine immense Konzentration, sowohl in der Wissenschaft als auch in der Industrie, auf die Nutzung von maschinellem Lernen für bestimmte Anwendungsfälle. Im Labor hatten wir das enorme Glück, große Unternehmenssponsoren zu haben, die uns halfen, unsere Arbeit zu gestalten, um dringendere Probleme zu lösen, mit denen sie in ihren Organisationen konfrontiert waren. Unsere Gruppe hatte insbesondere die einzigartige Gelegenheit, eng mit Technologie- und Banken-, Finanzdienstleistungs- und Versicherungsunternehmen (BFSI) zusammenzuarbeiten, um schwierige Datenschutzprobleme im Zusammenhang mit der Nutzung sensibler, aber wertvoller Daten für maschinelles Lernen zu lösen. Wie in allen Bereichen der KI hängt maschinelles Lernen von großen Mengen an hochwertigen Daten ab, um wertvolle und robuste Erkenntnisse zu produzieren.
Wir sind immer wieder auf das gleiche Muster gestoßen, während wir mit Teams von Unternehmen wie Amazon, Scotiabank und Ant Group (damals Ant Financial) zusammengearbeitet haben: Ihre maschinelles-Lernen-basierten Projekte sind vor dem Erreichen der Produktion aufgrund von Bedenken hinsichtlich der Nutzung sensibler, aber kritischer Daten für diese Anwendungsfälle ins Stocken geraten. Mit anderen Worten, diese Teams konnten nicht auf die richtigen Daten zugreifen, um AI in Projekten zu nutzen, die sie wussten, dass sie für das Unternehmen von Wert sein könnten, nicht weil es ein technisches Problem mit AI gab, sondern weil sie nicht auf die richtigen Daten zugreifen konnten.
Bei Opaque haben wir dasselbe Problem gelöst. Wir helfen Teams, Zugang zu den richtigen Daten zu erhalten, um ihre KI-Fähigkeiten zu entsperren oder aufzuwerten. Die einzige Veränderung seit unseren Forschungstagen ist die Dringlichkeit des Problems: Wir sehen jetzt konsistent, dass die Einführung und Integration von KI, die weiterhin durch den Zugang zu den richtigen Daten gebremst wird, zu einem unternehmensweiten strategischen Imperativ wird.
In einer Landschaft, in der Unternehmen stark in ableitende Modelle und agentenbasierte KI investieren, warum sind sichere Datenpipelines wichtiger denn je?
Sichere Datenpipelines sind das Rückgrat, auf dem Unternehmen ableitende Modelle und agentenbasierte KI aufbauen. Alles, von der Ausbildung dieser ableitenden Modelle bis zur Bereitstellung von agentenbasierter KI, beinhaltet sensible Daten und hängt von sicheren Datenpipelines ab.
Beispielsweise sehen wir als Branche eine wachsende Investition in die Erstellung hochwertiger Daten, um diese Modelle auszubilden. Einige Berichte haben sogar vorhergesagt, dass die Investition in die Erstellung hochwertiger Daten bald höher sein wird als die Investition in die Ausbildung der Modelle selbst. Natürlich ist die Erstellung von Daten ein mehrstufiger Prozess, der von Pipelines angetrieben wird, die das wertvollste geistige Eigentum eines Unternehmens produzieren: hochwertige, domänen-spezifische Daten, die Modelle ausbilden können, die immense Werte downstream erzeugen. Die Investition in die Erstellung dieser Daten ist enorm, und die erzeugten Daten, aufgrund ihrer Herkunft, unterscheiden ein Unternehmen von seinen Wettbewerbern und dienen als sein Schutzwall. Ein Unternehmen muss alles tun, um diese Pipeline zu sichern.
Die vertrauliche Rechenplattform von OPAQUE ermöglicht die Analyse von verschlüsselten Daten. Was sind die Kern-technischen Herausforderungen, um dies sowohl skalierbar als auch benutzerfreundlich für Unternehmensumgebungen zu machen?
Unsere vertrauliche KI-Plattform ermöglicht nicht nur die Analyse, maschinelles Lernen und generative KI auf verschlüsselten Daten, sondern bietet auch überprüfbare Beweise dafür, dass Ihre Daten nur auf die Weise verwendet wurden, die Sie erwarten und genehmigen.
Die Kernherausforderungen liegen in der Skalierbarkeit, Entwicklung und Verwaltung darin, die Orchestrierung der Arbeitslast sicher und überprüfbar zu machen. Viele Unternehmen nutzen heute verwaltete Cloud-Dienste, wenn sie skaliert werden müssen. Dies kann kosteneffizient und bequem sein. Die Herausforderung besteht jedoch darin, wie eine Organisation Software sichern und überprüfen kann, die nicht unter ihrer Kontrolle steht. Wenn die Organisation die Kontrolle über alle Software zurücknimmt, was muss sie aufgeben, um keinen verwalteten Dienst zu nutzen, und was verliert sie dadurch?
Sie haben gesagt, dass eine sichere Architektur ein langfristiger Wettbewerbsvorteil bieten kann. Können Sie erklären, wie sich dieses Prinzip praktisch für Unternehmens-KI-Teams auswirkt?
Es gibt zwei Perspektiven, aus denen man dies betrachten kann: eine Produkt-Perspektive und eine Ingenieur-Perspektive.
Aus einer Produkt-Perspektive versteht jeder, dass seine Daten radioaktiv, sein Schutzwall oder beides sind. Unternehmen werden immer reifer in ihrer Bewertung von Lösungen hinsichtlich Datenschutz, Sicherheit und Souveränität. Folglich muss jedes Team, das ein Produkt entwickelt, das Unternehmensdaten verarbeitet, Garantien bieten, dass die verarbeiteten Daten nur für autorisierte Parteien und Entitäten sichtbar sind und verwendet werden. Eine sichere Architektur bietet die Gewissheit, dass Datenschutz, Sicherheit und Souveränität bei der Produktentwicklung im Vordergrund standen und ermöglicht es dem Produkt, diese Garantien explizit zu bieten.
Aus einer Ingenieur-Perspektive ist eine sichere Architektur erweiterbarer und zukunftssicherer. Rechts-, Risiko- und Compliance-Teams werden immer strenger, um auf neue Risiken und Vorschriften zu reagieren. Daher sollten Ingenieur-Organisationen eine sichere Unternehmens-KI-Systematik von Anfang an aufbauen, um nicht monate- oder jahrelang wertvolle Ingenieur-Kapazitäten für die Umstrukturierung und Sicherung ihres Systems aufwenden zu müssen.
Wie sollten Organisationen die Rolle der Daten – jenseits einer Ressource – als verteidigbaren Schutzwall neu überdenken, wenn autonome KI-Systeme evolvieren?
Es gibt einen wachsenden Konsens in der Branche, dass Daten bald der einzige Schutzwall eines Unternehmens sein könnten. Wir sehen Forschung und Ingenieurtalente sowie die brillanten Technologien und Produkte, die sie entwickeln, von einem Unternehmen zum anderen wechseln. Als Ergebnis können zahlreiche Unternehmen die gleichen Produkte anbieten, die von den gleichen Technologien unterstützt werden.
Was jedoch nicht leicht von einem Unternehmen zum anderen übertragen werden kann, sind die Daten eines Unternehmens – es sei denn, sie werden geleakt. Darüber hinaus sind es genau diese Daten, die ein Produkt gegenüber seinen Wettbewerbern einzigartig machen können – personalisierter, angepasst und domänen-spezifisch. Organisationen müssen alles tun, um ihre Daten zu sichern und als Wettbewerbsvorteil zu nutzen.
Was sieht eine widerstandsfähige KI-Pipeline in der Praxis aus, und wie hilft sie Unternehmen, versteckte Kosten oder Risiken zu vermeiden, wenn sie ihre KI-Einsätze skaliert?
Eine widerstandsfähige KI-Pipeline ist eine, die zuverlässig, fehlertolerant, aber vor allem überprüfbar sicher von Ende zu Ende ist. Bevor die Verarbeitung beginnt, sollten Unternehmen die Daten, die in die Pipeline eingehen, sowie die Pipeline selbst überprüfen, um sicherzustellen, dass es keine Möglichkeit gibt, dass die Pipeline die Daten missbraucht. Während der Verarbeitung sollte die KI-Pipeline manipulationssicher sein, um sicherzustellen, dass niemand die Daten stehlen oder die Erkenntnisse, die sie liefert, verfälschen kann. Nach der Verarbeitung sollte die KI-Pipeline überprüfbar sein, sodass ein Team die Entscheidungsfindung und die Entwicklung der KI-Pipeline beobachten und erklären kann und sehen kann, was schiefgegangen ist, wenn etwas schiefgeht.
Es ist von entscheidender Bedeutung, zu berücksichtigen, wie eine unsichere, fehlerhafte KI-Pipeline die Daten eines Unternehmens oder sein eigenes Modell veröffentlichen oder die Auswirkungen auf die Unterscheidungsmerkmale oder den Ruf eines Unternehmens haben könnte. Was jedoch wichtiger ist, ist dies: Wenn Unternehmen ihre KI-Einsätze in kritischere und einflussreichere Anwendungsfälle skaliert, wächst das Risiko einer unsicheren, unerklärlichen KI-Pipeline exponentiell. In einer Welt, in der Kreditentscheidungen und Einstellungsentscheidungen bereits durch KI unterstützt werden und alles von persönlichen Finanzen bis hin zu Karrieren beeinflussen, kann ein beabsichtigter oder unabsichtlicher Fehler in einer KI-Pipeline dramatische Auswirkungen auf das Leben eines Einzelnen haben.
Viele Unternehmen konzentrieren sich auf Modellgenauigkeit oder Latenz. Was übersehen sie, wenn es um Datenintegrität und langfristige betriebliche Risiken geht?
Während viele Unternehmen sich auf das Modell oder die KI-Technologie konzentrieren, habe ich lange geglaubt, dass Daten der grundlegende Engpass für die Einführung von wertgenerierender KI sind.
Ein Modell, das sehr schnell eine genaue Antwort auf ein Thema liefert, das der Endbenutzer nicht interessiert, generiert null Wert. Um ein einzigartig überzeugendes Produkt zu entwickeln, müssen Unternehmen sicherstellen, dass ihre Modelle und die Produkte, die sie unterstützen, mit hochwertigen, relevanten Daten trainiert werden. Datenhygiene-Probleme, die aus einer mangelnden Qualität der Eingabedaten resultieren, können möglicherweise erst Monate später auftreten.
Zweitens haben wir festgestellt, dass Unternehmen im Allgemeinen keine gute Geschichte für die Erkennung von Datenverschiebung, -kontamination oder -leakage haben, was die Integrität des Modells gefährdet. Dies ist eng mit meinem ersten Punkt verbunden und macht Evaluierungen und Beobachtbarkeit noch wichtiger.
OPAQUE integriert sich in bestehende Cloud-Stacks. Was haben Sie über das Gleichgewicht zwischen einfacher Einführung und starken Sicherheitsgarantien in Unternehmenseinsätzen gelernt?
Wir haben fast ein Jahrzehnt, beginnend mit unseren Forschungstagen, damit verbracht, dieses Problem zu lösen. Die beweisbare Sicherheit von KI-Systemen, insbesondere in einer Unternehmensumgebung, ist ein sehr schwieriges Problem. Es erfordert System-, Sicherheits-, Kryptographie- und KI-Expertise. Als Ergebnis sind die meisten Systeme, die wir gesehen haben, nicht grundlegend sicher – weil Sicherheit so schwierig zu implementieren ist.
Bei Opaque haben wir ein Produkt entwickelt, das die beste Verbindung aus beiden Welten bietet – inhärent und überprüfbar sicher von Grund auf, aber leicht über Cloud-Marktplätze bereitstellbar und ausreichend flexibel, um in neue und bestehende KI-Anwendungen integriert zu werden.
Welche Arten von Bedrohungen oder Schwachstellen entstehen um KI-Pipelines und Datenfreigabe, die Unternehmensleiter noch nicht vollständig zu schätzen wissen?
Was wir in diesem agentenbasierten Goldrausch sehen, ist eine blinde Dringlichkeit, KI-Agents zu bereitstellen, die mit verschiedenen Systemen von Aufzeichnungen interagieren. Obwohl diese Agents Wert liefern können, bergen sie auch enorme Risiken, da sie so viele Systeme mit wertvollen Daten berühren. Agents sind inhärent nicht deterministisch, und wir haben zahlreiche Fälle gesehen, in denen sie Dinge tun, die wir nicht erwarten. In einer Welt, in der Ihre Daten Ihr einziger Schutzwall sind, sollten Unternehmensleiter immer fragen, ob sie KI-Agents vertrauen können, die auf all ihre Daten zugreifen, um sie nicht versehentlich oder sogar absichtlich zu missbrauchen.
Wie sehen Sie die Wechselwirkung zwischen sicherer Dateninfrastruktur, Modellverantwortlichkeit und Compliance in den nächsten Jahren, wenn die KI-Regulierung global Gestalt annimmt?
Überprüfbar sichere Dateninfrastruktur ermöglicht Modell- und Agenten-Verantwortlichkeit. Insbesondere kann ohne überprüfbare Beweise für die Entscheidungsfindung oder die Werkzeugnutzung eines Agents oder Modells nichts garantiert werden, und wir können die Verantwortlichkeit nicht nachverfolgen. Wenn KI immer mehr in unser tägliches Leben integriert wird, wollen wir mehr Erklärbarkeit und Beobachtbarkeit in die KI. Wenn jedoch KI mit Maschinengeschwindigkeit arbeiten kann und wir nicht, kann eine bösartige KI uns leicht mit falschen Geschichten täuschen. Wir benötigen Überprüfbarkeit, um KI zur Rechenschaft zu ziehen.
Für mich ist regulatorische Compliance sehr reaktiv. Die Entwicklung und Verabschiedung von Vorschriften erfolgt viel langsamer als technologische Innovation. Dies wird zunehmend der Fall sein, wenn KI uns hilft, unsere Innovationsgeschwindigkeit zu steigern. Während Compliance letztendlich die Nachzügler dazu bringen wird, sichere Dateninfrastruktur zu adoptieren, erkennen die Early Adopters und die Early Majority, dass es für die KI-Sicherheit von entscheidender Bedeutung ist und es weit vor dem Zeitpunkt adoptieren werden, an dem die Compliance es verpflichtend macht. Sie verstehen, dass Agenten-Verantwortlichkeit, ermöglicht durch sichere Dateninfrastruktur, für die Adoption ihrer eigenen KI-basierten Produkte von entscheidender Bedeutung ist.
Vielen Dank für das großartige Interview. Leser, die mehr erfahren möchten, sollten OPAQUE besuchen.












