Interviews

Ugur Tigli, Chief Technical Officer bei MinIO – Interview-Serie

mm

Ugur Tigli ist der Chief Technical Officer bei MinIO, dem Marktführer im Bereich High-Performance-Objekt-Speicher für KI. Als CTO hilft Ugur Kunden dabei, API-getriebene, cloud-native und skalierbare Unternehmenslösungen für Dateninfrastrukturen mit MinIO zu entwickeln und bereitzustellen.

Können Sie Ihre Karriere als CTO von MinIO beschreiben und wie Ihre Erfahrungen Ihre Herangehensweise an KI und Dateninfrastruktur geprägt haben?

Ich begann meine Karriere im Bereich Infrastruktur-Engineering bei Merrill Lynch als Administrator für Backup und Wiederherstellung. Ich übernahm verschiedene Herausforderungen und technische Positionen. Ich kam zu Bank of America durch die Übernahme von Merrill Lynch, wo ich Vice President of Storage Engineering war. Meine Rolle umfasste auch Computing und Rechenzentrums-Engineering.

Im Rahmen meiner Arbeit arbeitete ich auch mit verschiedenen Venture-Capital-Firmen (VCs) und ihren Portfolio-Unternehmen zusammen, um die neuesten und besten Technologien einzuführen. Während eines meiner Treffen mit General Catalyst wurde ich auf die Idee und die Menschen hinter MinIO aufmerksam gemacht. Es gefiel mir, wie sie die Dateninfrastruktur ansahen – es unterschied sich von allen anderen auf dem Markt. Das Unternehmen erkannte die Bedeutung des Objekt-Speichers und der Standard-APIs, die Anwendungen verwendeten. Während dieser Jahre konnten sie die Zukunft der Rechnertechnik und der KI vorhersagen, bevor sie überhaupt existierte. Ich wollte Teil dieser Vision sein und etwas Einzigartiges aufbauen. MinIO ist jetzt der am weitesten verbreitete Objekt-Speicher auf der ganzen Welt.

Die Auswirkungen meiner vorherigen Rollen und Erfahrungen auf meine Herangehensweise an neue Technologien, insbesondere KI und Dateninfrastruktur, sind einfach die Summe der vielen Projekte, an denen ich während meiner Jahre bei einem Finanzdienstleistungsunternehmen beteiligt war.

Von den begrenzten Netzwerkbandbreiten, die zu Hadoop-Technologie führten, bis hin zu verschiedenen Datenspeichertechnologien wie Festplatten und Solid-State-Drives – all diese technologischen Veränderungen haben meine Sicht auf das KI-Ökosystem und die Dateninfrastruktur geprägt.

MinIO ist bekannt für seine High-Performance-Objekt-Speicherfähigkeiten. Wie kommt MinIO speziell den Bedürfnissen von KI-getriebenen Unternehmen heute nach?

Als AB und Garima MinIO konzipierten, war ihr erster Schwerpunkt, ein Problem zu identifizieren – sie wussten, dass Daten weiter wachsen würden und bestehende Speichertechnologien mit diesem Wachstum nicht kompatibel waren. Die schnelle Entwicklung von KI hat ihre vorausschauenden Ansichten des Marktes zu einer Realität gemacht. Seitdem ist Objekt-Speicher zu einem Grundbestandteil der KI-Infrastruktur geworden (alle großen LLMs wie OpenAI und Anthropic basieren auf Objekt-Speichern), und der moderne Rechenzentrums-Bau basiert auf einem Objekt-Speicher.

MinIO hat kürzlich eine neue Objekt-Speicher-Plattform mit wichtigen Unternehmensfunktionen zur Unterstützung von Organisationen bei ihren KI-Initiativen gestartet: den MinIO Enterprise Object Store. Er ist für die Leistungs- und Skalierungsanforderungen konzipiert, die durch massive KI-Workloads entstehen, und ermöglicht es Kunden, die Herausforderungen im Zusammenhang mit Milliarden von Objekten und Hunderttausenden von kryptografischen Operationen pro Knoten pro Sekunde leichter anzugehen. Er verfügt über sechs neue kommerzielle Funktionen, die sich auf wichtige betriebliche und technische Herausforderungen konzentrieren, denen KI-Workloads gegenüberstehen: Katalog (dies löst das Problem des Objekt-Speicher-Namensraums und der Metadatensuche), Firewall (speziell für Daten entwickelt), Key-Management-System (löst das Problem des Umgangs mit Milliarden von kryptografischen Schlüsseln), Cache (funktioniert als Caching-Dienst), Beobachtbarkeit (ermöglicht Administratoren, alle Systemkomponenten über jede Instanz hinweg zu überwachen) und schließlich die Enterprise-Konsole (dient als zentrale Steuerung für alle Instanzen von MinIO).

Die Verarbeitung von KI im großen Maßstab wird immer wichtiger. Können Sie erklären, warum dies der Fall ist und wie MinIO diese Anforderungen für moderne Unternehmen erfüllt?

Fast alles, was Organisationen bauen, basiert jetzt auf Objekt-Speicher, was sich in der Ära moderner Datenseen und KI noch beschleunigen wird. Organisationen suchen nach neuen Infrastrukturen, um all die Daten zu verwalten, die in ihr System kommen, und bauen dann datenzentrierte Anwendungen darauf auf – dies erfordert eine außergewöhnliche Skalierbarkeit und Flexibilität, die nur Objekt-Speicher unterstützen kann. Das ist der Bereich, in dem MinIO agiert und warum das Unternehmen immer Meilen vor der Konkurrenz lag, weil es für das entwickelt wurde, was KI benötigt – die Speicherung von riesigen Mengen strukturierter und unstrukturierter Daten und die Bereitstellung von Leistung im großen Maßstab.

Ähnlich wie die Bedürfnisse von Machine Learning (ML) in früheren Generationen von KI sind Daten und moderne Datenseen für den Erfolg von “prädiktiver” KI von entscheidender Bedeutung. Mit der Weiterentwicklung von “generativer” KI hat sich dieses Landschaftsbild jedoch erweitert und umfasst nun viele weitere Komponenten, wie KI-Ops-Daten und Dokumenten-Pipelines, grundlegende Modelle und Vektor-Datenbanken.

All diese zusätzlichen Komponenten verwenden Objekt-Speicher, und die meisten davon integrieren direkt mit MinIO. Zum Beispiel verwendet die Vektor-Datenbank Milvus MinIO, und viele moderne Abfrage-Engines integrieren mit MinIO über S3-APIs.

KI-technische Schulden sind ein wachsendes Problem für viele Organisationen. Welche Strategien verfolgt MinIO, um Kunden dabei zu helfen, dieses Problem zu vermeiden, insbesondere im Hinblick auf die effizientere Nutzung von GPUs?

Eine Kette ist nur so stark wie ihr schwächstes Glied – und Ihre KI/ML-Infrastruktur ist nur so schnell wie ihre langsamste Komponente. Wenn Sie Machine-Learning-Modelle mit GPUs trainieren, kann Ihre schwache Komponente Ihre Speicherlösung sein. Das Ergebnis ist, was ich das “Hungry-GPU-Problem” nenne. Das Hungry-GPU-Problem tritt auf, wenn Ihre Netzwerk- oder Speicherlösung nicht in der Lage ist, Trainingsdaten an Ihre Trainingslogik schnell genug zu liefern, um Ihre GPUs voll auszulasten, wodurch wertvolle Rechenleistung auf der Strecke bleibt. Etwas, das Organisationen tun können, um ihre GPUs voll auszulasten, ist, zunächst die Anzeichen einer schlechten Datenarchitektur und wie sie direkt zur Unterauslastung von KI-Technologie führen kann, zu verstehen. Um technische Schulden zu vermeiden, müssen Unternehmen ihre Sichtweise auf Daten ändern.

Organisationen können eine Speicherlösung einrichten, die sich im gleichen Rechenzentrum wie ihre Recheninfrastruktur befindet. Ideal wäre es, wenn dies im gleichen Cluster wie ihre Recheninfrastruktur wäre. Da MinIO eine softwaredefinierte Speicherlösung ist, ist es in der Lage, die Leistung zu liefern, die erforderlich ist, um hungrige GPUs zu füttern – ein kürzlich durchgeführter Benchmark erreichte 325 GiB/s bei GETs und 165 GiB/s bei PUTs mit nur 32 Knoten von NVMe-SSDs.

Sie haben eine reiche Erfahrung im Bereich der Erstellung von Hochleistungs-Dateninfrastrukturen für globale Finanzinstitute. Wie beeinflussen diese Erfahrungen Ihre Arbeit bei MinIO, insbesondere bei der Architektur von Lösungen für diverse Branchenbedürfnisse?

Ich half bei der Erstellung der ersten privaten Cloud für Bank of America und diese Initiative rettete Milliarden von Dollar, indem sie Funktionen und Funktionalitäten bereitstellte, die in öffentlichen Clouds verfügbar waren, jedoch intern zu geringeren Kosten. Nicht nur diese wichtige Initiative, sondern auch viele andere vielfältige Anforderungen, an denen ich bei BofA Merrill Lynch gearbeitet habe, haben meine Arbeit bei MinIO im Hinblick auf die Architektur von Lösungen für unsere Kunden heute geprägt.

Beispielsweise half ich bei der Erstellung von Hadoop-Clustern, die nur die Datenspeicher-Komponenten der Server verwendeten, während die Server-CPUs unterausgelastet oder fast untätig blieben. Einfache Beispiele oder Erkenntnisse wie diese ermöglichten es mir, disaggregierte Daten- und Rechenlösungen in der modernen Dateninfrastruktur von heute zu verwenden, während ich unseren Kunden und Partnern half, technisch bessere und kostengünstigere Lösungen unter Verwendung heutiger Hochgeschwindigkeits-Netzwerktechnologien und Hochleistungs-Objekt-Speicher wie MinIO und jeder Abfrage- oder Verarbeitungs-Engine.

Die hybride Cloud stellt einzigartige Herausforderungen und Komplexitäten dar. Können Sie diese im Detail erläutern und erklären, wie MinIOs hybrides “Burst”-Modell zur Cloud die Kontrolle über Cloud-Kosten effektiv unterstützt?

Das Arbeiten in einer Multi-Cloud-Umgebung sollte nicht zu steigenden IT-Budgets und der Unfähigkeit, Meilensteine zu erreichen, führen – es sollte vielmehr dabei helfen, Kosten zu kontrollieren und den Weg einer Organisation zu beschleunigen. Etwas, das man berücksichtigen sollte, ist die Cloud-Repatriierung – die Realität ist, dass der Umzug von Operationen aus der Cloud in die Unternehmensinfrastruktur zu erheblichen Kosteneinsparungen führen kann, je nach Fall, und man sollte immer die Cloud als Betriebsmodell und nicht als Ziel betrachten. Zum Beispiel starten Organisationen GPU-Instanzen, verbringen aber dann Zeit damit, Daten vorzuverarbeiten, um sie in die GPU zu passen. Dies verschwendet wertvolle Zeit und Geld – Organisationen müssen besser optimieren, indem sie cloud-native und vor allem cloud-portable Technologien wählen, die die Macht der Multi-Cloud ohne erhebliche Kosten freisetzen können. Durch die Verwendung von cloud-first-Betriebsmodell-Prinzipien und die Einhaltung dieses Rahmens kann die Agilität zur Anpassung an veränderte betriebliche Anforderungen bereitgestellt werden.

Kubernetes-native Lösungen sind für die moderne Infrastruktur von entscheidender Bedeutung. Wie verbessert die Integration von MinIO mit Kubernetes seine Skalierbarkeit und Flexibilität für die KI-Dateninfrastruktur?

MinIO ist von Natur aus kubernetes-native und S3-kompatibel. Entwickler können schnell persistierenden Objekt-Speicher für alle ihre cloud-nativen Anwendungen bereitstellen. Die Kombination aus MinIO und Kubernetes bietet eine leistungsstarke Plattform, die es Anwendungen ermöglicht, über jede Multi-Cloud- und Hybrid-Cloud-Infrastruktur zu skalieren und dennoch zentral verwaltet und gesichert zu werden, ohne in die öffentliche Cloud gesperrt zu sein.

Mit Kubernetes als Motor kann MinIO überall laufen, wo Kubernetes läuft – was in der modernen, cloud-nativen/KI-Welt im Wesentlichen überall ist.

Blicken Sie in die Zukunft, welche zukünftigen Entwicklungen oder Verbesserungen können Benutzer von MinIO im Kontext der KI-Dateninfrastruktur erwarten?

Unsere jüngsten Partnerschaften und Produktstarts sind ein Zeichen für den Markt, dass wir nicht vorhaben, uns zu verlangsamen. Wir werden weiterhin voranschreiten, wo es für unsere Kunden sinnvoll ist. Zum Beispiel haben wir kürzlich mit Carahsoft zusammengearbeitet, um MinIOs softwaredefiniertes Objekt-Speicher-Portfolio für die Sektoren Regierung, Verteidigung, Geheimdienste und Bildung verfügbar zu machen. Dies ermöglicht es öffentlichen Organisationen, jede Art von Dateninfrastruktur aufzubauen, von umfassenden modernen Datenseen bis hin zu missionspezifischen Datenlösungen am autonomen Rand. Gemeinsam bringen wir diese bahnbrechenden, einzigartigen Lösungen den Kunden des öffentlichen Sektors, um ihnen dabei zu helfen, Dateninfrastruktur-Herausforderungen leicht und effizient anzugehen. Diese Partnerschaft kommt zu einem Zeitpunkt, an dem es einen verstärkten Druck gibt, den öffentlichen Sektor KI-bereit zu machen, mit den jüngsten Anforderungen der OMB, die besagen, dass alle Bundesbehörden einen Chief KI-Officer (und andere Dinge) benötigen. Insgesamt stärkt diese Partnerschaft die KI-Position der Branche und gibt dem öffentlichen Sektor die wertvollen Werkzeuge, die notwendig sind, um erfolgreich zu sein.

Darüber hinaus ist MinIO sehr gut für die Zukunft positioniert. Die KI-Dateninfrastruktur ist noch in den Kinderschuhen. Viele Bereiche davon werden in den nächsten paar Jahren deutlicher werden. Zum Beispiel werden die meisten Unternehmen ihre eigenen Daten und Dokumente mit grundlegenden Modellen und Retrieval-Augmented-Generation (RAG) verwenden wollen. Eine weitere Integration in dieses Bereitstellungsmodell wird für MinIO aufgrund der Tatsache, dass all diese architektonischen Entscheidungen und Bereitstellungsmodelle eine Sache gemeinsam haben – all diese Daten sind bereits in MinIO gespeichert.

Schließlich, für Technologie-Führer, die ihre Dateninfrastruktur für KI aufbauen oder verbessern möchten, welche Ratschläge würden Sie aufgrund Ihrer Erfahrungen und Erkenntnisse bei MinIO geben?

Um jede KI-Initiative erfolgreich zu machen, gibt es drei Schlüsselelemente, an die Sie sich halten müssen: die richtigen Daten, die richtige Infrastruktur und die richtigen Anwendungen. Es beginnt wirklich damit, zu verstehen, was Sie benötigen – gehen Sie nicht einfach hin und kaufen Sie teure GPUs, nur weil Sie Angst haben, den KI-Zug zu verpassen. Ich bin fest davon überzeugt, dass Unternehmens-KI-Strategien 2024 scheitern werden, wenn Organisationen sich nur auf die Modelle selbst konzentrieren und nicht auf die Daten. Das Denken von Modell zu Modell ist ein kritischer Fehler – Sie müssen mit den Daten beginnen. Bauen Sie eine ordnungsgemäße Dateninfrastruktur. Dann denken Sie über Ihre Modelle nach. Wenn Organisationen auf eine KI-erste Architektur zusteuern, ist es von entscheidender Bedeutung, dass ihre Dateninfrastruktur ihre Daten ermöglicht – und nicht einschränkt.

Vielen Dank für das großartige Interview. Leser, die mehr erfahren möchten, sollten MinIO besuchen: MinIO.

Antoine ist ein visionärer Führer und Gründungspartner von Unite.AI, getrieben von einer unerschütterlichen Leidenschaft für die Gestaltung und Förderung der Zukunft von KI und Robotik. Ein Serienunternehmer, glaubt er, dass KI so disruptiv für die Gesellschaft sein wird wie Elektrizität, und wird oft dabei ertappt, wie er über das Potenzial disruptiver Technologien und AGI schwärmt.

Als futurist ist er darauf fokussiert, zu erforschen, wie diese Innovationen unsere Welt formen werden. Zusätzlich ist er der Gründer von Securities.io, einer Plattform, die sich auf Investitionen in hochmoderne Technologien konzentriert, die die Zukunft neu definieren und ganze Branchen umgestalten.