Wywiady

Ugur Tigli, Chief Technical Officer w MinIO – Wywiad

mm

Ugur Tigli jest Chief Technical Officer w MinIO, liderem w dziedzinie wysokowydajnego przechowywania obiektów dla AI. Jako CTO, Ugur pomaga klientom projektować i wdrażać API-driven, cloud-native i skalowalne rozwiązania infrastruktury danych przedsiębiorstw z wykorzystaniem MinIO.

Czy mógłbyś opisać swoją drogę do objęcia stanowiska CTO w MinIO i jak Twoje doświadczenia ukształtowały Twoje podejście do AI i infrastruktury danych?

Rozpocząłem swoją karierę w dziedzinie inżynierii infrastruktury w Merrill Lynch jako administrator backupu i przywracania. Kontynuowałem podejmowanie różnych wyzwań i różnych stanowisk technicznych. Dołączyłem do Bank of America poprzez przejęcie Merrill Lynch, gdzie byłem wiceprezesem ds. inżynierii magazynowania. Moja rola rozrosła się jednak do objęcia również inżynierii komputerowej i centrum danych.

W ramach swojej pracy współpracowałem również z różnymi firmami venture capital (VC) i ich spółkami zależnymi, aby wprowadzić najnowszą i najlepszą technologię. Podczas jednego ze spotkań z General Catalyst zostałem zapoznany z pomysłem i ludźmi stojącymi za MinIO. Zainteresowało mnie to, jak podchodzili oni do infrastruktury danych — różniło się to od podejścia wszystkich innych na rynku. Firma zrozumiała wagę sklepu obiektów i standardowych API, z którymi aplikacje zaczynały współpracę. W tamtych latach mogli oni przewidzieć przyszłość komputowania i AI przed kimkolwiek innym, czy nawet przed tym, zanim zostało to nazwane tym, czym jest dzisiaj. Chciałem być częścią realizacji tego widzenia i budowy czegoś naprawdę unikalnego. MinIO jest teraz najbardziej rozpowszechnionym sklepem obiektów na świecie.

Wpływ moich poprzednich ról i doświadczeń na to, jak podchodzę do nowych technologii, szczególnie AI i infrastruktury danych, jest po prostu kumulacją wielu projektów, w których brałem udział w ciągu lat wspierania zespołów aplikacyjnych w wysoko wymagającej firmie finansowej.

Od ograniczonej przepustowości sieci, która doprowadziła do technologii Hadoop jako najnowszej technologii 15 lat temu, po różne technologie nośników danych, od dysku twardego (HDD) do dysku stanowego (SSD), wiele z tych zmian technologicznych ukształtowało moje obecne spojrzenie na ekosystem AI i infrastrukturę danych.

MinIO jest uznawany za swoje wysokowydajne możliwości przechowywania obiektów. Jak MinIO konkretnie odpowiada na potrzeby przedsiębiorstw napędzanych przez AI dzisiaj?

Kiedy AB i Garima konceptualizowali MinIO, ich pierwszym priorytetem było rozważenie problemu — wiedzieli, że dane będą nadal rosły, a istniejące technologie magazynowania są niezgodne z tym wzrostem. Szybkie pojawienie się AI uczyniło ich przewidziane opinie o rynku rzeczywistością. Od tego czasu przechowywanie obiektów stało się podstawą dla infrastruktury AI (wszystkie główne LLM, takie jak OpenAI i Anthropic, są zbudowane na sklepach obiektów), a nowoczesne centrum danych jest zbudowane na fundamencie sklepu obiektów.

MinIO niedawno uruchomił nową platformę przechowywania obiektów z kluczowymi funkcjami klasy przedsiębiorstw, aby wspierać organizacje w ich inicjatywach AI: MinIO Enterprise Object Store. Został on zaprojektowany z myślą o wydajności i skalowalności wprowadzanych przez ogromne obciążenia AI i umożliwia klientom łatwiejsze rozwiązywanie problemów związanych z miliardami obiektów, a także setkami tysięcy operacji kryptograficznych na węzeł na sekundę. Ma sześć nowych funkcji komercyjnych, które koncentrują się na kluczowych wyzwaniach operacyjnych i technicznych stawianych przez obciążenia AI: Katalog (rozwiązuje problem przestrzeni nazw i wyszukiwania metadanych sklepu obiektów), Zapora (została zaprojektowana specjalnie dla danych), System zarządzania kluczami (rozwiązuje problem radzenia sobie z miliardami kryptograficznych kluczy), Pamięć podręczna (działa jako usługa pamięci podręcznej), Obserwowalność (pozwala administratorom wyświetlać wszystkie składniki systemu we wszystkich instancjach), a na końcu Enterprise Console (służy jako pojedyncza szyba dla wszystkich instancji MinIO).

Rozwiązywanie AI w skali staje się coraz bardziej kluczowe. Czy mógłbyś wyjaśnić, dlaczego jest to przypadku i jak MinIO ułatwia te wymagania dla nowoczesnych przedsiębiorstw?

Prawie wszystko, co organizacje budują, jest teraz na przechowywaniu obiektów, co tylko przyspieszy wraz z tymi, którzy uruchamiają infrastrukturę z urządzeniem, uderzając w ścianę w erze nowoczesnych jezior danych i AI. Organizacje patrzą na nową infrastrukturę, aby zarządzać wszystkimi danymi wpływającymi do ich systemu, a następnie budować aplikacje oparte na danych na ich podstawie — wymaga to nadzwyczajnej skali i elastyczności, które tylko przechowywanie obiektów może obsłużyć. To tam wkracza MinIO i dlaczego firma zawsze stała o kilka kroków przed konkurencją, ponieważ została zaprojektowana z myślą o tym, czego potrzebuje AI — przechowywaniu ogromnych ilości danych strukturalnych i niestrukturalnych oraz zapewnianiu wydajności w skali.

Podobnie jak potrzeby uczenia maszynowego (ML) w poprzednich generacjach AI, dane i nowoczesne jeziora danych były kluczowe dla sukcesu każdej „przewidywalnej” AI. Jednak wraz z rozwojem „generatywnej” AI ten krajobraz rozwinął się, aby objąć wiele innych składników, takich jak dane operacyjne AI, potoki dokumentów, modele podstawowe i bazy danych wektorowych.

Wszystkie te dodatkowe składniki wykorzystują przechowywanie obiektów, a większość z nich bezpośrednio integruje się z MinIO. Na przykład Milvus, baza danych wektorowych, wykorzystuje MinIO, a wiele nowoczesnych silników zapytań integruje się z MinIO za pomocą interfejsów API S3.

AI techniczny dług jest coraz większym problemem dla wielu organizacji. Jakie strategie MinIO stosuje, aby pomóc klientom uniknąć tego problemu, szczególnie w zakresie wykorzystania GPU w sposób bardziej efektywny?

Łańcuch jest tak silny, jak jego najsłabsze ogniwo – a Twoja infrastruktura AI/ML jest tylko tak szybka, jak najwolniejszy składnik. Jeśli trenujesz modele uczenia maszynowego z użyciem GPU, Twoim słabym ogniwem może być rozwiązanie magazynowania. Wynikiem jest to, co nazywam „Głodnym problemem GPU”. Problem Głodnego GPU występuje, gdy Twoje rozwiązanie sieciowe lub magazynowania nie może podać danych szkoleniowych do logiki szkoleniowej wystarczająco szybko, aby w pełni wykorzystać Twoje GPU, pozostawiając cenne możliwości obliczeniowe na stole. Coś, co organizacje mogą zrobić, aby w pełni wykorzystać swoje GPU, to najpierw zrozumieć objawy złej architektury danych i jak może to bezpośrednio prowadzić do niewykorzystania technologii AI. Aby uniknąć długu technicznego, firmy muszą zmienić sposób, w jaki postrzegają (i przechowują) dane.

Organizacje mogą ustawić rozwiązanie magazynowania, które znajduje się w tym samym centrum danych, co ich infrastruktura obliczeniowa. Idealnie powinno to być w tym samym klastrze, co Twoja infrastruktura obliczeniowa. Ponieważ MinIO jest rozwiązaniem magazynowania zdefiniowanym przez oprogramowanie, jest ono w stanie osiągnąć wymaganą wydajność, aby nakarmić głodne GPU – niedawny benchmark osiągnął 325 GiB/s na operacjach GET i 165 GiB/s na operacjach PUT z zaledwie 32 węzłami dysków SSD NVMe.

Masz bogate doświadczenie w tworzeniu wysokowydajnych infrastruktur danych dla globalnych instytucji finansowych. Jak te doświadczenia wpływają na Twoją pracę w MinIO, szczególnie w projektowaniu rozwiązań dla różnorodnych potrzeb branżowych?

Pomogłem zbudować pierwsze chmury prywatne dla Bank of America, co zaoszczędziło miliardy dolarów, zapewniając funkcje i funkcjonalność dostępną w chmurach publicznych wewnętrznie po niższej cenie. Nie tylko ta inicjatywa, ale wiele innych różnorodnych wymagań aplikacyjnych, nad którymi pracowałem w BofA Merrill Lynch, ukształtowało moją pracę w MinIO w odniesieniu do projektowania rozwiązań dla naszych klientów dzisiaj.

Na przykład, uczenie się tego w złej lub „trudnej” drodze pracowałem z zespołem, który zbudował klastry Hadoop, które wykorzystywały tylko składniki magazynowania serwera, podczas gdy procesory CPU serwera były niedostatecznie wykorzystywane lub prawie bezczynne. Proste przykłady lub nauki, takie jak ta, pozwoliły mi wykorzystać rozwiązania danych i obliczeń w nowoczesnej infrastrukturze danych dzisiaj, pomagając naszym klientom i partnerom, co jest technicznie lepsze i tańsze rozwiązanie z wykorzystaniem dzisiejszych technologii sieci o wysokiej przepustowości i wysokowydajnych sklepów obiektów, takich jak MinIO i dowolny silnik zapytań lub przetwarzania.

Chmura hybrydowa przedstawia unikalne wyzwania i złożoności. Czy mógłbyś omówić je szczegółowo i wyjaśnić, jak model „wybuchu” MinIO do chmury pomaga kontrolować koszty chmury w sposób efektywny?

Przechodzenie do wielu chmur nie powinno prowadzić do nadmiernych budżetów IT i niemożności dotrzymania kamieni milowych — powinno pomóc w zarządzaniu kosztami i przyspieszyć drogę organizacji. Coś, co należy rozważyć, to repatriacja chmury — rzeczywistością jest, że przenoszenie operacji z chmury do infrastruktury lokalnej może prowadzić do znacznych oszczędności kosztów, w zależności od przypadku, i powinno się zawsze patrzeć na chmurę jako na model operacyjny, a nie destynację. Na przykład, organizacje uruchamiają instancje GPU, ale potem spędzają czas na przetwarzaniu danych, aby dopasować je do GPU. To marnuje cenny czas i pieniądze — organizacje muszą zoptymalizować lepiej, wybierając technologie rodzime dla chmury i, co ważniejsze, technologie przenośne dla chmury, które mogą odblokować moc wielu chmur bez znacznych kosztów. Używanie zasad modelu operacyjnego chmury i przestrzeganie tego frameworku zapewnia elastyczność, aby dostosować się do zmieniających się wymagań operacyjnych.

Rozwiązania rodzime dla Kubernetes są kluczowe dla nowoczesnej infrastruktury. Jak integracja MinIO z Kubernetes zwiększa jego skalowalność i elastyczność dla infrastruktury danych AI?

MinIO jest rodzimym dla Kubernetes od samego początku i zgodnym z S3. Deweloperzy mogą szybko wdrożyć trwałe przechowywanie obiektów dla wszystkich aplikacji natywnych dla chmury. Połączenie MinIO i Kubernetes zapewnia potężną platformę, która pozwala aplikacjom skalować się w dowolnej infrastrukturze wielu chmur i hybrydowej, a jednocześnie jest scentralizowana i zabezpieczona, unikając publicznej blokady chmury.

Z Kubernetes jako silnikiem MinIO może działać wszędzie, gdzie działa Kubernetes — co, w nowoczesnym, natywnym dla chmury/świecie AI, jest praktycznie wszędzie.

Spójrzając w przyszłość, jakie przyszłe rozwinięcia lub ulepszenia mogą oczekiwać użytkownicy od MinIO w kontekście infrastruktury danych AI?

Nasze niedawne partnerstwa i uruchomienia produktów są sygnałem dla rynku, że nie zwalniamy tempa. Na przykład, niedawno zawarliśmy partnerstwo z Carahsoft, aby uczynić portfolio oprogramowania zdefiniowanego przez MinIO dostępnym dla sektorów rządowych, obronnych, wywiadowczych i edukacyjnych. To umożliwia organizacjom sektora publicznego budowanie różnorodnych skalowalnych infrastruktur danych, od rozległych nowoczesnych jezior danych po rozwiązania magazynowania danych specyficznych dla misji na krawędzi autonomicznej. Razem wprowadzamy te innowacyjne, unikalne rozwiązania do klientów sektora publicznego, umożliwiając im łatwe i efektywne rozwiązywanie wyzwań związanych z infrastrukturą danych. To partnerstwo następuje w momencie, gdy jest coraz większa presja, aby umożliwić sektorowi publicznemu być gotowym do AI, z niedawnymi wymogami OMB, które mówią, że wszystkie agencje federalne potrzebują szefa AI (wśród innych rzeczy). Ogólnie partnerstwo pomaga wzmocnić postawę AI w branży i daje sektorowi publicznemu cenne narzędzia niezbędne do sukcesu.

Ponadto, MinIO jest bardzo dobrze przygotowany do przyszłości. Infrastruktura danych AI jest nadal w powijakach. Wiele obszarów będzie bardziej widocznych w ciągu najbliższych kilku lat. Na przykład, większość przedsiębiorstw będzie chciała wykorzystywać swoje własne dane i dokumenty z modelami podstawowymi i wzmocnioną generacją (RAG). Dalsza integracja z tym modelem wdrożeniowym będzie łatwa dla MinIO, ponieważ wszystkie te wybory architektoniczne i wzorce wdrożeniowe mają jedną rzecz wspólną — wszystkie te dane są już przechowywane na MinIO.

Wreszcie, dla liderów technologicznych, którzy chcą zbudować lub ulepszyć swoją infrastrukturę danych dla AI, jakie porady byś udzielił na podstawie swoich doświadczeń i spostrzeżeń w MinIO?

Aby uczynić każdą inicjatywę AI udaną, są trzy kluczowe elementy, których musisz przestrzegać: posiadanie odpowiednich danych, odpowiedniej infrastruktury i odpowiednich aplikacji. To naprawdę zaczyna się od zrozumienia, czego potrzebujesz — nie idź i nie kup drogich GPU tylko dlatego, że boisz się, że przegapisz łódkę AI. Uważam, że strategie AI przedsiębiorstw zawiodą w 2024 roku, jeśli organizacje będą się koncentrować tylko na samych modelach, a nie na danych. Myślenie „model w dół” zamiast „dane w górę” jest krytycznym błędem — musisz zacząć od danych. Zbuduj odpowiednią infrastrukturę danych. Następnie pomyśl o swoich modelach. Gdy organizacje przechodzą w kierunku architektury AI, jest niezwykle ważne, aby Twoja infrastruktura danych umożliwiała Twoim danym — a nie ograniczała ich.

Dziękuję za wspaniały wywiad, czytelnicy, którzy chcą dowiedzieć się więcej, powinni odwiedzić MinIO.

Antoine jest wizjonerskim liderem i współzałożycielem Unite.AI, z niezachwianą pasją do kształtowania i promowania przyszłości sztucznej inteligencji i robotyki. Jako serialowy przedsiębiorca, uważa, że sztuczna inteligencja będzie tak samo przełomowa dla społeczeństwa, jak elektryczność, i często zachwycany jest potencjałem technologie przełomowych i AGI. Jako futurysta, poświęca się badaniu, jak te innowacje ukształtują nasz świat. Ponadto jest założycielem Securities.io, platformy skupiającej się na inwestowaniu w najnowocześniejsze technologie, które przeobrażają przyszłość i zmieniają całe sektory.