Interviews

Ugur Tigli, Chief Technical Officer hos MinIO – Interviewserie

mm

Ugur Tigli er Chief Technical Officer hos MinIO, lederen inden for high-performance objektgemme til AI. Som CTO hjælper Ugur kunderne med at arkitekturere og implementere API-drevne, cloud-native og skalerbare enterprise-klasse datainfrastrukturer med MinIO.

Kan du beskrive din rejse til at blive CTO hos MinIO, og hvordan dine erfaringer har formet din tilgang til AI og datainfrastruktur?

Jeg startede min karriere i infrastrukturteknik på Merrill Lynch som backup- og gendannelseadministrator. Jeg fortsatte med at tage på nye udfordringer og forskellige tekniske stillinger. Jeg blev ansat hos Bank of America gennem opkøbet af Merrill Lynch, hvor jeg var vicepræsident for lagringsingeniør. Min rolle udvidede sig til at omfatte computing og datacenteringeniør.

Som en del af mit arbejde samarbejdede jeg også med forskellige venturekapitalfirmaer (VC) og deres porteføljefirmaer for at bringe den nyeste og bedste teknologi. Under et af mine møder med General Catalyst blev jeg introduceret til ideen og folkene bag MinIO. Det appellerede til mig, fordi de havde en anden tilgang til datainfrastruktur end alle andre på markedet. Firmaet indså vigtigheden af objektgemme og standard-API’er, som applikationer var begyndt at bruge. Under de år kunne de forudsige fremtidens computing og AI før nogen andre eller før det blev kaldt, hvad det er i dag. Jeg ville være en del af at udføre den vision og bygge noget virkelig unikt. MinIO er nu den mest bredt udbredte objektgemme på kloden.

Impakten af mine tidligere roller og erfaringer på, hvordan jeg tilgår nye teknologier, specielt AI og datainfrastruktur, er også blot en akkumulation af de mange projekter, jeg har været involveret i gennem mine år med at støtte applikationshold i en meget krævende finansielle servicesvirksomhed.

Fra de begrænsede netværksbandbredde-dage, der førte til Hadoop-teknologi som den nyeste teknologi for 15 år siden, til forskellige data-medie-teknologier fra Hard Disk Drive (HDD) til Solid State Drive (SSD), har mange af disse teknologiske ændringer formet min nuværende syn på AI-økosystemet og datainfrastruktur.

MinIO er kendt for sine high-performance objektgemmeegenskaber. Hvordan tilgår MinIO specifikt behovene hos AI-drevne virksomheder i dag?

Da AB og Garima konceptualiserede MinIO, var deres første prioritet at tænke over et problemstatement – de vidste, at data ville fortsætte med at vokse, og eksisterende lagrings-teknologier var inkompatible med den vækst. Den hurtige opdukken af AI har gjort deres klarsynede syn på markedet til virkelighed. Siden da er objektgemme blevet grundlæggende for AI-infrastruktur (alle de største LLM’er som OpenAI og Anthropic er alle bygget på objektgemme), og den moderne datacenter er bygget på en objektgemme-basis.

MinIO lancerede nyligt en ny objektgemme-platform med kritiske enterprise-klasse-funktioner for at støtte organisationer i deres AI-initiativer: MinIO Enterprise Object Store. Det er designet til at møde de præstations- og skalamæssige udfordringer, der er introduceret af massive AI-workloads, og det giver kunderne mulighed for at tackle de udfordringer, der er forbundet med milliarder af objekter, på en mere nem måde, samt hundredtusinder af kryptografiske operationer per node per sekund. Det har seks nye kommercielle funktioner, der målretter nøgleoperationelle og tekniske udfordringer, som AI-workloads står overfor: Katalog (dette løser problemet med objektgemme-navneområde og metadata-søgning), Firewall (specialbygget til data), Key Management System (løser problemet med at håndtere milliarder af kryptografiske nøgler), Cache (fungerer som en cacheløsning), Observability (giver administratorer mulighed for at se alle systemkomponenter på tværs af hver enkelt forekomst) og sidst, men ikke mindst, Enterprise Console (fungerer som en enkelt pane af glas for alle organisationens forekomster af MinIO).

Håndtering af AI i stor skala bliver mere og mere kritisk. Kan du uddybe, hvorfor det er tilfældet, og hvordan MinIO tilgår disse krav for moderne virksomheder?

Næsten alt, som organisationer bygger, er nu på objektgemme, hvilket kun vil accelerere, da de, der kører infrastruktur med en appliance, rammer en væg i den moderne data-sø- og AI-verden. Organisationer ser på nye infrastrukturer for at håndtere alle data, der kommer ind i deres system, og derefter bygge data-centrisk applikationer på toppen af det – dette kræver ekstraordinær skala og fleksibilitet, som kun objektgemme kan støtte. Det er her, MinIO kommer ind og hvorfor firmaet har stået milevidt foran konkurrencen, fordi det er designet til, hvad AI har brug for – lagring af massive mængder af struktureret og ustruktureret data og levering af præstationer i stor skala.

Ligesom maskinlæring (ML) behov i tidligere generationer af AI har data og moderne data-søer været afgørende for succesen af enhver “prædictiv” AI. Men med fremkomsten af “generativ” AI er landskabet udvidet til at omfatte mange andre komponenter, såsom AI Ops-data og dokument-pipelines, grundlæggende modeller og vektor-databaser.

Alle disse ekstra komponenter bruger objektgemme, og de fleste af dem integrerer direkte med MinIO. For eksempel bruger Milvus, en vektor-database, MinIO, og mange moderne forespørgselsmotorer integrerer med MinIO gennem S3-API’er.

AI-teknisk gæld er en voksende bekymring for mange organisationer. Hvordan hjælper MinIO kunderne med at undgå dette problem, især i forhold til at bruge GPU’er mere effektivt?

En kæde er kun så stærk som dens svageste led – og din AI/ML-infrastruktur er kun så hurtig som din langsommeste komponent. Hvis du træner maskinlæringsmodeller med GPU’er, kan din svageste led være din lagringsløsning. Resultatet er, hvad jeg kalder “Den sultne GPU-problem”. Den sultne GPU-problem opstår, når din netværks- eller lagringsløsning ikke kan servere træningsdata til din træningslogik hurtigt nok til at fuldt udnytte dine GPU’er, og efterlader værdifuld beregningskraft på hylden. Noget, som organisationer kan gøre for at fuldt udnytte deres GPU’er, er først at forstå tegnene på en dårlig data-arkitektur og hvordan den kan føre til underudnyttelse af AI-teknologi. For at undgå teknisk gæld må virksomhederne ændre, hvordan de ser på (og gemmer) data.

Organisationer kan opsætte en lagringsløsning, der er i samme datacenter som deres compute-infrastruktur. Ideelt set skulle det være i samme cluster som din compute. Fordi MinIO er en software-defineret lagringsløsning, er det i stand til den præstation, der er nødvendig for at mate sultne GPU’er – en ny benchmark opnåede 325 GiB/s på GET og 165 GiB/s på PUT med kun 32 noder af off-the-shelf NVMe SSD’er.

Har du en rig baggrund i at opbygge high-performance data-infrastrukturer for globale finansielle institutioner. Hvordan informerer disse erfaringer dit arbejde hos MinIO, især i forhold til at arkitekturere løsninger for diverse brancher?

Jeg hjalp med at bygge den første private cloud til Bank of America, og den initiativ reddede milliarder af dollars ved at give funktioner og funktionalitet, der var tilgængelige i offentlige cloud-tjenester internt til en lavere omkostning. Ikke kun denne store initiativ, men mange andre forskellige applikationskrav, jeg har arbejdet på hos BofA Merrill Lynch, har formet mit arbejde hos MinIO, så vidt angår arkitekturering af løsninger for vores kunder i dag.

For eksempel lærte jeg det forkerte eller “hårde” vej at arbejde med holdet, der byggede Hadoop-kluster, der kun brugte data-lagringskomponenterne af serveren, mens server-CPU’er var underudnyttede eller næsten inaktive. Simple eksempler eller lærdomme som denne gjorde det muligt for mig at bruge afkoblet data og compute-løsninger i den moderne data-infrastruktur i dag, mens jeg hjalp vores kunder og partnere, som er teknisk bedre og billigere løsninger, der bruger i dagens høj-båndbreddsnetværksteknologier og high-performance objektgemme som MinIO og enhver forespørgsels- eller procesmotor.

Hybrid-cloud præsenterer unikke udfordringer og kompleksiteter. Kan du diskutere disse i detalje og forklare, hvordan MinIO’s hybrid “burst” til cloud-modellen hjælper med at kontrollere cloud-omkostninger effektivt?

At gå multicloud burde ikke føre til en vækst i IT-budgetter og en manglende evne til at nå mål – det burde hjælpe med at kontrollere omkostninger og accelerere en organisations vej. Noget at overveje er cloud-repatriering – virkeligheden er, at at flytte operationer fra cloud til on-premises-infrastruktur kan føre til betydelige omkostningsbesparelser, afhængigt af sagen, og man burde altid se på cloud som en driftsmodel, ikke en destination. For eksempel spinner organisationer op GPU-forekomster, men derefter bruger de tid på at forarbejde data for at få det til at passe ind i GPU’en. Dette spilder dyrebar tid og penge – organisationer må optimere bedre ved at vælge cloud-native og, endnu vigtigere, cloud-portable teknologier, der kan låse op for multicloud uden betydelige omkostninger. Ved at bruge cloud-first driftsmodellen og følge den ramme giver det agility til at tilpasse sig ændrede driftskrav.

Kubernetes-native løsninger er afgørende for moderne infrastruktur. Hvordan forbedrer MinIO’s integration med Kubernetes dens skalerbarhed og fleksibilitet for AI-data-infrastruktur?

MinIO er Kubernetes-native fra design og S3-kompatibel fra begyndelsen. Udviklere kan hurtigt installere persistent objektgemme til alle deres cloud-native-applikationer. Kombinationen af MinIO og Kubernetes giver en kraftfuld platform, der giver mulighed for, at applikationer kan skaleres på tværs af enhver multicloud- og hybrid-cloud-infrastruktur og stadig være centralt administreret og sikret, undgående offentlig cloud-lås.

Med Kubernetes som motor kan MinIO køre overalt, hvor Kubernetes gør – hvilket i den moderne, cloud-native/AI-verden grundlæggende er overalt.

Settende fremad, hvad er de fremtidige udviklinger eller forbedringer, som brugere kan forvente fra MinIO i forhold til AI-data-infrastruktur?

Vores seneste partnerskaber og produktlanceringer er et tegn på markedet om, at vi ikke langsommeligt noget som helst. For eksempel har vi nyligt partnerskab med Carahsoft for at gøre MinIO’s software-defineret objektgemme-portefølje tilgængelig for offentlige sektorer. Dette giver offentlige sektorer mulighed for at bygge enhver skalerbar data-infrastruktur, fra omfattende moderne data-søer til missionsspecifikke data-lagringsløsninger på den autonome kant. Sammen bringer vi disse innovative løsninger til offentlige sektorer, og giver dem mulighed for at tackle data-infrastruktur-udfordringer let og effektivt. Dette partnerskab kommer på et tidspunkt, hvor der er en øget fokus på at gøre den offentlige sektor AI-parat, med de seneste OMB-krav, der fastsætter, at alle føderale agenturer skal have en Chief AI-officer (blandt andet). Samlet set hjælper partnerskabet med at styrke branchens AI-holdning og giver den offentlige sektor de værdifulde værktøjer, der er nødvendige for at lykkes.

Desuden er MinIO meget godt positioneret for fremtiden. AI-data-infrastruktur er stadig i sin barndom. Mange områder af det vil være mere åbenlyse i de næste par år. For eksempel vil de fleste virksomheder ønske at bruge deres proprietære data og dokumenter med grundlæggende modeller og Retrieval Augmented Generation (RAG). Yderligere integration til denne implementeringsmønster vil være let for MinIO, da alle disse arkitektoniske valg og implementeringsmønstre har én ting til fælles – alle disse data er allerede gemt på MinIO.

Til sidst, for tekniske ledere, der søger at bygge eller forbedre deres data-infrastruktur for AI, hvad ville du råde, baseret på din erfaring og indsigt hos MinIO?

For at gøre enhver AI-initiativ succesfuld, er der tre nøgleelementer, du må holde fast i: at have den rigtige data, den rigtige infrastruktur og de rigtige applikationer. Det begynder virkelig med at forstå, hvad du har brug for – gå ikke ud og køb dyre GPU’er bare, fordi du er bange for at miste AI-båden. Jeg tror stærkt på, at enterprise AI-strategier vil fejle i 2024, hvis organisationer fokuserer kun på modellerne selv og ikke på data. At tænke model-ned vs. data-op er en kritisk fejl – du må starte med data. Byg en ordentlig data-infrastruktur. Derefter tænker du over dine modeller. Da organisationer bevæger sig mod en AI-først arkitektur, er det afgørende, at din data-infrastruktur muliggør din data – ikke begrænser den.

Tak for det store interview, læsere, der ønsker at lære mere, skal besøge MinIO.

Antoine er en visionær leder og medstifter af Unite.AI, drevet af en urokkelig passion for at forme og fremme fremtiden for AI og robotteknologi. En serieiværksætter, han tror, at AI vil være lige så omvæltende for samfundet som elektricitet, og bliver ofte fanget i at tale begejstret om potentialet for omvæltende teknologier og AGI.

Som en futurist, er han dedikeret til at udforske, hvordan disse innovationer vil forme vores verden. Derudover er han grundlægger af Securities.io, en platform, der fokuserer på at investere i skærende teknologier, der gendefinerer fremtiden og omformer hele sektorer.