Intervjuer
Ugur Tigli, Chief Technical Officer i MinIO – Intervju-serie

Ugur Tigli er Chief Technical Officer i MinIO, ledende innen høy-ytelsesobjektlagring for AI. Som CTO hjelper Ugur kundene med å arkitektere og distribuere API-drevne, cloud-native og skalerbare bedriftsgraderte datainfrastrukturer med MinIO.
Kan du beskrive din reise til å bli CTO i MinIO, og hvordan dine erfaringer har formet din tilnærming til AI og datainfrastruktur?
Jeg startet min karriere i infrastrukturteknologi hos Merrill Lynch som backup- og gjenopprettingsadministrator. Jeg fortsatte å ta på meg ulike utfordringer og tekniske stillinger. Jeg ble med i Bank of America gjennom oppkjøpet av Merrill Lynch, der jeg var visepresident for lagringsingeniør. Min rolle utvidet seg til å omfatte databehandling og datacentersingeniør.
Som del av jobben min, arbeidet jeg også med ulike venturekapital-selskaper (VC) og deres porteføljeselskaper for å bringe de nyeste og beste teknologiene. Under ett av mine møter med General Catalyst, ble jeg introdusert for ideen og folkene bak MinIO. Det tiltalte meg på grunn av hvordan de nærmet seg datainfrastruktur — det forskjellige fra alle andre på markedet. Selskapet innsett viktigheten av objektbutikk og standard-API-er som applikasjonene var i gang med å starte med. Under disse årene kunne de forutsi fremtiden for databehandling og AI før noen andre eller før det ble kalt hva det er i dag. Jeg ønsket å være en del av å utføre denne visjonen og bygge noe virkelig unikt. MinIO er nå den mest bredt distribuerte objektbutikken på planeten.
Impakten av mine tidligere roller og erfaringer på hvordan jeg nærmer meg nye teknologier, spesielt AI og datainfrastruktur, er også bare en ansamling av de mange prosjektene jeg har vært involvert i gjennom årene med å støtte applikasjonslag i et høyt kravende finansielt tjenesteselskap.
Fra de begrensede nettverksbandbredde-dagene, som ledet til Hadoop-teknologi som den nyeste teknologien for 15 år siden, til ulike datamedie-teknologier fra harddisk til solid-state-disk, mange av disse teknologiske endringene har formet min nåværende syn på AI-økosystemet og datainfrastruktur.
MinIO er kjent for sine høy-ytelsesobjektlagringsmuligheter. Hvordan møter MinIO spesifikt behovene til AI-drevne bedrifter i dag?
Da AB og Garima konseptualiserte MinIO, var deres første prioritet å tenke på et problem — de visste at data ville fortsette å vokse og eksisterende lagringsteknologier var uforenlige med denne veksten. Den raske oppblomstringen av AI har gjort deres forutsåtte syn på markedet til virkelighet. Siden da har objektlagring blitt grunnleggende for AI-infrastruktur (alle de største LLM-er som OpenAI og Anthropic er bygget på objektbutikker), og den moderne datainfrastrukturen er bygget på en objektbutikk-grunn.
MinIO lanserte nylig en ny objektbutikkplattform med kritiske bedriftsgraderte funksjoner for å støtte organisasjoner i deres AI-initiativer: MinIO Enterprise Object Store. Den er designet for ytelses- og skaleringsutfordringer introdusert av massive AI-arbeidsbyrder og muliggjør at kundene kan håndtere utfordringene forbundet med milliarder av objekter og hundredtusener av kryptografiske operasjoner per node per sekund. Den har seks nye kommersielle funksjoner som målretter nøkkeloperasjonelle og tekniske utfordringer som AI-arbeidsbyrder møter: Katalog (dette løser problemet med objektbutikknavn og metadata-søk), Brannmur (formål-bygget for data), Nøkkelhåndteringssystem (løser problemet med å håndtere milliarder av kryptografiske nøkler), Cache (fungerer som en cachetjeneste), Observasjon (tillater administratorer å se alle systemkomponenter over hver enkelt instans) og til slutt, Enterprise-konsollen (fungerer som et enkelt vindu for alle organisasjonens instanser av MinIO).
Håndtering av AI i skala blir stadig viktigere. Kan du utdype på hvorfor dette er tilfelle og hvordan MinIO møter disse kravene for moderne bedrifter?
Nesten alt organisasjoner bygger er nå på objektbutikk, som vil akselerere når de som kjører infrastruktur med en enhet treffer en vegg i alderen av moderne datatjern og AI. Organisasjoner ser på nye infrastrukturer for å håndtere all data som kommer inn i deres system og deretter bygge data-sentriske applikasjoner på toppen av det – dette krever ekstraordinær skala og fleksibilitet som bare objektbutikk kan støtte. Det er der MinIO kommer inn og hvorfor selskapet alltid har stått miles foran konkurransen fordi det er designet for hva AI trenger — lagring av massive volumer med strukturert og ustrukturert data og tilbyr ytelse i skala.
Tilsvarende som maskinlæring (ML) behov i tidligere generasjoner av AI, har data og moderne datatjern vært kritisk for suksessen til noen “predictive” AI. Men med fremgangen av “generative” AI, har dette landskapet utvidet til å omfatte mange andre komponenter, som AI Ops-data og dokument-pipelines, grunnleggende modeller og vektor-databaser.
Alle disse ekstra komponentene bruker objektbutikk, og de fleste av dem integrerer direkte med MinIO. For eksempel, Milvus, en vektor-database, bruker MinIO, og mange moderne spørringsmotorer integrerer med MinIO gjennom S3-API-er.
AI-teknisk gjeld er en voksende bekymring for mange organisasjoner. Hva strategier setter MinIO i verk for å hjelpe kundene med å unngå dette problemet, spesielt i forhold til å bruke GPU-er mer effektivt?
En kjede er like sterk som dens svakeste lenke – og din AI/ML-infrastruktur er bare like rask som din sakteste komponent. Hvis du trener maskinlæringsmodeller med GPU-er, kan din svake lenke være din lagringsløsning. Resultatet er hva jeg kaller “sultne GPU-problemet”. Det skjer når din nettverks- eller lagringsløsning ikke kan betjene treningsdata til din treningslogikk raskt nok til å fullt utnytte dine GPU-er, og etterlater verdifull beregningskraft på bordet. Noe organisasjoner kan gjøre for å fullt utnytte sine GPU-er, er først å forstå tegnene på en dårlig dataarkitektur og hvordan det kan direkte resultere i underutnyttelse av AI-teknologi. For å unngå teknisk gjeld, må bedrifter endre hvordan de ser på (og lagrer) data.
Organisasjoner kan sette opp en lagringsløsning som er i samme datacenter som deres beregningsinfrastruktur. Ideelt sett skulle dette være i samme cluster som din beregning. Fordi MinIO er en programvaredefinert lagringsløsning, er den i stand til å levere den ytelsen som trengs for å mate sultne GPU-er – en nylig benchmark oppnådde 325 GiB/s på GET og 165 GiB/s på PUT med bare 32 noder av off-the-shelf NVMe-SSD-er.
Har du en rik bakgrunn i å lage høy-ytelsesdatainfrastrukturer for globale finansielle institusjoner. Hvordan informerer disse erfaringene ditt arbeid i MinIO, spesielt i å arkitektere løsninger for diverse industribehov?
Jeg hjalp med å bygge den første private skyen for Bank of America, og denne initiativet sparede milliarder av dollar ved å tilby funksjoner og funksjonalitet tilgjengelig i offentlige skyer internt til en lavere kostnad. Ikke bare dette store initiativet, men mange andre diverse applikasjonskrav jeg har arbeidet med i BofA Merrill Lynch, har formet mitt arbeid i MinIO i forhold til å arkitektere løsninger for våre kunder i dag.
For eksempel, å lære det feil eller “hardt” arbeidet med teamet som bygde Hadoop-kluster som bare brukte data-lagringskomponentene av serveren mens de holdt server-CPU-ene underutnyttet eller nesten idle. Enkle eksempler eller læring som dette, tillot meg å bruke avdelt data og beregningsløsninger i den moderne datainfrastrukturen i dag, samtidig som jeg hjelper våre kunder og partnere, som er teknisk bedre og lavere kostnadsløsninger som bruker i dagens høy-båndbredde nettverksteknologier og høy-ytelsesobjektbutikker som MinIO og enhver spørrings- eller prosesseringsmotor.
Hybrid-skyen presenterer unike utfordringer og kompleksiteter. Kan du diskutere disse i detalj og forklare hvordan MinIOs hybrid “burst” til sky-modell hjelper med å kontrollere sky-kostnader effektivt?
Gåing multicloud burde ikke føre til at IT-budsjettene svulmer opp og en evne til å nå milepæler — det burde hjelpe med å kontrollere kostnader og akselerere en organisasjons veikart. Noe å vurdere er sky-repatriering — virkeligheten er at å flytte operasjoner fra skyen til on-premises-infrastruktur kan føre til betydelige kostnadsbesparelser, avhengig av saken, og du burde alltid se på skyen som en driftsmodell, ikke en destinasjon. For eksempel, organisasjoner spinner opp GPU-instanse, men så bruker tid på å forhåndsbearbeide data for å få det til å passe inn i GPU-en. Dette sparer verdifull tid og penger — organisasjoner må optimalisere bedre ved å velge cloud-native og, viktigere, cloud-portable teknologier som kan låse opp kraften i multicloud uten betydelige kostnader. Ved å bruke sky-først-driftsmodell-prinsipper og holde fast ved denne rammen, gir det evnen til å tilpasse seg endrede driftskrav.
Kubernetes-native løsninger er avgjørende for moderne infrastruktur. Hvordan forbedrer MinIOs integrasjon med Kubernetes dens skalerbarhet og fleksibilitet for AI-datainfrastruktur?
MinIO er Kubernetes-native fra design og S3-kompatibel fra begynnelsen. Utviklere kan raskt distribuere varig objektbutikk for alle deres cloud-native-applikasjoner. Kombinasjonen av MinIO og Kubernetes gir en kraftfull plattform som tillater applikasjoner å skale over enhver multi-cloud og hybrid-cloud-infrastruktur og likevel være sentralt administrert og sikret, og unngår offentlig sky-lås.
Med Kubernetes som sin motor, er MinIO i stand til å kjøre hvor som helst Kubernetes gjør — hvilket, i den moderne, cloud-native/AI-verden, er essensielt overalt.
Ser fremover, hva er fremtidige utviklinger eller forbedringer som brukerne kan forvente fra MinIO i sammenheng med AI-datainfrastruktur?
Våre nylige partnerskap og produktlanseringer er et tegn til markedet om at vi ikke skal sakke ned noen gang snart, og vi vil fortsette å drive der det har mening for våre kunder. For eksempel, har vi nylig inngått et partnerskap med Carahsoft for å gjøre MinIOs programvaredefinerte objektbutikk-portefølje tilgjengelig for offentlige sektorer. Dette muliggjør at offentlige sektorer kan bygge enhver skalerbar datainfrastruktur, fra omfattende moderne datatjern til målrettede datalagringsløsninger på den autonome kanten. Sammen bringer vi disse banebrytende, unike løsningene til offentlige sektorer, og gir dem mulighet til å håndtere datainfrastruktur-utfordringer enkelt og effektivt. Dette partnerskapet kommer på et tidspunkt når det er en økt fokus på å muliggjøre at offentlige sektorer skal være AI-klare, med de nylige OMB-kravene som fastsetter at alle føderale byråer må ha en sjef AI-offiser (blant annet). Overordnet sett hjelper partnerskapet med å styrke bransjens AI-holdning og gir offentlige sektorer de verdifulle verktøyene som trengs for å lykkes.
I tillegg er MinIO svært godt posisjonert for fremtiden. AI-datainfrastruktur er fortsatt i sin barndom. Mange områder av det vil bli mer åpenbart i de neste par årene. For eksempel, vil de fleste bedriftene ønske å bruke sine egne data og dokumenter med grunnleggende modeller og Gjenopprettende Augmentert Generering (RAG). Videre integrasjon til denne distribusjonsmønsteret vil være enkelt for MinIO, ettersom alle disse arkitektoniske valgene og distribusjonsmønstrene har én ting til felles — all denne data er allerede lagret på MinIO.
Til slutt, for tekniske ledere som ønsker å bygge eller forbedre sin datainfrastruktur for AI, hva råd ville du gi basert på din erfaring og innsikt i MinIO?
For å gjøre noen AI-initiativ suksessfulle, er det tre nøkkel-elementer du må holde fast ved: å ha riktig data, riktig infrastruktur og riktige applikasjoner. Det begynner virkelig med å forstå hva du trenger — ikke gå ut og kjøp dyre GPU-er bare fordi du er redd for å gå glipp av AI-båten. Jeg tror sterkt på at bedrifts AI-strategier vil feile i 2024 hvis organisasjoner fokuserer bare på modellene selv og ikke på data. Tenkning modell-ned vs. data-opp er en kritisk feil — du må starte med data. Bygg en ordentlig datainfrastruktur. Deretter, tenk på dine modeller. Ettersom organisasjoner går mot en AI-først-arkitektur, er det avgjørende at din datainfrastruktur muliggjør din data — ikke begrenser den.
Takk for det flotte intervjuet, lesere som ønsker å lære mer, bør besøke MinIO.












