Seguici sui social

interviste

Ugur Tigli, Direttore tecnico di MinIO – Serie di interviste

mm

Pubblicato il

 on

Ugur Tigli è il Direttore Tecnico di Minio, leader nello storage di oggetti ad alte prestazioni per AI. In qualità di CTO, Ugur aiuta i clienti a progettare e distribuire un'infrastruttura dati di livello aziendale basata su API, nativa del cloud e scalabile utilizzando MinIO.

Puoi descrivere il tuo viaggio per diventare CTO di MinIO e in che modo le tue esperienze hanno plasmato il tuo approccio AI e l'infrastruttura dati?

Ho iniziato la mia carriera nell'ingegneria delle infrastrutture presso Merrill Lynch come amministratore di backup e ripristino. Ho continuato ad accettare diverse sfide e vari ruoli tecnici. Sono entrato in Bank of America attraverso l'acquisizione di Merrill Lynch, dove ero vicepresidente di Storage Engineering. Tuttavia, il mio ruolo si è ampliato fino a includere l'ingegneria informatica e dei data center.

Nell'ambito del mio lavoro, ho anche collaborato con varie società di venture capital (VC) e le loro società in portafoglio per portare la tecnologia più recente e migliore. Durante uno dei miei incontri con General Catalyst, mi è stata presentata l'idea e le persone dietro MinIO. Mi ha attratto per il modo in cui si avvicinavano all'infrastruttura dei dati: era diverso da tutti gli altri sul mercato. L'azienda si è resa conto dell'importanza dell'archivio oggetti e delle API standard con cui le applicazioni venivano avviate. Durante quegli anni, potevano predire il futuro dell'informatica e AI prima di chiunque altro o anche prima che venisse chiamata come è oggi. Volevo essere parte della realizzazione di quella visione e della costruzione di qualcosa di veramente unico. MinIO è ora l’archivio di oggetti più diffuso sul pianeta.

L'impatto dei miei ruoli precedenti e della mia esperienza sul modo in cui mi avvicino alle nuove tecnologie, in particolare AI e l'infrastruttura dei dati, è anche semplicemente un accumulo dei numerosi progetti in cui sono stato coinvolto durante i miei anni di supporto ai team applicativi in ​​un'azienda di servizi finanziari molto esigente.

Dai tempi della larghezza di banda di rete limitata, che hanno portato la tecnologia Hadoop a diventare la tecnologia più recente 15 anni fa, alle varie tecnologie di supporti dati, dall'hard disk (HDD) all'unità a stato solido (SSD), molti di questi cambiamenti tecnologici hanno modellato la mia visione attuale del AI ecosistema e infrastruttura dati.

MinIO è riconosciuto per le sue capacità di archiviazione di oggetti ad alte prestazioni. In che modo MinIO soddisfa specificamente le esigenze di AIimprese guidate oggi?

Quando AB e Garima stavano concettualizzando MinIO, la loro prima priorità era pensare a una definizione del problema: sapevano che i dati avrebbero continuato a crescere e le tecnologie di storage esistenti erano incompatibili con tale crescita. La rapida comparsa di AI ha trasformato in realtà la propria visione preveggente del mercato. Da allora, l'archiviazione di oggetti è diventata fondamentale per AI infrastruttura (tutti i principali LLM come OpenAI e Anthropic sono tutti basati su archivi di oggetti) e il moderno data center è costruito su una base di archivio di oggetti.

MinIO ha recentemente lanciato una nuova piattaforma di storage di oggetti con funzionalità critiche di livello aziendale per supportare le organizzazioni nel loro AI iniziative: il MinIO Enterprise Object Store. È progettato per le sfide in termini di prestazioni e scala introdotte da Massive AI carichi di lavoro e consente ai clienti di affrontare più facilmente le sfide associate a miliardi di oggetti, nonché a centinaia di migliaia di operazioni crittografiche per nodo al secondo. Presenta sei nuove funzionalità commerciali che mirano alle principali sfide operative e tecniche affrontate da AI carichi di lavoro: Catalogo (risolve il problema dello spazio dei nomi di archiviazione degli oggetti e della ricerca dei metadati), Firewall (creato appositamente per i dati), Sistema di gestione delle chiavi (risolve il problema di gestire miliardi di chiavi crittografiche), Cache (funziona come un servizio di caching ), osservabilità (consente agli amministratori di visualizzare tutti i componenti di sistema in ogni istanza) e, infine, Enterprise Console (funge da unico pannello di controllo per tutte le istanze di MinIO dell'organizzazione).

Manovrabilità AI su larga scala sta diventando sempre più cruciale. Potresti spiegare perché questo accade e in che modo MinIO facilita questi requisiti per le imprese moderne?

Quasi tutto ciò che le organizzazioni costruiscono è ora basato sullo storage di oggetti, che non potrà che accelerare man mano che coloro che gestiscono infrastrutture con un'appliance si scontrano con un muro nell'era dei moderni data lake e AI. Le organizzazioni stanno cercando nuove infrastrutture per gestire tutti i dati che entrano nel loro sistema e quindi costruire su di esse applicazioni incentrate sui dati: ciò richiede una scalabilità e una flessibilità straordinarie che solo l'object storage può supportare. È qui che entra in gioco MinIO e perché l'azienda è sempre stata molto avanti rispetto alla concorrenza: perché è progettata per cosa AI esigenze: archiviare enormi volumi di dati strutturati e non strutturati e fornire prestazioni su larga scala.

Simile alle esigenze di machine learning (ML) nelle generazioni precedenti di AI, i dati e i data lake moderni sono stati fondamentali per il successo di qualsiasi attività “predittiva” AI. Tuttavia, con l’avanzamento della “generatività” AI, questo panorama si è espanso per includere molti altri componenti, come AI Dati operativi e pipeline di documenti, modelli fondamentali e database vettoriali.

Tutti questi componenti aggiuntivi utilizzano l'archiviazione di oggetti e la maggior parte di essi si integra direttamente con MinIO. Ad esempio, Milvus, un database vettoriale, utilizza MinIO e molti motori di query moderni si integrano con MinIO tramite API S3.

AI il debito tecnico è una preoccupazione crescente per molte organizzazioni. Quali strategie utilizza MinIO per aiutare i clienti a evitare questo problema, soprattutto in termini di utilizzo delle GPU in modo più efficiente?

Una catena è forte quanto il suo anello più debole – e il tuo AIL'infrastruttura /ML è veloce quanto il componente più lento. Se addestri modelli di machine learning con GPU, il tuo anello debole potrebbe essere la tua soluzione di archiviazione. Il risultato è quello che io chiamo il “problema della GPU affamata”. Il problema della GPU affamata si verifica quando la rete o la soluzione di archiviazione non è in grado di fornire i dati di addestramento alla logica di addestramento abbastanza velocemente da utilizzare appieno le GPU, lasciando sul tavolo una preziosa potenza di elaborazione. Qualcosa che le organizzazioni possono fare per sfruttare appieno le proprie GPU è innanzitutto comprendere i segnali di un’architettura dati inadeguata e come ciò possa comportare direttamente il sottoutilizzo di AI tecnologia. Per evitare debiti tecnici, le aziende devono cambiare il modo in cui visualizzano (e archiviano) i dati.

Le organizzazioni possono configurare una soluzione di storage che si trova nello stesso data center della propria infrastruttura informatica. Idealmente, questo dovrebbe trovarsi nello stesso cluster del tuo computer. Poiché MinIO è una soluzione di archiviazione definita dal software, è in grado di fornire le prestazioni necessarie per alimentare le GPU affamate, una novità recente benchmark ha raggiunto 325 GiB/s su GET e 165 GiB/s su PUT con soli 32 nodi di SSD NVMe standard.

Hai una ricca esperienza nella creazione di infrastrutture dati ad alte prestazioni per istituzioni finanziarie globali. In che modo queste esperienze informano il tuo lavoro presso MinIO, in particolare nell'architettura di soluzioni per le diverse esigenze del settore?

Ho contribuito a creare il primo cloud privato per Bank of America e quell'iniziativa ha consentito di risparmiare miliardi di dollari fornendo caratteristiche e funzionalità disponibili internamente nei cloud pubblici a un costo inferiore. Non solo questa importante iniziativa, ma molti altri diversi requisiti applicativi su cui ho lavorato presso BofA Merrill Lynch hanno plasmato il mio lavoro presso MinIO per quanto riguarda l'architettura delle soluzioni per i nostri clienti oggi.

Ad esempio, apprenderlo nel modo sbagliato o “difficile” ha funzionato con il team che ha creato cluster Hadoop che utilizzavano solo i componenti di archiviazione dati del server mantenendo le CPU del server sottoutilizzate o quasi inattive. Semplici esempi o apprendimenti come questo mi hanno permesso di utilizzare dati disaggregati e soluzioni di calcolo nella moderna infrastruttura di dati di oggi aiutando al contempo i nostri clienti e partner, che sono soluzioni tecnicamente migliori e a costi inferiori che utilizzano le odierne tecnologie di rete a larghezza di banda elevata e archivi di oggetti ad alte prestazioni come MinIO e qualsiasi query o motore di elaborazione.

 Il cloud ibrido presenta sfide e complessità uniche. Potresti discuterne in dettaglio e spiegare in che modo il passaggio ibrido di MinIO al modello cloud aiuta a controllare i costi del cloud in modo efficace?

Il passaggio al multicloud non dovrebbe comportare un aumento esponenziale dei budget IT e l'incapacità di raggiungere gli obiettivi prefissati: dovrebbe aiutare a gestire i costi e ad accelerare la roadmap di un'organizzazione. Qualcosa da considerare è il rimpatrio del cloud: la realtà è che lo spostamento delle operazioni dal cloud all’infrastruttura on-premise può portare a notevoli risparmi sui costi, a seconda dei casi, e dovresti sempre considerare il cloud come un modello operativo, non come una destinazione. Ad esempio, le organizzazioni avviano istanze GPU ma poi dedicano tempo alla preelaborazione dei dati per adattarli alla GPU. Ciò fa sprecare tempo e denaro preziosi: le organizzazioni devono ottimizzare meglio scegliendo tecnologie native del cloud e, soprattutto, portabili sul cloud in grado di sbloccare la potenza del multicloud senza costi significativi. L'utilizzo dei principi del modello operativo cloud-first e l'adesione a tale framework fornisce l'agilità necessaria per adattarsi ai mutevoli requisiti operativi.

Le soluzioni native di Kubernetes sono fondamentali per le infrastrutture moderne. In che modo l'integrazione di MinIO con Kubernetes ne migliora la scalabilità e la flessibilità per AI infrastruttura dati?

MinIO è nativo di Kubernetes in base alla progettazione e compatibile con S3 fin dall'inizio. Gli sviluppatori possono distribuire rapidamente lo storage di oggetti persistente per tutte le loro applicazioni native del cloud. La combinazione di MinIO e Kubernetes fornisce una potente piattaforma che consente alle applicazioni di scalare su qualsiasi infrastruttura multi-cloud e cloud ibrido e di essere comunque gestite e protette centralmente, evitando il blocco del cloud pubblico.

Con Kubernetes come motore, MinIO è in grado di funzionare ovunque lo faccia Kubernetes, il che, nel moderno ambiente cloud-native/AI mondo, è essenzialmente ovunque.

Guardando al futuro, quali sono gli sviluppi futuri o i miglioramenti che gli utenti possono aspettarsi da MinIO nel contesto di AI infrastruttura dati?

Le nostre recenti partnership e lanci di prodotti sono un segnale per il mercato che non rallenteremo presto e che continueremo a spingere dove ha senso per i nostri clienti. Ad esempio, abbiamo recentemente collaborato con Carahsoft per rendere disponibile il portafoglio di storage di oggetti definito dal software di MinIO ai settori del governo, della difesa, dell'intelligence e dell'istruzione. Ciò consente alle organizzazioni del settore pubblico di costruire qualsiasi infrastruttura dati su vasta scala, dai moderni datalake espansivi alle soluzioni di archiviazione dati specifiche per missione nell'edge autonomo. Insieme, stiamo offrendo queste soluzioni uniche e all’avanguardia ai clienti del settore pubblico, consentendo loro di affrontare le sfide dell’infrastruttura dati in modo semplice ed efficiente. Questa partnership arriva in un momento in cui c’è una crescente spinta verso la possibilità del settore pubblico di esserlo AI-pronto, con i recenti requisiti dell'OMB che stabiliscono che tutte le agenzie federali necessitano di un capo AI Ufficiale (tra le altre cose). Nel complesso, la partnership contribuisce a rafforzare il settore AI postura e fornisce al settore pubblico gli strumenti preziosi necessari per avere successo.

Inoltre, MinIO è molto ben posizionata per il futuro. AI l’infrastruttura dei dati è ancora agli inizi. Molte aree saranno più evidenti nei prossimi due anni. Ad esempio, la maggior parte delle aziende vorrà utilizzare i propri dati e documenti proprietari con modelli fondamentali e Retrieval Augmented Generation (RAG). Un’ulteriore integrazione con questo modello di distribuzione sarà facile per MinIO poiché tutte queste scelte architettoniche e modelli di distribuzione hanno una cosa in comune: tutti i dati sono già archiviati su MinIO.

Infine, per i leader tecnologici che desiderano costruire o migliorare la propria infrastruttura dati per AI, quale consiglio daresti in base alla tua esperienza e alle tue intuizioni presso MinIO?

Per farne qualcuno AI iniziativa abbia successo, ci sono tre elementi chiave a cui devi attenersi: avere i dati giusti, la giusta infrastruttura e le giuste applicazioni. Tutto inizia con la comprensione di ciò di cui hai bisogno: non uscire e acquistare GPU costose solo perché hai paura di perdere l'opportunità. AI barca. Credo fermamente in quell'impresa AI Le strategie falliranno nel 2024 se le organizzazioni si concentreranno solo sui modelli stessi e non sui dati. Considerare il modello in basso piuttosto che i dati in alto è un errore fondamentale: devi iniziare con i dati. Costruire un'infrastruttura dati adeguata. Quindi, pensa ai tuoi modelli. Mentre le organizzazioni si muovono verso un AI-prima architettura, è fondamentale che la tua infrastruttura dati consenta i tuoi dati, non li vincoli.

Grazie per l'ottima intervista, i lettori che desiderano saperne di più dovrebbero visitare Minio.

Socio fondatore di unite.AI e membro di Consiglio tecnologico di Forbes, Antonio è un futurista che è appassionato del futuro dell'intelligenza artificiale e della robotica.

È anche il Fondatore di Titoli.io, un sito web che si concentra sugli investimenti in tecnologie dirompenti.