Interviste
Ronak Desai, Fondatore e Amministratore Delegato di Ciroos – Serie di Interviste

Ronak Desai, fondatore e amministratore delegato di Ciroos, guida l’azienda con una missione chiara: eliminare il lavoro ripetitivo IT e restituire il tempo agli ingegneri SRE, DevOps e operazioni. Egli porta una profonda convinzione che l’AI debba essere utilizzata per migliorare significativamente l’esperienza umana, piuttosto che sostituirla, soprattutto in ambienti operativi ad alto rischio. Prima di fondare Ciroos, Desai ha trascorso più di 20 anni in Cisco, dove ha ricoperto diversi ruoli di leadership, tra cui Senior Vice President e General Manager di Cisco Full-Stack Observability e AppDynamics. Nel corso della sua carriera, si è concentrato sulla costruzione di piattaforme scalabili e centrate sul cliente, detiene più di 50 brevetti in uso attivo oggi e porta avanti i principi di innovazione e ossessione per il cliente che hanno caratterizzato il suo periodo in Cisco.
Ciroos sta costruendo un compagno di lavoro SRE basato sull’AI progettato per ridurre drasticamente il tempo necessario per indagare e risolvere incidenti IT complessi in ambienti moderni e multi-dominio. La piattaforma utilizza un’AI multi-agente nativa per ragionare sui segnali, automatizzare le indagini e supportare l’automazione, il potenziamento e le operazioni autonome, garantendo che gli esseri umani rimangano saldamente in controllo. Correlando i dati tra strumenti e domini tradizionalmente isolati, Ciroos consente ai team di passare da un approccio reattivo di gestione degli incidenti a una presa di decisioni più rapida e più sicura, liberando gli ingegneri per concentrarsi su lavori ad alto impatto piuttosto che su lavoro ripetitivo e logorante.
Hai trascorso più di due decenni in Cisco, aiutando a costruire alcuni dei suoi prodotti di networking e osservabilità più di successo. Cosa ti ha ispirato a fare il salto e fondare Ciroos?
In tutte le mie interazioni con vari team aziendali, ho visto la stessa storia ripetersi più volte. I team operativi erano sopraffatti da dashboard, inseguivano allarmi e dipendevano dalla conoscenza istituzionale per risolvere problemi in più sistemi. Nonostante la spesa significativa per l’osservabilità, non avevano ancora un modo per collegare le prove tra domini in tempo reale. I miei co-fondatori e io volevamo cambiare questo. Ci siamo impegnati a costruire un sistema AI che potesse ragionare come un operatore esperto e lavorare in concerto con gli SRE fin dall’inizio, consentendo ai team di concentrarsi sul miglioramento della resilienza e dell’affidabilità piuttosto che spendere tempo a cercare informazioni o a risolvere problemi.
Hai descritto Ciroos come una risposta a uno dei problemi più difficili nelle operazioni – le indagini che attraversano più domini. Come la tua esperienza alla guida del business di AppDynamics e Full-Stack Observability in Cisco ha plasmato quella consapevolezza e influenzato l’architettura di Ciroos?
In AppDynamics, abbiamo raggiunto un alto livello di comprensione del comportamento delle applicazioni. Tuttavia, quando la causa di un incidente si trovava al di fuori dell’applicazione (sia nella configurazione cloud, nella rete o nell’IAM), avere visibilità solo a livello di applicazione non era sufficiente. La sfida era stabilire il contesto. Quell’esperienza ha guidato la progettazione di Ciroos. La nostra piattaforma porta il ragionamento AI alla scala delle operazioni di produzione. Esamina i segnali tra i domini, allinea gli eventi su una timeline comune e ragiona tra i confini dei domini per determinare le vere cause radice degli incidenti.
Ciroos introduce il concetto di “Compagno di lavoro SRE AI”. Come questa idea di AI come collaboratore differisce dagli strumenti di automazione o osservabilità tradizionali?
Il Compagno di lavoro SRE AI funziona più come un nuovo compagno di squadra che come uno strumento nuovo. Ascolta prima, acquisisce una comprensione dell’ambiente, accetta incarichi definiti e favorisce la fiducia nel tempo. Mentre l’automazione tradizionale esegue regole, il compagno di lavoro applica il ragionamento. Quando identifica un problema, seleziona gli agenti di dominio pertinenti da interrogare, raccoglie prove a supporto e le presenta nel contesto. Questo elemento di collaborazione libera il tempo degli ingegneri per convalidare e risolvere problemi piuttosto che derivare manualmente le correlazioni.
La tua piattaforma utilizza un ragionamento AI multi-agente. Puoi spiegare come più agenti AI coordinano per accelerare l’analisi della causa radice e migliorare l’accuratezza attraverso sistemi complessi?
Ogni agente ha una competenza di dominio – uno in Kubernetes, un altro in cloud, un altro in rete e così via. Quando si verifica un incidente, questi agenti lavorano insieme come parte di un livello di ragionamento centrale che correla i risultati in tempo reale. Il sistema determina quali agenti invocare, quali compiti assegnare a ciascun agente, in quale ordine e per quanto tempo. Questa coordinazione riduce i tempi di indagine e migliora l’accuratezza assicurando che ogni livello sia valutato nel contesto piuttosto che in un silo.
Da un punto di vista tecnico, come Ciroos ragiona dinamicamente attraverso fonti di dati disparate – come telemetria cloud, log di applicazioni e metriche di infrastruttura – senza sopraffare gli utenti con rumore?
Ciroos considera ogni fonte di dati come una singola lente in un quadro più ampio. Allinea le osservazioni tra le fonti di dati su una timeline unificata e mette in evidenza solo le relazioni causali rilevanti. Ad esempio, se si verifica un evento di riavvio del pod dopo un piccolo cambiamento nell’IAM o nella politica di rete, Ciroos collega automaticamente quella sequenza. Va oltre la fornitura di dashboard grezze e invece assembla una storia completa basata sulle prove che aiuta gli ingegneri a capire perché qualcosa è successo.
Fiducia e spiegabilità sono centrali nella tua filosofia di progettazione. Come assicuri che le raccomandazioni guidate dall’AI rimangano trasparenti e che gli ingegneri umani rimangano saldamente in controllo?
Ogni raccomandazione viene fornita con le prove a supporto e il ragionamento che l’ha portata. Gli ingegneri possono tracciare ogni conclusione, testare le loro ipotesi e gestire il livello di autonomia del sistema, dall’assistenza all’autonomia semi-autonoma. Il sistema mantiene la conoscenza contestuale nel tempo attraverso il feedback umano, consentendogli di migliorare la qualità delle decisioni restando completamente governato. Il nostro approccio assomiglia al modo in cui un team farebbe onboardare nuovi membri, con guardrail chiari, ragionamento diretto e piena supervisione umana. La fiducia si costruisce man mano che il sistema mostra prestazioni sempre più affidabili nel tempo.
I primi adottanti segnalano che Ciroos riduce il tempo di indagine da ore a minuti. Quali tipi di modelli o intuizioni ti hanno sorpreso di più quando i team hanno iniziato a utilizzare il Compagno di lavoro SRE AI in produzione?
Ci sono state due piacevoli sorprese – in primo luogo, la velocità con cui anche le grandi imprese hanno risposto favorevolmente alla nostra proposta di valore fondamentale è stata incoraggiante. In secondo luogo, i nostri clienti hanno esaminato attentamente la nostra tecnologia e hanno individuato alcuni casi d’uso unici che vanno ben oltre l’analisi della causa radice. Questi casi d’uso mettono in evidenza le sfide del mondo reale che le grandi imprese affrontano oggi nelle loro operazioni di produzione.
Il termine “AI come Compagno di lavoro” suggerisce collaborazione piuttosto che sostituzione. Come vedi evolversi questo concetto man mano che le organizzazioni diventano più confortevoli nel lavorare con sistemi intelligenti?
Consideriamo questo come un percorso che coinvolge automazione, potenziamento e, infine, autopilota. Sebbene Ciroos supporti tutti e tre i modi oggi, di solito vediamo l’adozione aziendale di AI seguire una curva di maturità. All’inizio, le imprese utilizzano il nostro sistema AI per automatizzare compiti chiaramente definiti e ripetibili mentre minimizzano il sovraccarico cognitivo per gli esseri umani. Al contrario, i sistemi non nativi AI richiedono troppo onere all’operatore umano per configurare molti parametri e regole prima che i clienti realizzi il valore.
Nella fase successiva, le imprese sfruttano il sistema AI per potenziare il ragionamento umano su larga scala in più domini, anche mentre il sistema fornisce spiegazioni dettagliate e raccomandazioni per la risoluzione che l’umano convalida ed esegue. Questo è il punto in cui si trovano la maggior parte delle imprese oggi.
Nel tempo, l’AI può gestire i flussi di lavoro degli incidenti in modo autonomo per l’impresa, sollevando solo gli umani quando necessario. Ci aspettiamo che questo si apra gradualmente in base al compito. Quella progressione è simile a come i team sviluppano fiducia con i nuovi assunti. Man mano che si guadagna più fiducia, la partnership cresce.
Molte imprese già si affidano a piattaforme di osservabilità e gestione degli incidenti stabilite. Come Ciroos si integra con questi ecosistemi esistenti senza interrompere i flussi di lavoro?
Fin dall’inizio, l’integrazione non era mai stata opzionale. Crediamo che un modello di dati federato fornisca alle imprese il tempo di valore più rapido, la massima opzionalità e il minor costo totale di proprietà. Il Compagno di lavoro SRE AI Ciroos si integra con sette diverse categorie di sistemi aziendali oggi – osservabilità, risposta agli incidenti, strumenti di collaborazione, piattaforme cloud, sistemi di ticketing, strumenti CI/CD e infrastruttura fisica tramite API aperte e protocolli come MCP e A2A. Si integra nei flussi di lavoro stabiliti invece di richiedere ai team di adottare nuovi. Questa progettazione ha aiutato a renderlo facile per le imprese adottare. I team ottengono risposte più rapide senza cambiare i loro flussi di lavoro esistenti.
Hai sottolineato l’ossessione per il cliente e l’innovazione in tutta la tua carriera. Come quei valori guidano la cultura di Ciroos e la sua visione a lungo termine per ridefinire la progettazione dell’affidabilità?
Essere ossessionati dal cliente significa essere implacabilmente concentrati sulle sfide del mondo reale affrontate dai team operativi dei nostri clienti, come le lunghe ore, la stanchezza, il lavoro ripetitivo e la costante ricerca di risposte alle domande che sorgono nelle operazioni. L’innovazione è risolvere quei problemi in modi che restituiscono significativamente tempo e concentrazione. Noi ci immaginiamo tutti i team operativi che hanno un compagno di lavoro AI che apprende in modo continuo, si scala con la domanda e aiuta a garantire l’affidabilità attraverso i sistemi. A lungo termine, vediamo il servizio AI come software diventare standard in tutto il ciclo di sviluppo alle operazioni di produzione – sistemi che pensano, agiscono e migliorano insieme ai loro pari umani. Se possiamo fornire ai nostri utenti la chiarezza e il respiro che hanno sempre avuto bisogno, abbiamo fatto il nostro lavoro correttamente. Questi utenti potrebbero essere SRE, personale IT, ingegneri di operazioni di produzione, ingegneri di operazioni cloud, membri del team DevOps che eseguono operazioni di produzione.












