Interviews
Ronak Desai, Gründer und CEO von Ciroos – Interview-Serie

Ronak Desai, Gründer und CEO von Ciroos, leitet das Unternehmen mit einer klaren Mission, um IT-Arbeit und -Zeit für SRE-, DevOps- und Operations-Engineers zurückzugeben. Er bringt eine tiefe Überzeugung mit, dass KI menschliche Expertise sinnvoll ergänzen sollte, anstatt sie zu ersetzen, insbesondere in hochriskanten operativen Umgebungen. Bevor er Ciroos gründete, verbrachte Desai mehr als 20 Jahre bei Cisco, wo er mehrere Senior-Führungspositionen innehatte, darunter Senior Vice President und General Manager von Cisco Full-Stack Observability und AppDynamics. Im Laufe seiner Karriere hat er sich auf den Bau von skalierbaren, kundenorientierten Plattformen konzentriert, hält mehr als 50 Patente, die heute aktiv verwendet werden, und setzt die Prinzipien von Innovation und Kundenerfahrung fort, die seine Zeit bei Cisco geprägt haben.
Ciroos baut ein KI-Teammitglied für SRE, das die Zeit, die für die Untersuchung und Lösung komplexer IT-Vorfälle in modernen, multi-domänenübergreifenden Umgebungen benötigt, dramatisch reduzieren soll. Die Plattform verwendet native Multi-Agentic-KI, um über Signale zu argumentieren, Untersuchungen zu automatisieren und Automation, Ergänzung und autonome Operationen zu unterstützen, während sie sicherstellt, dass Menschen fest im Kontrolle bleiben. Durch die Korrelation von Daten über Tools und Domänen, die traditionell isoliert sind, ermöglicht Ciroos Teams, von reaktiver Brandbekämpfung zu schnellerer, selbstbewussterer Entscheidungsfindung überzugehen, und befreit Ingenieure von der Konzentration auf höherwertige Arbeiten anstatt repetitive und erschöpfende operative Arbeit.
Sie haben mehr als zwei Jahrzehnte bei Cisco verbracht und halfen, einige der erfolgreichsten Netzwerk- und Observability-Produkte aufzubauen. Was hat Sie dazu inspiriert, den Sprung zu wagen und Ciroos zu gründen?
Während meiner Interaktionen mit verschiedenen Unternehmenseams sah ich immer wieder die gleiche Geschichte. Operations-Teams waren von Dashboards überwältigt, jagten Alarme und verließen sich auf institutionelles Wissen, um Probleme über mehrere Systeme hinweg zu lösen. Trotz erheblicher Investitionen in Observability fehlte es ihnen an einer Möglichkeit, Beweise über Domänen in Echtzeit zu verbinden. Meine Mitgründer und ich wollten das ändern. Wir setzten uns das Ziel, ein KI-System zu bauen, das wie ein erfahrener Operator denken und mit SREs von Anfang an zusammenarbeiten kann, um Teams zu ermöglichen, sich auf die Verbesserung der Widerstandsfähigkeit und Zuverlässigkeit zu konzentrieren, anstatt Zeit mit der Suche nach Erkenntnissen oder der Lösung von Problemen zu verbringen.
Sie haben Ciroos als Antwort auf eines der schwierigsten Probleme im Betrieb beschrieben – Untersuchungen, die mehrere Domänen umfassen. Wie hat Ihre Erfahrung bei der Leitung von AppDynamics und Full-Stack Observability bei Cisco diese Erkenntnis geprägt und die Architektur von Ciroos beeinflusst?
Bei AppDynamics erreichten wir ein hohes Maß an Einblicken in das Verhalten von Anwendungen. Allerdings war die Sichtbarkeit allein auf der Anwendungsebene unzureichend, wenn die Ursache eines Vorfalls außerhalb der Anwendung (ob in der Cloud-Konfiguration, dem Netzwerk oder IAM) lag. Die Herausforderung bestand darin, den Kontext herzustellen. Diese Erfahrung hat unsere Auslegung von Ciroos geleitet. Unsere Plattform bringt KI-Argumentation in die Produktion. Sie betrachtet Signale über Domänen hinweg, ordnet Ereignisse auf einer gemeinsamen Zeitachse an und argumentiert über Domänen hinweg, um die tatsächlichen Ursachen von Vorfällen zu bestimmen.
Ciroos führt das Konzept eines “KI-SRE-Teammitglieds” ein. Wie unterscheidet sich diese Idee von KI als Kollaborateur von traditionellen Automatisierungs- oder Observability-Tools?
Das KI-SRE-Teammitglied funktioniert eher wie ein neues Teammitglied als ein neues Tool. Es hört zuerst zu, gewinnt ein Verständnis für die Umgebung, akzeptiert definierte Aufgaben und fördert Vertrauen im Laufe der Zeit. Während traditionelle Automatisierung Regeln ausführt, wendet das Teammitglied Argumentation an. Wenn es ein Problem identifiziert, wählt es die relevanten Domänen-Experten-Agenten aus, um sie zu befragen, sammelt unterstützende Beweise und präsentiert sie im Kontext. Dieses kollaborative Element befreit Ingenieure von der manuellen Ableitung von Korrelationen und gibt ihnen Zeit, Probleme zu lösen.
Ihre Plattform verwendet Multi-Agentic-KI-Argumentation. Können Sie erklären, wie mehrere KI-Agenten zusammenarbeiten, um die Wurzelursachenanalyse zu beschleunigen und die Genauigkeit in komplexen Systemen zu verbessern?
Jeder Agent verfügt über Domänen-Expertenwissen – einer in Kubernetes, ein anderer in der Cloud, ein weiterer im Netzwerk und so weiter. Wenn ein Vorfall auftritt, arbeiten diese Agenten zusammen als Teil einer zentralen Argumentationsschicht, die in Echtzeit Erkenntnisse korreliert. Das System bestimmt, welche Agenten aufzurufen sind, welche Aufgaben jedem Agenten zuzuweisen sind, in welcher Reihenfolge und für wie lange. Diese Koordination reduziert die Untersuchungszeit und verbessert die Genauigkeit, indem sie sicherstellt, dass jede Ebene im Kontext und nicht in einem Silo ausgewertet wird.
Wie argumentiert Ciroos dynamisch über verschiedene Datenquellen wie Cloud-Telemetrie, Anwendungsprotokolle und Infrastrukturmetriken, ohne Benutzer mit Rauschen zu überwältigen?
Ciroos betrachtet jede Datenquelle als ein einzelnes Objektiv in einem größeren Bild. Es ordnet Beobachtungen über Datenquellen auf einer einheitlichen Zeitachse an und zeigt nur die relevanten kausalen Beziehungen an. Zum Beispiel, wenn ein Pod-Neustart-Ereignis nach einer kleinen Änderung in IAM oder Netzwerkpolicen auftritt, verbindet Ciroos automatisch diese Sequenz. Es geht über die Bereitstellung von rohen Dashboards hinaus und stellt stattdessen eine vollständige Geschichte basierend auf den Beweisen zusammen, die Ingenieuren helfen, zu verstehen, warum etwas passiert ist.
Vertrauen und Erklärbarkeit sind zentrale Aspekte Ihrer Designphilosophie. Wie stellen Sie sicher, dass KI-getriebene Empfehlungen transparent bleiben und menschliche Ingenieure fest im Kontrolle bleiben?
Jede Empfehlung kommt mit den unterstützenden Beweisen und der Argumentation, die zu ihr geführt hat. Ingenieure können jede Schlussfolgerung nachvollziehen, ihre Annahmen testen und das Maß an Autonomie des Systems steuern, von assistiv bis semi-autonom. Das System behält kontextuelles Wissen im Laufe der Zeit durch menschliches Feedback, was es ermöglicht, die Entscheidungsqualität zu verbessern, während es vollständig reguliert bleibt. Unser Ansatz ähnelt der Art und Weise, wie ein Team neue Teammitglieder aufnimmt, mit klaren Sicherheitsvorkehrungen, direkter Argumentation und vollständiger menschlicher Aufsicht. Vertrauen baut sich auf, wenn das System zunehmend zuverlässige Leistung über die Zeit zeigt.
Frühzeitige Anwender berichten, dass Ciroos die Untersuchungszeit von Stunden auf Minuten reduziert. Welche Muster oder Erkenntnisse überraschten Sie am meisten, als Teams begannen, den KI-SRE-Teammitglied in der Produktion zu verwenden?
Es gab zwei angenehme Überraschungen – erstens, die Geschwindigkeit, mit der sogar große Unternehmen positiv auf unser Kernwertangebot reagiert haben, war ermutigend. Zweitens haben unsere Kunden unsere Technologie genau betrachtet und einige sehr einzigartige Anwendungsfälle gefunden, die weit über die Wurzelursachenanalyse hinausgehen. Diese Anwendungsfälle unterstreichen die realen Herausforderungen, denen große Unternehmen in ihren Produktionsbetrieben heute gegenüberstehen.
Der Begriff “KI als Teammitglied” suggeriert Zusammenarbeit anstelle von Ersetzung. Wie sehen Sie diese Konzeption in der Zukunft, wenn Organisationen immer mehr mit intelligenten Systemen zusammenarbeiten?
Wir betrachten dies als eine Reise, die Automation, Ergänzung und letztendlich Autopilot umfasst. Obwohl Ciroos alle drei Modi heute unterstützt, sehen wir in der Regel, dass die organisatorische Akzeptanz von KI einer Reifekurve folgt. Zu Beginn verwenden Unternehmen unser KI-System, um klar definierte und wiederholbare Aufgaben zu automatisieren, während sie den kognitiven Überlastung für Menschen minimieren. Im Gegensatz dazu legen nicht-KI-native Systeme zu viel Belastung auf den menschlichen Operator, um viele Parameter und Regeln zu konfigurieren, bevor Kunden einen Nutzen realisieren.
In der nächsten Phase nutzen Unternehmen das KI-System, um menschliche Argumentation in großem Umfang über mehrere Domänen hinweg zu ergänzen, während das System detaillierte Erklärungen und Empfehlungen für die Behebung bereitstellt, die der Mensch validiert und ausführt. Das ist der Punkt, an dem die meisten Unternehmen heute stehen.
Im Laufe der Zeit kann das KI-System vollständige Vorfall-Workflows autonom für das Unternehmen verwalten, nur wenn notwendig an einen Menschen eskaliert. Wir erwarten, dass dies schrittweise basierend auf der Aufgabe geöffnet wird. Diese Fortschritte sind ähnlich wie die Art und Weise, wie Teams Vertrauen zu neuen Mitarbeitern aufbauen. Mit zunehmender Vertrauensbildung wächst die Partnerschaft.
Viele Unternehmen verlassen sich bereits auf etablierte Observability- und Incident-Management-Plattformen. Wie integriert Ciroos in diese bestehenden Ökosysteme, ohne Workflows zu stören?
Von Anfang an war die Integration nie optional. Wir glauben, dass ein föderales Datenmodell Unternehmen den schnellsten Zeitpunkt für den Wert, die meisten Optionen und die niedrigsten Gesamtkosten bietet. Der KI-SRE-Teammitglied von Ciroos integriert sich mit sieben verschiedenen Kategorien von Unternehmenssystemen – Observability, Incident-Response, Kollaborations-Tools, Cloud-Plattformen, Ticket-Systemen, CI/CD-Tools und physischer Infrastruktur über offene APIs und Protokolle wie MCP und A2A. Es integriert sich in etablierte Workflows, anstatt Teams zu verlangen, neue anzunehmen. Dieses Design hat es Unternehmen erleichtert, es zu übernehmen. Teams erhalten schneller Antworten, ohne ihre bestehenden Workflows zu ändern.
Sie haben Kundenorientierung und Innovation während Ihrer gesamten Karriere betont. Wie leiten diese Werte die Kultur von Ciroos und seine langfristige Vision für die Neufassung der Zuverlässigkeits-Engineering?
Kundenorientierung bedeutet, sich unermüdlich auf die realen Herausforderungen zu konzentrieren, denen sich die Operations-Teams unserer Kunden gegenübersehen, wie lange Arbeitszeiten, Erschöpfung, Arbeit und die ständige Suche nach Antworten auf Fragen, die im Betrieb auftreten. Innovation bedeutet, diese Probleme auf eine Weise zu lösen, die Zeit und Fokus zurückgibt. Wir stellen uns vor, dass alle Operations-Teams ein KI-Teammitglied haben, das kontinuierlich lernt, mit der Nachfrage skaliert und dazu beiträgt, Zuverlässigkeit über Systeme hinweg zu gewährleisten. Langfristig sehen wir KI-Dienste als Software, die über den gesamten Entwicklungs- bis Produktions-Betriebszyklus hinweg Standard werden – Systeme, die neben ihren menschlichen Kollegen denken, handeln und verbessern. Wenn wir unseren Benutzern die Klarheit und den Freiraum geben, den sie immer benötigt haben, haben wir unsere Arbeit richtig gemacht. Diese Benutzer könnten SREs, IT-Operations-Mitarbeiter, Produktions-Operations-Ingenieure, Cloud-Operations-Ingenieure oder DevOps-Teammitglieder sein, die Produktions-Operationen durchführen.












