wawancara
Ronak Desai, Pendiri dan CEO Ciroos β Seri Wawancara

Ronak Desai, pendiri dan CEO Ciroos, memimpin perusahaan dengan misi yang jelas untuk menghilangkan beban kerja IT dan memberikan waktu kembali kepada SRE, DevOps, dan insinyur operasional. Ia memiliki keyakinan yang kuat bahwa AI harus secara bermakna meningkatkan keahlian manusia daripada menggantikannya, terutama di lingkungan operasional yang berisiko tinggi. Sebelum mendirikan Ciroos, Desai menghabiskan lebih dari 20 tahun di Cisco, di mana ia memegang berbagai peran kepemimpinan senior, termasuk Wakil Presiden Senior dan Manajer Umum Cisco Full-Stack Observability dan AppDynamics. Sepanjang kariernya, ia fokus pada pembangunan platform yang skalabel dan berpusat pada pelanggan, memegang lebih dari 50 paten yang masih aktif digunakan hingga saat ini, dan meneruskan prinsip-prinsip inovasi dan obsesi pelanggan yang membentuk masa jabatannya di Cisco.
Ciroos Ciroos sedang membangun rekan tim SRE berbasis AI yang dirancang untuk secara dramatis mengurangi waktu yang dibutuhkan untuk menyelidiki dan menyelesaikan insiden TI kompleks di lingkungan multi-domain modern. Platform ini menggunakan AI multi-agen asli untuk menalar di berbagai sinyal, mengotomatiskan investigasi, dan mendukung otomatisasi, augmentasi, dan operasi otonomβsambil memastikan manusia tetap memegang kendali penuh. Dengan mengkorelasikan data di berbagai alat dan domain yang secara tradisional terisolasi, Ciroos memungkinkan tim untuk beralih dari penanganan masalah reaktif ke pengambilan keputusan yang lebih cepat dan lebih percaya diri, membebaskan para insinyur untuk fokus pada pekerjaan yang berdampak lebih tinggi daripada pekerjaan operasional yang berulang dan melelahkan.
Anda menghabiskan lebih dari dua dekade di Cisco, membantu membangun beberapa produk jaringan dan observabilitasnya yang paling sukses. Apa yang menginspirasi Anda untuk mengambil langkah berani dan mendirikan Ciroos?
Sepanjang interaksi saya dengan berbagai tim perusahaan, saya melihat alur cerita yang sama berulang kali terjadi. Tim operasional kewalahan dengan dasbor, mengejar peringatan, dan bergantung pada pengetahuan institusional untuk memecahkan masalah di berbagai sistem. Meskipun modal yang signifikan telah dihabiskan untuk observabilitas, mereka masih kekurangan cara untuk menghubungkan bukti di berbagai domain secara real-time. Saya dan rekan pendiri saya ingin mengubah itu. Kami bertekad untuk membangun sistem AI yang dapat berpikir seperti operator berpengalaman dan bekerja sama dengan SRE sejak awal, memungkinkan tim untuk fokus pada peningkatan ketahanan dan keandalan daripada menghabiskan waktu mencari wawasan atau mengatasi masalah yang muncul.
Anda telah menggambarkan Ciroos sebagai respons terhadap salah satu masalah tersulit dalam operasi β investigasi yang mencakup berbagai domain. Bagaimana pengalaman Anda memimpin bisnis AppDynamics dan Full-Stack Observability di Cisco membentuk pemahaman tersebut dan memengaruhi arsitektur Ciroos?
Di AppDynamics, kami mencapai tingkat wawasan yang tinggi tentang perilaku aplikasi. Namun, ketika penyebab suatu insiden berada di luar aplikasi (baik dalam konfigurasi cloud, jaringan, atau IAM), visibilitas pada lapisan aplikasi saja tidak cukup. Tantangannya adalah dalam membangun konteks. Pengalaman itulah yang memandu cara kami merancang Ciroos. Platform kami menghadirkan penalaran AI untuk meningkatkan skala operasi produksi. Platform ini menganalisis sinyal di berbagai domain, menyelaraskan peristiwa pada garis waktu yang sama, dan melakukan penalaran lintas batas domain untuk menentukan akar penyebab sebenarnya dari insiden tersebut.
Ciroos memperkenalkan konsep "Rekan Tim AI SRE." Bagaimana gagasan AI sebagai kolaborator ini berbeda dari alat otomatisasi atau observabilitas tradisional?
AI SRE Teammate berfungsi lebih seperti rekan tim baru daripada alat baru. Ia mendengarkan terlebih dahulu, memahami lingkungan, menerima tugas yang telah ditentukan, dan membangun kepercayaan dari waktu ke waktu. Sementara otomatisasi tradisional menjalankan aturan, rekan tim ini menerapkan penalaran. Ketika mengidentifikasi suatu masalah, ia memilih agen ahli domain yang relevan untuk ditanyai, mengumpulkan bukti pendukung, dan menyajikannya dalam konteks. Elemen kolaboratif ini membebaskan waktu para insinyur untuk memvalidasi dan memecahkan masalah daripada secara manual mencari korelasi.
Platform Anda menggunakan penalaran AI multi-agen. Dapatkah Anda menjelaskan bagaimana beberapa agen AI berkoordinasi untuk mempercepat analisis akar penyebab dan meningkatkan akurasi di seluruh sistem yang kompleks?
Setiap agen memiliki keahlian di bidangnya masing-masing β satu di Kubernetes, satu di cloud, satu di jaringan, dan sebagainya. Ketika terjadi insiden, agen-agen ini bekerja sama sebagai bagian dari lapisan penalaran pusat yang mengkorelasikan temuan secara real-time. Sistem menentukan agen mana yang akan dipanggil, tugas apa yang akan diberikan kepada setiap agen, dalam urutan apa, dan berapa lama. Koordinasi ini mengurangi waktu investigasi dan meningkatkan akurasi dengan memastikan bahwa setiap lapisan dievaluasi dalam konteksnya, bukan secara terpisah.
Dari perspektif teknis, bagaimana Ciroos secara dinamis melakukan penalaran di berbagai sumber data yang berbeda β seperti telemetri cloud, log aplikasi, dan metrik infrastruktur β tanpa membebani pengguna dengan informasi yang tidak perlu?
Ciroos menganggap setiap sumber data sebagai satu lensa dalam gambaran yang lebih besar. Ia menyelaraskan pengamatan di berbagai sumber data pada garis waktu yang terpadu dan hanya menampilkan hubungan sebab-akibat yang relevan. Misalnya, jika peristiwa restart pod terjadi setelah perubahan kecil pada IAM atau kebijakan jaringan, Ciroos secara otomatis menghubungkan urutan tersebut. Ia melampaui penyediaan dasbor mentah dan malah menyusun cerita lengkap berdasarkan bukti yang membantu para insinyur memahami mengapa sesuatu terjadi.
Kepercayaan dan kemampuan menjelaskan merupakan inti dari filosofi desain Anda. Bagaimana Anda memastikan bahwa rekomendasi berbasis AI tetap transparan dan para insinyur manusia tetap memegang kendali penuh?
Setiap rekomendasi disertai dengan bukti pendukung dan alasan yang mendasarinya. Para insinyur dapat menelusuri setiap kesimpulan, menguji asumsi mereka, dan mengelola tingkat otonomi sistem, dari bantuan hingga semi-otonom. Sistem mempertahankan pengetahuan kontekstual dari waktu ke waktu melalui umpan balik manusia, memungkinkan sistem untuk meningkatkan kualitas pengambilan keputusan sambil tetap sepenuhnya terkendali. Pendekatan kami menyerupai cara sebuah tim melakukan orientasi anggota tim baru, dengan batasan yang jelas, penalaran langsung, dan pengawasan manusia sepenuhnya. Kepercayaan terbangun seiring sistem menunjukkan kinerja yang semakin andal dari waktu ke waktu.
Para pengguna awal melaporkan bahwa Ciroos mengurangi waktu investigasi dari berjam-jam menjadi beberapa menit. Pola atau wawasan apa yang paling mengejutkan Anda ketika tim mulai menggunakan AI SRE Teammate di lingkungan produksi?
Ada dua kejutan menyenangkan β pertama, kecepatan respons positif dari perusahaan-perusahaan besar terhadap proposisi nilai inti kami sangat menggembirakan. Kedua, pelanggan kami telah mencermati teknologi kami dan menemukan beberapa kasus penggunaan yang sangat unik yang jauh melampaui analisis akar penyebab. Kasus-kasus penggunaan ini menyoroti tantangan nyata yang dihadapi perusahaan-perusahaan besar saat ini dalam operasi produksi mereka.
Istilah βAI sebagai Rekan Timβ menyiratkan kolaborasi, bukan penggantian. Bagaimana Anda melihat konsep ini berkembang seiring organisasi semakin nyaman bekerja berdampingan dengan sistem cerdas?
Kami memandang ini sebagai sebuah perjalanan yang melibatkan otomatisasi, augmentasi, dan pada akhirnya, autopilot. Meskipun Ciroos mendukung ketiga mode tersebut saat ini, kami biasanya melihat adopsi AI oleh organisasi mengikuti kurva kematangan. Sebagai permulaan, perusahaan menggunakan sistem AI kami untuk mengotomatisasi tugas-tugas yang terdefinisi dengan jelas dan berulang sambil meminimalkan beban kognitif bagi manusia. Sebaliknya, sistem khusus non-AI memberikan terlalu banyak beban pada operator manusia untuk mengkonfigurasi banyak parameter dan aturan sebelum pelanggan menyadari nilainya.
Pada fase selanjutnya, perusahaan memanfaatkan sistem AI untuk meningkatkan penalaran manusia dalam skala besar di berbagai domain, bahkan ketika sistem tersebut memberikan penjelasan rinci dan rekomendasi untuk perbaikan yang divalidasi dan dieksekusi oleh manusia. Di sinilah sebagian besar perusahaan berada saat ini.
Seiring waktu, AI dapat mengelola alur kerja insiden secara otomatis untuk seluruh perusahaan, hanya akan meningkatkan penanganan ke manusia jika diperlukan. Kami berharap ini akan secara bertahap diperluas berdasarkan tugas yang ada. Perkembangan ini mirip dengan bagaimana tim membangun kepercayaan dengan karyawan baru. Seiring bertambahnya kepercayaan, kemitraan akan semakin erat.
Banyak perusahaan sudah mengandalkan platform observabilitas dan manajemen insiden yang sudah mapan. Bagaimana Ciroos terintegrasi dengan ekosistem yang ada tanpa mengganggu alur kerja?
Sejak awal, integrasi bukanlah pilihan opsional. Kami percaya bahwa model data terfederasi memberikan perusahaan waktu tercepat untuk mendapatkan nilai, pilihan terbanyak, dan biaya kepemilikan total terendah. Ciroos AI SRE Teammate terintegrasi dengan tujuh kategori sistem perusahaan yang berbeda saat ini β observabilitas, respons insiden, alat kolaborasi, platform cloud, sistem tiket, alat CI/CD, dan infrastruktur fisik melalui API dan protokol terbuka seperti MCP dan A2A. Integrasi ini masuk ke dalam alur kerja yang sudah ada, alih-alih mengharuskan tim untuk mengadopsi alur kerja baru. Desain ini telah membantu memudahkan perusahaan untuk mengadopsinya. Tim mendapatkan jawaban lebih cepat tanpa mengubah alur kerja yang ada.
Sepanjang karier Anda, Anda selalu menekankan obsesi terhadap pelanggan dan inovasi. Bagaimana nilai-nilai tersebut memandu budaya Ciroos dan visi jangka panjangnya untuk mendefinisikan ulang rekayasa keandalan?
Berorientasi pada pelanggan berarti fokus tanpa henti pada tantangan dunia nyata yang dihadapi oleh tim operasional pelanggan kami, seperti jam kerja yang panjang, kelelahan, kerja keras, dan pencarian jawaban terus-menerus atas pertanyaan yang muncul dalam operasional. Inovasi adalah tentang memecahkan masalah tersebut dengan cara yang secara bermakna mengembalikan waktu dan fokus. Kami membayangkan semua tim operasional memiliki rekan AI yang terus belajar, berkembang sesuai permintaan, dan membantu memastikan keandalan di seluruh sistem. Dalam jangka panjang, kami melihat layanan AI sebagai perangkat lunak yang menjadi standar di seluruh siklus pengembangan hingga produksi operasional β sistem yang berpikir, bertindak, dan berkembang bersama rekan-rekan manusianya. Jika kami dapat memberikan kejelasan dan ruang bernapas yang selalu dibutuhkan pengguna kami, kami telah melakukan pekerjaan kami dengan benar. Pengguna ini bisa berupa SRE, staf Operasional TI, insinyur operasional produksi, insinyur operasional cloud, atau anggota tim DevOps yang melakukan operasional produksi.












