สัมภาษณ์
Ronak Desai, ผู้ก่อตั้งและCEO ของ Ciroos – สัมภาษณ์ซีรีส์

Ciroos กำลังสร้าง AI ที่เป็นมิตรกับ SRE ที่ออกแบบมาเพื่อลดเวลาในการสืบสวนและแก้ไขเหตุการณ์ IT ที่ซับซ้อนใน môi trườngหลายโดเมนสมัยใหม่ แพลตฟอร์มนี้ใช้ AI ที่มีหลายตัวแทนในการให้เหตุผลข้ามสัญญาณ การสืบสวนแบบอัตโนมัติ และการสนับสนุนการทำงานอัตโนมัติ การเพิ่มประสิทธิภาพ และการปฏิบัติการอัตโนมัติ ในขณะเดียวกันก็รับรองว่ามนุษย์ยังคงอยู่ในการควบคุมโดยแน่นอน โดยการเชื่อมโยง数据ข้ามเครื่องมือและโดเมนที่แยกจากกันตามปกติ Ciroos ช่วยให้ทีมสามารถย้ายจากการตอบสนองต่อการดับเพลิงแบบเรียกด่วนไปยังการตัดสินใจที่รวดเร็วและมั่นใจมากขึ้น ทำให้วิศวกรสามารถมุ่งเน้นไปที่งานที่มีผลกระทบสูงมากกว่าการทำงานปฏิบัติการที่ซ้ำซากและเหนื่อยล้า
คุณใช้เวลาเกินสองทศวรรษที่ Cisco ช่วยสร้างผลิตภัณฑ์เครือข่ายและความสามารถในการสังเกตที่ประสบความสำเร็จมากที่สุดของบริษัท คุณได้รับแรงบันดาลใจอะไรในการตัดสินใจกระโดดและก่อตั้ง Ciroos?
ตลอดการโต้ตอบกับทีมองค์กรต่างๆ ฉันเห็นเรื่องราวเดียวกันซ้ำๆ กัน ทีมปฏิบัติการถูกท่วมด้วยแดชบอร์ด การแจ้งเตือน และพึ่งพาความรู้เชิงสถาบันในการแก้ไขปัญหาในระบบหลายระบบ แม้ว่าจะมีการใช้เงินทุนจำนวนมากกับการสังเกตการณ์ แต่ก็ยังไม่มีวิธีการเชื่อมโยงหลักฐานข้ามโดเมนในเวลาเดียวกัน ผู้ร่วมก่อตั้งและฉันต้องการเปลี่ยนแปลงสิ่งนั้น เราตั้งเป้าหมายในการสร้างระบบ AI ที่สามารถให้เหตุผลเหมือนผู้ปฏิบัติการที่มีประสบการณ์และทำงานร่วมกับ SRE ตั้งแต่ต้น เพื่อให้ทีมสามารถมุ่งเน้นไปที่การปรับปรุงความทนทานและความน่าเชื่อถือมากกว่าการใช้เวลาค้นหาข้อมูลหรือต่อสู้กับปัญหา
คุณได้อธิบาย Ciroos ว่าเป็นการตอบสนองต่อหนึ่งในปัญหาที่ยากที่สุดในการปฏิบัติการ — การสืบสวนที่ครอบคลุมหลายโดเมน การใช้ประสบการณ์ของคุณในการนำทีม AppDynamics และ Full-Stack Observability ของ Cisco ช่วยให้คุณตระหนักถึงการออกแบบและอิทธิพลต่อสถาปัตยกรรมของ Ciroos อย่างไร?
ที่ AppDynamics เราได้รับข้อมูลเชิงลึกที่สูงเกี่ยวกับการทำงานของแอปพลิเคชัน อย่างไรก็ตาม เมื่อเหตุการณ์เกิดขึ้นนอกแอปพลิเคชัน (ไม่ว่าจะเป็นในคลาวด์ การกำหนดค่าเครือข่ายหรือ IAM) การมองเห็นเพียงชั้นแอปพลิเคชันเพียงอย่างเดียวไม่เพียงพอ ความท้าทายคือการสร้างบริบท การใช้ประสบการณ์นั้นเป็นแนวทางในการออกแบบ Ciroos แพลตฟอร์มของเรานำการให้เหตุผลของ AI มาสู่การผลิตปฏิบัติการ มันตรวจสอบสัญญาณข้ามโดเมน จัดเรียงเหตุการณ์บนเส้นเวลาเดียวกัน และให้เหตุผลข้ามขอบเขตโดเมนเพื่อกำหนดสาเหตุที่แท้จริงของเหตุการณ์
Ciroos แนะนำแนวคิดของ “AI SRE Teammate” วิธีการทำงานของ AI ในฐานะผู้ร่วมงานนี้แตกต่างจากเครื่องมืออัตโนมัติหรือการสังเกตการณ์แบบดั้งเดิมอย่างไร?
AI SRE Teammate ทำงานเหมือนเพื่อนร่วมงานใหม่มากกว่าเครื่องมือใหม่ มันฟังอย่างแรก เพื่อให้เข้าใจสภาพแวดล้อม รับคำสั่งและสร้างความไว้วางใจเมื่อเวลาผ่านไป ในขณะที่การอัตโนมัติแบบดั้งเดิมจะดำเนินการตามกฎ AI Teammate นี้ใช้การให้เหตุผล เมื่อมันระบุปัญหา มันเลือกตัวแทนโดเมนที่เกี่ยวข้องเพื่อซักถาม รวบรวมหลักฐานที่สนับสนุน และนำเสนอในบริบทที่เหมาะสม สิ่งนี้ช่วยให้วิศวกรสามารถตรวจสอบและแก้ปัญหาได้มากกว่าการค้นหาความสัมพันธ์โดยใช้แรงงานคน
แพลตฟอร์มของคุณใช้การให้เหตุผล AI แบบหลายตัวแทน สามารถอธิบายได้อย่างไรว่าตัวแทน AI หลายตัวทำงานร่วมกันเพื่อเร่งการวิเคราะห์สาเหตุและปรับปรุงความแม่นยำในระบบที่ซับซ้อน?
แต่ละตัวแทนจะมีความเชี่ยวชาญในโดเมนต่างๆ — หนึ่งใน Kubernetes, อีกอันในคลาวด์, อีกอันในเครือข่าย และอื่นๆ เมื่อเกิดเหตุการณ์ ตัวแทนเหล่านี้ทำงานร่วมกันเป็นส่วนหนึ่งของชั้นการให้เหตุผลกลางที่สอดคล้องกับการค้นพบในเวลาจริง ระบบจะกำหนดตัวแทนไหนที่จะเรียกใช้, งานไหนที่จะกำหนดให้ตัวแทนแต่ละตัว, ในลำดับไหน และเป็นเวลานานเท่าใด การประสานงานนี้ลดเวลาในการสืบสวนและปรับปรุงความแม่นยำโดยการรับรองว่าทุกชั้นจะถูกประเมินในบริบทมากกว่าในซิลโล
จากมุมมองทางเทคนิค Ciroos ใช้การให้เหตุผลข้ามแหล่งข้อมูลที่แตกต่างกัน — เช่น ข้อมูลโทรเมทรีคลาวด์, บันทึกแอปพลิเคชัน และเมตริกโครงสร้างพื้นฐาน — โดยไม่ทำให้ผู้ใช้เสียสมาธิด้วยเสียงรบกวน?
Ciroos พิจารณาแหล่งข้อมูลทุกแหล่งเป็นเลนส์เดียวในภาพที่ใหญ่กว่า มันจัดเรียงการสังเกตข้ามแหล่งข้อมูลบนเส้นเวลารวมและแสดงเพียงความสัมพันธ์เชิงสาเหตุที่เกี่ยวข้องเท่านั้น ตัวอย่างเช่น หากเกิดเหตุการณ์เริ่มต้นพอดหลังจากการเปลี่ยนแปลงเล็กๆ ใน IAM หรือนโยบายเครือข่าย Ciroos จะเชื่อมโยงลำดับนั้นโดยอัตโนมัติ มันไปไกลกว่าการให้แดชบอร์ดแบบดั้งเดิมและประกอบเรื่องราวที่สมบูรณ์ตามหลักฐานที่ช่วยให้วิศวกรเข้าใจว่าทำไมสิ่งหนึ่งจึงเกิดขึ้น
ความไว้วางใจและความสามารถอธิบายเป็นศูนย์กลางของปรัชญาการออกแบบของคุณ คุณรับรองว่าคำแนะนำที่ได้รับจาก AI ยังคงโปร่งใสและวิศวกรมนุษย์ยังคงอยู่ในการควบคุมอย่างไร?
คำแนะนำทุกข้อมาพร้อมกับหลักฐานที่สนับสนุนและเหตุผลที่นำไปสู่มัน วิศวกรสามารถติดตามข้อสรุปแต่ละข้อ ทดสอบสมมติฐานของตนเอง และจัดการระดับอัตโนมัติของระบบ ตั้งแต่การช่วยเหลือไปจนถึงการทำงานอัตโนมัติระบบจะเก็บรักษาความรู้เชิงบริบทตามเวลาผ่านการให้ข้อมูลย้อนกลับของมนุษย์ ทำให้สามารถปรับปรุงคุณภาพการตัดสินใจในขณะเดียวกันก็ยังคงอยู่ภายใต้การกำกับดูแลอย่างเต็มที่ วิธีการของเรานี้คล้ายกับวิธีที่ทีมจะรับเพื่อนร่วมงานใหม่ โดยมีการป้องกันที่ชัดเจน การให้เหตุผลโดยตรง และการกำกับดูแลของมนุษย์อย่างเต็มที่ ความไว้วางใจจะถูกสร้างขึ้นเมื่อระบบแสดงผลการทำงานที่น่าเชื่อถือมากขึ้นเมื่อเวลาผ่านไป
ผู้ใช้ในช่วงแรกรายงานว่า Ciroos ลดเวลาในการสืบสวนจากชั่วโมงลงเหลือนาที รูปแบบหรือข้อมูลเชิงลึกอะไรที่ทำให้คุณประหลาดใจมากที่สุดเมื่อทีมเริ่มใช้ AI SRE Teammate ในการผลิต?
มีสิ่งที่น่าพอใจสองประการ — ประการแรก ความเร็วที่องค์กรขนาดใหญ่ตอบรับข้อเสนอคุณค่าหลักของเรานั้นเป็นเรื่องที่น่าประทับใจ ประการที่สอง ลูกค้าของเรามองหาสิ่งใหม่ๆ ในเทคโนโลยีของเราและคิดค้นกรณีการใช้งานที่ไม่เหมือนใครซึ่งไปไกลกว่าการวิเคราะห์สาเหตุของเหตุการณ์ กรณีการใช้งานเหล่านี้เน้นถึงความท้าทายที่แท้จริงที่องค์กรขนาดใหญ่ต้องเผชิญในปัจจุบันในการดำเนินงานการผลิต
คำว่า “AI เป็นเพื่อนร่วมงาน” หมายถึงการทำงานร่วมกันมากกว่าการแทนที่ คุณเห็นแนวคิดนี้วิวัฒนาการอย่างไรเมื่อองค์กรเติบโตและทำงานร่วมกับระบบอัจฉริยะมากขึ้น?
เรามองว่านี่เป็นกระบวนการที่เกี่ยวข้องกับการอัตโนมัติ การเพิ่มประสิทธิภาพ และในที่สุดก็เป็นอัตโนมัติ แม้ว่า Ciroos จะรองรับโหมดทั้งสามโหมดนี้ในปัจจุบัน แต่โดยทั่วไปแล้วเราจะเห็นองค์กรใช้ระบบ AI ของเราเพื่อทำงานอัตโนมัติที่กำหนดและซ้ำกันในขณะที่ลดภาระการทำงานของมนุษย์ให้เหลือน้อยที่สุด ในทางกลับกัน ระบบที่ไม่ใช่ AI ที่ไม่ใช่ของเราจะให้ภาระงานมากเกินไปแก่ผู้ปฏิบัติงานในการกำหนดพารามิเตอร์และกฎหลายอย่างก่อนที่ลูกค้าจะได้รับประโยชน์
ในขั้นตอนต่อไป องค์กรจะใช้ระบบ AI เพื่อเพิ่มประสิทธิภาพการให้เหตุผลของมนุษย์ในระดับที่กว้างขวางข้ามโดเมนต่างๆ ในขณะที่ระบบให้คำอธิบายและคำแนะนำที่มีรายละเอียดสำหรับการแก้ไขที่มนุษย์ตรวจสอบและดำเนินการ นี่คือจุดที่องค์กรส่วนใหญ่อยู่ในปัจจุบัน
เมื่อเวลาผ่านไป AI จะสามารถจัดการการทำงานเหตุการณ์เต็มรูปแบบได้อย่างอัตโนมัติสำหรับองค์กร โดยเพียงแต่ยกเลิกไปยังมนุษย์เมื่อจำเป็น เราคาดหวังว่าสิ่งนี้จะถูกเปิดเผยอย่างช้าๆ ตามงานนั้น การเปลี่ยนแปลงนี้คล้ายกับวิธีที่ทีมพัฒนาความไว้วางใจกับพนักงานใหม่ เมื่อคุณมีความมั่นใจมากขึ้น ความร่วมมือก็จะลึกซึ้งยิ่งขึ้น
หลายองค์กรพึ่งพาแพลตฟอร์มการสังเกตการณ์และการจัดการเหตุการณ์ที่มีอยู่แล้ว Ciroos รวมเข้ากับระบบนิเวศที่มีอยู่เหล่านี้ได้อย่างไรโดยไม่ทำให้กระบวนการทำงานถูกรบกวน?
ตั้งแต่ต้น การรวมเข้าด้วยกันไม่เคยเป็นตัวเลือก เราเชื่อว่าโมเดลข้อมูลที่กระจายจะให้เวลาในการใช้งานที่เร็วที่สุด ตัวเลือกมากที่สุด และต้นทุนการเป็นเจ้าของที่ต่ำที่สุด AI SRE Teammate ของ Ciroos รวมเข้ากับระบบองค์กรเจ็ดประเภท — การสังเกตการณ์, การตอบสนองต่อเหตุการณ์, เครื่องมือสื่อสาร, แพลตฟอร์มคลาวด์, ระบบตั๋ว, เครื่องมือ CI/CD และโครงสร้างพื้นฐานทางกายภาพผ่าน API และโพรโทคอลที่เปิดกว้าง เช่น MCP และ A2A มันรวมเข้ากับกระบวนการทำงานที่มีอยู่แทนการบังคับให้ทีมต้องใช้กระบวนการใหม่ การออกแบบนี้ช่วยให้องค์กรมีเวลาในการตอบสนองเร็วขึ้นโดยไม่ต้องเปลี่ยนกระบวนการทำงานที่มีอยู่
คุณเน้นย้ำถึงความหลงใหลในลูกค้าและนวัตกรรมตลอดอาชีพของคุณ ค่านิยมเหล่านี้เป็นแนวทางในการสร้างวัฒนธรรมของ Ciroos และมุมมองระยะยาวในการกำหนดความน่าเชื่อถือของวิศวกรรมใหม่?
การเป็นลูกค้าหลงใหลหมายถึงการมุ่งเน้นอย่างไม่หยุดยั้งในการท้าทายที่แท้จริงที่ทีมปฏิบัติการของลูกค้าเผชิญ เช่น ชั่วโมงทำงานยาว ความเหนื่อยล้า การทำงานที่ไม่จำเป็น และการค้นหาคำตอบสำหรับคำถามที่เกิดขึ้นในการปฏิบัติการ นวัตกรรมคือการแก้ปัญหาเหล่านี้ด้วยวิธีที่มีประสิทธิภาพและคืนเวลาให้กับลูกค้า เราเห็นภาพทีมปฏิบัติการทุกทีมที่มี AI Teammate ที่เรียนรู้อย่างต่อเนื่อง ขยายขนาดตามความต้องการ และช่วยรับรองความน่าเชื่อถือทั่วทั้งระบบ ในระยะยาว เราเห็นระบบบริการ AI ที่กลายเป็นซอฟต์แวร์มาตรฐานทั่วทั้งวงจรการพัฒนาการผลิต — ระบบที่คิด ทำงาน และปรับปรุงร่วมกับเพื่อนร่วมงานมนุษย์ หากเราสามารถให้ผู้ใช้ของเรามีความชัดเจนและพื้นที่หายใจที่พวกเขาต้องการมาโดยตลอด เราก็จะทำหน้าที่ของเราแล้ว ผู้ใช้เหล่านี้อาจเป็น SRE, IT Operations, วิศวกรปฏิบัติการการผลิต, วิศวกรคลาวด์ หรือสมาชิกทีม DevOps ที่ทำงานการผลิต












