สัมภาษณ์
โรนัค เดซาไอ ผู้ก่อตั้งและซีอีโอของ Ciroos – ซีรีส์สัมภาษณ์

โรนัค เดซาไอ ผู้ก่อตั้งและซีอีโอของ Ciroos นำบริษัทด้วยภารกิจที่ชัดเจนในการกำจัดงานที่ไม่จำเป็นในด้านไอที และให้เวลากลับไปแก่ทีม SRE, DevOps และวิศวกรปฏิบัติการ เขามีความเชื่อมั่นอย่างลึกซึ้งว่า AI ควรเสริมสร้างความเชี่ยวชาญของมนุษย์มากกว่าการแทนที่ โดยเฉพาะใน môi trườngปฏิบัติการที่มีความเสี่ยงสูง ก่อนที่จะก่อตั้ง Ciroos เดซาไอใช้เวลาเกิน 20 ปีที่ Cisco โดยดำรงตำแหน่งผู้นำระดับสูงหลายตำแหน่ง รวมถึงรองประธานอาวุโสและผู้จัดการทั่วไปของ Cisco Full-Stack Observability และ AppDynamics ในทั้งอาชีพการงานของเขา เขามุ่งเน้นในการสร้างแพลตฟอร์มที่มีลูกค้าเป็นศูนย์กลางและสามารถขยายได้ ถือสิทธิบัตรมากกว่า 50 รายการซึ่งใช้งานอยู่ในปัจจุบัน และยึดมั่นในหลักการของนวัตกรรมและความหลงใหลในลูกค้าที่ชี้นำการทำงานของเขา tại Cisco
Ciroos กำลังสร้าง AI ที่เป็นเพื่อนร่วมงาน SRE ที่ออกแบบมาเพื่อลดเวลาในการสืบสวนและแก้ไขเหตุการณ์ IT ที่ซับซ้อนใน môi trườngหลายโดเมนสมัยใหม่ แพลตฟอร์มนี้ใช้ AI ที่มีหลายตัวแทนในการให้เหตุผลข้ามสัญญาณ การสืบสวนแบบอัตโนมัติ และการสนับสนุนการทำงานอัตโนมัติ การเพิ่มประสิทธิภาพ และการทำงานอัตโนมัติ – ในขณะเดียวกันก็รับประกันว่ามนุษย์ยังคงอยู่ในการควบคุม โดยการเชื่อมโยงระหว่างข้อมูลจากเครื่องมือและโดเมนที่แยกจากกัน Ciroos ช่วยให้ทีมสามารถเปลี่ยนจากการดับเพลิงแบบตอบสนองไปสู่การตัดสินใจที่รวดเร็วและมั่นใจมากขึ้น ทำให้วิศวกรสามารถมุ่งเน้นไปที่งานที่มีผลกระทบสูงมากกว่าการทำงานที่ซ้ำซากและเหนื่อยล้า
คุณใช้เวลาเกินสองทศวรรษที่ Cisco ช่วยสร้างผลิตภัณฑ์เครือข่ายและผลิตภัณฑ์ Observability ที่ประสบความสำเร็จมากที่สุด คุณได้รับแรงบันดาลใจอะไรในการตัดสินใจก่อตั้ง Ciroos?
ตลอดการโต้ตอบกับทีมองค์กรต่างๆ ฉันเห็นเรื่องราวเดียวกันซ้ำๆ ทีมปฏิบัติการถูกท่วมด้วยแดชบอร์ด การแจ้งเตือน และพึ่งพาความรู้เชิงสถาบันในการแก้ไขปัญหาในระบบต่างๆ แม้ว่าจะมีการใช้จ่ายทุนจำนวนมากกับ Observability แต่ก็ยังคงไม่มีทางเชื่อมโยงหลักฐานข้ามโดเมนในเวลาจริง ผู้ร่วมก่อตั้งและฉันต้องการเปลี่ยนแปลงสิ่งนี้ เราตั้งเป้าหมายในการสร้างระบบ AI ที่สามารถให้เหตุผลเหมือนผู้ปฏิบัติการที่มีประสบการณ์ และทำงานร่วมกับ SRE ตั้งแต่เริ่มต้น เพื่อให้ทีมสามารถมุ่งเน้นไปที่การปรับปรุงความทนทานและความน่าเชื่อถือมากกว่าการใช้เวลาค้นหาข้อมูลหรือต่อสู้กับปัญหา
คุณได้อธิบาย Ciroos ว่าเป็นการตอบสนองต่อหนึ่งในปัญหาที่ยากที่สุดในการปฏิบัติการ – การสืบสวนที่ครอบคลุมหลายโดเมน การใช้ประสบการณ์ของคุณในการนำ AppDynamics และ Full-Stack Observability ที่ Cisco ชี้นำการออกแบบ Ciroos อย่างไร?
ที่ AppDynamics เราได้รับข้อมูลเชิงลึกเกี่ยวกับพฤติกรรมของแอปพลิเคชันในระดับสูง อย่างไรก็ตาม เมื่อเหตุการณ์เกิดขึ้นนอกแอปพลิเคชัน (ไม่ว่าจะเป็นการกำหนดค่าคลาวด์ การทำงานเครือข่าย หรือ IAM) การมองเห็นเพียงในระดับแอปพลิเคชันเพียงอย่างเดียวไม่เพียงพอ ความท้าทายอยู่ที่การสร้างบริบท ประสบการณ์นี้ชี้นำการออกแบบ Ciroos ของเรา แพลตฟอร์มของเรานำการให้เหตุผลของ AI มาสู่การปฏิบัติการการผลิต มันตรวจสอบสัญญาณข้ามโดเมน จัดเรียงเหตุการณ์ตามเส้นเวลาเดียวกัน และให้เหตุผลข้ามขอบเขตโดเมนเพื่อกำหนดสาเหตุแท้จริงของเหตุการณ์
Ciroos นำเสนอแนวคิดของ “AI SRE Teammate” แนวคิดนี้ของ AI ในฐานะผู้ร่วมงานแตกต่างจากเครื่องมืออัตโนมัติหรือ Observability แบบดั้งเดิมอย่างไร?
AI SRE Teammate ทำงานเหมือนเพื่อนร่วมงานใหม่มากกว่าเครื่องมือใหม่ มันฟังอย่างแรก เข้าใจสภาพแวดล้อม รับงานที่กำหนดไว้ และสร้างความไว้วางใจเมื่อเวลาผ่านไป ในขณะที่การอัตโนมัติแบบดั้งเดิมจะดำเนินการตามกฎ AI Teammate นี้ใช้การให้เหตุผล เมื่อมันระบุปัญหา มันเลือกตัวแทนโดเมนที่เกี่ยวข้องเพื่อขอข้อมูล รวบรวมหลักฐานที่เกี่ยวข้อง และนำเสนอในบริบทที่เหมาะสม ส่วนประกอบการทำงานร่วมกันนี้ช่วยให้วิศวกรมีเวลาในการตรวจสอบและแก้ปัญหาแทนการหาความสัมพันธ์โดยอัตโนมัติ
แพลตฟอร์มของคุณใช้การให้เหตุผลของ AI ที่มีหลายตัวแทน อธิบายว่าตัวแทน AI หลายตัวทำงานร่วมกันเพื่อเร่งการวิเคราะห์สาเหตุและปรับปรุงความแม่นยำในระบบที่ซับซ้อนอย่างไร?
แต่ละตัวแทนจะมีความเชี่ยวชาญในโดเมน – ตัวหนึ่งใน Kubernetes, อีกตัวหนึ่งในคลาวด์, อีกตัวหนึ่งในเครือข่าย และอื่นๆ เมื่อเหตุการณ์เกิดขึ้น ตัวแทนเหล่านี้ทำงานร่วมกันเป็นส่วนหนึ่งของชั้นการให้เหตุผลที่จัดกลุ่มผลลัพธ์แบบเรียลไทม์ ระบบกำหนดตัวแทนไหนที่จะเรียกใช้, งานไหนที่จะกำหนดให้ตัวแทนแต่ละตัว, ในลำดับไหน, และนานแค่ไหน การประสานงานนี้ลดเวลาในการสืบสวนและปรับปรุงความแม่นยำโดยการรับรองว่าทุกชั้นถูกประเมินในบริบทมากกว่าในซิลโล
จากมุมมองทางเทคนิค Ciroos ใช้เหตุผลข้ามแหล่งข้อมูลที่แตกต่างกัน เช่น ข้อมูลที่มาจากคลาวด์ การบันทึกของแอปพลิเคชัน และเมตริกของโครงสร้างพื้นฐาน – โดยไม่ทำให้ผู้ใช้เสียสมาธิด้วยสัญญาณรบกวนอย่างไร?
Ciroos พิจารณาแหล่งข้อมูลทุกแหล่งข้อมูลเป็นเลนส์เดียวในภาพที่ใหญ่กว่า มันจัดเรียงการสังเกตข้ามแหล่งข้อมูลตามเส้นเวลาที่เป็นเอกลักษณ์ และนำเสนอความสัมพันธ์เชิงสาเหตุเท่านั้น ตัวอย่างเช่น หากเหตุการณ์การรีสตาร์ทของพอดเกิดขึ้นหลังจากการเปลี่ยนแปลงเล็กน้อยใน IAM หรือนโยบายเครือข่าย Ciroos จะเชื่อมโยงลำดับเหตุการณ์นั้นโดยอัตโนมัติ มันไปไกลกว่าการให้แดชบอร์ดแบบดั้งเดิมและประกอบเรื่องราวที่สมบูรณ์ตามหลักฐานที่ช่วยให้วิศวกรเข้าใจว่าเหตุการณ์เกิดขึ้นได้อย่างไร
ความไว้วางใจและความสามารถในการอธิบายเป็นศูนย์กลางของปรัชญาการออกแบบของคุณ คุณรับรองว่าคำแนะนำที่ขับเคลื่อนด้วย AI ยังคงโปร่งใสและวิศวกรมนุษย์ยังคงอยู่ในการควบคุมอย่างไร?
คำแนะนำทุกข้อมาพร้อมกับหลักฐานที่สนับสนุนและเหตุผลที่นำไปสู่มัน วิศวกรสามารถติดตามข้อสรุปทุกข้อ ตรวจสอบสมมติฐานของตน และจัดการระดับอัตโนมัติของระบบ ตั้งแต่การช่วยเหลือไปจนถึงการทำงานอัตโนมัติแบบกึ่งอิสระ ระบบจะรักษาความรู้เชิงบริบทตามเวลาผ่านการให้ข้อมูลโดยมนุษย์ ช่วยให้สามารถปรับปรุงคุณภาพการตัดสินใจในขณะเดียวกันก็ยังคงอยู่ภายใต้การกำกับดูแลอย่างเต็มที่ วิธีการของเรานี้คล้ายกับวิธีที่ทีมจะรับพนักงานใหม่ โดยมีเครื่องมือชี้นำที่ชัดเจน การให้เหตุผลโดยตรง และการกำกับดูแลของมนุษย์อย่างเต็มที่ ความไว้วางใจจะเติบโตเมื่อระบบแสดงการทำงานที่เชื่อถือได้มากขึ้นเมื่อเวลาผ่านไป
ผู้ใช้ในช่วงแรกรายงานว่า Ciroos ลดเวลาในการสืบสวนจากชั่วโมงเหลือเป็นนาที รูปแบบหรือข้อมูลเชิงลึกใดที่ทำให้คุณประหลาดใจมากที่สุดเมื่อทีมเริ่มใช้ AI SRE Teammate ในการผลิต?
มีสิ่งที่น่าพอใจสองประการ – ประการแรก ความเร็วที่องค์กรขนาดใหญ่ตอบรับข้อเสนอคุณค่าหลักของเรานั้นเป็นเรื่องที่น่าประทับใจ ประการที่สอง ลูกค้าของเรามองหาสิ่งใหม่ๆ ในเทคโนโลยีของเราและพบกรณีการใช้งานที่ไม่เหมือนใครซึ่งไปไกลกว่าการวิเคราะห์สาเหตุของเหตุการณ์ กรณีการใช้งานเหล่านี้เน้นถึงความท้าทายที่แท้จริงที่องค์กรขนาดใหญ่ต้องเผชิญในปัจจุบันในการดำเนินงานการผลิต
คำว่า “AI เป็นเพื่อนร่วมงาน” หมายถึงการทำงานร่วมกันมากกว่าการแทนที่ คุณเห็นแนวคิดนี้วิวัฒนาการอย่างไรเมื่อองค์กรเติบโตและทำงานร่วมกับระบบอัจฉริยะมากขึ้น?
เรามองว่านี่เป็นกระบวนการที่เกี่ยวข้องกับการอัตโนมัติ การเพิ่มประสิทธิภาพ และในที่สุดก็เป็นอัตโนมัติ แม้ว่า Ciroos จะรองรับทั้งสามโหมดในปัจจุบัน แต่โดยทั่วไปแล้วเราจะเห็นการนำ AI ขององค์กรมาใช้ตามเส้นโค้งของความต้องการ ในขั้นตอนแรก องค์กรใช้ระบบ AI ของเราเพื่อทำงานอัตโนมัติสำหรับงานที่กำหนดและซ้ำซาก ในขณะที่ลดภาระการทำงานของมนุษย์ให้เหลือน้อยที่สุด ในทางกลับกัน ระบบที่ไม่ใช่ AI ที่ไม่ใช่ AI ส่วนใหญ่ทำให้ผู้ดำเนินการมนุษย์ต้องกำหนดพารามิเตอร์และกฎหลายอย่างมาก่อนที่ลูกค้าจะได้รับประโยชน์
ในขั้นตอนถัดไป องค์กรใช้ระบบ AI เพื่อเพิ่มประสิทธิภาพการให้เหตุผลของมนุษย์ในระดับที่สูงขึ้นข้ามโดเมนหลายโดเมน ในขณะเดียวกันก็ให้คำอธิบายและคำแนะนำที่ละเอียดสำหรับการแก้ไขที่มนุษย์ตรวจสอบและดำเนินการ สิ่งนี้เป็นจุดที่องค์กรส่วนใหญ่อยู่ในปัจจุบัน
เมื่อเวลาผ่านไป ระบบ AI สามารถจัดการการทำงานของเหตุการณ์โดยอัตโนมัติสำหรับองค์กรได้ โดยเพียงแต่ยกเลิกไปยังมนุษย์เมื่อจำเป็น เราคาดหวังว่าสิ่งนี้จะถูกเปิดเผยอย่างค่อยเป็นค่อยไปตามงานที่ทำ การพัฒนานี้คล้ายกับวิธีที่ทีมสร้างความไว้วางใจกับพนักงานใหม่ เมื่อคุณมั่นใจมากขึ้น ความร่วมมือก็จะลึกซึ้งยิ่งขึ้น
หลายองค์กรพึ่งพาแพลตฟอร์ม Observability และการจัดการเหตุการณ์ที่มีอยู่แล้ว Ciroos รวมเข้ากับระบบนิเวศเหล่านี้โดยไม่หยุดชะงักการทำงานอย่างไร?
ตั้งแต่เริ่มต้น การรวมระบบไม่เคยเป็นตัวเลือก เราเชื่อว่าโมเดลข้อมูลแบบสหพันธรัฐให้เวลาในการตอบสนองที่เร็วที่สุด ตัวเลือกที่ดีที่สุด และต้นทุนการเป็นเจ้าของที่ต่ำที่สุด Ciroos AI SRE Teammate รวมเข้ากับระบบองค์กรเจ็ดประเภท – Observability, การตอบสนองต่อเหตุการณ์, เครื่องมือร่วมมือ, แพลตฟอร์มคลาวด์, ระบบตั๋ว, เครื่องมือ CI/CD และโครงสร้างพื้นฐานทางกายภาพผ่าน API และโพรโทคอลที่เปิดกว้าง เช่น MCP และ A2A มันรวมเข้ากับกระบวนการทำงานที่มีอยู่แทนการบังคับให้ทีมใช้กระบวนการใหม่ การออกแบบนี้ช่วยให้องค์กรนำไปใช้ได้ง่าย ทีมจะได้รับคำตอบที่รวดเร็วโดยไม่ต้องเปลี่ยนกระบวนการทำงานที่มีอยู่
คุณเน้นย้ำถึงความหลงใหลในลูกค้าและนวัตกรรมตลอดอาชีพการงานของคุณ ค่านิยมเหล่านี้ชี้นำวัฒนธรรมของ Ciroos และวิสัยทัศน์ระยะยาวในการกำหนดความน่าเชื่อถือใหม่อย่างไร?
การหลงใหลในลูกค้าหมายถึงการมุ่งเน้นอย่างไม่หยุดยั้งในความท้าทายที่แท้จริงที่ทีมปฏิบัติการของลูกค้าเผชิญ เช่น ชั่วโมงทำงานที่ยาวนาน ความเหนื่อยล้า การทำงานที่ไม่จำเป็น และการค้นหาคำตอบสำหรับคำถามที่เกิดขึ้นในการปฏิบัติการ นวัตกรรมคือการแก้ปัญหาเหล่านี้ด้วยวิธีที่มีผลกระทบต่อการคืนเวลาและโฟกัสให้กับลูกค้า เราเห็นภาพทีมปฏิบัติการทุกทีมที่มี AI ที่เรียนรู้อย่างต่อเนื่อง ขยายได้ และช่วยรับรองความน่าเชื่อถือทั่วทั้งระบบ ในระยะยาว เราเห็น AI ในฐานะซอฟต์แวร์ที่จะกลายเป็นมาตรฐานทั่วทั้งวงจรการพัฒนาไปจนถึงการปฏิบัติการ – ระบบที่คิด ทำงาน และปรับปรุงร่วมกับเพื่อนร่วมงานของมนุษย์ หากเราสามารถให้ผู้ใช้ของเรามีความชัดเจนและพื้นที่หายใจที่พวกเขาต้องการมาเสมอ เราก็จะทำงานให้สำเร็จ ผู้ใช้เหล่านี้อาจเป็น SRE, ทีมปฏิบัติการไอที, วิศวกรปฏิบัติการการผลิต, วิศวกรปฏิบัติการคลาวด์ หรือสมาชิกทีม DevOps ที่ปฏิบัติงานการผลิต












