ผู้นำทางความคิด
โครงสร้างการตรวจสอบมีความสำคัญมากกว่าโมเดลใน Enterprise AI

ระยะถัดไปของความเป็นมืออาชีพของ AI ในองค์กรขึ้นอยู่กับการสร้างโครงสร้างการตรวจสอบที่เชื่อถือได้รอบๆ โมเดลมากกว่าการพัฒนาโมเดลที่ดีกว่า
ทุกๆ การสนทนาเกี่ยวกับการกำกับดูแล AI ที่ฉันทำในสองปีที่ผ่านมามักจะกลับมาที่ประเด็นเดียวกัน: อัตราการหลอกลวง ความแม่นยำของมาตรฐาน และการตรวจสอบการทำงานร่วมกัน สิ่งเหล่านี้เป็นปัญหาจริงๆ แต่การสนทนาได้ถูกจัดให้อยู่ในจุดที่ผิดของปัญหา
แม้ว่าโมเดลจะมีการปรับปรุงอย่างมาก แต่จำนวนผลลัพธ์ของ AI ที่ไม่ได้รับการตรวจสอบที่ไปถึงผู้นำระดับสูงได้เพิ่มขึ้นตามไปด้วย สิ่งนี้บ่งชี้ถึง ปัญหาโครงสร้างการตรวจสอบ และอุตสาหกรรมยังพูดถึงเรื่องนี้เพียงเล็กน้อย
เรื่องราวที่มีโมเดลเป็นศูนย์กลางได้ล่วงหน้าไปมากกว่าความเป็นจริง
กรอบการทำงานที่โดดเด่นใน Enterprise AI ยังคงถือว่าคุณภาพของโมเดลเป็นตัวแปรหลัก: หากโมเดลมีความแม่นยำเพียงพอ ผลลัพธ์จะน่าเชื่อถือ การให้เหตุผลนี้สามารถเข้าใจได้สองปีที่แล้วเมื่อ LLMs ในช่วงแรกมีความไม่สอดคล้องกันและมีแนวโน้มที่จะหลอกลวงมากกว่า แต่สถานการณ์ได้เปลี่ยนแปลงไปแล้ว
โมเดลในปัจจุบันสร้างผลลัพธ์ที่มีโครงสร้างดี มีการอ้างอิงที่มีคุณภาพ และใช้ภาษาที่พร้อมสำหรับผู้มีส่วนได้ส่วนเสีย องค์กรใช้ AI ในปริมาณที่มากกว่าที่กระบวนการตรวจสอบของพวกเขาสามารถจัดการได้ การวิจัยเกี่ยวกับการนำ AI มาใช้ในองค์กรได้บันทึกความไม่สมดุลนี้ในพัฒนาซอฟต์แวร์ โดยที่ นักพัฒนาที่ได้รับการช่วยเหลือจาก AI สามารถทำงานได้มากขึ้น 21% ในขณะที่เวลาในการตรวจสอบการขอ pull-request เพิ่มขึ้น 91% การผลิตเพิ่มขึ้น ดังนั้นความสามารถจึงไม่ใช่ปัญหาอีกต่อไป ความสามารถในการตรวจสอบ เป็นอุปสรรคที่แท้จริง
สิ่งที่ข้อมูลแสดงให้เห็นในงาน Insights
อุตสาหกรรม Insights เป็นสถานที่ที่ดีในการศึกษาปัญหานี้ เนื่องจากผู้เชี่ยวชาญด้านการวิจัยได้รับการฝึกฝนให้เป็นนักวิจารณ์ที่มีความสงสัย พวกเขารู้ความแตกต่างระหว่างสหสัมพันธ์ การก่อให้เกิดผล การค้นพบ และข้อสรุป การตั้งคำถามถึงคุณภาพของข้อมูลเป็นส่วนหนึ่งของงาน
ตาม Knit AI Trust Index, 92% ของผู้เชี่ยวชาญด้าน Insights ในองค์กรมeld ที่ AI-ผลลัพธ์ไปถึงผู้นำระดับสูงโดยไม่มีการตรวจสอบอย่างครอบคลุม
ผลการวิจัยของ Trust Index ระบุจุดกดดันสามจุดหลัก:
- ปริมาณได้ล่วงหน้าความสามารถในการตรวจสอบ ทีมสร้างผลลัพธ์มากกว่าที่พวกเขามีแบนด์วิธในการตรวจสอบอย่างละเอียด
- ความมั่นใจได้เพิ่มขึ้นเร็วกว่าการเปลี่ยนแปลงพฤติกรรมในการตรวจสอบ นักวิจัยรู้สึกดีเกี่ยวกับคุณภาพของ AI ในขณะที่ยอมรับว่าการปฏิบัติในการตรวจสอบของพวกเขายังไม่สอดคล้องกัน
- เครื่องมือสำหรับการตรวจสอบงาน AI ตกหลังเครื่องมือสำหรับการผลิต องค์กรมีการลงทุนอย่างมากในการสร้างความสามารถ แต่ลงทุนน้อยกว่าในการสร้างโครงสร้างพื้นฐานสำหรับการตรวจสอบและติดตามสิ่งที่ AI สร้างขึ้น
ผลลัพธ์ที่มีการจัดรูปแบบดีเชิญชวนให้มีการตรวจสอบน้อยลง
รูปแบบการล้มเหลวที่ยากกว่าคือกรณีที่ AI สร้างคำตอบที่ผิดชัดเจนและ有人จับได้ ปัญหาที่ยากกว่าคือความลำเอียงของการทำให้自动, ความโน้มนากที่จะลดการตรวจสอบผลลัพธ์ที่ดูเหมือนมีอำนาจและจัดรูปแบบอย่างดี การศึกษาที่เป็นระบบในปี 2025 ที่เผยแพร่ใน AI & Society ตรวจสอบสิ่งนี้ใน 35 การศึกษาที่ได้รับการตรวจสอบโดยผู้ทรงคุณวุฒิและพบว่าผลลัพธ์ของ AI ที่มีการจัดรูปแบบดีและความมั่นใจสูงลดความลึกของการตรวจสอบของมนุษย์อย่างต่อเนื่อง — แม้แต่ในหมู่ผู้เชี่ยวชาญที่มีประสบการณ์ เมื่อสิ่งใดดูเหมือนถูกต้อง เราจะจัดสรรความสนใจน้อยลงในการตรวจสอบว่ามันถูกต้องหรือไม่
สิ่งนี้สร้างปัญหาในการแพร่กระจาย ผลลัพธ์ของการวิจัยที่นักวิเคราะห์ตรวจสอบอย่างเบาๆ จะกลายเป็นจุดข้อมูลในแผนการนำเสนอของ VP ซึ่งกลายเป็นฐานของการอภิปรายในระดับคณะกรรมการ โดยเวลาที่ข้อผิดพลาดเดินทางไปถึงจุดนั้น ต้นกำเนิดของมันจะหายไปและการแก้ไขมันจะแพง การสูญเสียทางธุรกิจทั่วโลกจากข้อผิดพลาดที่สร้างโดย AI มีมูลค่ามากกว่า 67 พันล้านดอลลาร์สหรัฐฯ ในปี 2024 ค่าใช้จ่ายในการตรวจสอบต่อพนักงานสามารถสูงถึง 14,200 ดอลลาร์สหรัฐฯ ต่อปี เพียงเพื่อตรวจสอบว่าเนื้อหาที่สร้างโดย AI นั้นถูกต้องหรือไม่ อีกครั้ง สิ่งเหล่านี้ไม่ใช่ปัญหาเกี่ยวกับคุณภาพของโมเดล แต่เป็นปัญหาเกี่ยวกับโครงสร้างการตรวจสอบ
สิ่งที่กระบวนการทำงาน AI ที่มีความเป็นมืออาชีพจริงๆ ดูเหมือน
องค์กรที่จัดการปัญหานี้ได้ดีไม่ได้ใช้โมเดลที่ดีกว่าใครๆ แต่พวกเขาสร้างโครงสร้างการตรวจสอบที่ครอบคลุมมากขึ้นรอบๆ โมเดลที่พวกเขาใช้ สี่หลักการกำหนดแนวทางของพวกเขา:
-
การตรวจสอบที่มีแหล่งที่มาอย่างชัดเจน
ทุกๆ ผลลัพธ์ของ AI มีบันทึกที่ชัดเจนของที่มาของข้อมูลเข้า บันทึกนี้ให้ข้อมูลที่มีคุณค่าแก่ผู้ตรวจสอบในการประเมินผลลัพธ์เหล่านั้นอย่างมีประสิทธิภาพ คุณไม่สามารถประเมินข้อเรียกร้องที่ไม่สามารถติดตามได้
-
การตรวจสอบแบบ分层ตามความเสี่ยง
ผลลัพธ์ของ AI ไม่ได้มีความเสี่ยงเท่ากัน กระบวนการทำงานที่มีความเป็นมืออาชีพใช้ความเข้มข้นในการตรวจสอบตามผลที่ตามมาของการทำผิดพลาด ผลลัพธ์ที่มีความเสี่ยงสูงจะได้รับการตรวจสอบอย่างเข้มข้นและขั้นตอนการตรวจสอบที่มีโครงสร้าง
-
การสร้างความต้านทานในจุดที่เหมาะสม
องค์กรที่ต่อสู้กับปัญหา AI ที่มีความน่าเชื่อถือมากที่สุดได้ลบการสร้างความต้านทานออกไปอย่างสม่ำเสมอ โดยมองว่าความเร็วเป็นเป้าหมายสากล องค์กรที่ประสบความสำเร็จได้เลือกที่จะรักษาความต้านทานที่ตั้งใจไว้ที่จุดที่ AI ผลลัพธ์กลายเป็นการตัดสินใจขององค์กร กระบวนการของพวกเขากำหนดให้ต้องมีการอนุมัติก่อนที่ผลลัพธ์ของ AI จะเข้าสู่แผนการนำเสนอของคณะกรรมการหรือมีขั้นตอนการตรวจสอบที่มีโครงสร้างก่อนที่จะเข้าสู่การอภิปรายเชิงกลยุทธ์
-
วงจรป้อนกลับไปยังชั้นโมเดล
กระบวนการทำงานที่ดีที่สุดมองการตรวจสอบเป็นกระบวนการที่สร้างข้อมูล ไม่ใช่จุดตรวจสอบ เมื่อผู้ตรวจสอบระบุข้อผิดพลาดหรือย้อนกลับคำแนะนำของ AI สัญญาณนั้นจะถูกจับและป้อนกลับไปยังวิธีการใช้ AI ในงานในอนาคต รายงาน State of Enterprise AI ของ OpenAI พบว่าองค์กรที่มีประสิทธิภาพสูงสุดมีความแตกต่างไม่ใช่ความซับซ้อนของโมเดล แต่ความเข้มงวดของกระบวนการนำไปใช้ องค์กรที่ไม่มีวงจรป้อนกลับนี้เริ่มต้นจากจุดศูนย์ในการทำงานทุกครั้ง
ระยะถัดไปจะชนะที่ชั้นการตรวจสอบ
ความได้เปรียบทางการแข่งขันที่แท้จริงในอุตสาหกรรม Insights คือใครที่สามารถเชื่อถือสิ่งที่พวกเขาสร้างได้อย่างต่อเนื่อง ความเชื่อมั่นนี้มาจากความรู้ว่าผลลัพธ์มาจากไหน ใครตรวจสอบมัน และเกิดอะไรขึ้นเมื่อมีอะไรผิดพลาด ประวัติศาสตร์เมื่อเร็วๆ นี้ได้คำตอบสำหรับคำถามเกี่ยวกับโมเดลแล้ว โครงสร้างพื้นฐานขององค์กรสำหรับการใช้โมเดลอย่างรับผิดชอบในขนาดใหญ่คือจุดที่อุตสาหกรรมยังคงตามทัน
สิ่งที่ 92% ของผู้เชี่ยวชาญด้าน Insights มองเห็นเนื้อหาที่สร้างโดย AI ที่ไปถึงผู้นำระดับสูงโดยไม่มีการตรวจสอบอย่างครอบคลุมไม่ใช่ความล้มเหลวของเทคโนโลยี มันเป็นความล้มเหลวของการออกแบบองค์กร และมันปรากฏขึ้น ในอุตสาหกรรมทุกแห่งที่ความเร็วถูกเพิ่มประสิทธิภาพและกระบวนการตรวจสอบถูกมองว่าเป็นต้นทุน องค์กรที่มีโมเดลที่ฉลาดที่สุดจะไม่ชนะในระยะถัดไปของ Enterprise AI แต่องค์กรที่มีโครงสร้างการตรวจสอบที่น่าเชื่อถือที่สุดรอบๆ โมเดลจะเป็นผู้ชนะ












