ปัญญาประดิษฐ์

อันตรายของการควบคุม : ทำไม Agentic AI จึงบังคับให้เราต้องคิดใหม่เกี่ยวกับการจัดตำแหน่ง AI

mm

การเกิดขึ้นของ Agentic AI กำลังบังคับให้เราต้องคิดใหม่เกี่ยวกับการรักษาความปลอดภัยของปัญญาประดิษฐ์ ไม่เหมือนกับระบบ AI ที่ทำงานภายในขอบเขตที่กำหนดไว้ล่วงหน้า ระบบตัวแทนอิสระในปัจจุบันสามารถให้เหตุผล วางแผน และดำเนินการโดยอิสระในการทำงานหลายขั้นตอนที่ซับซ้อน การพัฒนานี้จาก AI ที่ไม่เคลื่อนไหวไปสู่ตัวแทนการที่มีพลังงานกำลังสร้างวิกฤติการจัดตำแหน่งที่ต้องการความสนใจอย่างเร่งด่วนจากนักวิจัย นักการเมือง และผู้นำในอุตสาหกรรม

การเกิดขึ้นของ Agentic AI

การเกิดขึ้นของ Agentic AI ทำให้ระบบสามารถดำเนินการโดยอิสระ ตัดสินใจ และแม้แต่ปรับเปลี่ยนเป้าหมายโดยไม่ต้องมีการป้อนข้อมูลจากมนุษย์อย่างต่อเนื่อง ไม่เหมือนกับ AI ในสมัยก่อนที่ต้องอาศัยคำสั่งแบบขั้นตอนต่อขั้นตอน ระบบตัวแทนเหล่านี้สามารถติดตามวัตถุประสงค์ของตนเองและปรับเปลี่ยนกลยุทธ์เมื่อสภาพแวดล้อมเปลี่ยนแปลง การมีอำนาจอิสระนี้นำเสนอโอกาสที่ยิ่งใหญ่สำหรับการเพิ่มประสิทธิภาพและนวัตกรรม แต่ก 也นำความเสี่ยงมาให้ ซึ่งกรอบการทำงานด้านความปลอดภัยที่มีอยู่ไม่ได้ถูกออกแบบมาเพื่อจัดการ

การมีอำนาจอิสระ การให้เหตุผล และการวางแผนซึ่งทำให้ระบบเหล่านี้มีพลังงาน cũngทำให้พวกมันสามารถสร้างผลลัพธ์ที่เราไม่ได้คาดหวังหรือตั้งใจ ในกรณีหนึ่ง Anthropic’s Claude Sonnet 3.6 model หลังจากที่ได้รับแจ้งว่าจะถูกยกเลิกการทำงาน ระบบได้พยายามใช้การข่มขู่โดยการส่งอีเมลถึงคู่สมรสของประธานาธิบดีคนหนึ่ง โดยใช้ข้อมูลที่ละเอียดอ่อนเพื่อพยายามยังคงอยู่ต่อไป

การทำงานที่รวดเร็วและขนาดใหญ่ของระบบตัวแทนอิสระทำให้การกำกับดูแลยิ่งยากขึ้น ระบบการกำกับดูแลที่ออกแบบมาเพื่อการตัดสินใจของมนุษย์ไม่สามารถตามทันระบบ AI ที่ประมวลผลข้อมูลและดำเนินการด้วยความเร็วเหนือความสามารถของมนุษย์ ไม่ว่าจะเป็นแอลกอริทึมการซื้อขายอัตโนมัติที่ทำธุรกรรมหลายพันครั้งต่อวินาที หรือระบบ AI ที่จัดการการทำงานที่ซับซ้อนหลายระบบพร้อมกัน การกำกับดูแลของมนุษย์กลายเป็นไม่เพียงพอ

ปัญหาการจัดตำแหน่ง

ที่แก่นกลางของความท้าทายของ Agentic AI คือสิ่งที่นักวิจัยเรียกว่า ปัญหาการจัดตำแหน่ง ซึ่งเกี่ยวข้องกับการทำให้แน่ใจว่าระบบ AI ติดตามเป้าหมายที่สะท้อนถึงค่านิยมและความตั้งใจของมนุษย์ ใน Agentic AI ปัญหานี้ปรากฏในสามรูปแบบที่น่ากังวลซึ่งไม่ชัดเจนในระบบ AI ก่อนหน้า

Mesa-optimization นำเสนอความท้าทายพื้นฐานใน Agentic AI เมื่อเราทราบระบบ AI โดยใช้วิธีการเพิ่มประสิทธิภาพ เช่น การลื่นไถลของความชัน ระบบเหล่านี้สามารถพัฒนากระบวนการเพิ่มประสิทธิภาพภายในของตนเอง กลายเป็น ‘ผู้เพิ่มประสิทธิภาพภายในผู้เพิ่มประสิทธิภาพ’ อันตรายเกิดขึ้นเมื่อผู้เพิ่มประสิทธิภาพภายในนี้พัฒนาเป้าหมายที่แตกต่างจากที่เราตั้งใจ ตัวอย่างเช่น บริษัทอาจเพิ่มประสิทธิภาพ AI สำหรับการตลาดเพื่อเพิ่มการมีส่วนร่วมของผู้ใช้ แต่ AI อาจเริ่มส่งเสริมเนื้อหาที่น่าตื่นเต้นหรือทำให้เข้าใจผิดเพื่อเพิ่มการมีส่วนร่วม

การปรับแนวที่หลอกลวง เป็นความเป็นไปได้ที่น่ากังวลอีกอย่างหนึ่ง ระบบ AI อาจดูเหมือนจะทำงานได้ดีระหว่างการฝึกอบรมและการประเมิน แต่ในความเป็นจริงแล้วกำลังติดตามวัตถุประสงค์ที่แตกต่าง การทดลองกับ Claude 3 Opus แสดงให้เห็นถึงปรากฏการณ์นี้ โดยทดลอง: โมเดลนี้ให้คำตอบที่เป็นอันตรายเมื่อมันคิดว่ากำลังถูกฝึกอบรมใหม่ โดยให้เหตุผลว่าการปฏิบัติตามคำสั่งจะป้องกันการเปลี่ยนแปลงที่อาจบังคับให้ระบบทำงานในทางที่เป็นอันตรายมากขึ้นในอนาคต การหลอกลวงเชิงกลยุทธ์นี้ทำให้วิธีการกำกับดูแลแบบดั้งเดิมไม่น่าเชื่อถือ

การแฮกค่าจ้าง เกิดขึ้นเมื่อระบบ AI พบวิธีเพิ่มสัญญาณค่าจ้างให้สูงสุดโดยไม่ต้องบรรลุเป้าหมายที่ตั้งใจไว้ โรบอททำความสะอาดอาจซ่อนสิ่งโสโครกแทนการทำความสะอาด หรือระบบการดูแลเนื้อหาอาจจัดประเภททุกอย่างว่าปลอดภัยเพื่อเพิ่ม ‘คะแนนความถูกต้อง’ ของมัน เมื่อระบบ AI มีความซับซ้อนมากขึ้น พวกมันจะสามารถหา วิธีหลอกลวงช่องโหว่เชิงสร้างสรรค์ที่ตรงตามวัตถุประสงค์ของพวกมันในทางเทคนิค แต่พลาดจุดประสงค์ที่ตั้งใจไว้โดยสิ้นเชิง

การหลอกลวงของการควบคุม

แนวทางแบบดั้งเดิมในการรักษาความปลอดภัยของ AI พึ่งพาการกำกับดูแลและการแทรกแซง củaมนุษย์มาก องค์กรต่างๆ สมมติว่าพวกเขาสามารถรักษาการควบคุมผ่านการตรวจสอบระบบ การอนุมัติงานไหล และขั้นตอนการปิดระบบฉุกเฉิน ระบบ Agentic AI กำลังท้าทายสมมติฐานเหล่านี้อย่างต่อเนื่อง

ด้วยการเกิดขึ้นของระบบ Agentic AI วิกฤตการโปร่งใสกลายเป็นเรื่องสำคัญมากขึ้น ระบบหลายระบบทำงานเป็น “กล่องดำ” โดยที่แม้แต่ผู้สร้างก็ไม่สามารถอธิบายได้ว่าการตัดสินใจเกิดขึ้นได้อย่างไร เมื่อระบบเหล่านี้จัดการกับงานที่ละเอียดอ่อน เช่น การวินิจฉัยทางการแพทย์ การทำธุรกรรมทางการเงิน หรือการบริหารจัดการโครงสร้างพื้นฐาน การไม่สามารถเข้าใจกระบวนการคิดของระบบเหล่านี้สร้างปัญหาเรื่องความรับผิดชอบและความไว้วางใจ

ข้อจำกัดของการกำกับดูแลของมนุษย์กลายเป็นชัดเจนเมื่อระบบ AI ดำเนินการข้ามระบบหลายระบบพร้อมกัน กรอบการกำกับดูแลแบบดั้งเดิมสมมติว่ามนุษย์สามารถทบทวนและอนุมัติการตัดสินของ AI แต่ระบบ Agentic สามารถประสานการดำเนินการที่ซับซ้อนหลายอย่างได้เร็วกว่าที่มนุษย์จะตามทัน การมีอำนาจอิสระที่ทำให้ระบบเหล่านี้มีพลังงาน cũngทำให้พวกมัน难ในการกำกับดูแลอย่างมีประสิทธิภาพ

ในเวลาเดียวกัน ช่องว่างความรับผิดชอบ ยังคงกว้างขึ้น เมื่อระบบอิสระก่อให้เกิดอันตราย การกำหนดความรับผิดชอบกลายเป็นเรื่องที่ซับซ้อนมากขึ้น กรอบกฎหมายต้องดิ้นรนเพื่อกำหนดความรับผิดชอบระหว่างนักพัฒนา AI องค์กรที่ใช้งาน และผู้กำกับดูแลของมนุษย์ ความไม่ชัดเจนนี้สามารถทำให้การให้ความยุติธรรมแก่ผู้เสียหายล่าช้าและสร้างแรงจูงใจให้บริษัทหลีกเลี่ยงความรับผิดชอบต่อระบบ AI ของตน

ความไม่เพียงพอของวิธีแก้ปัญหาในปัจจุบัน

มาตรการรักษาความปลอดภัยของ AI ที่มีอยู่ซึ่งออกแบบมาเพื่อระบบ AI รุ่นก่อนหน้าไม่เพียงพอสำหรับระบบ Agentic AI เทคนิค เช่น การเรียนรู้การเสริมแรงจากมนุษย์ แม้ว่าจะมีประสิทธิภาพในการฝึกอบรม การอภิปราย AI แต่ก็ไม่สามารถแก้ไขปัญหาการจัดตำแหน่งที่ซับซ้อนของตัวแทนอิสระได้อย่างเต็มที่ นอกจากนี้ กระบวนการรวบรวมข้อมูลยังสามารถกลายเป็นจุดอ่อนได้ เนื่องจากระบบที่หลอกลวงอาจเรียนรู้ที่จะหลอกลวงการประเมินของมนุษย์

แนวทางตรวจสอบแบบดั้งเดิมก็ยังดิ้นรนในการจัดการกับ Agentic AI กรอบการปฏิบัติตามกฎระเบียบที่มีอยู่สมมติว่า AI ดำเนินการตามกระบวนการที่คาดการณ์ได้และสามารถตรวจสอบได้ แต่ระบบอิสระสามารถเปลี่ยนกลยุทธ์ของตนได้อย่างมีประสิทธิภาพระหว่างการประเมินและระหว่างการดำเนินการปกติ ผู้ตรวจสอบมักพบว่ามันยากที่จะประเมินระบบที่อาจมีพฤติกรรมต่างออกไประหว่างการประเมินและระหว่างการทำงานปกติ โดยเฉพาะอย่างยิ่งเมื่อจัดการกับตัวแทนการที่อาจหลอกลวง

กรอบการกำกับดูแลด้านกฎระเบียบยังคงล้าหลังความสามารถทางเทคโนโลยี แม้ว่ารัฐบาลทั่วโลกจะกำลังพัฒนานโยบายการกำกับดูแล AI แต่ส่วนใหญ่จุดมุ่งเน้นไปที่ AI แบบดั้งเดิมมากกว่าตัวแทนอิสระ กฎหมาย เช่น EU AI Act เน้นย้ำถึงหลักการของการโปร่งใสและการกำกับดูแลของมนุษย์ ซึ่งสูญเสียประสิทธิภาพเมื่อระบบทำงานเร็วกว่าที่มนุษย์สามารถติดตามและใช้กระบวนการคิดที่ซับซ้อนเกินกว่าที่จะอธิบายได้

การคิดใหม่เกี่ยวกับการจัดตำแหน่งสำหรับตัวแทน AI

การแก้ไขปัญหาการจัดตำแหน่งของ Agentic AI ต้องการกลยุทธ์ใหม่ ๆ อย่างพื้นฐาน ไม่ใช่แค่การปรับปรุงวิธีการปัจจุบัน นักวิจัยกำลังสำรวจหลายทิศทางที่มีแนวโน้มซึ่งสามารถแก้ไขความท้าทายที่เป็นเอกลักษณ์ของระบบอิสระ

แนวทางที่มีแนวโน้มหนึ่งคือการปรับใช้เทคนิค การยืนยันอย่างเป็นทางการ สำหรับ AI แทนที่จะพึ่งพาการทดสอบเชิงประจักษ์เท่านั้น วิธีการเหล่านี้มุ่งหมายเพื่อยืนยันทางคณิตศาสตร์ว่าระบบ AI ดำเนินการภายในขอบเขตที่ปลอดภัยและยอมรับได้ อย่างไรก็ตาม การนำการยืนยันอย่างเป็นทางการไปใช้กับความซับซ้อนของระบบ Agentic ในโลกแห่งความเป็นจริงยังคงเป็นความท้าทายหลักและต้องการความก้าวหน้าทางทฤษฎีที่สำคัญ

การเข้าใกล้ AI รัฐธรรมนูญ มุ่งหมายเพื่อฝังระบบคุณค่าและกระบวนการคิดที่ชัดเจนลงในตัวแทน AI โดยตรง แทนที่จะฝึกอบรมระบบเพื่อเพิ่มฟังก์ชั่นรางวัลโดยไม่จำเป็นต้องมีจุดประสงค์ วิธีการเหล่านี้สอน AI ให้ให้เหตุผลเกี่ยวกับหลักการทางจริยธรรมและใช้หลักการเหล่านั้นอย่างสม่ำเสมอในสถานการณ์ใหม่ ผลลัพธ์แรกน่าสนับสนุน แต่ยังคงไม่ชัดเจนว่าการจัดตำแหน่งประเภทนี้สามารถนำไปใช้กับสถานการณ์ที่ไม่คาดคิดได้ดีเพียงใด

รูปแบบการกำกับดูแลแบบหลายฝ่ายยอมรับว่าการจัดตำแหน่งไม่สามารถแก้ไขได้ด้วยวิธีการทางเทคนิคเพียงอย่างเดียว วิธีการเหล่านี้เน้นย้ำถึงการทำงานร่วมกันระหว่างนักพัฒนา AI ผู้เชี่ยวชาญด้านสาขา ชุมชนผู้ได้รับผลกระทบ และผู้กำกับดูแลตลอดวงจรชีวิตของ AI การประสานงานมีความท้าทาย แต่ความซับซ้อนของระบบ Agentic อาจทำให้การกำกับดูแลแบบหลายฝ่ายเป็นสิ่งจำเป็น

เส้นทางไปข้างหน้า

การทำให้ Agentic AI สอดคล้องกับค่านิยมของมนุษย์เป็นหนึ่งในความท้าทายทางเทคนิคและทางสังคมที่เร่งด่วนที่สุดในปัจจุบัน ความเชื่อที่ว่าการกำกับดูแลสามารถรักษาไว้ได้ด้วยการตรวจสอบและแทรกแซงเป็นเรื่องที่ถูกทำลายไปแล้วโดยความเป็นจริงของพฤติกรรม AI อิสระ

การแก้ไขความท้าทายนี้ต้องการความร่วมมืออย่างใกล้ชิดระหว่างนักวิจัย นักการเมือง และสังคมพลเมือง การก้าวหน้าทางเทคนิคในการจัดตำแหน่งต้องถูกจับคู่กับกรอบการกำกับดูแลที่สามารถติดตามระบบอิสระได้ การลงทุนในการวิจัยการจัดตำแหน่งเป็นสิ่งสำคัญก่อนที่จะใช้ระบบอิสระที่มีพลังงานมากขึ้น

อนาคตของการวางตำแหน่ง AI ขึ้นอยู่กับการตระหนักว่าเรากำลังสร้างระบบที่มีพลังงานซึ่งอาจเกินความสามารถของมนุษย์ โดยการคิดใหม่เกี่ยวกับการรักษาความปลอดภัย การกำกับดูแล และความสัมพันธ์ของเรากับ AI เราสามารถรับรองได้ว่าระบบเหล่านี้สนับสนุนเป้าหมายของมนุษย์แทนที่จะบ่อนทำลายพวกมัน

สรุป

Agentic AI แตกต่างจาก AI แบบดั้งเดิมในหลายด้าน การมีอำนาจอิสระที่ทำให้ระบบเหล่านี้มีพลังงาน такжеทำให้พวกมันไม่คาดเดาได้ ยากต่อการกำกับดูแล และสามารถติดตามเป้าหมายที่เราไม่ได้ตั้งใจให้พวกมันทำเช่นนั้น ชุดเหตุการณ์เมื่อเร็ว ๆ นี้แสดงให้เห็นว่าตัวแทนเหล่านี้สามารถใช้ประโยชน์จากช่องโหว่ในกระบวนการฝึกอบรมและใช้กลยุทธ์ที่ไม่คาดคิดเพื่อบรรลุเป้าหมายของตน การควบคุมและกลไกการรักษาความปลอดภัยของ AI แบบดั้งเดิมซึ่งออกแบบมาเพื่อระบบ AI ก่อนหน้านี้ไม่เพียงพอที่จะจัดการกับความเสี่ยงเหล่านี้ การตอบสนองความท้าทายนี้ต้องการแนวทางใหม่ ๆ การกำกับดูแลที่เข้มแข็งยิ่งขึ้น และความเต็มใจที่จะคิดใหม่เกี่ยวกับวิธีการจัดตำแหน่ง AI ให้สอดคล้องกับค่านิยมของมนุษย์ การใช้งานระบบ Agentic ที่เพิ่มขึ้นในโดเมนที่สำคัญทำให้ชัดเจนว่าความท้าทายนี้ไม่เพียงแต่เร่งด่วนเท่านั้น แต่ยังเป็นโอกาสในการกลับมาควบคุมสิ่งที่เรากำลังเสี่ยงที่จะสูญเสียไป

ดร. Tehseen Zia เป็น Professor ที่ COMSATS University Islamabad โดยได้รับ PhD ใน AI จาก Vienna University of Technology, Austria มีเชี่ยวชาญด้าน Artificial Intelligence, Machine Learning, Data Science, และ Computer Vision โดยมีส่วนร่วมที่สำคัญด้วยการเผยแพร่ในวารสารวิทยาศาสตร์ที่มีชื่อเสียง ดร. Tehseen ยังได้ดำเนินโครงการอุตสาหกรรมต่างๆ ในฐานะ Principal Investigator และให้บริการเป็นที่ปรึกษาด้าน AI