ปัญญาประดิษฐ์

ปฏิทรรศน์ของระบบหลายตัวแทน: ทำไมตัวแทน AI มากขึ้นสามารถนำไปสู่ผลลัพธ์ที่แย่ลง

mm

ในช่วงสองปีที่ผ่านมา ระบบหลายตัวแทนได้รับการพิจารณาว่าเป็นขั้นตอนต่อไปที่เป็นธรรมชาติในด้านปัญญาประดิษฐ์ หากโมเดลภาษาขนาดใหญ่หนึ่งสามารถให้เหตุผล วางแผน และกระทำการได้ แล้วหลายตัวที่ทำงานร่วมกันควรให้ผลลัพธ์ที่ดีกว่า ความเชื่อนี้ได้ขับเคลื่อนการเพิ่มขึ้นของทีมตัวแทนสำหรับการเขียนโค้ด การวิจัย การเงิน และการทำงานอัตโนมัติของกระบวนการ แต่ การวิจัยใหม่ เปิดเผยความขัดแย้งเชิงตรรกะที่ไม่คาดคิด มันปรากฏว่าการเพิ่มตัวแทนเข้าไปในระบบไม่ได้ทำให้ระบบมีประสิทธิภาพดีขึ้นเสมอไป แต่ทำให้ระบบช้าลง มีค่าใช้จ่ายสูงขึ้น และมีความแม่นยำน้อยลง ปรากฏการณ์นี้ ซึ่งเรียกว่า ปฏิทรรศน์ของระบบหลายตัวแทน แสดงให้เห็นว่าการประสานงานมากขึ้น การสื่อสารมากขึ้น และหน่วยการให้เหตุผลมากขึ้นไม่ได้นำไปสู่ความฉลาดที่ดีกว่าเสมอไป แต่การเพิ่มตัวแทนจะแนะนำโหมดการล้มเหลวใหม่ที่มีมากกว่าผลประโยชน์ การทำความเข้าใจความขัดแย้งนี้มีความสำคัญเนื่องจากระบบตัวแทนกำลังเคลื่อนจากการสาธิตไปสู่การนำไปใช้ ทีมที่สร้างผลิตภัณฑ์ AI ต้องการคำแนะนำที่ชัดเจนเกี่ยวกับว่าเมื่อใดที่การทำงานร่วมกันจะช่วยและเมื่อใดที่จะทำให้เสีย ในบทความนี้ เราจะตรวจสอบว่าทำไมตัวแทน AI มากขึ้นสามารถนำไปสู่ผลลัพธ์ที่แย่ลง และสิ่งนี้หมายถึงอะไรสำหรับอนาคตของระบบ AI ที่ใช้ตัวแทน

ทำไมระบบหลายตัวแทนจึงได้รับความนิยม

แนวคิดของ ระบบหลายตัวแทน ได้รับแรงบันดาลใจจากวิธีการทำงานร่วมกันของมนุษย์ในทีม เมื่อเผชิญกับปัญหาที่ซับซ้อน การทำงานจะถูกแบ่งออกเป็นส่วน ผู้เชี่ยวชาญจะจัดการกับงานแต่ละส่วน และผลลัพธ์ของพวกเขา sẽถูกผสมผสานกัน การทดลองในตอนต้น สนับสนุนแนวทางนี้ ในงานที่เป็นแบบคงที่ เช่น ปัญหาทางคณิตศาสตร์หรือการสร้างโค้ด ตัวแทนหลายตัวที่ถกเถียงหรือลงคะแนนเสียงมักจะทำงานได้ดีกว่าโมเดลเดี่ยว

อย่างไรก็ตาม ความสำเร็จเหล่านี้ส่วนใหญ่มาจากงานที่ไม่สะท้อนถึงสภาพการนำไปใช้จริง พวกมันโดยทั่วไป เกี่ยวข้องกับ การให้เหตุผลที่สั้น การโต้ตอบที่จำกัดกับระบบภายนอก และสภาพแวดล้อมที่คงที่โดยไม่มีสถานะที่เปลี่ยนแปลง เมื่อตัวแทนปฏิบัติงานในสภาพแวดล้อมที่ต้องการการโต้ตอบอย่างต่อเนื่อง การปรับตัว และการวางแผนระยะยาว สถานการณ์เปลี่ยนแปลงไปอย่างมาก นอกจากนี้ เมื่อเครื่องมือพัฒนาขึ้น ตัวแทนจะได้รับการเพิ่มความสามารถในการค้นหาทางอินเทอร์เน็ต เรียก API เขียนและดำเนินการโค้ด และอัปเดตแผนงานตามเวลา สิ่งนี้ทำให้มีความน่าสนใจที่จะเพิ่มตัวแทนเข้าไปในระบบมากขึ้น

งานของตัวแทนแตกต่างจากงานแบบคงที่

มันเป็นสิ่งสำคัญที่จะต้องรับรู้ว่างานของตัวแทนแตกต่างจากงานที่ให้เหตุผลแบบคงที่ งานแบบคงที่สามารถแก้ไขได้ในครั้งเดียว: โมเดลจะถูกนำเสนอด้วยปัญหา มันจะสร้างคำตอบและหยุดลง ในสภาพแวดล้อมนี้ ตัวแทนหลายตัวทำงานเหมือนกับアンサンブル โดยที่กลยุทธ์อย่างการลงคะแนนเสียงโดย đa sốมักจะให้ผลลัพธ์ที่ดีกว่า

ระบบตัวแทน โดยทางกลับกัน ทำงาน ในสภาพแวดล้อมที่แตกต่างมาก พวกมันต้องการการโต้ตอบซ้ำๆ กับสภาพแวดล้อม โดยที่ตัวแทนจะต้องสำรวจ ดูผลลัพธ์ อัปเดตแผนงาน และกระทำการอีกครั้ง ตัวอย่างรวมถึงการนำทางเว็บ การวิเคราะห์ทางการเงิน การแก้ปัญหา软件 และการวางแผนเชิงกลยุทธ์ในโลกจำลอง ในงานเหล่านี้ แต่ละขั้นตอนขึ้นอยู่กับขั้นตอนที่แล้ว ทำให้กระบวนการนี้เป็นแบบลำดับและไวต่อข้อผิดพลาดในตอนต้น

ในสถานการณ์เหล่านี้ ข้อผิดพลาดที่เกิดขึ้นโดยตัวแทนหลายตัวไม่ได้ถูกยกเลิกไปเหมือนในアンサンブル แต่จะสะสมขึ้น การสันนิษฐานที่ไม่ถูกต้องเพียงครั้งเดียวในตอนต้นของกระบวนการสามารถทำให้ทุกสิ่งที่ตามมาเสียหาย และเมื่อตัวแทนหลายตัวเกี่ยวข้อง ข้อผิดพลาดเหล่านั้นสามารถแพร่กระจายไปทั่วระบบได้อย่างรวดเร็ว

การประสานงานมีค่าใช้จ่าย

ทุกระบบหลายตัวแทนจ่าย ค่าใช้จ่ายในการประสานงาน ตัวแทนจะต้องแบ่งปันผลการค้นพบ จัดแนวเป้าหมาย และรวมผลลัพธ์ที่ไม่สมบูรณ์ กระบวนการนี้ไม่เคยไม่มีค่าใช้จ่าย มันใช้โทเค็น เวลา และแบนด์วิธทางปัญญา และสามารถกลายเป็นข้อติดขัดได้อย่างรวดเร็วเมื่อจำนวนของตัวแทนเพิ่มขึ้น

ภายใต้งบประมาณการคำนวณที่คงที่ ค่าใช้จ่ายในการประสานงานนี้กลายเป็นสิ่งสำคัญอย่างยิ่ง หากตัวแทน 4 ตัวแบ่งงบประมาณทั้งหมดเท่ากับตัวแทน 1 ตัว แต่ละตัวจะมีความสามารถในการให้เหตุผลลึกน้อยลง ระบบอาจต้องบีบอัดความคิดที่ซับซ้อนให้เป็นสรุปสั้นๆ สำหรับการสื่อสาร และในกระบวนการนี้ อาจสูญเสียรายละเอียดที่สำคัญซึ่งสามารถทำให้ประสิทธิภาพโดยรวมของระบบอ่อนลงได้

สิ่งนี้สร้าง การแลกเปลี่ยน ระหว่างความหลากหลายและความสอดคล้อง ระบบตัวแทนเดี่ยวเก็บการให้เหตุผลทั้งหมดไว้ในที่เดียว มันรักษาสถานะภายในที่สอดคล้องกันตลอดกระบวนการ ระบบหลายตัวแทนเสนอมุมมองที่หลากหลาย แต่มีค่าใช้จ่ายในการกระจายบริบท เมื่องานกลายเป็นแบบลำดับและขึ้นอยู่กับสภาพแวดล้อมมากขึ้น การกระจายบริบทกลายเป็นจุดอ่อนที่สำคัญ ซึ่งมักจะ超过ประโยชน์ของตัวแทนหลายตัว

เมื่อตัวแทนหลายตัวทำให้ประสิทธิภาพเสียลง

การศึกษา ที่ควบคุม ใหม่แสดงให้เห็นว่าในงานวางแผนเชิงลำดับ ระบบหลายตัวแทนมักจะทำงานได้ไม่ดีกว่าระบบที่ใช้ตัวแทนเดี่ยว ในสภาพแวดล้อมที่แต่ละการกระทำเปลี่ยนสถานะและ影響ตัวเลือกในอนาคต การประสานงานระหว่างตัวแทนขัดขวางการให้เหตุผลของพวกมัน ชะลอความก้าวหน้า และเพิ่มความเสี่ยงของการสะสมข้อผิดพลาด สิ่งนี้เป็น đặc biệtเมื่อตัวแทนปฏิบัติงานแบบขนานโดยไม่มีการสื่อสาร ในสถานการณ์เหล่านี้ ข้อผิดพลาดของตัวแทนมักจะไม่ได้รับการตรวจสอบ และเมื่อผลลัพธ์ถูกผสมผสาน ข้อผิดพลาดจะสะสมแทนที่จะถูกแก้ไข

แม้ระบบที่มีการประสานงานแบบมีโครงสร้างก็ไม่ได้ 면คุณจาก ความล้มเหลว ระบบที่มีเครื่องมือประสานงานที่เฉพาะเจาะจงสามารถช่วยบรรเทาความเสี่ยงได้ แต่ก็ไม่สามารถกำจัดมันไปได้ทั้งหมด ตัวประสานงานกลายเป็นจุดบีบอัดที่การให้เหตุผลที่ยาวจะถูกย่อให้สั้นลง สิ่งนี้มักจะนำไปสู่การตัดสินใจที่ไม่ถูกต้องในงานที่มีการโต้ตอบและยาวกว่าการตัดสินใจที่ได้จากวงจรการให้เหตุผลเดี่ยว นี่คือแก่นกลางของปฏิทรรศน์ของระบบหลายตัวแทน: การทำงานร่วมกันแนะนำโหมดการล้มเหลวใหม่ที่ไม่มีอยู่ในระบบตัวแทนเดี่ยว

ทำไมบางงานยังคงได้รับประโยชน์จากตัวแทนหลายตัว

ความขัดแย้งไม่ได้หมายความว่าระบบหลายตัวแทนนั้นไร้ประโยชน์ แต่เน้นย้ำว่าประโยชน์ของพวกมัน มีเงื่อนไข ระบบเหล่านี้มี ประสิทธิภาพสูงสุด เมื่องานสามารถแบ่งออกเป็นงานย่อยที่เป็นอิสระและขนานกันได้ ตัวอย่างหนึ่งของงานดังกล่าวคือการวิเคราะห์ทางการเงิน ในงานนี้ ตัวแทนสามารถใช้ในการวิเคราะห์แนวโน้มรายได้ ตัวแทนอื่นสามารถตรวจสอบค่าใช้จ่าย และตัวแทนอื่นอีกสามารถเปรียบเทียบคู่แข่งได้ งานย่อยเหล่านี้เป็นอิสระจากกัน และผลลัพธ์ของพวกมันสามารถผสมผสานกันโดยไม่ต้องมีการประสานงานอย่างระมัดระวัง ในกรณีเหล่านี้ การประสานงานแบบมีศูนย์กลางมักจะให้ผลลัพธ์ที่ดีกว่า การค้นหาทางเว็บแบบไดนามิกเป็นอีกกรณีหนึ่งที่ตัวแทนหลายตัวสามารถทำงานได้โดยอิสระ เมื่องานต้องสำรวจหลายเส้นทางข้อมูลในเวลาเดียวกัน การสำรวจขนานสามารถช่วยได้

ข้อสรุปหลักคือระบบหลายตัวแทนใช้ได้ดีที่สุดเมื่อ งาน สามารถแบ่งออกเป็นชิ้นส่วนที่เป็นอิสระซึ่งไม่ต้องการการประสานงานอย่างใกล้ชิด สำหรับงานที่เกี่ยวข้องกับการให้เหตุผลแบบลำดับหรือติดตามสภาพแวดล้อมที่เปลี่ยนแปลงอย่างระมัดระวัง ตัวแทนเดี่ยวมักจะทำงานได้ดีกว่า

ผลกระทบของเพดานความสามารถ

การค้นพบอีกประการหนึ่งที่สำคัญคือโมเดลฐานที่แข็งแกร่งกว่าลดความจำเป็นในการประสานงาน เมื่อตัวแทนเดี่ยมมีความสามารถมากขึ้น ผลประโยชน์ที่อาจเกิดขึ้นจากการเพิ่มตัวแทนมีแนวโน้มที่จะลดลง เมื่อเกินระดับการทำงานที่แน่นอน การเพิ่มตัวแทนมักจะนำไปสู่ผลลัพธ์ที่ลดลงหรือแม้แต่แย่ลง

สิ่งนี้เกิดขึ้นเพราะค่าใช้จ่ายในการประสานงานยังคงเท่าเดิมในขณะที่ผลประโยชน์ลดลง เมื่อตัวแทนเดี่ยวสามารถจัดการงานส่วนใหญ่แล้ว ตัวแทนเพิ่มเติมมักจะเพิ่มสัญญาณรบกวนมากกว่าคุณค่า ในทางปฏิบัติ สิ่งนี้หมายความว่าระบบหลายตัวแทนมีประโยชน์มากกว่าสำหรับโมเดลที่อ่อนแอและน้อยกว่าสำหรับโมเดลระดับแนวหน้า

สิ่งนี้ท้าทายสมมติฐานที่ว่าความฉลาดของโมเดลจะขยายออกไปพร้อมกับตัวแทนหลายตัว ในหลายกรณี การปรับปรุงโมเดลหลักจะให้ผลลัพธ์ที่ดีกว่าการล้อมรอบด้วยตัวแทนเพิ่มเติม

การเพิ่มความผิดพลาดเป็นความเสี่ยงที่ซ่อนอยู่

ข้อสรุปที่สำคัญที่สุดจาก การวิจัยล่าสุด คือวิธีการที่ข้อผิดพลาดสามารถถูกเพิ่มในระบบหลายตัวแทน ในงานหลายขั้นตอน ข้อผิดพลาดเดียวในตอนต้นของกระบวนการสามารถแพร่กระจายไปทั่วทั้งกระบวนการ เมื่อตัวแทนหลายตัวพึ่งพาความสันนิษฐานร่วมกัน ข้อผิดพลาดนั้นจะแพร่กระจายเร็วขึ้นและยากต่อการควบคุม

ตัวแทนอิสระมีความเสี่ยงต่อปัญหานี้เป็นพิเศษ โดยไม่มีการตรวจสอบที่ถูกสร้างไว้ ข้อสรุปที่ไม่ถูกต้องสามารถปรากฏซ้ำและเสริมสร้างซึ่งกันและกัน ทำให้เกิดความมั่นใจที่ผิดๆ การสร้างระบบที่มีศูนย์กลางช่วยลดความเสี่ยงนี้โดยการเพิ่มขั้นตอนการตรวจสอบ แต่ไม่สามารถกำจัดมันได้ทั้งหมด

ตัวแทนเดี่ยวโดยทั่วไปมีข้อได้เปรียบในการสร้างภายใน เนื่องจากการให้เหตุผลทั้งหมดเกิดขึ้นภายในบริบทเดียว การขัดแย้งจึงสามารถระบุและแก้ไขได้ง่ายขึ้น ความสามารถที่จะแก้ไขตนเองนี้มีพลังแต่บ่อยครั้งถูกละเลยเมื่อประเมินระบบหลายตัวแทน

สรุป

บทเรียนหลักจากปฏิทรรศน์ของระบบหลายตัวแทนไม่ใช่การหลีกเลี่ยงการทำงานร่วมกัน แต่เลือกอย่างมีเลือกสรร คำถามไม่ควรเป็นจำนวนของตัวแทน แต่ว่าเมื่อใดที่การประสานงานมีความสมเหตุสมผลสำหรับงาน

งานที่มีความสัมพันธ์เชิงลำดับที่เข้มข้นมักจะชอบตัวแทนเดี่ยว ในขณะที่งานที่มีโครงสร้างขนานสามารถได้รับประโยชน์จากทีมขนาดเล็กที่ประสานงานดี งานที่ต้องใช้เครื่องมือต่างๆ ต้องการการวางแผนอย่างรอบคอบ เนื่องจากการประสานงานเองก็ใช้ทรัพยากรที่อาจใช้สำหรับการกระทำได้ สิ่งสำคัญที่สุดคือการเลือกสถาปัตยกรรมตัวแทนควรเป็นไปตามคุณสมบัติงานที่วัดได้ ไม่ใช่ความเชื่อ คุณสมบัติ เช่น การแบ่งส่วน ความทนทานต่อข้อผิดพลาด และความลึกของการโต้ตอบ มีความสำคัญมากกว่าขนาดทีมเมื่อพูดถึงการบรรลุผลลัพธ์ที่มีประสิทธิภาพ

ดร. Tehseen Zia เป็น Professor ที่ COMSATS University Islamabad โดยได้รับ PhD ใน AI จาก Vienna University of Technology, Austria มีเชี่ยวชาญด้าน Artificial Intelligence, Machine Learning, Data Science, และ Computer Vision โดยมีส่วนร่วมที่สำคัญด้วยการเผยแพร่ในวารสารวิทยาศาสตร์ที่มีชื่อเสียง ดร. Tehseen ยังได้ดำเนินโครงการอุตสาหกรรมต่างๆ ในฐานะ Principal Investigator และให้บริการเป็นที่ปรึกษาด้าน AI