Connect with us

การให้เหตุผลบนถนน: NVIDIA’s Alpamayo สามารถแก้ปัญหา ‘Edge Case’ ของการขับรถอัตโนมัติได้หรือไม่?

ปัญญาประดิษฐ์

การให้เหตุผลบนถนน: NVIDIA’s Alpamayo สามารถแก้ปัญหา ‘Edge Case’ ของการขับรถอัตโนมัติได้หรือไม่?

mm
Reasoning on the Road: Can NVIDIA’s Alpamayo Solve the Self-Driving ‘Edge Case’ Problem?

รถยนต์อัตโนมัติ ได้ทำความก้าวหน้าอย่างมากในช่วงสิบปีที่ผ่านมา โดยสะสมไมล์หลายล้านและทำงานได้ดีบน高速ทางหลวง ในพื้นที่ทดสอบที่ควบคุม และในเขตเมืองที่เลือก อย่างไรก็ตาม แม้ในปี 2026 การขับรถในโลกแห่งความเป็นจริงยังคงเปิดเผยข้อจำกัดที่สำคัญ ตัวอย่างเช่น การเลี้ยวซ้ายที่ไม่ได้รับการคุ้มครองระหว่างฝนตกหนัก โซนการก่อสร้างที่มีเครื่องหมายเลนที่จางหรือหายไป และทางแยกที่บุคลากรฉุกเฉินใช้สัญญาณมือที่ไม่เป็นทางการยังคงท้าทายระบบขับรถอัตโนมัติที่ซับซ้อน

สถานการณ์เหล่านี้ไม่ใช่ความผิดปกติที่หายากที่สามารถแก้ไขได้ด้วยการเพิ่มจำนวนข้อมูลเพียงอย่างเดียว แต่เป็นการเน้นย้ำถึงปัญหาที่ลึกซึ้งยิ่งขึ้นในเทคโนโลยีรถยนต์อัตโนมัติปัจจุบัน ระบบสมัยใหม่มีความสามารถในการตรวจจับวัตถุและสร้างแผนที่สิ่งแวดล้อม แต่มันยากที่จะให้เหตุผลเกี่ยวกับเหตุการณ์ในอนาคต ตีความเจตนาของผู้ใช้ถนนอื่น ๆ และตัดสินใจที่มีความอ่อนไหวต่อบริบท ดังนั้น การรับรู้เพียงอย่างเดียวจึงไม่เพียงพอสำหรับการรับประกันความปลอดภัยในสถานการณ์ที่ซับซ้อนและไม่คาดคิด

เพื่อแก้ไขความท้าทายนี้ NVIDIA ได้แนะนำ Alpamayo ที่ CES 2026 นี่คือชุดของโมเดล Vision-Language-Action ที่เปิดกว้างซึ่งรวมถึงชั้นการให้เหตุผลที่ชัดเจนเหนือการรับรู้ โดยการผสมผสานการรับรู้เข้ากับการให้เหตุผล Alpamayo ช่วยให้ยานพาหนะสามารถนำทางสถานการณ์การขับรถที่หายากและซับซ้อนได้อย่างปลอดภัยยิ่งขึ้น ในขณะเดียวกันก็ให้คำอธิบายที่สามารถเข้าใจได้สำหรับการตัดสินใจแต่ละครั้ง ดังนั้น จึงเป็นขั้นตอนที่สำคัญต่อระบบอัตโนมัติที่สามารถคิด อธิบาย และปรับตัวได้มากกว่าการสังเกตการณ์

การทำความเข้าใจปัญหา Edge Case ในการขับรถอัตโนมัติ

กรณี Edge เป็นหนึ่งในปัญหาที่ซับซ้อน nhấtในรถยนต์ขับอัตโนมัติ สิ่งเหล่านี้คือสถานการณ์ที่หายากที่การกระทำที่ปลอดภัยที่สุดขึ้นอยู่กับบริบทที่ซับซ้อน กฎสังคมที่ไม่ได้เขียนไว้ และการโต้ตอบแบบเรียลไทม์กับผู้ใช้ถนนอื่น ๆ ตัวอย่างเช่น ผู้เดินถนนอาจส่งสัญญาณให้รถผ่านทางแยกแม้ว่าพวกเขาจะมีสิทธิ์ทางก็ตาม หรือโซนการก่อสร้างอาจมีเครื่องหมายเลนที่จางหรือสัญญาณจราจรที่ขัดแย้งกับโคนสัญญาณชั่วคราว สถานการณ์เหล่านี้ไม่เกิดขึ้นบ่อยๆ อาจเป็นเพียงครั้งเดียวทุกๆ ไมล์หลายพันครั้ง แต่ก็ทำให้เกิดอุบัติเหตุและข้อผิดพลาดของระบบจำนวนมาก

รายงานการยกเลิกของ แคลิฟอร์เนียในปี 2024 แสดงให้เห็นถึงสิ่งนี้อย่างชัดเจน ในบรรดบริษัทรถยนต์อัตโนมัติ 31 บริษัทที่ได้รับอนุญาต มียานพาหนะทดสอบมากกว่า 2,800 คัน วิ่งไปหลายแสนไมล์ แต่ความล้มเหลวหลายอย่างเกิดขึ้นในพื้นที่ถนนไม่ปกติ การควบคุมการจราจรที่ไม่เป็นทางการ หรือเมื่อการกระทำของมนุษย์นั้นไม่คาดคิด รถยนต์ขับอัตโนมัติแบบดั้งเดิมมีความสามารถในการรับรู้ที่ดี ระบบสามารถตรวจจับยานพาหนะ จักรยาน ผู้เดินถนน และสัญญาณจราจรได้อย่างแม่นยำโดยใช้กล้อง ลิดาร์ และเรดาร์ นอกจากนี้ โมเดลแบบ end-to-end ยังสามารถแปลงข้อมูลเซ็นเซอร์เป็นคำสั่งการขับและเบรกได้โดยตรง ในถนนที่คุ้นเคย สิ่งนี้ช่วยให้รถยนต์สามารถขับรถได้อย่างราบรื่นและปลอดภัย

อย่างไรก็ตาม การรับรู้เพียงอย่างเดียวไม่สามารถจัดการสถานการณ์ทั้งหมดได้ ไม่สามารถตอบคำถามที่สำคัญที่เกิดขึ้นในสถานการณ์ที่ซับซ้อนหรือไม่คาดคิดได้ ตัวอย่างเช่น ผู้เดินถนนจะข้ามถนนหรือไม่? มันปลอดภัยที่จะให้ทางในขณะนี้หรือเสี่ยงเล็กน้อย? ทำไมการกระทำหนึ่งจึงปลอดภัยกว่าการกระทำอื่น? โมเดลแบบกล่องดำทำให้คำถามเหล่านี้ยากขึ้นเพราะไม่สามารถอธิบายการตัดสินใจได้ ดังนั้น ทีมความปลอดภัยและหน่วยงานกำกับดูแลอาจพบว่ามันยากที่จะเชื่อใจระบบเหล่านี้

NVIDIA Alpamayo และการเปลี่ยนแปลงสู่ความเป็นอิสระโดยใช้เหตุผล

NVIDIA แนะนำ Alpamayo ซึ่งเป็นแพลตฟอร์มที่มุ่งเน้นการให้เหตุผลที่ออกแบบมาเพื่อแก้ไขกรณี Edge ที่ยังคงทำให้ความก้าวหน้าในการขับรถอัตโนมัติระดับ 4 ชะงักงัน อย่างไรก็ตาม แทนที่จะทำงานเป็นระบบขับรถอัตโนมัติเต็มรูปแบบภายในยานพาหนะ Alpamayo ทำหน้าที่เป็นสภาพแวดล้อมการวิจัยและพัฒนาที่เปิดกว้าง ซึ่งรวมถึงสามส่วนประกอบที่เชื่อมโยงถึงกันอย่างใกล้ชิด: โมเดล Vision-Language-Action ที่เป็นรากฐาน การจำลอง AlpaSim และชุดข้อมูลการขับรถ Physical AI ขนาดใหญ่ ส่วนประกอบเหล่านี้ช่วยสนับสนุนการวิจัย การทดสอบ และการปรับปรุงนโยบายการขับรถที่ต้องดำเนินการภายใต้ความไม่แน่นอนและความซับซ้อนของสังคม ในขณะเดียวกันก็ยังคงสามารถอธิบายได้สำหรับผู้ทบทวนของมนุษย์

การนำการให้เหตุผลแบบ Chain of Thought มาใช้กับกรณี Edge

Alpamayo จัดการกับสถานการณ์การขับรถที่ยากลำบากผ่านการให้เหตุผลที่ชัดเจนและสามารถปรับให้เข้ากับการขับรถบนถนนจริงได้ แทนที่จะตอบสนองต่อสถานการณ์ทั้งหมด ระบบจะแบ่งสถานการณ์ออกเป็นลำดับของขั้นตอนที่มีเหตุผล ดังนั้นการตัดสินใจจึงไม่ได้ถูกสร้างขึ้นเป็นเอาต์พุตเดียว แต่เป็นผลมาจากการวิเคราะห์ที่มีโครงสร้าง วิธีการนี้สะท้อนถึงการให้เหตุผลของมนุษย์และลดพฤติกรรมที่ไม่คาดคิดในสถานการณ์ที่ไม่คุ้นเคย

ก่อนอื่น ระบบจะระบุผู้มีส่วนได้ส่วนเสียที่เกี่ยวข้องทั้งหมดในสถานการณ์ รวมถึงยานพาหนะ ผู้เดินถนน จักรยาน และวัตถุชั่วคราว ต่อไป ระบบจะอนุมานเจตนาที่น่าจะเป็นไปได้โดยการตรวจสอบรูปแบบการเคลื่อนไหว บริบท และสัญญาณทางสังคม หลังจากนั้น ระบบจะประเมินข้อจำกัดของการมองเห็น การบดบัง และอันตรายที่อาจเกิดขึ้น นอกจากนี้ ระบบยังพิจารณาผลลัพธ์ที่เป็นไปได้ เช่น สิ่งที่อาจเกิดขึ้นหากผู้เดินถนนก้าวเข้าไปในถนนโดยไม่คาดคิด ก่อนที่จะตัดสินใจเส้นทางต่างๆ ตามข้อจำกัดด้านความปลอดภัยและเลือกการกระทำสุดท้าย ในขณะเดียวกัน ระบบจะสร้างการให้เหตุผลที่ชัดเจนและสามารถอธิบายได้สำหรับการตัดสินใจแต่ละครั้ง

การปิดช่องว่างข้อมูล Long Tail ผ่านการให้เหตุผลและการจำลอง

ระบบที่ใช้การให้เหตุผล เช่น Alpamayo ไม่ได้แก้ไขปัญหากรณี Edge โดยการรวบรวมข้อมูลการขับรถเพิ่มเติม แต่เปลี่ยนวิธีการตีความ ขยายและทดสอบข้อมูลที่มีอยู่ ดังนั้นความก้าวหน้าจึงขึ้นอยู่กับการใช้ข้อมูลที่มีประสิทธิภาพมากกว่าการเพิ่มระยะทาง NVIDIA จัดการกับความท้าทายนี้ผ่านการผสมผสานชุดข้อมูลการขับรถ Physical AI ที่มีขนาดใหญ่เข้ากับสภาพแวดล้อมการจำลอง AlpaSim ทั้งสองอย่างนี้ได้รับการออกแบบมาเพื่อสนับสนุนการพัฒนาที่มุ่งเน้นการให้เหตุผล

ชุดข้อมูล Physical AI ของ NVIDIA รวมถึงข้อมูลการขับรถมากกว่า 1,700 ชั่วโมง ที่รวบรวมข้าม 25 ประเทศและเมืองหลายพันเมือง ข้อมูลนี้รวมเข้ากับอินพุตจากกล้อง ลิดาร์ และเรดาร์ เพื่อจับภาพพฤติกรรมจริงบนถนนในหลายๆ ด้าน นอกจากนี้ การบันทึกเหล่านี้ยังครอบคลุมพื้นที่มากกว่าภูมิภาคเดียวหรือวัฒนธรรมการขับรถใดๆ ทำให้สะท้อนถึงมาตรฐานการจราจรที่แตกต่างกัน สภาพอากาศ รูปแบบการออกแบบถนน และแนวปฏิบัติการขับรถที่ไม่เป็นทางการที่แตกต่างกัน ความหลากหลายนี้ทำให้โมเดลได้รับการฝึกฝนในสถานการณ์ที่สะท้อนถึงความซับซ้อนของโลกแห่งความเป็นจริง

ผลกระทบต่ออุตสาหกรรมและความท้าทายที่ยังคงอยู่

Alpamayo สอดคล้องกับกลยุทธ์การขับรถอัตโนมัติในวงกว้างของ NVIDIA โดยการผสมผสานการฝึกอบรมขนาดใหญ่ การจำลอง และการนำไปใช้ในยานพาหนะ การฝึกอบรมและการประเมินเกิดขึ้นบนระบบ GPU ที่มีประสิทธิภาพสูงในศูนย์ข้อมูล ในขณะที่โมเดลที่เล็กกว่าที่ได้รับจากงานนี้จะทำงานบนฮาร์ดแวร์ยานพาหนะ เช่น แพลตฟอร์ม DRIVE Thor ทำให้สามารถตัดสินใจในเวลาจริงภายในยานพาหนะได้ ในทำนองเดียวกัน ระบบที่เกี่ยวข้องจะขยายไปยังหุ่นยนต์ผ่านแพลตฟอร์ม Jetson ดังนั้น Alpamayo จึงทำให้รถยนต์และระบบทางกายภาพอื่นๆ สามารถใช้เฟรมเวิร์กการพัฒนาที่ใช้ร่วมกันได้

ความสนใจของอุตสาหกรรมสะท้อนถึงแนวทางนี้ ผู้ผลิตและกลุ่มวิจัยหลายรายกำลังทดสอบ Alpamayo ในฐานะชั้นการให้เหตุผลบนระบบการรับรู้ที่มีอยู่ ตัวอย่างเช่น Mercedes-Benz วางแผนเพื่อสำรวจการรวมเข้ากับยานพาหนะในอนาคต ในขณะที่ Jaguar Land Rover ศึกษาการใช้งานสำหรับการประเมินสถานการณ์การขับรถที่ซับซ้อน ในเวลาเดียวกัน องค์กร เช่น Lucid, Uber และ Berkeley DeepDrive ใช้ Alpamayo สำหรับการทดสอบนโยบายและตรวจสอบความปลอดภัย ดังนั้น แพลตฟอร์มนี้จึงถูกมองว่าเป็นเครื่องมือที่จะปรับปรุงตรรกะความปลอดภัยและสนับสนุนเป้าหมายระดับ 4 มากกว่าการแทนที่สแต็คอัตโนมัติ

สรุป

การขับรถอัตโนมัติได้มาถึงจุดที่การรับรู้เพียงอย่างเดียวไม่เพียงพอแล้ว แม้ว่ายานพาหนะจะสามารถมองเห็นถนนได้อย่างแม่นยำ แต่สถานการณ์ที่ยากลำบากยังคงต้องการความเข้าใจ การตัดสินใจ และการอธิบาย ดังนั้น ระบบที่ใช้การให้เหตุผล เช่น Alpamayo จึงเป็นขั้นตอนที่สำคัญในการแก้ไขความท้าทายนี้ โดยการผสมผสานการให้เหตุผลที่มีโครงสร้าง การจำลองที่สมจริง และการประเมินที่โปร่งใส วิธีการนี้มุ่งเป้าไปที่กรณี Edge ที่สำคัญที่สุดสำหรับความปลอดภัย

นอกจากนี้ยังให้เครื่องมือที่วิศวกรและหน่วยงานกำกับดูแลสามารถตรวจสอบและซักถามได้ ซึ่งเป็นสิ่งจำเป็นสำหรับความไว้วางใจ อย่างไรก็ตาม การให้เหตุผลไม่ได้กำจัดความเสี่ยงออกไป การตรวจสอบอย่างรอบคอบ การทดสอบท้องถิ่น และการกำกับดูแลที่เข้มงวดยังคงจำเป็น แม้ว่าจะเป็นเช่นนั้น การมุ่งเน้นไปที่เหตุผลที่อยู่เบื้องหลังการตัดสินใจมากกว่าการกระทำที่เกิดขึ้น ทำให้เทคโนโลยีการขับรถอัตโนมัติใกล้เคียงกับการนำไปใช้บนถนนจริงอย่างปลอดภัยและรับผิดชอบมากขึ้น

ดร. อัสซาด อับบาส เป็น Professor ที่ COMSATS University Islamabad, Pakistan ซึ่งได้รับ Ph.D. จาก North Dakota State University, USA การวิจัยของเขาเน้นไปที่เทคโนโลยีขั้นสูง รวมถึง cloud, fog, และ edge computing, big data analytics, และ AI ดร. อับบาสได้ทำการมีส่วนร่วมอย่างมากด้วยการเผยแพร่ผลงานในวารสารและประชุมวิชาการที่มีชื่อเสียง เขายังเป็นผู้ก่อตั้ง MyFastingBuddy