ปัญญาประดิษฐ์

การเพิ่มขึ้นของหน่วยประมวลผลประสาท: การเพิ่มประสิทธิภาพ AI ที่สร้างขึ้นบนอุปกรณ์สำหรับความเร็วและความยั่งยืน

mm

การพัฒนาของ generative AI ไม่เพียงแต่เปลี่ยนแปลงวิธีการโต้ตอบและประสบการณ์ของเราในการใช้อุปกรณ์คำนวณเท่านั้น แต่ยังเปลี่ยนแปลงหลักการคำนวณด้วย หนึ่งในปัจจัยหลักที่ขับเคลื่อนการเปลี่ยนแปลงนี้คือความจำเป็นที่จะต้องดำเนินการ AI ที่สร้างขึ้นบนอุปกรณ์ที่มีทรัพยากรการคำนวณที่จำกัด บทความนี้พูดถึงความท้าทายที่นำเสนอและวิธีการที่ หน่วยประมวลผลประสาท (NPUs) กำลังเกิดขึ้นเพื่อแก้ไขปัญหาเหล่านี้ นอกจากนี้ บทความนี้ยังแนะนำโปรเซสเซอร์ NPU ล่าสุดบางตัวที่เป็นผู้นำในด้านนี้

ความท้าทายของโครงสร้างพื้นฐาน AI ที่สร้างขึ้นบนอุปกรณ์

AI ที่สร้างขึ้นซึ่งเป็นพลังหลักที่อยู่เบื้องหลังการสร้างภาพ การสร้างข้อความ และการประพันธ์เพลง ต้องการทรัพยากรการคำนวณที่มาก มักจะใช้ความสามารถที่กว้างใหญ่ของแพลตฟอร์มคลาวด์ในการตอบสนองความต้องการเหล่านี้ แม้ว่าจะมีประสิทธิภาพ แต่วิธีการนี้ก็มีความท้าทายของตนเองสำหรับ AI ที่สร้างขึ้นบนอุปกรณ์ รวมถึงการเชื่อมต่ออินเทอร์เน็ตอย่างต่อเนื่องและโครงสร้างพื้นฐานที่มีการจัดการส่วนกลาง ความพึ่งพานี้ทำให้เกิดความล่าช้า ความไม่ปลอดภัย และการบริโภคพลังงานที่เพิ่มขึ้น

โครงสร้างพื้นฐาน AI ที่มีการจัดการส่วนกลางส่วนใหญ่พึ่งพา หน่วยประมวลผลกลาง (CPUs) และ หน่วยประมวลผลกราฟิก (GPUs) เพื่อจัดการกับความต้องการการคำนวณของ AI ที่สร้างขึ้น อย่างไรก็ตาม เมื่อนำไปใช้กับ AI ที่สร้างขึ้นบนอุปกรณ์ โปรเซสเซอร์เหล่านี้พบกับความท้าทายที่สำคัญ CPUs ได้รับการออกแบบสำหรับงานทั่วไปและขาดสถาปัตยกรรมที่มีการออกแบบมาเพื่อการทำงานที่มีประสิทธิภาพและใช้พลังงานต่ำสำหรับการทำงานของ AI ที่สร้างขึ้น ความสามารถในการประมวลผลขนานที่จำกัดทำให้การประมวลผลช้าลง ความล่าช้าเพิ่มขึ้น และการบริโภคพลังงานที่สูงขึ้น ทำให้ไม่เหมาะสำหรับ AI บนอุปกรณ์ ในทางกลับกัน แม้ว่า GPUs จะมีความสามารถในการประมวลผลขนานที่ดี แต่ก็ได้รับการออกแบบหลักสำหรับการประมวลผลกราฟิก เพื่อให้สามารถทำงาน AI ที่สร้างขึ้นได้อย่างมีประสิทธิภาพ GPUs ต้องการวงจรอิเล็กทรอนิกส์ที่มีการออกแบบมาเฉพาะ ซึ่งใช้พลังงานสูงและสร้างความร้อนมาก นอกจากนี้ ขนาดทางกายภาพที่ใหญ่ทำให้เกิดอุปสรรคต่อการใช้งานในอุปกรณ์ที่มีขนาดกะทัดรัด

การเกิดขึ้นของหน่วยประมวลผลประสาท (NPUs)

เพื่อตอบสนองต่อความท้าทายเหล่านี้ หน่วยประมวลผลประสาท (NPUs) กำลังเกิดขึ้นเป็นเทคโนโลยีที่เปลี่ยนแปลงการนำ AI ที่สร้างขึ้นมาใช้บนอุปกรณ์ สถาปัตยกรรมของ NPUs ได้รับแรงบันดาลใจจากโครงสร้างและหน้าที่ของสมอง โดยเฉพาะวิธีการที่เซลล์ประสาทและซินแอปส์ทำงานร่วมกันเพื่อประมวลผลข้อมูล ใน NPUs เซลล์ประสาทเทียมทำหน้าที่เป็นหน่วยพื้นฐาน โดยเลียนแบบเซลล์ประสาททางชีววิทยาในการรับข้อมูลประมวลผลและผลิตผลลัพธ์ เซลล์ประสาทเหล่านี้เชื่อมต่อกันด้วยซินแอปส์เทียม ซึ่งส่งสัญญาณระหว่างเซลล์ประสาทด้วยความแข็งแรงที่แตกต่างกันซึ่งปรับเปลี่ยนระหว่างกระบวนการเรียนรู้ NPUs ถูกจัดระเบียบเป็นชั้น ๆ ชั้นการรับข้อมูลดิบ ชั้นการประมวลผลระหว่าง และชั้นผลลัพธ์ โครงสร้างชั้นนี้สะท้อนถึงความสามารถในการประมวลผลข้อมูลหลายขั้นตอนและขนานของสมอง เนื่องจาก AI ที่สร้างขึ้นยังถูกสร้างขึ้นโดยใช้โครงสร้างที่คล้ายกันของเครือข่ายประสาทเทียม NPUs จึงเหมาะสมอย่างยิ่งสำหรับการจัดการงาน AI ที่สร้างขึ้น การจัดเรียงโครงสร้างนี้ลดความจำเป็นในการมีวงจรอิเล็กทรอนิกส์ที่มีการออกแบบมาเฉพาะ ทำให้เกิดโซลูชันที่กะทัดรัด มีประสิทธิภาพด้านพลังงาน เร็ว และยั่งยืน

การแก้ไขความต้องการการคำนวณที่หลากหลายของ AI ที่สร้างขึ้น

AI ที่สร้างขึ้นประกอบด้วยงานต่างๆ เช่น การสร้างภาพ การสร้างข้อความ และการประพันธ์เพลง แต่ละงานมีความต้องการการคำนวณที่ไม่เหมือนกัน ตัวอย่างเช่น การสร้างภาพพึ่งพาการดำเนินการเมทริกซ์อย่างมาก ในขณะที่การสร้างข้อความเกี่ยวข้องกับการประมวลผลแบบลำดับ เพื่อตอบสนองความต้องการการคำนวณที่หลากหลายนี้ หน่วยประมวลผลประสาท (NPUs) มักถูกผสมผสานเข้ากับเทคโนโลยี System-on-Chip (SoC) ร่วมกับ CPUs และ GPUs

โปรเซสเซอร์แต่ละตัวมีความสามารถการคำนวณที่แตกต่างกัน CPUs มีความเหมาะสมอย่างยิ่งสำหรับการควบคุมลำดับและความเร็วสูง GPUs มีความสามารถในการประมวลผลข้อมูลแบบขนาน และ NPUs ได้รับการปรับให้เหมาะสมสำหรับการดำเนินการ AI หลัก โดยจัดการกับเลขคณิตสเกลาร์ เเวกเตอร์ และเทนเซอร์ โดยการใช้สถาปัตยกรรมการประมวลผลที่หลากหลาย งานสามารถถูกกำหนดให้โปรเซสเซอร์ตามความแข็งแกร่งและความต้องการของงานเฉพาะ

NPUs ซึ่งได้รับการปรับให้เหมาะสมสำหรับงาน AI สามารถโอนย้ายงาน AI ที่สร้างขึ้นออกจาก CPU ได้อย่างมีประสิทธิภาพ การโอนย้ายนี้ไม่เพียงแต่ทำให้การดำเนินการเร็วขึ้นและใช้พลังงานน้อยลงเท่านั้น แต่ยังเร่งการอนุมาน AI ทำให้โมเดล AI ที่สร้างขึ้นสามารถทำงานบนอุปกรณ์ได้อย่างราบรื่น เมื่อ NPUs จัดการงานที่เกี่ยวข้องกับ AI CPUs และ GPUs จะมีทรัพยากรเหลือสำหรับการทำงานอื่น ๆ ทำให้ประสิทธิภาพของแอปพลิเคชันโดยรวมดีขึ้นในขณะเดียวกันก็รักษาความมีประสิทธิภาพด้านความร้อน

ตัวอย่างจริงของ NPUs

การปรับปรุงของ NPUs กำลังได้รับแรงผลักดัน ต่อไปนี้คือตัวอย่างจริงของ NPUs:

  • Hexagon NPUs โดย Qualcomm ได้รับการออกแบบมาเพื่อเร่งการอนุมาน AI บนอุปกรณ์ที่มีพลังงานและทรัพยากรต่ำ ออกแบบมาเพื่อจัดการกับงาน AI ที่สร้างขึ้น เช่น การสร้างข้อความ การสร้างภาพ และการประมวลผลเสียง Hexagon NPU ถูกผสมผสานเข้ากับแพลตฟอร์ม Snapdragon ของ Qualcomm โดยให้การดำเนินการโมเดลเครือข่ายประสาทเทียมที่มีประสิทธิภาพบนอุปกรณ์ที่มีผลิตภัณฑ์ AI ของ Qualcomm
  • Apple’s Neural Engine เป็นส่วนสำคัญของชิป A-series และ M-series ที่ขับเคลื่อนคุณสมบัติ AI ต่างๆ เช่น Face ID, Siri และ ความเป็นจริงเสริม (AR) Neural Engine เร่งการทำงาน เช่น การรับรองใบหน้าสำหรับ Face ID ที่ปลอดภัย การประมวลผลภาษาธรรมชาติ (NLP) สำหรับ Siri และการ跟踪วัตถุและความเข้าใจฉากที่ดีขึ้นสำหรับแอปพลิเคชัน AR ทำให้ประสบการณ์ของผู้ใช้ดีขึ้นอย่างมีนัยสำคัญ
  • NPU ของ Samsung เป็นโปรเซสเซอร์ที่มีการออกแบบมาเฉพาะสำหรับการคำนวณ AI สามารถจัดการการคำนวณหลายพันรายการพร้อมกัน ได้รับการผสมผสานเข้ากับ SoCs Exynos ล่าสุด ของ Samsung ซึ่งขับเคลื่อนโทรศัพท์ Samsung หลายรุ่น เทคโนโลยี NPU ของ Samsung ทำให้สามารถคำนวณ AI ที่สร้างขึ้นได้อย่างรวดเร็วและมีประสิทธิภาพด้านพลังงาน นอกจากนี้ เทคโนโลยี NPU ของ Samsung ยังถูกผสมผสานเข้ากับทีวีระดับพรีเมียม ทำให้เกิดนวัตกรรมเสียงที่ขับเคลื่อนโดย AI และปรับปรุงประสบการณ์ของผู้ใช้
  • สถาปัตยกรรม Da Vinci ของ Huawei ทำหน้าที่เป็นแก่นกลางของ โปรเซสเซอร์ AI Ascend ที่ออกแบบมาเพื่อเพิ่มพลังการคำนวณ AI สถาปัตยกรรมนี้ใช้เครื่องมือการคำนวณ 3D คิวบ์ที่มีประสิทธิภาพสูง ทำให้มีประสิทธิภาพสูงสำหรับงาน AI

สรุป

AI ที่สร้างขึ้นกำลังเปลี่ยนแปลงวิธีการโต้ตอบของเราและกำลังเปลี่ยนแปลงการคำนวณ ความท้าทายในการดำเนินการ AI ที่สร้างขึ้นบนอุปกรณ์ที่มีทรัพยากรการคำนวณที่จำกัดนั้นสำคัญ และ CPU และ GPU ทั่วไปมักจะไม่เพียงพอ หน่วยประมวลผลประสาท (NPUs) เสนอคำตอบที่มีแนวโน้มด้วยสถาปัตยกรรมที่มีการออกแบบมาเพื่อตอบสนองความต้องการของ AI ที่สร้างขึ้น โดยการผสมผสาน NPUs เข้ากับเทคโนโลยี System-on-Chip (SoC) ร่วมกับ CPUs และ GPUs เราสามารถใช้ความสามารถเฉพาะของโปรเซสเซอร์แต่ละตัวได้ ทำให้การทำงาน AI บนอุปกรณ์เร็วขึ้น มีประสิทธิภาพด้านพลังงาน และยั่งยืนมากขึ้น เมื่อ NPUs ต่อไปเรื่อย ๆ พวกมันจะปรับปรุงความสามารถ AI บนอุปกรณ์ ทำให้แอปพลิเคชันทำงานได้เร็วขึ้นและใช้พลังงานน้อยลง

ดร. Tehseen Zia เป็น Professor ที่ COMSATS University Islamabad โดยได้รับ PhD ใน AI จาก Vienna University of Technology, Austria มีเชี่ยวชาญด้าน Artificial Intelligence, Machine Learning, Data Science, และ Computer Vision โดยมีส่วนร่วมที่สำคัญด้วยการเผยแพร่ในวารสารวิทยาศาสตร์ที่มีชื่อเสียง ดร. Tehseen ยังได้ดำเนินโครงการอุตสาหกรรมต่างๆ ในฐานะ Principal Investigator และให้บริการเป็นที่ปรึกษาด้าน AI