ปัญญาประดิษฐ์
การเพิ่มขึ้นของหน่วยประมวลผลประสาท: การเพิ่มประสิทธิภาพ AI ที่สร้างขึ้นบนอุปกรณ์สำหรับความเร็วและความยั่งยืน
การพัฒนาของ generative AI ไม่เพียงแต่เปลี่ยนแปลงวิธีการโต้ตอบและประสบการณ์ของเราในการใช้อุปกรณ์คำนวณเท่านั้น แต่ยังเปลี่ยนแปลงหลักการคำนวณด้วย หนึ่งในปัจจัยหลักที่ขับเคลื่อนการเปลี่ยนแปลงนี้คือความจำเป็นที่จะต้องดำเนินการ AI ที่สร้างขึ้นบนอุปกรณ์ที่มีทรัพยากรการคำนวณที่จำกัด บทความนี้พูดถึงความท้าทายที่นำเสนอและวิธีการที่ หน่วยประมวลผลประสาท (NPUs) กำลังเกิดขึ้นเพื่อแก้ไขปัญหาเหล่านี้ นอกจากนี้ บทความนี้ยังแนะนำโปรเซสเซอร์ NPU ล่าสุดบางตัวที่เป็นผู้นำในด้านนี้
ความท้าทายของโครงสร้างพื้นฐาน AI ที่สร้างขึ้นบนอุปกรณ์
AI ที่สร้างขึ้นซึ่งเป็นพลังหลักที่อยู่เบื้องหลังการสร้างภาพ การสร้างข้อความ และการประพันธ์เพลง ต้องการทรัพยากรการคำนวณที่มาก มักจะใช้ความสามารถที่กว้างใหญ่ของแพลตฟอร์มคลาวด์ในการตอบสนองความต้องการเหล่านี้ แม้ว่าจะมีประสิทธิภาพ แต่วิธีการนี้ก็มีความท้าทายของตนเองสำหรับ AI ที่สร้างขึ้นบนอุปกรณ์ รวมถึงการเชื่อมต่ออินเทอร์เน็ตอย่างต่อเนื่องและโครงสร้างพื้นฐานที่มีการจัดการส่วนกลาง ความพึ่งพานี้ทำให้เกิดความล่าช้า ความไม่ปลอดภัย และการบริโภคพลังงานที่เพิ่มขึ้น
โครงสร้างพื้นฐาน AI ที่มีการจัดการส่วนกลางส่วนใหญ่พึ่งพา หน่วยประมวลผลกลาง (CPUs) และ หน่วยประมวลผลกราฟิก (GPUs) เพื่อจัดการกับความต้องการการคำนวณของ AI ที่สร้างขึ้น อย่างไรก็ตาม เมื่อนำไปใช้กับ AI ที่สร้างขึ้นบนอุปกรณ์ โปรเซสเซอร์เหล่านี้พบกับความท้าทายที่สำคัญ CPUs ได้รับการออกแบบสำหรับงานทั่วไปและขาดสถาปัตยกรรมที่มีการออกแบบมาเพื่อการทำงานที่มีประสิทธิภาพและใช้พลังงานต่ำสำหรับการทำงานของ AI ที่สร้างขึ้น ความสามารถในการประมวลผลขนานที่จำกัดทำให้การประมวลผลช้าลง ความล่าช้าเพิ่มขึ้น และการบริโภคพลังงานที่สูงขึ้น ทำให้ไม่เหมาะสำหรับ AI บนอุปกรณ์ ในทางกลับกัน แม้ว่า GPUs จะมีความสามารถในการประมวลผลขนานที่ดี แต่ก็ได้รับการออกแบบหลักสำหรับการประมวลผลกราฟิก เพื่อให้สามารถทำงาน AI ที่สร้างขึ้นได้อย่างมีประสิทธิภาพ GPUs ต้องการวงจรอิเล็กทรอนิกส์ที่มีการออกแบบมาเฉพาะ ซึ่งใช้พลังงานสูงและสร้างความร้อนมาก นอกจากนี้ ขนาดทางกายภาพที่ใหญ่ทำให้เกิดอุปสรรคต่อการใช้งานในอุปกรณ์ที่มีขนาดกะทัดรัด
การเกิดขึ้นของหน่วยประมวลผลประสาท (NPUs)
เพื่อตอบสนองต่อความท้าทายเหล่านี้ หน่วยประมวลผลประสาท (NPUs) กำลังเกิดขึ้นเป็นเทคโนโลยีที่เปลี่ยนแปลงการนำ AI ที่สร้างขึ้นมาใช้บนอุปกรณ์ สถาปัตยกรรมของ NPUs ได้รับแรงบันดาลใจจากโครงสร้างและหน้าที่ของสมอง โดยเฉพาะวิธีการที่เซลล์ประสาทและซินแอปส์ทำงานร่วมกันเพื่อประมวลผลข้อมูล ใน NPUs เซลล์ประสาทเทียมทำหน้าที่เป็นหน่วยพื้นฐาน โดยเลียนแบบเซลล์ประสาททางชีววิทยาในการรับข้อมูลประมวลผลและผลิตผลลัพธ์ เซลล์ประสาทเหล่านี้เชื่อมต่อกันด้วยซินแอปส์เทียม ซึ่งส่งสัญญาณระหว่างเซลล์ประสาทด้วยความแข็งแรงที่แตกต่างกันซึ่งปรับเปลี่ยนระหว่างกระบวนการเรียนรู้ NPUs ถูกจัดระเบียบเป็นชั้น ๆ ชั้นการรับข้อมูลดิบ ชั้นการประมวลผลระหว่าง และชั้นผลลัพธ์ โครงสร้างชั้นนี้สะท้อนถึงความสามารถในการประมวลผลข้อมูลหลายขั้นตอนและขนานของสมอง เนื่องจาก AI ที่สร้างขึ้นยังถูกสร้างขึ้นโดยใช้โครงสร้างที่คล้ายกันของเครือข่ายประสาทเทียม NPUs จึงเหมาะสมอย่างยิ่งสำหรับการจัดการงาน AI ที่สร้างขึ้น การจัดเรียงโครงสร้างนี้ลดความจำเป็นในการมีวงจรอิเล็กทรอนิกส์ที่มีการออกแบบมาเฉพาะ ทำให้เกิดโซลูชันที่กะทัดรัด มีประสิทธิภาพด้านพลังงาน เร็ว และยั่งยืน
การแก้ไขความต้องการการคำนวณที่หลากหลายของ AI ที่สร้างขึ้น
AI ที่สร้างขึ้นประกอบด้วยงานต่างๆ เช่น การสร้างภาพ การสร้างข้อความ และการประพันธ์เพลง แต่ละงานมีความต้องการการคำนวณที่ไม่เหมือนกัน ตัวอย่างเช่น การสร้างภาพพึ่งพาการดำเนินการเมทริกซ์อย่างมาก ในขณะที่การสร้างข้อความเกี่ยวข้องกับการประมวลผลแบบลำดับ เพื่อตอบสนองความต้องการการคำนวณที่หลากหลายนี้ หน่วยประมวลผลประสาท (NPUs) มักถูกผสมผสานเข้ากับเทคโนโลยี System-on-Chip (SoC) ร่วมกับ CPUs และ GPUs
โปรเซสเซอร์แต่ละตัวมีความสามารถการคำนวณที่แตกต่างกัน CPUs มีความเหมาะสมอย่างยิ่งสำหรับการควบคุมลำดับและความเร็วสูง GPUs มีความสามารถในการประมวลผลข้อมูลแบบขนาน และ NPUs ได้รับการปรับให้เหมาะสมสำหรับการดำเนินการ AI หลัก โดยจัดการกับเลขคณิตสเกลาร์ เเวกเตอร์ และเทนเซอร์ โดยการใช้สถาปัตยกรรมการประมวลผลที่หลากหลาย งานสามารถถูกกำหนดให้โปรเซสเซอร์ตามความแข็งแกร่งและความต้องการของงานเฉพาะ
NPUs ซึ่งได้รับการปรับให้เหมาะสมสำหรับงาน AI สามารถโอนย้ายงาน AI ที่สร้างขึ้นออกจาก CPU ได้อย่างมีประสิทธิภาพ การโอนย้ายนี้ไม่เพียงแต่ทำให้การดำเนินการเร็วขึ้นและใช้พลังงานน้อยลงเท่านั้น แต่ยังเร่งการอนุมาน AI ทำให้โมเดล AI ที่สร้างขึ้นสามารถทำงานบนอุปกรณ์ได้อย่างราบรื่น เมื่อ NPUs จัดการงานที่เกี่ยวข้องกับ AI CPUs และ GPUs จะมีทรัพยากรเหลือสำหรับการทำงานอื่น ๆ ทำให้ประสิทธิภาพของแอปพลิเคชันโดยรวมดีขึ้นในขณะเดียวกันก็รักษาความมีประสิทธิภาพด้านความร้อน
ตัวอย่างจริงของ NPUs
การปรับปรุงของ NPUs กำลังได้รับแรงผลักดัน ต่อไปนี้คือตัวอย่างจริงของ NPUs:
- Hexagon NPUs โดย Qualcomm ได้รับการออกแบบมาเพื่อเร่งการอนุมาน AI บนอุปกรณ์ที่มีพลังงานและทรัพยากรต่ำ ออกแบบมาเพื่อจัดการกับงาน AI ที่สร้างขึ้น เช่น การสร้างข้อความ การสร้างภาพ และการประมวลผลเสียง Hexagon NPU ถูกผสมผสานเข้ากับแพลตฟอร์ม Snapdragon ของ Qualcomm โดยให้การดำเนินการโมเดลเครือข่ายประสาทเทียมที่มีประสิทธิภาพบนอุปกรณ์ที่มีผลิตภัณฑ์ AI ของ Qualcomm
- Apple’s Neural Engine เป็นส่วนสำคัญของชิป A-series และ M-series ที่ขับเคลื่อนคุณสมบัติ AI ต่างๆ เช่น Face ID, Siri และ ความเป็นจริงเสริม (AR) Neural Engine เร่งการทำงาน เช่น การรับรองใบหน้าสำหรับ Face ID ที่ปลอดภัย การประมวลผลภาษาธรรมชาติ (NLP) สำหรับ Siri และการ跟踪วัตถุและความเข้าใจฉากที่ดีขึ้นสำหรับแอปพลิเคชัน AR ทำให้ประสบการณ์ของผู้ใช้ดีขึ้นอย่างมีนัยสำคัญ
- NPU ของ Samsung เป็นโปรเซสเซอร์ที่มีการออกแบบมาเฉพาะสำหรับการคำนวณ AI สามารถจัดการการคำนวณหลายพันรายการพร้อมกัน ได้รับการผสมผสานเข้ากับ SoCs Exynos ล่าสุด ของ Samsung ซึ่งขับเคลื่อนโทรศัพท์ Samsung หลายรุ่น เทคโนโลยี NPU ของ Samsung ทำให้สามารถคำนวณ AI ที่สร้างขึ้นได้อย่างรวดเร็วและมีประสิทธิภาพด้านพลังงาน นอกจากนี้ เทคโนโลยี NPU ของ Samsung ยังถูกผสมผสานเข้ากับทีวีระดับพรีเมียม ทำให้เกิดนวัตกรรมเสียงที่ขับเคลื่อนโดย AI และปรับปรุงประสบการณ์ของผู้ใช้
- สถาปัตยกรรม Da Vinci ของ Huawei ทำหน้าที่เป็นแก่นกลางของ โปรเซสเซอร์ AI Ascend ที่ออกแบบมาเพื่อเพิ่มพลังการคำนวณ AI สถาปัตยกรรมนี้ใช้เครื่องมือการคำนวณ 3D คิวบ์ที่มีประสิทธิภาพสูง ทำให้มีประสิทธิภาพสูงสำหรับงาน AI
สรุป
AI ที่สร้างขึ้นกำลังเปลี่ยนแปลงวิธีการโต้ตอบของเราและกำลังเปลี่ยนแปลงการคำนวณ ความท้าทายในการดำเนินการ AI ที่สร้างขึ้นบนอุปกรณ์ที่มีทรัพยากรการคำนวณที่จำกัดนั้นสำคัญ และ CPU และ GPU ทั่วไปมักจะไม่เพียงพอ หน่วยประมวลผลประสาท (NPUs) เสนอคำตอบที่มีแนวโน้มด้วยสถาปัตยกรรมที่มีการออกแบบมาเพื่อตอบสนองความต้องการของ AI ที่สร้างขึ้น โดยการผสมผสาน NPUs เข้ากับเทคโนโลยี System-on-Chip (SoC) ร่วมกับ CPUs และ GPUs เราสามารถใช้ความสามารถเฉพาะของโปรเซสเซอร์แต่ละตัวได้ ทำให้การทำงาน AI บนอุปกรณ์เร็วขึ้น มีประสิทธิภาพด้านพลังงาน และยั่งยืนมากขึ้น เมื่อ NPUs ต่อไปเรื่อย ๆ พวกมันจะปรับปรุงความสามารถ AI บนอุปกรณ์ ทำให้แอปพลิเคชันทำงานได้เร็วขึ้นและใช้พลังงานน้อยลง












