Connect with us

การใช้ประโยชน์จากซิลิกอน: วิธีการพัฒนาชิปในองค์กรที่กำหนดรูปแบบอนาคตของ AI

ปัญญาประดิษฐ์

การใช้ประโยชน์จากซิลิกอน: วิธีการพัฒนาชิปในองค์กรที่กำหนดรูปแบบอนาคตของ AI

mm

ปัญญาประดิษฐ์ เช่นเดียวกับซอฟต์แวร์อื่นๆ ขึ้นอยู่กับส่วนประกอบพื้นฐานสองประการ ได้แก่ โปรแกรม AI ซึ่งมักถูกเรียกว่าแบบจำลอง และฮาร์ดแวร์คำนวณ หรือชิป ที่ขับเคลื่อนโปรแกรมเหล่านี้ ในช่วงเวลาที่ผ่านมา การพัฒนา AI มุ่งเน้นไปที่การปรับปรุงแบบจำลอง ในขณะที่ฮาร์ดแวร์ถูกมองว่าเป็นส่วนประกอบมาตรฐานที่จัดหาโดยซัพพลายเออร์จากภายนอก อย่างไรก็ตาม ในช่วงไม่นานมานี้ วิธีการนี้ได้เริ่มเปลี่ยนแปลงไป บริษัท AI รายใหญ่ เช่น Google, Meta และ Amazon ได้เริ่มพัฒนาชิป AI ของตนเอง การพัฒนาชิป AI ในองค์กรเป็นสัญญาณของยุคใหม่ในการพัฒนา AI เรียงความนี้จะสำรวจเหตุผลเบื้องหลังการเปลี่ยนแปลงแนวทางนี้ และจะเน้นถึงการพัฒนาล่าสุดในพื้นที่ที่กำลังพัฒนานี้

ทำไมจึงต้องมีการพัฒนาชิป AI ในองค์กร?

การเปลี่ยนแปลงไปสู่การพัฒนาชิป AI ในองค์กรถูกขับเคลื่อนโดยปัจจัยสำคัญหลายประการ ซึ่งรวมถึง:

ความต้องการชิป AI ที่เพิ่มขึ้น

การสร้างและใช้แบบจำลอง AI ต้องการทรัพยากรคำนวณที่สำคัญเพื่อจัดการข้อมูลจำนวนมากและสร้างการคาดการณ์ที่แม่นยำหรือข้อมูลเชิงลึก ชิปคอมพิวเตอร์แบบดั้งเดิมไม่สามารถจัดการกับความต้องการคำนวณเมื่อฝึกอบรมบนจุดข้อมูลล้านๆ จุด ความจำกัดนี้ได้นำไปสู่การสร้างชิป AI ที่ทันสมัยซึ่งออกแบบมาเพื่อตอบสนองความต้องการประสิทธิภาพและประสิทธิผลของแอปพลิเคชัน AI ในยุคสมัยใหม่ เมื่อการวิจัยและพัฒนา AI ยังคงเติบโต ความต้องการชิปเหล่านี้จึงเพิ่มขึ้น

Nvidia ซึ่งเป็นผู้นำในการผลิตชิป AI ที่ทันสมัยและก้าวหน้ากว่าคู่แข่งของตน กำลังเผชิญกับความท้าทาย เนื่องจากความต้องการเกินความสามารถในการผลิตของตน ซึ่งนำไปสู่ การรอชิป AI ของ Nvidia ที่ขยายออกไปเป็นหลายเดือน ซึ่งเป็นความล่าช้าที่ยังคงเพิ่มขึ้นเมื่อความต้องการชิป AI ของพวกเขาเพิ่มขึ้น นอกจากนี้ ตลาดชิป ซึ่งรวมถึงผู้เล่นหลักๆ เช่น Nvidia และ Intel ยังเผชิญกับความท้าทายในการผลิตชิป ปัญหา นี้เกิดจากความพึ่งพาในการผลิตชิปของ TSMC ซึ่งเป็นผู้ผลิตชิปของไต้หวัน ซึ่งนำไปสู่เวลาผลิตที่ยาวนานสำหรับการผลิตชิปที่ทันสมัยเหล่านี้

การทำให้การคำนวณ AI มีประสิทธิภาพและยั่งยืน

ชิป AI รุ่นปัจจุบัน ซึ่งออกแบบมาเพื่อทำงานคำนวณหนัก มักจะ ใช้พลังงานมาก และสร้างความร้อนมาก ซึ่งนำไปสู่ผลกระทบต่อสิ่งแวดล้อมที่สำคัญสำหรับการฝึกอบรมและใช้แบบจำลอง AI นักวิจัยของ OpenAI ชี้ให้เห็นว่า: ตั้งแต่ปี 2012 กำลังคำนวณที่จำเป็นในการฝึกอบรมแบบจำลอง AI ที่ทันสมัยเพิ่มขึ้นสองเท่าทุกๆ 3.4 เดือน ซึ่งหมายความว่าภายในปี 2040 การปล่อยก๊าซเรือนกระจกจากภาค ICT อาจประกอบด้วย 14% ของการปล่อยก๊าซเรือนกระจกทั่วโลก การศึกษาอื่น แสดงให้เห็นว่า การฝึกอบรมแบบจำลอง ภาษา ขนาดใหญ่เพียงแบบเดียวสามารถปล่อยก๊าซคาร์บอนไดออกไซด์ได้มากถึง 284,000 กิโลกรัม ซึ่งเทียบเท่ากับการใช้พลังงานของรถยนต์ 5 คันตลอดอายุการใช้งาน นอกจากนี้ คาดการณ์ ว่าการใช้พลังงานของศูนย์ข้อมูลจะ เพิ่มขึ้น 28% ภายในปี 2030 การค้นพบเหล่านี้เน้นย้ำถึงความจำเป็นในการสร้างสมดุลระหว่างการพัฒนา AI และความรับผิดชอบต่อสิ่งแวดล้อม ในการตอบสนอง บริษัท AI จำนวนมากกำลังลงทุนในการพัฒนาชิปที่มีประสิทธิภาพมากขึ้น โดยมีเป้าหมายในการทำให้การฝึกอบรม AI และการดำเนินงานมีความยั่งยืนและเป็นมิตรต่อสิ่งแวดล้อมมากขึ้น

การปรับชิปให้เหมาะสมกับงานเฉพาะ

กระบวนการ AI ที่แตกต่างกันมีความต้องการคำนวณที่แตกต่างกัน ตัวอย่างเช่น การฝึกอบรมแบบจำลองการเรียนรู้ลึกต้องใช้พลังคำนวณที่สำคัญและทูพุตสูงเพื่อจัดการข้อมูลจำนวนมากและดำเนินการคำนวณที่ซับซ้อนอย่างรวดเร็ว ชิปที่ออกแบบมาเพื่อฝึกอบรมได้รับการปรับปรุงเพื่อเพิ่มการทำงานเหล่านี้ โดยปรับปรุงความเร็วและประสิทธิภาพ ในทางกลับกัน การอนุมาน ซึ่งเป็นกระบวนการที่แบบจำลองนำความรู้ที่ได้มาไปใช้เพื่อทำการคาดการณ์ ต้องการการประมวลผลที่รวดเร็วโดยใช้พลังงานน้อย โดยเฉพาะในอุปกรณ์เช่น สมาร์ทโฟนและอุปกรณ์ IoT ชิปที่ออกแบบมาเพื่อการอนุมานได้รับการออกแบบมาเพื่อเพิ่มประสิทธิภาพต่อวัตต์ โดยรับประกันการตอบสนองที่รวดเร็วและประหยัดแบตเตอรี่ การปรับชิปให้เหมาะสมกับงานฝึกอบรมและงานอนุมานช่วยให้แต่ละชิปสามารถปรับให้เหมาะสมกับบทบาทที่ตั้งใจไว้ โดยเพิ่มประสิทธิภาพในการทำงานบนอุปกรณ์และแอปพลิเคชันต่างๆ การเชี่ยวชาญประเภทนี้ไม่เพียงแต่สนับสนุนฟังก์ชัน AI ที่แข็งแกร่งยิ่งขึ้น แต่ยังช่วยส่งเสริมประสิทธิภาพการใช้พลังงานและความคุ้มค่าที่ดีขึ้นในวงกว้าง

การลดภาระทางการเงิน

ภาระทางการเงินของการคำนวณสำหรับการฝึกอบรมและดำเนินการแบบจำลอง AI ยังคงมาก OpenAI ตัวอย่างเช่น ใช้ซูเปอร์คอมพิวเตอร์ที่สร้างโดย Microsoft สำหรับการฝึกอบรมและอนุมานตั้งแต่ปี 2020 มันใช้เงิน OpenAI ประมาณ 12 ล้านเหรียญสหรัฐในการฝึกอบรมแบบจำลอง GPT-3 และค่าใช้จ่ายเพิ่มขึ้นเป็น 100 ล้านเหรียญสหรัฐ สำหรับการฝึกอบรม GPT-4 ตาม รายงาน ของ SemiAnalysis OpenAI ต้องการเซิร์ฟเวอร์ HGX A100 ประมาณ 3,617 เครื่อง รวมทั้งหมด 28,936 GPU เพื่อสนับสนุน ChatGPT โดยมีค่าใช้จ่ายเฉลี่ยต่อการค้นห约 0.36 ดอลลาร์ ด้วยค่าใช้จ่ายเหล่านี้ในใจ Sam Altman ซีอีโอของ OpenAI ได้รับการรายงานว่ากำลังมองหาการลงทุนที่สำคัญเพื่อสร้างเครือข่ายการผลิตชิป AI ทั่วโลก ตาม รายงานของ Bloomberg

การควบคุมและนวัตกรรม

ชิป AI ของบุคคลที่สามมักจะมีข้อจำกัด บริษัทที่พึ่งพาชิปเหล่านี้อาจพบว่าตัวเองถูกจำกัดด้วยโซลูชันที่ไม่เหมาะสมกับแบบจำลอง AI หรือแอปพลิเคชันที่ไม่เหมือนใคร การพัฒนาชิปในองค์กรช่วยให้สามารถปรับแต่งได้ตามกรณีการใช้งานเฉพาะ ไม่ว่าจะเป็นสำหรับรถยนต์ไร้คนขับหรืออุปกรณ์มือถือ การควบคุมฮาร์ดแวร์ทำให้บริษัทสามารถใช้ประโยชน์จากอัลกอริทึม AI ของตนได้อย่างเต็มที่ ชิปที่ปรับแต่งสามารถปรับปรุงงานเฉพาะ ลดความล่าช้า และเพิ่มประสิทธิภาพโดยรวม

ความก้าวหน้าล่าสุดในการพัฒนาชิป AI

ส่วนนี้จะสำรวจความก้าวหน้าล่าสุดของ Google, Meta และ Amazon ในการสร้างเทคโนโลยีชิป AI

โปรเซสเซอร์ Axion ของ Google

Google ได้พัฒนาอย่างต่อเนื่องในด้านเทคโนโลยีชิป AI ตั้งแต่การเปิดตัว Tensor Processing Unit (TPU) ในปี 2015 โดยสร้างบนพื้นฐานนี้ Google ได้เปิดตัว โปรเซสเซอร์ Axion ซึ่งเป็น CPU ที่ออกแบบเองโดยเฉพาะสำหรับศูนย์ข้อมูลและงาน AI เหล่านี้ โปรเซสเซอร์เหล่านี้ใช้แอร์คิเทคเจอร์ Arm ซึ่งรู้จักกันดีในเรื่องของประสิทธิภาพและดีไซน์ที่กะทัดรัด โปรเซสเซอร์ Axion มีเป้าหมายที่จะปรับปรุงประสิทธิภาพของการฝึกอบรม AI และการอนุมานโดยใช้ CPU ในขณะเดียวกันก็รักษาความสามารถในการประหยัดพลังงานไว้ นอกจากนี้ยังแสดงถึงการปรับปรุงประสิทธิภาพที่สำคัญสำหรับงานทั่วไปต่างๆ รวมถึงเซิร์ฟเวอร์เว็บและแอปพลิเคชัน ไมโครเซอร์วิสที่อยู่ในคอนเทนเนอร์ ฐานข้อมูลโอเพ่นซอร์ส เครื่องมือประมวลผลสื่อ และอื่นๆ อีกมากมาย

MTIA ของ Meta

Meta กำลังผลักดันไปข้างหน้าในด้านเทคโนโลยีชิป AI ด้วย Meta Training and Inference Accelerator (MTIA) ของตน ซึ่งออกแบบมาเพื่อเพิ่มประสิทธิภาพของการฝึกอบรมและกระบวนการอนุมาน โดยเฉพาะสำหรับอัลกอริทึมการจัดอันดับและคำแนะนำ เมต้าได้อธิบายว่า MTIA เป็นส่วนสำคัญของกลยุทธ์ในการเสริมสร้างโครงสร้างพื้นฐาน AI ของตนเองไปไกลกว่า GPU ในตอนแรกกำหนดให้เปิดตัวในปี 2025 แต่เมต้าได้ผลิตทั้งสองรุ่นของ MTIA แล้ว ซึ่งแสดงถึงความเร็วในการวางแผนพัฒนาชิปของตน ในขณะที่ MTIA มุ่งเน้นไปที่การฝึกอบรมอัลกอริทึมบางประเภทในขณะนี้ เมต้ามีเป้าหมายที่จะขยายการใช้งานเพื่อรวมการฝึกอบรมสำหรับ AI ที่สร้างสรรค์ เช่น แบบจำลองภาษา Llama ของตน

Trainium และ Inferentia ของ Amazon

ตั้งแต่การแนะนำ ชิป Nitro ที่ออกแบบเองในปี 2013 Amazon ได้ขยายการพัฒนาชิป AI ของตนอย่างมาก บริษัทได้เปิดตัวชิป AI 2 ชิปรุ่นใหม่ Trainium และ Inferentia Trainium ได้รับการออกแบบมาโดยเฉพาะเพื่อปรับปรุงการฝึกอบรม AI และกำหนดให้ใช้ใน EC2 UltraClusters คลัสเตอร์เหล่านี้สามารถรองรับชิปได้มากถึง 100,000 ชิป และได้รับการปรับให้เหมาะสมสำหรับการฝึกอบรมแบบจำลองพื้นฐานและแบบจำลองภาษาขนาดใหญ่โดยใช้พลังงานอย่างมีประสิทธิภาพ Inferentia ในทางกลับกัน ได้รับการออกแบบมาเพื่อการอนุมาน โดยมุ่งเน้นในการลดความล่าช้าและค่าใช้จ่ายในการอนุมานเพื่อตอบสนองความต้องการของผู้ใช้หลายล้านคนที่โต้ตอบกับบริการที่ได้รับการสนับสนุนจาก AI

สรุป

การเคลื่อนไหวไปสู่การพัฒนาชิป AI ในองค์กรโดยบริษัทหลักๆ เช่น Google, Microsoft และ Amazon สะท้อนถึงการเปลี่ยนแปลงเชิงกลยุทธ์ในการตอบสนองความต้องการคำนวณที่เพิ่มขึ้นของเทคโนโลยี AI แนวโน้มนี้เน้นย้ำถึงความจำเป็นในการมีโซลูชันที่ออกแบบมาโดยเฉพาะเพื่อสนับสนุนแบบจำลอง AI โดยตรง โดยตอบสนองความต้องการที่ไม่เหมือนใครของระบบเหล่านี้ เมื่อความต้องการชิป AI ยังคงเติบโต ผู้นำในอุตสาหกรรม เช่น Nvidia มีแนวโน้มที่จะเห็นการเพิ่มขึ้นอย่างมีนัยสำคัญในมูลค่าตลาด ซึ่งเน้นย้ำถึงบทบาทที่สำคัญที่ชิปที่ออกแบบเองมีต่อการขับเคลื่อนนวัตกรรม AI ด้วยการสร้างชิปของตนเอง บริษัทเหล่านี้ไม่เพียงแต่ปรับปรุงประสิทธิภาพและประสิทธิผลของระบบ AI ของตนเท่านั้น แต่ยังช่วยส่งเสริมอนาคตที่ยั่งยืนและคุ้มค่ามากขึ้น การพัฒนานี้กำลังกำหนดมาตรฐานใหม่ในอุตสาหกรรม โดยขับเคลื่อนความก้าวหน้าทางเทคโนโลยีและความได้เปรียบในการแข่งขันในตลาดโลกที่เปลี่ยนแปลงอย่างรวดเร็ว

ดร. Tehseen Zia เป็น Professor ที่ COMSATS University Islamabad โดยได้รับ PhD ใน AI จาก Vienna University of Technology, Austria มีเชี่ยวชาญด้าน Artificial Intelligence, Machine Learning, Data Science, และ Computer Vision โดยมีส่วนร่วมที่สำคัญด้วยการเผยแพร่ในวารสารวิทยาศาสตร์ที่มีชื่อเสียง ดร. Tehseen ยังได้ดำเนินโครงการอุตสาหกรรมต่างๆ ในฐานะ Principal Investigator และให้บริการเป็นที่ปรึกษาด้าน AI