เชื่อมต่อกับเรา

รีวิวหนังสือ: เครื่องจักรแห่งความคิด: เจนเซน หวง, NVIDIA และไมโครชิปที่ทรงคุณค่าที่สุดในโลก โดย สตีเฟน วิทท์

รีวิวหนังสือ

รีวิวหนังสือ: เครื่องจักรแห่งความคิด: เจนเซน หวง, NVIDIA และไมโครชิปที่ทรงคุณค่าที่สุดในโลก โดย สตีเฟน วิทท์

mm

เครื่องจักรแห่งความคิด: เจนเซน หวง, NVIDIA และไมโครชิปที่ทุกคนต่างปรารถนามากที่สุดในโลก หนังสือเล่มนี้แตกต่างจากหนังสือส่วนใหญ่ที่เขียนเกี่ยวกับปัญญาประดิษฐ์ เพราะมันเข้าถึงหัวข้อนี้จากมุมมองที่ผู้อ่านที่เชี่ยวชาญด้านเทคนิคหลายคน รวมถึงตัวผมเองด้วย มักมองข้ามไปในอดีต

เช่นเดียวกับหลายคนที่ติดตาม AI มาหลายปี ความเข้าใจของผมเกี่ยวกับสาขานี้ถูกหล่อหลอมด้วยเหตุการณ์สำคัญที่คุ้นเคย เรื่องราวมักเริ่มต้นใน... ปี 1956 ณ โรงงานดาร์ทมัธ เริ่มต้นด้วยระบบสัญลักษณ์ยุคแรก จากนั้นข้ามไปยังช่วงเวลาสำคัญๆ เช่น การก่อตั้ง IBM ดีพบลูเอาชนะแกรี่ คาสปารอฟ, DeepMind เชี่ยวชาญภาษา Goและเมื่อไม่นานมานี้ OpenAI ได้แสดงให้เห็นว่าแบบจำลองภาษาขนาดใหญ่สามารถประสานกลยุทธ์ในสภาพแวดล้อมแบบผู้เล่นหลายคนที่มีความซับซ้อนได้ ช่วงเวลาเหล่านี้สร้างความพึงพอใจทางปัญญาและจดจำได้ง่าย เพราะมันเน้นไปที่ชัยชนะที่เห็นได้ชัด

สิ่งที่หนังสือของสตีเฟน วิทท์ทำได้อย่างยอดเยี่ยมคือการท้าทายกรอบความคิดนั้น แทนที่จะมุ่งเน้นไปที่ช่วงเวลาที่ AI สร้างความประทับใจให้กับโลก เครื่องคิด บทความนี้มุ่งเน้นไปที่ชั้นที่มองไม่เห็นซึ่งอยู่เบื้องหลังความสำเร็จเหล่านั้น โดยให้เหตุผลอย่างน่าเชื่อถือว่า ยุคปัญญาประดิษฐ์สมัยใหม่ไม่ได้เกิดขึ้นจากแนวคิดที่ชาญฉลาดเพียงอย่างเดียว แต่เกิดจากการเปลี่ยนแปลงพื้นฐานในวิธีการคำนวณนั่นเอง

โดยการเน้นเรื่องราวไปที่ NVIDIA (NVDA + 0.47%) และด้วยความร่วมมือของ Jensen Huang ผู้ร่วมก่อตั้ง Witt ได้นำเสนอการปฏิวัติ AI ในมุมมองใหม่ โดยเน้นเรื่องราวเกี่ยวกับสถาปัตยกรรมคอมพิวเตอร์ ระบบนิเวศของนักพัฒนา และความเชื่อมั่นในระยะยาว ผลลัพธ์ที่ได้จึงไม่ใช่แค่ชีวประวัติของบริษัท แต่ยังเป็นบทที่ขาดหายไปในประวัติศาสตร์ที่กว้างขึ้นของปัญญาประดิษฐ์อีกด้วย

จากวิดีโอเกมสู่กระบวนทัศน์การคำนวณแบบใหม่

จุดเริ่มต้นของ NVIDIA นั้นแตกต่างอย่างสิ้นเชิงจากความทะเยอทะยานอันสูงส่งที่เกี่ยวข้องกับปัญญาประดิษฐ์ในปัจจุบัน บริษัท เกิดขึ้นในปี 1993 ในฐานะผู้ผลิตชิปประมวลผลกราฟิก บริษัทมุ่งเน้นไปที่การสร้างโลกในวิดีโอเกมที่สมจริงยิ่งขึ้นเรื่อยๆ ความท้าทายในขณะนั้นไม่ใช่เรื่องของสติปัญญา แต่เป็นเรื่องของความเร็ว เกมต่างๆ ต้องการการคำนวณจำนวนมหาศาลที่ต้องทำทันทีเพื่อจำลองแสง การเคลื่อนไหว และความลึก

โซลูชันที่ NVIDIA เลือกใช้คือ การคำนวณแบบขนาน การประมวลผลแบบขนานหมายถึงการดำเนินการคำนวณจำนวนมากในเวลาเดียวกัน แทนที่จะดำเนินการทีละรายการ แทนที่จะพึ่งพาแกนประมวลผลทรงพลังเพียงแกนเดียวในการประมวลผลคำสั่งทีละคำสั่ง GPU ใช้แกนประมวลผลขนาดเล็กหลายพันแกนที่ทำงานพร้อมกันในการคำนวณทางคณิตศาสตร์ที่คล้ายคลึงกัน วิธีการนี้มีประสิทธิภาพอย่างยิ่งสำหรับงานที่เกี่ยวข้องกับการคำนวณซ้ำๆ ในชุดข้อมูลขนาดใหญ่

เดิมที สถาปัตยกรรมนี้ถูกสร้างขึ้นเพื่อการประมวลผลกราฟิก แต่ Witt ได้แสดงให้เห็นว่าการตัดสินใจนี้ได้สร้างรากฐานที่เหมาะสมสำหรับเครือข่ายประสาทเทียมในอีกหลายทศวรรษต่อมา การฝึกฝนโมเดล AI สมัยใหม่เกี่ยวข้องกับการดำเนินการทางคณิตศาสตร์ที่เหมือนกันจำนวนมหาศาลกับข้อมูลจำนวนมหาศาล และ GPU ก็ได้รับการปรับให้เหมาะสมสำหรับงานประเภทนี้อยู่แล้ว

สิ่งที่ทำให้ส่วนนี้ของหนังสือมีความน่าสนใจคือ วิธีที่วิทท์เชื่อมโยงทางเลือกด้านการออกแบบทางเทคนิคเข้ากับการอยู่รอดได้อย่างชัดเจน NVIDIA ไม่ได้เลือกใช้การประมวลผลแบบขนานเพราะมองเห็นอนาคตของปัญญาประดิษฐ์ แต่เลือกใช้เพราะมันเป็นหนทางเดียวที่จะแข่งขันได้ในด้านกราฟิกแบบเรียลไทม์ ความจำเป็นนั้นบังคับให้บริษัทต้องเชี่ยวชาญโมเดลการประมวลผลที่จะพิสูจน์ให้เห็นในภายหลังว่าเป็นการเปลี่ยนแปลงครั้งใหญ่ที่นอกเหนือไปจากวงการเกม

เจนเซน หวง และการคิดเชิงระบบ ไม่ใช่เชิงผลิตภัณฑ์

ใจกลางของเรื่องราวนี้คือ เจนเซน หวง ซึ่งไม่ได้ถูก portray ในฐานะผู้บริหารทั่วไป แต่เป็นคนที่คิดในเชิงระบบมากกว่าคิดแค่ผลิตภัณฑ์แต่ละชิ้น วิทท์นำเสนอหวงในฐานะคนที่เข้มงวด จริงจัง และมักจะยากที่จะเข้าถึง แต่ก็มีความสม่ำเสมออย่างน่าทึ่งในมุมมองที่มีต่อเทคโนโลยีตลอดช่วงระยะเวลาอันยาวนาน

ในขณะที่คู่แข่งมองว่า GPU เป็นเพียงชิ้นส่วนใช้แล้วทิ้งที่ผูกติดอยู่กับวงจรการเล่นเกม แต่ Huang กลับมองว่า GPU เป็นรากฐานของแพลตฟอร์มการประมวลผลที่กว้างกว่า ความแตกต่างนี้มีความสำคัญอย่างยิ่ง ผลิตภัณฑ์มีการทดแทนกัน แพลตฟอร์มมีการพัฒนาอย่างต่อเนื่อง

ภายในบริษัท NVIDIA สะท้อนให้เห็นถึงแนวคิดนี้ วิศวกรได้รับการสนับสนุนให้คิดล่วงหน้าหลายปี ซอฟต์แวร์ได้รับการพิจารณาว่ามีความสำคัญเชิงกลยุทธ์ไม่แพ้ชิป การลงทุนในเครื่องมือและการสนับสนุนนักพัฒนาเกิดขึ้นนานก่อนที่จะมีความต้องการที่ชัดเจน ทางเลือกหลายอย่างเหล่านี้ดูเหมือนจะมากเกินไปหรือไม่จำเป็นในขณะนั้น แต่เมื่อมองย้อนกลับไปแล้ว สิ่งเหล่านี้ได้สร้างกำแพงป้องกันที่คู่แข่งยากที่จะข้ามผ่านได้

วิทท์ชี้แจงอย่างชัดเจนว่า การเติบโตของ NVIDIA ไม่ได้เกิดขึ้นโดยหลีกเลี่ยงไม่ได้ บริษัทเกือบจะล้มเหลวหลายครั้ง สิ่งที่ผลักดันให้บริษัทก้าวไปข้างหน้าไม่ใช่ความก้าวหน้าเพียงครั้งเดียว แต่เป็นการเชื่อมั่นอย่างต่อเนื่องว่า การประมวลผลแบบเร่งความเร็วจะมีความสำคัญมากกว่าการใช้งานดั้งเดิมในที่สุด

CUDA และเรื่องราวต้นกำเนิดของ AI ที่หลายคนมองข้ามไป

หนึ่งในผลงานสำคัญที่สุดของ เครื่องคิด นั่นคือวิธีที่มันปรับเปลี่ยนบทบาทของ CUDA ในประวัติศาสตร์ปัญญาประดิษฐ์

ก่อนอ่านหนังสือเล่มนี้ เราอาจคิดว่า... CUDA ในฐานะเครื่องมือสำหรับนักพัฒนาที่ประสบความสำเร็จ วิทท์แสดงให้เห็นว่าทำไมมันถึงสมควรได้รับความสนใจมากกว่านี้ CUDA ถูกสร้างขึ้นเพื่อทำให้การประมวลผลแบบขนานสามารถใช้งานได้นอกเหนือจากงานด้านกราฟิก ก่อนหน้า CUDA การใช้ GPU สำหรับการคำนวณทั่วไปจำเป็นต้องบังคับแก้ปัญหาผ่านอินเทอร์เฟซเฉพาะด้านกราฟิก ซึ่งมีความเปราะบาง ไม่มีประสิทธิภาพ และจำกัดอยู่เฉพาะผู้เชี่ยวชาญเท่านั้น

CUDA เปลี่ยนแปลงสิ่งนั้นโดยอนุญาตให้นักพัฒนาสามารถเขียนโปรแกรม GPU โดยใช้รูปแบบการเขียนโปรแกรมที่คุ้นเคย ทำให้แกนประมวลผลหลายพันแกนกลายเป็นทรัพยากรที่เข้าถึงได้ทั่วไป ซึ่งช่วยลดอุปสรรคในการเข้าถึงการประมวลผลประสิทธิภาพสูงในแบบที่คนส่วนใหญ่ไม่ได้ตระหนักอย่างถ่องแท้ในขณะนั้น

ตรงจุดนี้เองที่หนังสือเล่มนี้สอดคล้องกับประสบการณ์การเรียนรู้ประวัติศาสตร์ปัญญาประดิษฐ์ของผมอย่างมาก เนื้อหาที่ผมได้รับนั้นเน้นหนักไปที่แบบจำลองและอัลกอริธึม อะไรนะ? เครื่องคิด สิ่งที่ทำให้เห็นได้อย่างชัดเจนคือ แนวคิดเหล่านั้นจำนวนมากกลายเป็นสิ่งที่นำไปใช้ได้จริงก็ต่อเมื่อนักวิจัยสามารถฝึกฝนพวกเขาในวงกว้างได้เท่านั้น

นักวิจัยด้าน AI ตระหนักได้อย่างรวดเร็วว่าโครงข่ายประสาทเทียมนั้นเหมาะสมอย่างยิ่งสำหรับการประมวลผลแบบขนาน การฝึกฝนเกี่ยวข้องกับการทำซ้ำการดำเนินการเดียวกันกับชุดข้อมูลขนาดใหญ่ โดยปรับพารามิเตอร์นับล้านหรือพันล้านตัวตลอดเวลา CUDA ช่วยให้กระบวนการนี้เกิดขึ้นได้เร็วขึ้น ประหยัดกว่า และเชื่อถือได้มากกว่าที่ CPU เคยทำได้

สิ่งนี้มีความสำคัญอย่างยิ่งเมื่อการเรียนรู้เชิงลึกพัฒนาไปอย่างรวดเร็ว และต่อมาเมื่อโมเดลแบบ Transformer ปรากฏขึ้น โมเดล Transformer ทำงานได้ดีเยี่ยมเมื่อต้องการประมวลผลในขนาดใหญ่ หากไม่มีการเร่งความเร็วด้วย GPU โมเดลจำนวนมากที่กำหนดภูมิทัศน์ของ AI ในปัจจุบันคงจะยังคงเป็นเพียงทฤษฎีหรือมีราคาแพงเกินไป CUDA ไม่ได้คิดค้นสถาปัตยกรรมเหล่านี้ แต่ทำให้การพัฒนาอย่างรวดเร็วของพวกมันเป็นไปได้

สิ่งที่วิทท์ชี้ให้เห็นอย่างชัดเจนคือ ผลลัพธ์นี้ไม่ได้วางแผนไว้ล่วงหน้าทั้งหมด CUDA ถูกสร้างขึ้นเพื่อการคำนวณทางวิทยาศาสตร์ นักวิจัยด้าน AI ค้นพบพลังของมันและดึง NVIDIA เข้าสู่ใจกลางของการแข่งขันด้าน AI

โครงสร้างพื้นฐานเหนืออัลกอริทึม

หนึ่งในข้อคิดที่ทรงคุณค่าที่สุดของหนังสือเล่มนี้คือ ความก้าวหน้าของ AI นั้นถูกจำกัดด้วยโครงสร้างพื้นฐานมากพอๆ กับแนวคิด บทความยอดนิยมหลายชิ้นมุ่งเน้นไปที่อัลกอริธึม เทคนิคการฝึกฝน และชุดข้อมูล เครื่องคิด เตือนผู้อ่านว่าสิ่งเหล่านี้ไม่มีความหมายอะไรเลยหากปราศจากพลังการประมวลผลที่เพียงพอ

จากมุมมองนี้ กระแสความนิยม AI สมัยใหม่ ดูเหมือนว่าจะไม่เกิดขึ้นอย่างฉับพลัน แต่เป็นการล่าช้ามากกว่า เครือข่ายประสาทเทียมมีมานานหลายทศวรรษแล้ว สิ่งที่เปลี่ยนไปคือความพร้อมของฮาร์ดแวร์ที่สามารถฝึกฝนเครือข่ายเหล่านั้นในระดับที่มีความหมายได้

NVIDIA ไม่ได้แค่ผลิตชิปที่เร็วขึ้นเท่านั้น แต่ยังสร้างระบบนิเวศของฮาร์ดแวร์ ไลบรารีซอฟต์แวร์ และเครื่องมือสำหรับนักพัฒนาที่เสริมซึ่งกันและกันมาโดยตลอด เมื่อนักวิจัยปรับปรุงงานของตนให้เหมาะสมกับแพลตฟอร์มของ NVIDIA ทาง NVIDIA ก็ได้ปรับปรุงผลิตภัณฑ์ของตนให้ดียิ่งขึ้นเพื่อรองรับงานด้าน AI วงจรป้อนกลับนี้สร้างความได้เปรียบที่ยั่งยืนซึ่งขยายไปไกลกว่าประสิทธิภาพโดยรวมเพียงอย่างเดียว

หนังสือเล่มนี้เน้นย้ำความเป็นจริงที่ปรากฏชัดเจนมากขึ้นในปัจจุบันอย่างเงียบๆ นั่นคือ ความเป็นผู้นำในด้านปัญญาประดิษฐ์นั้นถูกกำหนดโดยห่วงโซ่อุปทาน กำลังการผลิต ระบบนิเวศซอฟต์แวร์ และการควบคุมแพลตฟอร์ม ไม่ใช่แค่ความฉลาดหลักแหลมด้านการวิจัยเพียงอย่างเดียว

วิสัยทัศน์ ความเสี่ยง และผลพวงที่ทวีคูณ

วิทท์ไม่ได้หลีกเลี่ยงผลกระทบจากการครอบงำของ NVIDIA เนื่องจากบริษัทนี้กลายเป็นรากฐานสำคัญของโครงสร้างพื้นฐาน AI ระดับโลก อิทธิพลของบริษัทจึงเติบโตขึ้นตามไปด้วย ความเชื่อของเจนเซน หวง ที่ว่าการประมวลผลแบบเร่งความเร็วจะเป็นตัวกำหนดความก้าวหน้าทางเทคโนโลยีในระยะต่อไปนั้น ปรากฏให้เห็นตลอดทั้งเล่ม

แทนที่จะสั่งสอนศีลธรรม เครื่องคิด บทความนี้เน้นไปที่วิธีการที่วิศวกรรมและการตัดสินใจเชิงกลยุทธ์ที่สม่ำเสมอได้สะสมกันมาเรื่อย ๆ เมื่อเวลาผ่านไป NVIDIA ไม่ได้ประสบความสำเร็จด้วยการไล่ตามกระแส แต่ประสบความสำเร็จด้วยการมุ่งมั่นในด้านการประมวลผลแบบขนานตั้งแต่เนิ่น ๆ อดทนต่อวัฏจักรของตลาดซ้ำแล้วซ้ำเล่า และลงทุนอย่างไม่หยุดยั้งในเครื่องมือที่ทำให้ฮาร์ดแวร์ของตนมีความสำคัญอย่างยิ่ง

สำหรับผู้อ่านที่ต้องการเข้าใจว่า AI สามารถขยายขนาดได้อย่างแท้จริงอย่างไร

สำหรับผู้อ่านที่ทราบถึงเหตุการณ์สำคัญๆ ของข่าวอยู่แล้ว ประวัติศาสตร์ AIหนังสือเล่มนี้เติมเต็มส่วนที่ขาดหายไปซึ่งอยู่เบื้องหลังความก้าวหน้าเหล่านั้น อธิบายว่าเหตุใดความก้าวหน้าเหล่านั้นจึงสามารถขยายขนาดได้ในเวลานั้น และเหตุใด NVIDIA จึงกลายเป็นกำลังสำคัญในกระบวนการนี้

หนังสือเล่มนี้เหมาะสำหรับผู้อ่านที่ต้องการเข้าใจปัญญาประดิษฐ์ในฐานะระบบอุตสาหกรรมมากกว่าเป็นเพียงชุดของแบบจำลองอัจฉริยะ และจะตรงใจผู้ที่สนใจในเรื่องชิป ศูนย์ข้อมูล และการตัดสินใจทางวิศวกรรมที่มักมองไม่เห็น ซึ่งเป็นส่วนสำคัญในการกำหนดพลังทางเทคโนโลยี

เครื่องคิด ประสบความสำเร็จเพราะเป็นการนำเสนอเรื่องราวของ AI ในมุมมองใหม่ทั้งหมด โดยแสดงให้เห็นว่าการประมวลผลแบบขนาน แพลตฟอร์มสำหรับนักพัฒนา และวิสัยทัศน์ระยะยาวได้สร้างรากฐานที่ทำให้ปัญญาประดิษฐ์สมัยใหม่ยืนอยู่ได้

อองตวนเป็นผู้นำที่มีวิสัยทัศน์และหุ้นส่วนผู้ก่อตั้ง Unite.AI ผู้เปี่ยมด้วยความมุ่งมั่นอย่างไม่ลดละในการกำหนดและส่งเสริมอนาคตของ AI และหุ่นยนต์ เขาเป็นผู้ประกอบการต่อเนื่องที่เชื่อว่า AI จะสร้างการเปลี่ยนแปลงครั้งใหญ่ให้กับสังคมเช่นเดียวกับพลังงานไฟฟ้า และมักถูกพูดถึงอย่างออกรสออกชาติเกี่ยวกับศักยภาพของเทคโนโลยีที่พลิกโฉมและ AGI

ในฐานะที่เป็น ผู้เป็นเจ้ายังมาไม่ถึงเขาอุทิศตนเพื่อสำรวจว่านวัตกรรมเหล่านี้จะกำหนดโลกของเราอย่างไร นอกจากนี้ เขายังเป็นผู้ก่อตั้ง หลักทรัพย์.ioแพลตฟอร์มที่มุ่งเน้นการลงทุนในเทคโนโลยีล้ำสมัยที่กำลังกำหนดอนาคตใหม่และปรับเปลี่ยนรูปแบบภาคส่วนต่างๆ ทั้งหมด