Connect with us

โครงสร้างพื้นฐาน AI มีปัญหา โทเค็นกลายเป็นมาตรฐานใหม่ของมูลค่า

ผู้นำทางความคิด

โครงสร้างพื้นฐาน AI มีปัญหา โทเค็นกลายเป็นมาตรฐานใหม่ของมูลค่า

mm

อุตสาหกรรม AI มีปัญหาในการวัดผล

มานานแล้วที่ความสำเร็จถูกกำหนดโดยการเข้าถึงคอมพิวเตอร์ เช่น ใครมี GPU มากที่สุด ใครมีคลัสเตอร์ที่ใหญ่ที่สุด หรือ ใครมีการฝึกอบรมที่เร็วที่สุด หลายพันล้านถูกเทลงในโครงสร้างพื้นฐานเพื่อชนะการแข่งขันนี้

แต่เมื่อ AI ย้ายจากการทดลองไปสู่การผลิต โมเดลนี้เริ่มแตกหัก

องค์กรไม่ได้ซื้อ GPU พวกเขาไม่ได้ซื้อความสามารถในการอนุมาน พวกเขาซื้อผลลัพธ์ เช่น สรุปคำแนะนำ การตัดสินใจ เนื้อหา ในอีกคำหนึ่ง พวกเขาซื้อโทเค็น

แต่โครงสร้างพื้นฐาน AI ส่วนใหญ่ยังคงถูกออกแบบมาเหมือนเดิม คอมพิวเตอร์เป็นเป้าหมายสุดท้าย ไม่ใช่ผลลัพธ์

หน่วยวัดมูลค่าจริงใน AI คือโทเค็น และบริษัทที่รับรู้การเปลี่ยนแปลงนี้เร็วๆ นี้จะกำหนดยุคใหม่ของตลาด

การเพิ่มขึ้นของโรงงานโทเค็น AI

ถ้าโทเค็นเป็นผลิตภัณฑ์ โครงสร้างพื้นฐาน AI ต้องทำงานเหมือนระบบการผลิต ไม่ใช่โครงการวิทยาศาสตร์ นั่นคือที่ที่แนวคิดของโรงงานโทเค็น AI เข้ามา

โรงงานโทเค็น AI ไม่ใช่แค่ซอฟต์แวร์อีกชั้นหนึ่งในสแต็ก มันเป็นการคิดใหม่ของสแต็กเอง แทนที่จะปรับให้เหมาะสมกับการทำงานของโมเดลหรือการใช้ฮาร์ดแวร์โดยตรง มันเน้นไปที่ผลลัพธ์เดียว คือการผลิตโทเค็นที่มีประสิทธิภาพในระดับใหญ่

วันนี้ โมเดลคือการเช่า GPU พร้อมกับขั้นตอนพิเศษ องค์กรจัดเตรียมฮาร์ดแวร์ที่มีราคาแพง ติดป้ายเครื่องมือที่กระจัดกระจาย และหวังว่าการใช้งานจะถูกต้องตามการลงทุน

โรงงานโทเค็นกลับด้านนั้นไปเลย มันส่งผลลัพธ์ ไม่ใช่โครงสร้างพื้นฐาน และมองเห็นประสิทธิภาพเป็นหลักการออกแบบตั้งแต่วันแรก นี่ไม่ใช่ความก้าวหน้าแบบทีละน้อย มันคือการเปลี่ยนแปลงจากโครงสร้างพื้นฐานเป็นความสามารถไปสู่โครงสร้างพื้นฐานเป็นการผลิต

ทำไมโมเดลเก่าไม่สามารถรองรับได้

โมเดลโครงสร้างพื้นฐาน AI ปัจจุบันไม่ได้เพียงแต่ไม่มีประสิทธิภาพ มันไม่ยั่งยืน

การขาดแคลน GPU เปิดเผยรอยแตกแรก อุปสงค์ยังคงเกินอุปทาน ทำให้องค์กรต้องใช้การวางผู้ให้บริการหลายรายพร้อมกัน สิ่งที่เริ่มต้นเป็นวิธีแก้ปัญชั่วคราวกลายเป็นบรรทัดฐาน

ปัญหาอยู่ที่สแต็กส่วนใหญ่ไม่เคยถูกสร้างขึ้นสำหรับความเป็นจริงนี้ มันไม่ได้ปรับให้เหมาะสมกับโครงสร้างพื้นฐานที่แตกต่างกัน ไม่ได้ปรับเปลี่ยนในเวลาจริง และไม่ได้ให้ความชัดเจนเกี่ยวกับการทำงานและต้นทุน

ดังนั้น ความซับซ้อนจึงเพิ่มขึ้นเร็วกว่าการขยายตัว

ทุกๆ โมเดล เฟรมเวิร์ก อ_accelerator หรือแพลตฟอร์มคลาวด์ใหม่ๆ นำเสนออีกชั้นหนึ่งของภาระการทำงาน Teams ใช้เวลามากในการจัดการการทำงานแทนการปรับปรุงผลลัพธ์

สิ่งที่ควรเป็นข้อได้เปรียบในการขยายตัวกลายเป็นปัญหาในการประสานงาน

ในขณะเดียวกัน เศรษฐกิจก็ยากที่จะเพิกเฉยได้ การใช้งาน AI ในช่วงแรกๆ สามารถปิดบังความไม่มีประสิทธิภาพด้วยการเติบโตและการทดลอง ช่องว่างนั้นกำลังปิดลง

ผู้บริหารกำลังถามคำถามที่ยากขึ้นเรื่อยๆ ว่าทำไมต้นทุนการอนุมานจึงไม่คาดเดาได้ ทำไมการใช้ GPU ยังคงต่ำ ทำไมการใช้ GPU ยังคงต่ำ ทำไมองค์กรจ่ายค่าใช้จ่ายพรีเมียมสำหรับฮาร์ดแวร์ที่มักจะไม่ได้ใช้งาน ทำไมจึงยากที่จะเชื่อมโยงการลงทุนโครงสร้างพื้นฐานกับผลลัพธ์ทางธุรกิจ

คำตอบคือง่าย ระบบถูกออกแบบมาเพื่อการเข้าถึง ไม่ใช่ประสิทธิภาพ

จากโครงสร้างพื้นฐานที่มีศูนย์กลางเป็นคอมพิวเตอร์ไปสู่โครงสร้างพื้นฐานที่มีศูนย์กลางเป็นโทเค็น

การเปลี่ยนแปลงไปสู่โรงงานโทเค็นเป็นทั้งการเปลี่ยนแปลงเชิงปรัชญาและเชิงโครงสร้าง

まず ตลาดกำลังย้ายจาก GPU เป็นบริการไปสู่การบริการผลลัพธ์ ลูกค้าไม่ต้องการจัดการโครงสร้างพื้นฐาน พวกเขาต้องการผลลัพธ์ที่รับประกัน ผลลัพธ์สุดท้ายคือการบริโภคตามผลลัพธ์ ไม่ใช่ทรัพยากร

ที่สอง สแต็กที่กระจัดกระจายกำลังให้ทางเข้าสู่การควบคุมที่เป็นเอกภาพ ในสภาพแวดล้อมที่หลากหลาย ความชัดเจนและควบคุมทุกสิ่งเป็นทุกอย่าง โรงงานโทเค็นให้ข้อมูลเชิงลึกในเวลาจริงเกี่ยวกับการใช้งาน ต้นทุน และประสิทธิภาพ และความสามารถในการดำเนินการ องค์กรต้องเข้าใจว่า ใครสร้างโทเค็น ในราคาเท่าใด บนฮาร์ดแวร์ใด ภายใต้การทำงานใด และด้วยประสิทธิภาพเท่าใด ไม่มีคำตอบเหล่านั้น การปรับให้เหมาะสมจะกลายเป็นเดา

สุดท้าย การมุ่งเน้นของอุตสาหกรรมกำลังเปลี่ยนจากการทำงานไปสู่การปรับให้เหมาะสมอย่างต่อเนื่อง ปัญหาไม่ใช่แค่การทำงานแบบโมเดล แต่การทำงานแบบฉลาด องค์กรต้องกำหนดว่า การทำงานใดควรอยู่บนฮาร์ดแวร์ใด วิธีเพิ่มการทำงานให้สูงสุดโดยควบคุมต้นทุน วิธีหยุดการใช้โทเค็นที่ไม่ควบคุม

โรงงานโทเค็นมองปัญหาเหล่านี้เป็นปัญหาหลัก ไม่ใช่เรื่องรอง

ทำไมรูปแบบการนำส่ง AI ของวันนี้ไม่เพียงพอ

สแต็ก AI แบบดั้งเดิม (ครอบคลุมผู้ให้บริการฮาร์ดแวร์ แพลตฟอร์มคลาวด์ บริการอนุมาน) ถูกสร้างขึ้นหลักๆ สำหรับการเติบโตอย่างรวดเร็ว ไม่ใช่ประสิทธิภาพของระบบ

ทุกๆ ชั้นเพิ่มคุณค่า แต่ยังเพิ่มต้นทุน การทำให้ซับซ้อน และการกระจายตัวของการทำงาน ผลลัพธ์คือระบบที่มีกำไรทับซ้อนกัน ความโปร่งใสที่จำกัด และ การผูกขาดของผู้ให้บริการที่เพิ่มขึ้น องค์กรจบด้วยการปรับให้เหมาะสมภายในซิลโล ไม่ใช่ข้ามระบบ

โรงงานโทเค็นท้าทายโมเดลนั้นอย่างพื้นฐาน

โดยการแยกฮาร์ดแวร์ออกจากการส่งมอบคุณค่า มันทำให้สามารถปรับให้เหมาะสมได้ทุกจุด การทำงานสามารถเคลื่อนย้ายได้อย่างอิสระระหว่างสภาพแวดล้อม โครงสร้างสามารถพัฒนาได้โดยไม่ต้องเขียนใหม่ ประสิทธิภาพสามารถวัดได้ จัดการได้ และปรับปรุงได้อย่างต่อเนื่อง

นี่คือวิธีที่องค์กรและ คลาวด์ใหม่ที่เกิดขึ้นสามารถแข่งขันกับ hyperscalers ได้อย่างมีประสิทธิภาพ ไม่ใช่โดยการเทียบขนาด แต่โดยการเอาชนะด้านประสิทธิภาพ

ใครที่จะชนะ

บางทีปัจจัยที่เปลี่ยนแปลงที่สุดในการเปลี่ยนแปลงนี้คือ ใครที่ได้รับอำนาจ

คุณไม่ต้องเป็นเจ้าของศูนย์ข้อมูลหรือแม้แต่ GPU เพื่อทำงานโรงงานโทเค็น

สิ่งที่สำคัญคือการควบคุมการทำงาน การปรับให้เหมาะสมและการส่งมอบ นั่นเปิดประตูให้กับผู้เล่นที่หลากหลายมากขึ้น:

  • องค์กรที่มีงาน AI ที่มีขนาดใหญ่และคงที่
  • ผู้ให้บริการคลาวด์ใหม่ที่ปรับให้เหมาะสมสำหรับแนวตั้งหรือกรณีการใช้งานเฉพาะ
  • ผู้ให้บริการโครงสร้างพื้นฐานที่ย้ายขึ้นไปในสตैक

ในโมเดลนี้ ข้อได้เปรียบในการแข่งขันไม่ได้มาจากการสะสมคอมพิวเตอร์ มันมาจากการผลิตโทเค็นที่ดีกว่า เร็วกว่า และถูกกว่าใครๆ

สนามรบที่ใหม่: ต้นทุนต่อโทเค็น

ระยะถัดไปของการแข่งขัน AI จะไม่ได้รับการชนะด้วยคุณภาพของโมเดลเพียงอย่างเดียว มันจะถูกชนะด้วยประสิทธิภาพ มากกว่านั้น คือต้นทุนต่อโทเค็น

ใครสามารถส่งมอบผลลัพธ์ที่เทียบเท่าหรือดีกว่าในราคาเพียงเศษเสี้ยวของต้นทุน ใครสามารถขยายตัวโดยไม่ต้องมีการใช้จ่ายโครงสร้างพื้นฐานที่ไม่ควบคุมได้ ใครสามารถเปลี่ยน AI ให้เป็นธุรกิจที่คาดการณ์ได้และมีกำไร

สิ่งเหล่านี้ไม่ใช่คำถามเกี่ยวกับโครงสร้างพื้นฐาน มันเป็นคำถามเกี่ยวกับการผลิตที่ต้องการความคิดในการผลิต

อนาคตไม่ได้ถูกสร้างขึ้นบน GPU

GPU ไม่ได้หายไป แต่มันไม่ใช่เรื่องราวอีกต่อไป โทเค็นคือเรื่องราว

องค์กรที่ยังคงมุ่งเน้นไปที่คอมพิวเตอร์จะเผชิญกับต้นทุนที่เพิ่มขึ้นและผลตอบแทนที่ลดลง องค์กรที่เปลี่ยนไปสู่ระบบที่มีศูนย์กลางเป็นโทเค็นจะปลดล็อกโมเดลที่แตกต่างไปจากเดิมอย่างพื้นฐาน โมเดลที่สอดคล้องกับโครงสร้างพื้นฐานกับผลลัพธ์และต้นทุนกับคุณค่า

โรงงานโทเค็น AI ไม่ใช่แนวคิดที่อยู่ห่างไกล มันเป็นการพัฒนาที่ไม่避免ได้ของตลาด คำถามเดียวที่แท้จริงคือ ใครสร้างมันขึ้นมาและใครถูกทิ้งไว้ข้างหลัง

Gaurav Shah เป็น Vice President of Business Development and Strategy ที่ NeuReality, ซึ่งเขานำทีมลูกค้าในการปฏิวัติ AI inference และเร่งการนำไปใช้ในภาคส่วนต่างๆ รวมถึง fintech, healthtech และรัฐบาล Gaurav มีประสบการณ์ในอุตสาหกรรมเทคโนโลยีเป็นเวลา 3 ทศวรรษ โดยทำงานในบทบาทการตลาดผลิตภัณฑ์และการจัดการที่ NVIDIA, Marvell, Tenstorrent และ GlobalFoundries เขาเป็นคนพื้นที่ San Francisco Bay area