การระดมทุน
Cerebras Secures $1.1 Billion Series G at $8.1 Billion Valuation to Redefine the AI Chip Race

Cerebras Systems ได้ประกาศการเสร็จสิ้นของการระดมทุน Series G มูลค่า $1.1 พันล้าน ซึ่งมีการจองซื้อมากกว่าที่คาดไว้ โดยมีมูลค่าบริษัทอยู่ที่ $8.1 พันล้าน การระดมทุนนี้ได้รับการนำสู้โดย Fidelity Management & Research และ Atreides Management โดยมีการเข้าร่วมจาก Tiger Global, Valor Equity Partners, 1789 Capital และผู้สนับสนุนเดิม Altimeter, Alpha Wave และ Benchmark。
บริษัทระบุว่าเงินลงทุนจะช่วยเร่งการพัฒนาโปรเซสเซอร์ขนาดวาฟเฟอร์, ขยายความสามารถในการผลิตในประเทศสหรัฐอเมริกา และเพิ่มขนาดเทอร์มินัลข้อมูล ซึ่งจะช่วยให้ Cerebras สามารถตอบสนองความต้องการที่เพิ่มขึ้นอย่างรวดเร็วสำหรับงาน inference ที่เป็นรากฐานของการนำ AI ไปใช้ในรูปแบบที่ทันสมัย
เหตุผลที่ Cerebras แตกต่าง
ในขณะที่ Nvidia เป็นผู้นำในการฝึกอบรมโมเดล AI ขนาดใหญ่ด้วย GPU ของตน Cerebras ได้สร้างตำแหน่งของตนเองในด้าน inference ซึ่งโมเดลถูกนำไปใช้ในสถานการณ์จริง ในช่วงปีที่ผ่านมา Cerebras ได้แสดงความเร็วที่มากกว่า 20 เท่าของ Nvidia GPUs ในโมเดลต่างๆ ความได้เปรียบด้านประสิทธิภาพนี้ได้กระตุ้นให้เกิดการนำไปใช้อย่างกว้างขวางในองค์กร รัฐบาล และสถาบันวิจัย
กุญแจสำคัญอยู่ที่ Wafer Scale Engine (WSE) ของ Cerebras ซึ่งเป็นชิปเซมิคอนดักเตอร์ที่ใหญ่ที่สุดในโลก รุ่นล่าสุด WSE-3 รวมคอร์ AI ที่ได้รับการปรับให้เหมาะสมเกือบหนึ่งล้านคอร์บนชิปวาฟเฟอร์เดียว ซึ่งหลีกเลี่ยงปัญหาการสื่อสารที่เกิดขึ้นเมื่องานถูกกระจายไปทั่วหลาย GPU การออกแบบนี้ลดความล่าช้าและพลังงานที่ใช้ขณะเดียวกันก็เพิ่มการผ่านเข้า ซึ่งทำให้เหมาะสำหรับงาน inference ที่ความเร็วและประสิทธิภาพเป็นสิ่งสำคัญ
การเปรียบเทียบกับ Nvidia และ Groq
Cerebras ไม่ได้อยู่คนเดียวในการคิดใหม่เกี่ยวกับฮาร์ดแวร์สำหรับ inference Groq ได้เลือกเส้นทางที่แตกต่างด้วย Language Processing Units ที่ออกแบบสำหรับการทำงานในเวลาจริงและความหน่วงต่ำ ในขณะเดียวกัน Nvidia ยังคงนำหน้าในด้านการฝึกอบรมและให้การสนับสนุนอย่างกว้างขวางสำหรับการ inference ผ่านระบบนิเวศ CUDA และ GPU ในศูนย์ข้อมูล
การแข่งขันเน้นย้ำถึงอุตสาหกรรมที่แบ่งออกเป็นสถาปัตยกรรมเฉพาะ Nvidia ยังคงมีความแข็งแกร่งในด้านความสามารถและระบบนิเวศ Groq มุ่งเน้นไปที่งานจริงที่มีขนาดเล็กและความหน่วงต่ำ Cerebras มุ่งเป้าไปที่ส่วนบนของสเปกตรัม โดยที่โมเดลขนาดใหญ่ต้องการการผ่านเข้าและประสิทธิภาพอย่างมาก วิธีการใช้วาฟเฟอร์-สเกลของ Cerebras อาจไม่ได้แบบ môดูลาร์เหมือนกับคลัสเตอร์ GPU แต่ให้ความได้เปรียบอย่างชัดเจนเมื่องาน inference เพิ่มขึ้นเป็นล้านๆ
ความเร็วและตำแหน่งในตลาด
ระบบของ Cerebras ได้รับการนำไปใช้แล้วโดยบริษัทเทคโนโลยีและสถาบันต่างๆ รวมถึง AWS, Meta, IBM, Mistral, Cognition และ Notion ร่วมกับรัฐบาลและศูนย์วิจัย เช่น กระทรวงพลังงานสหรัฐอเมริกาและกระทรวงกลาโหม บริษัทได้กลายเป็นผู้ให้บริการ inference อันดับหนึ่งบน Hugging Face โดยให้บริการมากกว่า 5 ล้านคำขอจากนักพัฒนาทุกเดือน
ความเร็วในการเติบโตนี้เน้นย้ำถึงการเปลี่ยนแปลงในเศรษฐกิจของ AI ในขณะที่การฝึกอบรมยังคงมีค่าใช้จ่ายสูงและต้องใช้ทรัพยากรมาก แต่คุณค่าในระยะยาวอยู่ที่การนำโมเดลไปใช้ขนาดใหญ่ องค์กรต่างๆ มีความตื่นตัวมากขึ้นเกี่ยวกับต้นทุน การหน่วง และความน่าเชื่อถือของ inference — ปัจจัยที่ส่งผลโดยตรงต่อจุดแข็งของ Cerebras
ความท้าทายในอนาคต
การเติบโตของ Cerebras ไม่ได้ปราศจากอุปสรรคที่สำคัญ การออกแบบขนาดวาฟเฟอร์เป็นที่รู้กันว่าเป็นการผลิตที่ยาก การผลิตอาจมีผลผลิตต่ำ และการแก้ปัญหาเรื่องการทำความเย็นอาจซับซ้อน ซึ่งทำให้การขยายการผลิตมีความเสี่ยงและต้องใช้เงินมาก เมื่อเทียบกับคลัสเตอร์ GPU ที่ชิปที่มีข้อบกพร่องสามารถถูกแทนที่ได้แบบส่วนบุคคล ระบบขนาดวาฟเฟอร์-สเกลมีความอดทนน้อยกว่า
บริษัทยังเผชิญกับการตรวจสอบอย่างใกล้ชิดเกี่ยวกับการกระจายลูกค้า ในการเปิดเผยทางการเงินก่อนหน้านี้ Cerebras ได้เปิดเผยว่ารายได้ส่วนใหญ่ในครึ่งแรกของปี 2024 มาจากลูกค้าเพียงรายเดียว การพึ่งพาในลักษณะนี้ทำให้ธุรกิจตกอยู่ในความผันผวนหากพันธมิตรหลักเปลี่ยนกลยุทธ์ ใช้ฮาร์ดแวร์ทางเลือก หรือตัดสินใจกระจายซัพพลายเออร์ในการคำนวณ
พลวัตด้านกฎระเบียบเพิ่มอีกชั้นหนึ่งของความซับซ้อน Cerebras ได้ยื่นฟ้อง IPO อย่างเป็นความลับในปี 2024 แต่เลื่อนออกไปเนื่องจากรีวิวความมั่นคงแห่งชาติที่เกี่ยวข้องกับการทำธุรกิจกับ G42 บริษัท AI ของอาบูดาบี ผู้กำกับดูแลของสหรัฐฯ ได้ตรวจสอบการลงทุนต่างชาติและหุ้นส่วนที่เพิ่มขึ้นในอุตสาหกรรมชิป AI ซึ่งทำให้เส้นทางของ Cerebras สู่ตลาดสาธารณะซับซ้อนมากขึ้น ในขณะที่รอบการระดมทุนใหม่ $1.1 พันล้านซื้อเวลา แต่ก็เพิ่มความคาดหวังที่บริษัทจะต้องแสดงการเติบโตของรายได้ที่ยั่งยืนและกระจายความเสี่ยงเพื่อตอบสนองนักลงทุนและผู้กำกับดูแล
สุดท้าย การแข่งขันก็เพิ่มความเข้มข้นขึ้น Nvidia ยังคงพัฒนา GPU Blackwell และระบบนิเวศซอฟต์แวร์อย่างรวดเร็ว Groq ได้รับการยอมรับในด้านการ inference ในเวลาจริง Hyperscalers เช่น Amazon, Microsoft และ Google กำลังสร้างซิลิคอนแบบกำหนดเองเพื่อลดการอาศัยซัพพลายเออร์ภายนอก Cerebras ต้องพิสูจน์ว่าวิธีการใช้วาฟเฟอร์-สเกลของตนไม่เพียงแต่เร็วกว่า แต่ยังขยายได้ คุ้มต้นทุน และสามารถป้องกันการโจมตีจากทั้งผู้นำตลาดและผู้เข้าใหม่ได้
การคำนวณ Inference และอนาคตของ AI
Cerebras การระดมทุนเน้นย้ำถึงช่วงเวลาสำคัญในการพัฒนา AI: การเปลี่ยนจุดสนใจจากฝึกอบรมไปสู่การ inference การฝึกอบรมกำหนดว่าโมเดลใหม่ๆ จะเกิดขึ้นได้เร็วแค่ไหน แต่การ inference ตัดสินว่าสามารถนำไปใช้อย่างกว้างขวางและประสิทธิภาพได้ขนาดไหน ฮาร์ดแวร์สำหรับการ inference กำลังจะกลายเป็นปัญหาสำคัญ — และโอกาส — สำหรับอุตสาหกรรม
เมื่อโมเดลใหญ่ขึ้นและใช้งานในโดเมนแบบเรียลไทม์ เช่น การให้เหตุผล ระบบอัจฉริยะ และการสร้างโค้ด ความเร็วและประสิทธิภาพจะกำหนดข้อได้เปรียบในการแข่งขัน บริษัทที่สามารถให้บริการ inference ที่มีต้นทุนต่ำ ล่าช้าน้อย และมีประสิทธิภาพสูงจะกำหนดผู้ชนะใน AI ที่สร้างสรรค์ Nvidia, Cerebras, Groq และโครงการชิปแบบกำหนดเองของยักษ์ใหญ่คลาวด์กำลังเข้ามาแข่งขันในพื้นที่นี้ โดยมีจุดแข็งแตกต่างกัน
อนาคตของ AI จะไม่ได้ถูกกำหนดเพียงโดยผู้ที่ฝึกโมเดลที่ใหญ่ที่สุด แต่จะถูกตัดสินโดยผู้ที่สามารถนำโมเดลเหล่านั้นไปใช้ในโลก — ขับเคลื่อนธุรกิจ รัฐบาล และนักพัฒนา — ด้วยแพลตฟอร์ม inference ที่เร็วที่สุด ราคาไม่แพง และมีประสิทธิภาพสูงสุด การระดมทุน $1 พันล้านของ Cerebras แสดงให้เห็นว่าการแข่งขันนี้มีความสำคัญเพียงใด












