ผู้นำทางความคิด

ศูนย์ข้อมูล AI ต้องการมากกว่าระบบทำความเย็น: ต้องการวิศวกรรมที่เร็วขึ้น

mm

ปัญญาประดิษฐ์กำลังเปลี่ยนแปลงการทำงานดิจิทัล แต่ผลกระทบของมันกำลังเพิ่มขึ้นในด้านกายภาพ AI ในระดับใหญ่ต้องการพลังงานมากกว่าที่เคย และศูนย์ข้อมูลที่เป็นที่อยู่ของเซิร์ฟเวอร์ AI เหล่านั้นกำลังดิ้นรนเพื่อตอบสนองความต้องการ ในความเป็นจริง รายงานจาก Deloitte 估计ว่าในปี 2035 ความต้องการพลังงานจากศูนย์ข้อมูล AI ในสหรัฐอเมริกาอาจเพิ่มขึ้นมากกว่า 30 เท่า

อย่างไรก็ตาม ปัญหาไม่ใช่แค่เรื่องของการใช้พลังงานเท่านั้น ศูนย์ข้อมูลที่เป็นที่อยู่ของเซิร์ฟเวอร์ AI เหล่านั้นต้องคำนึงถึงระดับความร้อนที่เทคโนโลยีนี้สร้างขึ้น คลัสเตอร์ GPU สมัยใหม่สามารถสร้างความร้อนได้ถึง 50 kW ต่อชั้นวาง และมากกว่านั้น ซึ่งเป็นการเพิ่มขึ้น 10 เท่าจากเซิร์ฟเวอร์คำนวณมาตรฐานของทศวรรษที่แล้ว

ระบบทำความเย็นที่ใช้มาอย่างยาวนานสำหรับศูนย์ข้อมูลเพื่อจัดการกับงาน IT ไม่สามารถติดตามผลลัพธ์ความร้อนใหม่ๆ ได้ อินฟราสตร์กต์ไม่สามารถตามทัน ทำให้ผู้ที่รับผิดชอบในการออกแบบระบบทำความเย็นสำหรับศูนย์ข้อมูลต้องเผชิญกับความท้าทายใหม่ วิศวกรที่รับผิดชอบในการออกแบบอินฟราสตร์กต์สำหรับ AI ที่พร้อมใช้งานพบว่ากระบวนการวิศวกรรมแบบดั้งเดิมไม่สามารถติดตามขนาดและความเร็วของการนำ AI ไปใช้ได้

อาจดูเหมือนเป็นเรื่องขัดแย้งกัน แต่ AI ทั้งเพิ่มความต้องการความจุของศูนย์ข้อมูลและเปลี่ยนแปลงกระบวนการวิศวกรรมที่ใช้ในการสร้างความจุนั้น การพัฒนา AI ที่ขับเคลื่อนความต้องการอินฟราสตร์กต์ใหม่ๆ เหล่านั้น cũngเริ่มเร่งกระบวนการวิศวกรรมที่ใช้ในการสร้างอินฟราสตร์กต์เหล่านั้น

ในความเป็นจริง AI กำลังเป็นส่วนหนึ่งของกระบวนการที่ใช้ในการออกแบบอินฟราสตร์กต์ที่ใช้สำหรับ AI

ในแสงแห่งความเป็นจริงนี้ ทีมวิศวกรหลายทีมกำลังใช้กระบวนการจำลองแบบที่เร่งด้วย AI และเป็นมิตรกับคลาวด์ ซึ่งช่วยให้พวกเขาสามารถประเมินประสิทธิภาพความร้อน กลยุทธ์ทำความเย็น และการแลกเปลี่ยนอินฟราสตร์กต์ ก่อนที่การก่อสร้างจะเริ่มต้นขึ้น

เมื่อพูดถึงอินฟราสตร์กต์ของศูนย์ข้อมูลในปัจจุบัน ผลที่ตามมาของความผิดพลาดใดๆ อาจเป็นเรื่องร้ายแรง การพิสูจน์ประสิทธิภาพก่อนการก่อสร้างได้กลายเป็นข้อกำหนดที่จำเป็นสำหรับความสำเร็จในระยะยาว ไม่ใช่การอาศัยสมมติฐาน กฎเกณฑ์ หรือการตรวจสอบในระยะหลัง

อินฟราสตร์กต์ทำความเย็นแบบดั้งเดิมตกอยู่ภายใต้แรงกดดัน

ไม่幸ด้วยสำหรับทีมวิศวกรรม งาน AI มีความแตกต่างจากงานคำนวณแบบดั้งเดิมบนคลาวด์ ไม่มีการเปลี่ยนแปลงของความต้องการด้วย AI ความต้องการเครือข่าย ความร้อน และพลังงานมีความต่อเนื่อง

การเปลี่ยนแปลงนี้เป็นส่วนหนึ่งที่ทำให้ศูนย์ข้อมูลหลายแห่งเผชิญกับความล้มเหลว อินฟราสตร์กต์หลายแห่งถูกสร้างขึ้นโดยมีสมมติฐานที่ว่าความต้องการที่ยั่งยืนไม่จำเป็น และเนื่องจากระบบทำความเย็นเหล่านี้มักต้องการพลังงานสูงมาก จึงเริ่มไม่เหมาะสมที่จะ ‘ทำความเย็นมากเกินไป’ และคาดหวังว่าจะครอบคลุมความต้องการของศูนย์ข้อมูล การใช้แนวทางนี้และจัดลำดับความสำคัญของการทำงานอย่างต่อเนื่องจะทำให้ค่าใช้จ่ายและการใช้พลังงานเพิ่มขึ้นอย่างรวดเร็ว

ที่สุดของวัน ที่ตั้งคร่อมของศูนย์ข้อมูลหลายแห่งไม่ใช่เรื่องของ ‘ความร้อนมาก’ ความเสี่ยงที่การเติบโตของ AI นำมาคือการลดลงของระยะห่างสำหรับข้อผิดพลาด

สำหรับผู้พัฒนาศูนย์ข้อมูล การล่าช้าใดๆ ในกระบวนการตรวจสอบสามารถส่งผลกระทบต่อความมุ่งมั่นของลูกค้า การวางแผนความจุ หรือต้นทุนพลังงาน

ในอดีต ทีมวิศวกรรมสามารถชดเชยความไม่แน่นอนด้วยการให้ความสำคัญกับการออกแบบและการตรวจสอบในระยะหลัง AI เปลี่ยนแปลงสมการนี้ การติดตั้ง AI ที่รวดเร็ว การลงทุนด้านทุน และการเพิ่มความหนาแน่นของชั้นวางทำให้ไม่มีพื้นที่สำหรับการออกแบบและการทดสอบที่มีข้อผิดพลาด การตัดสินใจที่สามารถตรวจสอบได้ในระยะหลังตอนนี้ต้องได้รับการพิสูจน์ไว้ก่อนในกระบวนการออกแบบ

ความเป็นจริงใหม่: การพิสูจน์ประสิทธิภาพความร้อนก่อนการก่อสร้าง

ด้วยระยะห่างสำหรับข้อผิดพลาดที่ลดลง ทีมวิศวกรรมกำลังย้ายการวิเคราะห์ความร้อนไปสู่กระบวนการออกแบบในระยะที่เร็วขึ้น ในขณะที่การเปลี่ยนแปลงยังคงมีราคาไม่แพงและแบบจำลองยังคงมีความยืดหยุ่น ไม่ต้องรอจนกว่าการตรวจสอบจะเริ่มต้นเพื่อค้นหาว่าลวดลายการไหลของอากาศ การจัดเรียงชั้นวาง กลยุทธ์การกักเก็บ หรือการวางอุปกรณ์ทำความเย็น是否เพียงพอ พวกเขาสามารถสร้างแบบจำลองการไหลของอากาศและการถ่ายเทความร้อนก่อนที่การก่อสร้างจะเริ่มต้น

ซึ่งช่วยให้วิศวกรสามารถระบุจุดร้อน ทดสอบกลยุทธ์ทำความเย็น และเปรียบเทียบตัวเลือกการออกแบบภายใต้สภาพการทำงานที่แท้จริง ทีมสามารถประเมินว่าลมเย็นเข้าถึงชั้นวางที่มีความหนาแน่นสูงได้หรือไม่ ลมที่ออกจากอุปกรณ์ไหลกลับเข้าไปในอุปกรณ์หรือไม่ และความสามารถในการทำความเย็นถูกใช้อย่างมีประสิทธิภาพหรือไม่

สิ่งนี้คือที่ที่สถาปัตยกรรมของแพลตฟอร์มมีความสำคัญ สำหรับทีมที่ทำงานภายใต้แรงกดดันที่รุนแรง การจำลองไม่สามารถจำกัดอยู่กับกลุ่มผู้เชี่ยวชาญที่มีทรัพยากร HPC ที่เฉพาะเจาะจง การใช้แพลตฟอร์มการจำลองแบบที่เป็นมิตรกับคลาวด์ทำให้การวิเคราะห์ที่มีคุณภาพสูงสามารถเข้าถึงได้สำหรับทีมวิศวกรรมทั้งหมด ไม่ใช่แค่ผู้เชี่ยวชาญเพียงไม่กี่คนเท่านั้น ซึ่งช่วยให้ทีมสามารถดำเนินการวิจัย เปรียบเทียบตัวเลือกการออกแบบ และร่วมมือกันโดยไม่ต้องสร้างหรือบำรุงรักษาโครงสร้างพื้นฐานการคำนวณของตนเอง

ด้วยการเพิ่ม AI เข้าไปในกระบวนการนี้ บทบาทของการจำลองแบบเองเริ่มเปลี่ยนแปลงไป ในอดีต การจำลองแบบถูกจำกัดด้วยความเชี่ยวชาญ เวลา และทรัพยากรการคำนวณ การดำเนินการวิจัยที่มีคุณภาพสูงมักต้องการความรู้เชี่ยวชาญ อุปกรณ์เฉพาะ และรอบการวนซ้ำที่ยาวนาน

การเพิ่ม AI เข้าไปในกระบวนการวิศวกรรม ช่วยลดข้อจำกัดเหล่านี้โดยการเร่งการเตรียมแบบจำลอง การแสดงข้อมูลที่เกี่ยวข้อง และทำให้ทีมสามารถประเมินตัวเลือกการออกแบบได้มากขึ้นในเวลาที่สั้นลง แทนที่จะใช้การจำลองแบบเพียงในขั้นตอนการตรวจสอบสุดท้าย ทีมวิศวกรรมสามารถใช้กระบวนการทำงานที่เร่งด้วย AI เพื่อสำรวจทางเลือกต่างๆ อย่างต่อเนื่องตลอดกระบวนการออกแบบ

ผลลัพธ์ไม่ใช่แค่การจำลองแบบที่เร็วขึ้น แต่เป็นการนวัตกรรมที่เร็วขึ้น

ดังนั้น สิ่งนี้ดูเหมือนอย่างไรในความเป็นจริงสำหรับทีมวิศวกรรม ลองพิจารณาบริษัทที่ผลิตระบบทำความเย็นและระบายอากาศสำหรับสิ่งอำนวยความสะดวกขนาดใหญ่ที่ต้องการวิธีการทดสอบอุปกรณ์ใหม่ๆ ที่เร็วขึ้น บริษัทเหล่านี้มักต้องสร้างต้นแบบจริง นำผู้เชี่ยวชาญจากภายนอกมา และใช้เวลาหลายสัปดาห์ในการตรวจสอบว่าอากาศไหลและผสมอย่างเหมาะสมภายในระบบหรือไม่

แต่เมื่อบริษัทนี้ตัดสินใจใช้ซอฟต์แวร์จำลองเพื่อสร้างเวอร์ชันเสมือนที่ตั้งค่าการทดสอบ การเปลี่ยนแปลงนี้ทำให้วิศวกรสามารถทดสอบการไหลของอากาศและประสิทธิภาพอุณหภูมิบนคอมพิวเตอร์ก่อนที่จะสร้างผลิตภัณฑ์จริง

และผลลัพธ์มักจะส่งผลกระทบอย่างแท้จริง การทดสอบก่อนการผลิตสามารถลดลงเหลือเพียง 2-3 สัปดาห์ และเวลาในการออกแบบสามารถลดลงเหลือ 40 ชั่วโมง แทนที่จะเป็น 85 ชั่วโมงในกระบวนการแบบดั้งเดิม

และคุณค่าใน这里ไม่ใช่แค่การประหยัดเวลาเท่านั้น คุณค่าที่แท้จริงอยู่ที่ความสามารถของทีมวิศวกรรมในการถามคำถามและสำรวจความเป็นไปได้มากขึ้นในระยะแรก สิ่งที่เกิดขึ้นหากความหนาแน่นของชั้นวางเพิ่มขึ้น? สิ่งที่เกิดขึ้นหากเส้นทางการไหลของอากาศเปลี่ยนแปลง? สิ่งที่เกิดขึ้นหากสมมติฐานการสำรองข้อมูลล้มเหลว?

การทำให้เกิดการสำรวจเช่นนี้คือสิ่งที่ยกการจำลองแบบจากเครื่องมือวิเคราะห์ไปสู่ส่วนประกอบสำคัญของกลยุทธ์การออกแบบอินฟราสตร์กต์

อินฟราสตร์กต์ AI ต้องการวิศวกรรมที่เร่งด้วย AI

ระยะต่อไปของอินฟราสตร์กต์ AI จะไม่ได้ถูกกำหนดโดยขนาดของสิ่งอำนวยความสะดวก ความหนาแน่นของชั้นวาง หรือความสามารถในการทำความเย็นเพียงอย่างเดียว แต่ยังรวมถึงความเร็วในการพิสูจน์ว่าระบบเหล่านั้นจะทำงานได้ก่อนที่จะถูกสร้างขึ้น

นั่นคือที่ที่ความได้เปรียบในการแข่งขันครั้งต่อไปของอุตสาหกรรมจะเกิดขึ้น ผู้พัฒนาศูนย์ข้อมูลที่นำการจำลองแบบเข้ามาในกระบวนการออกแบบในระยะแรก ทำให้การจำลองแบบสามารถเข้าถึงได้ทั่วทีมวิศวกรรม และจับคู่กับกระบวนการทำงานที่เร่งด้วย AI จะมีความพร้อมที่ดีกว่าในการตัดสินใจอย่างมั่นใจก่อนที่จะลงทุนและเริ่มการก่อสร้าง

เมื่อ AI ยังคงเปลี่ยนแปลงความต้องการทางกายภาพที่วางอยู่บนศูนย์ข้อมูล มันจะเปลี่ยนแปลงวิธีการที่สิ่งอำนวยความสะดวกเหล่านั้นถูกออกแบบด้วย ผู้นำในยุคต่อไปจะไม่แค่ตอบสนองต่อภาระความร้อนที่สูงขึ้นหรือข้อจำกัดพลังงานที่เข้มงวดมากขึ้น แต่จะสร้างกระบวนการออกแบบที่สามารถคาดการณ์พวกมันได้

เดวิด ไฮนี เป็น CEO และผู้ร่วมก่อตั้ง SimScale เขาได้รับปริญญาตรีสาขาคณิตศาสตร์และไดปโลมาในสาขาวิศวกรรมเครื่องกลจาก Technical University of Munich รวมทั้งปริญญาโทสาขาวิทยาศาสตร์คอมพิวเตอร์และวิศวกรรมจาก Georgia Institute of Technology ความเชี่ยวชาญของเขารวมถึง CFD, การวิเคราะห์เชิงตัวเลข, การพัฒนาซอฟต์แวร์และคณิตศาสตร์ประยุกต์ ซึ่งพัฒนาขึ้นจากการศึกษาและประสบการณ์ทำงาน (FZG – TU München, MAN Diesel & Turbo, FluiDyna GmbH)

เดวิดยังมีปริญญาดุษฎีบัณฑิตสาขาเทคโนโลยีจัดการจาก Center for Digital Technology and Management (CDTM) เดวิดจบการศึกษาจาก Bavarian Elite Academy (Bayerische EliteAkademie) ร่วมกับสามผู้ร่วมก่อตั้ง SimScale คนอื่นๆ ได้แก่ Vincenz Dölle, Johannes Probst และ Alexander Fischer