Connect with us

Реальная бутылка AI: Электричество, охлаждение и физика масштаба

Искусственный интеллект

Реальная бутылка AI: Электричество, охлаждение и физика масштаба

mm

Искусственный интеллект продвинулся вперед с необыкновенной скоростью за последнее десятилетие. Более быстрые GPU, более крупные кластеры и революционные архитектуры открыли прорывы, которые когда-то казались невозможными. Однако, когда отрасль движется к моделям с триллионом параметров и гипермасштабным фабрикам AI, следующий барьер не имеет отношения к алгоритмам. Реальная бутылка сегодня физическая: электричество, охлаждение и инфраструктура, необходимая для поддержания вычислений в планетарном масштабе.

Вопрос больше не состоит в том, сколько чипов можно произвести, а в том, можно ли обеспечить гигаватты, воду и линии передачи, необходимые для их работы. Инфраструктура, а не кремний, будет определять темп развития AI в ближайшие годы.

Гигаватты вместо гигафлопс

Проект OpenAI “Stargate”, который строится вместе с Oracle и SoftBank, нацелен на почти 7 гигаватт мощности на кампусах США — что сопоставимо с несколькими ядерными реакторами. На таком масштабе основной задачей не является производство GPU, а обеспечение электростанций и подстанций для их работы.

Спрос Microsoft не менее ошеломляющий. Его рабочие нагрузки AI, как ожидается, будут требовать столько же электричества, сколько весь регион Новой Англии к 2030 году. Это помогает объяснить, почему компания инвестировала десятки миллиардов в проекты возобновляемой энергии и также изучает более экспериментальные варианты, такие как ядерный синтез и передовые ядерные реакторы.

Динамика распространяется на энергетическую политику. В PJM Interconnection, региональной организации передачи, которая управляет сетью для более чем 65 миллионов человек в 13 штатах и Вашингтоне, коммунальные услуги изучают механизмы ограничения для центров данных во время пикового спроса. Крупные технологические фирмы лоббируют против таких ограничений, но тот факт, что регулирующие органы даже рассматривают их, показывает, насколько центральным AI стал для планирования сети.

Проблема охлаждения

Снабжение электричеством — это только половина проблемы. Как только электричество достигает стойки, следующей задачей становится тепло. Каждый высококлассный GPU потребляет около 700 ватт, и с стойками, в которых размещаются сотни GPU, плотности достигают 100-600 киловатт на стойку. Воздушное охлаждение, отраслевой стандарт на протяжении десятилетий, становится непригодным для использования после примерно 40 киловатт на стойку из-за неэффективности воздушного потока и рециркуляции.

Охлаждение жидкостью поэтому сместилось от нишевого к мейнстримовому. Последние жидкостно охлаждаемые платформы Blackwell от NVIDIA предназначены для гипермасштабных кластеров AI и обеспечивают 25-кратную лучшую энергоэффективность и 300-кратную большую водоэффективность по сравнению с воздушно охлаждаемыми стойками. Компания также сотрудничает с Vertiv над референс-архитектурой, которая может обрабатывать более 130 киловатт на стойку, что делает возможным развертывание плотных GPU.

Стартапы также инновируют. Corintis, швейцарская компания, встраивающая микроканалы непосредственно в подложки чипов, недавно привлекла $24 миллиона инвестиций и уже имеет среди своих клиентов Microsoft. Собственная исследовательская команда Microsoft продемонстрировала микрофлюидные каналы, выгравированные в упаковке чипа, снижающие пиковые температуры GPU на 65 процентов и увеличивающие эффективность в три раза по сравнению с традиционными холодными пластинами. Эти технологии делают возможным поддержание GPU на полной мощности без перегрева центра данных.

Вода как стратегическая переменная

Охлаждение жидкостью вводит другую переменную: потребление воды. Испарительные и охлаждаемые водой системы могут требовать огромных объемов при масштабировании до кампусов сотен мегаватт. В Фениксе кластеры центров данных могут требовать сотни миллионов галлонов воды в день, что вызывает обеспокоенность в регионах, подверженных засухе.

Это привело к разработке систем охлаждения без воды и замкнутых контуров. IEEE Spectrum задокументировал стратегии, такие как герметичные диэлектрические иммерсионные ванны, сухие охладители и водоэффективные охладители, которые снижают потребление питьевой воды почти до нуля. Тем временем некоторые операторы экспериментируют с повторным использованием отходящего тепла. Проекты, такие как Aquasar и iDataCool, показали, как горячие контуры охлаждения могут питать системы отопления зданий или абсорбционные охладители, перерабатывая большую часть энергии, которая в противном случае была бы потеряна.

Компромисс часто заключается между водой и электричеством: замкнутые или сухие системы потребляют больше энергии, в то время как испарительные конструкции экономят энергию, но сильно зависят от воды. В регионах с нехваткой воды политика все чаще отдает предпочтение сохранению воды, даже если это означает более высокое потребление энергии.

Инфраструктура и сеть

Даже с решениями по электричеству и охлаждению в месте, окончательной бутылкой является инфраструктура. Решения о размещении теперь определяют победителей и проигравших в гонке AI.

Кампус Microsoft Fairwater в Висконсине стоимостью 80 миллиардов долларов иллюстрирует, как стратегическое расположение стало важным. Объект занимает 315 акров, вмещает сотни тысяч GPU и был выбран за доступ к подстанциям, волоконно-оптическим линиям и грунтовым водам. Дизайн также подчеркивает замкнутое охлаждение, чтобы минимизировать водное воздействие.

Чтобы поддержать свою растущую нагрузку, Microsoft заключил знаковое соглашение с Brookfield о добавлении 10,5 гигаватт возобновляемой мощности к 2030 году. В то же время компания поддержала более экспериментальные проекты, такие как ядерный синтезный завод, строящийся компанией Helion Energy, который должен питать центры данных к 2028 году, и 20-летнее соглашение о перезапуске ядерного реактора на острове Три Миля в Пенсильвании.

Amazon и Google предпринимают аналогичные шаги, обеспечивая места рядом с ядерными станциями и разрабатывая свои собственные портфели чистой энергии. В Ирландии, где центры данных уже потребляют больше электроэнергии, чем все домохозяйства вместе взятые, регулирующие органы заморозили новые одобрения до 2028 года, подчеркивая, как политика и разрешения могут сорвать даже самые хорошо финансируемые проекты.

Умная эксплуатация: AI, управляющий AI

Интересно, что сам AI используется для управления инфраструктурной нагрузкой. Рефлексивное обучение было развернуто в производственных центрах данных для оптимизации систем охлаждения, что привело к экономии энергии на 14-21 процент без компрометации безопасности. Цифровые двойники и прогностическое моделирование также используются для предсказания горячих точек, предварительного охлаждения оборудования и переноса рабочих нагрузок на более прохладные часы или периоды избытка возобновляемой энергии.

Google уже продемонстрировал, как машинное обучение может снизить потребность в охлаждении центров данных на 40 процентов, и другие операторы принимают аналогичные системы. По мере роста затрат на электричество и охлаждение эти операционные экономии становятся важным конкурентным преимуществом.

Стратегический прогноз

Траектория ясна. Спрос на AI, как ожидается, удвоит потребление электроэнергии центрами данных во всем мире к 2030 году, при этом рабочие нагрузки AI будут составлять среднесрочную долю общего мирового потребления энергии к 2050 году. Хотя NVIDIA и другие производители чипов продолжают продвигать производительность кремния вперед, практическая граница AI будет определяться тем, насколько быстро коммунальные предприятия могут строить новые генерирующие мощности, линии передачи и инфраструктуру охлаждения.

Для компаний, строящих продукты AI, это означает, что дорожные карты все чаще связаны с местами, где существует емкость. Для инвесторов наиболее ценные проекты могут быть коммунальными предприятиями, разработчиками линий передачи и стартапами в области охлаждения, а не только поставщиками GPU. А для политиков дискуссия об AI смещается от вопросов этики и управления данными к вопросам мегаватт, воды и модернизации сети.

Будущее AI будет решаться не только в исследовательских лабораториях и фабриках по производству чипов, но и на подстанциях, контурах охлаждения и электростанциях. Физика масштаба — а не только математика алгоритмов — будет определять скорость и масштаб искусственного интеллекта в ближайшее десятилетие.

Антуан - видный лидер и сооснователь Unite.AI, движимый непоколебимой страстью к формированию и продвижению будущего ИИ и робототехники. Как серийный предприниматель, он считает, что ИИ будет столь же разрушительным для общества, как электричество, и часто увлекается потенциалом разрушительных технологий и ИИ.

Как футуролог, он посвящен изучению того, как эти инновации изменят наш мир. Кроме того, он является основателем Securities.io, платформы, ориентированной на инвестиции в передовые технологии, которые переопределяют будущее и меняют целые сектора.