Лидеры мысли
Мегамодели не являются причиной кризиса вычислений

Каждый раз, когда появляется новая модель ИИ — обновления GPT, DeepSeek, Gemini — люди удивляются огромному размеру, сложности и все большему вычислительному голоду этих мегамоделей. Предполагается, что эти модели определяют потребности в ресурсах для революции ИИ.
Это предположение неверно.
Да, большие модели требуют вычислений. Но наибольшая нагрузка на инфраструктуру ИИ исходит не от нескольких мегамоделей, а от молчаливого распространения моделей ИИ в разных отраслях, каждая из которых настроена на конкретные приложения и потребляет вычисления в беспрецедентных масштабах.
Несмотря на потенциальную конкуренцию «победитель получает всё», развивающуюся среди магистров права (LLM), ландшафт ИИ в целом не централизуется, а фрагментируется. Каждая компания не просто использует ИИ, но и обучает, настраивает и развертывает частные модели, адаптированные к своим потребностям. Именно эта ситуация создаст кривую спроса на инфраструктуру, к которой облачные провайдеры, предприятия и государственные учреждения не готовы.
Мы уже видели эту модель раньше. Облако не консолидировало ИТ-нагрузки; оно создало разрастающуюся гибридную экосистему. Сначала это было разрастание серверов. Затем разрастание виртуальных машин. Теперь? Разрастание ИИ. Каждая волна вычислений приводила к распространению, а не к упрощению. ИИ не исключение.
Распространение ИИ: почему будущее ИИ — это миллион моделей, а не одна
Финансы, логистика, кибербезопасность, обслуживание клиентов, НИОКР — у каждого есть своя собственная модель ИИ, оптимизированная для своей собственной функции. Организации не обучают одну модель ИИ для управления всей своей деятельностью. Они обучают тысячи. Это означает больше циклов обучения, больше вычислений, больше спроса на хранение и большее разрастание инфраструктуры.
Это не теория. Даже в отраслях, которые традиционно осторожны в отношении внедрения технологий, инвестиции в ИИ ускоряются. Отчет McKinsey за 2024 год показал, что организации теперь используют ИИ в среднем в трех бизнес-функциях, причем лидируют производство, цепочка поставок и разработка продуктов (McKinsey).
Здравоохранение — яркий пример. Navina, стартап, который интегрирует ИИ в электронные медицинские карты для получения клинических знаний, только что привлек $55 млн в рамках финансирования серии C от Goldman Sachs (Business Insider). Энергетика не исключение — лидеры отрасли запустили Open Power AI Consortium, чтобы оптимизировать работу сетей и предприятий с помощью ИИ (Вардар).
Вычислительная нагрузка, о которой никто не говорит
ИИ уже ломает традиционные модели инфраструктуры. Предположение, что облако может масштабироваться бесконечно для поддержки роста ИИ, совершенно неверно. ИИ не масштабируется как традиционные рабочие нагрузки. Кривая спроса не постепенна — она экспоненциальна, и гипермасштаберы не поспевают.
- Ограничения мощности: Центры обработки данных, ориентированные на ИИ, теперь строятся с учетом доступности электроэнергии, а не только сетевых магистралей.
- Узкие места сети: Гибридные ИТ-среды становятся неуправляемыми без автоматизации, а рабочие нагрузки ИИ только усугубят эту ситуацию.
- Экономическое давление: Рабочие нагрузки ИИ могут потреблять миллионы в месяц, создавая финансовую непредсказуемость.
На дата-центры уже приходится 1% мирового потребления электроэнергии. В Ирландии они сейчас потребляют 20% национальной сети, и ожидается, что эта доля значительно возрастет к 2030 году (МЭА).
Добавьте к этому надвигающееся давление на графические процессоры. Bain & Company недавно предупредила, что рост ИИ создает условия для дефицита полупроводников, вызванного взрывным спросом на чипы класса центров обработки данных (Bain).
Между тем, проблема устойчивости ИИ растет. Анализ 2024 года в Устойчивые города и общество предупреждает, что широкое внедрение ИИ в здравоохранении может существенно увеличить потребление энергии и выбросы углерода в секторе, если это не будет компенсировано целевыми мерами по повышению эффективности (ScienceDirect).
Распространение ИИ превышает рынок — это вопрос государственной власти
Если вы считаете, что разрастание ИИ — это корпоративная проблема, подумайте еще раз. Наиболее значимым фактором фрагментации ИИ является не частный сектор, а правительства и военные оборонные агентства, развертывающие ИИ в масштабах, с которыми не может сравниться ни один гиперскейлер или предприятие.
Только правительство США внедрило ИИ в более чем 700 приложений в 27 агентствах, охватывающих анализ разведданных, логистику и многое другое (Журнал FedTech).
Канада инвестирует до 700 миллионов долларов в расширение внутренних вычислительных мощностей ИИ, запуская общенациональную кампанию по укреплению инфраструктуры суверенных центров обработки данных (Инновации, наука и экономическое развитие Канады).
И все чаще звучат призывы к «программе Аполлон» для инфраструктуры ИИ, что подчеркивает переход ИИ от коммерческой выгоды к национальной необходимости (MIT Technology Review).
Военный ИИ не будет эффективным, скоординированным или оптимизированным по стоимости — он будет обусловлен требованиями национальной безопасности, геополитической срочностью и потребностью в закрытых, суверенных системах ИИ. Даже если предприятия сдержат распространение ИИ, кто скажет правительствам замедлиться?
Потому что, когда на кону национальная безопасность, никто не останавливается, чтобы спросить, справится ли с этим энергосистема.