Connect with us

Мега-модели не являются ключом к кризису вычислений

Лидеры мнений

Мега-модели не являются ключом к кризису вычислений

mm

Каждый раз, когда выпускается новая модель ИИ — обновления GPT, DeepSeek, Gemini — люди поражаются огромному размеру, сложности и все чаще вычислительному голода этих мега-моделей. Предполагается, что эти модели определяют потребности в ресурсах революции ИИ.

Это предположение неверно.

Да, крупные модели требуют больших вычислительных ресурсов. Но самая большая нагрузка на инфраструктуру ИИ не исходит от горстки мега-моделей — она исходит от бесшумного распространения моделей ИИ по отраслям, каждая из которых настроена для конкретных приложений, каждая потребляющая вычислительные ресурсы в беспрецедентном масштабе.

Несмотря на потенциальную конкуренцию «winner-takes-all», развивающуюся среди LLM, ИИ-ландшафт в целом не централизуется — он фрагментируется. Не каждое предприятие просто использует ИИ — они тренируют, настраивают и развертывают частные модели, адаптированные к их потребностям. Именно эта ситуация создаст кривую спроса на инфраструктуру, для которой облачные провайдеры, предприятия и правительства не готовы.

Мы уже видели эту закономерность. Облачные вычисления не консолидировали рабочие нагрузки ИТ — они создали разветвленную гибридную экосистему. Сначала это была распыл серверов. Затем распыл ВМ. Теперь? Распыл ИИ. Каждая волна вычислений привела к распространению, а не упрощению. ИИ не является исключением.

Распыл ИИ: Почему будущее ИИ — это миллион моделей, а не одна

Финансы, логистика, кибербезопасность, обслуживание клиентов, НИОКР — каждая имеет свою модель ИИ, оптимизированную для своей функции. Организации не тренируют одну модель ИИ, чтобы она правила всей их операцией. Они тренируют тысячи. Это означает больше циклов обучения, больше вычислений, больше спроса на хранилище и больше инфраструктурного распыла.

Это не теоретически. Даже в отраслях, которые традиционно осторожны в отношении принятия технологий, инвестиции в ИИ ускоряются. Отчет McKinsey 2024 года показал, что организации теперь используют ИИ в среднем в трех бизнес-функциях, а производство, цепочка поставок и разработка продукции возглавляют список (McKinsey).

Здравоохранение — это яркий пример. Navina, стартап, который интегрирует ИИ в электронные медицинские записи для выявления клинических прозрений, только что привлек 55 миллионов долларов в рамках раунда серии C от Goldman Sachs (Business Insider). Энергетика не является исключением — лидеры отрасли запустили консорциум Open Power AI, чтобы привнести оптимизацию ИИ в эксплуатацию сетей и заводов (Axios).

Нагрузка на вычисления, о которой никто не говорит

ИИ уже ломает традиционные модели инфраструктуры. Предположение, что облако может масштабироваться бесконечно для поддержки роста ИИ, совершенно неверно. ИИ не масштабируется как традиционные рабочие нагрузки. Кривая спроса не постепенная — она экспоненциальная, и гипермасштабируемость не поспевает.

  • Ограничения мощности: Центры данных, специфичные для ИИ, теперь строятся вокруг доступности мощности, а не только сетевых магистралей.
  • Проблемы сети: Гибридные ИТ-среды становятся неуправляемыми без автоматизации, которую рабочие нагрузки ИИ только усугубят.
  • Экономическое давление: Рабочие нагрузки ИИ могут потреблять миллионы за один месяц, создавая финансовую непредсказуемость.

Центры данных уже составляют 1% от общего потребления электроэнергии в мире. В Ирландии они теперь потребляют 20% национальной сети, доля которой ожидается к 2030 году (IEA).

Добавьте к этому надвигающееся давление на GPU. Bain & Company недавно предупредила, что рост ИИ создает предпосылки для нехватки полупроводников, обусловленной взрывным спросом на чипы класса центров данных (Bain).

Тем временем проблема устойчивости ИИ растет. Анализ 2024 года в Устойчивые города и общество предупреждает, что широкое внедрение ИИ в здравоохранении может существенно увеличить потребление энергии и выбросы углерода в секторе, если не будет компенсировано нацеленными на эффективность мерами (ScienceDirect).

Распыл ИИ больше, чем рынок — это вопрос государственной власти

Если вы думаете, что распыл ИИ — это корпоративная проблема, подумайте еще раз. Самый значительный фактор фрагментации ИИ не является частным сектором — это правительства и агентства военной обороны, развертывающие ИИ в масштабе, который ни один гипермасштабируемый или корпоративный сектор не может сравниться.

Правительство США alone развернуло ИИ более чем в 700 приложениях по 27 агентствам, покрывая анализ разведки, логистику и многое другое (FedTech Magazine).

Канада инвестирует до 700 миллионов долларов для расширения внутренней вычислительной мощности ИИ, запуская национальный вызов для укрепления суверенной инфраструктуры центров данных (Innovation, Science and Economic Development Canada).

И есть растущие призывы к «программе Аполлон» для инфраструктуры ИИ — подчеркивая возвышение ИИ от коммерческого преимущества до национального императива (MIT Technology Review).

Военный ИИ не будет эффективным, скоординированным или оптимизированным по стоимости — он будет обусловлен национальными требованиями безопасности, геополитической срочностью и необходимостью закрытых, суверенных систем ИИ. Даже если корпорации сдержат распыл ИИ, кто скажет правительствам замедлить темп?

Потому что когда на кону национальная безопасность, никто не останавливается, чтобы спросить, может ли сеть питания справиться с этим.

Herb Hogue является техническим директором глобального системного интегратора Myriad360, привнося более 25 лет опыта в стратегическом планировании, интеграции технологий, инновациях и глобальном лидерстве. Экспертиза Herb охватывает финансы, здравоохранение, медиа, консалтинг, ипотечные отрасли и интеграторов решений. В Myriad360 он руководит предложениями решений, партнерствами и управляет профессиональными услугами для Cloud, AI, Networking, Security и Infrastructure. Его предыдущие роли в Insight и PCM подчеркивают его способность стимулировать значительный рост в облачных услугах и решениях для центров данных. Он имеет степень бакалавра наук в области кибербезопасности и защиты данных Университета Аризоны.

Раскрытие информации о рекламе: Unite.AI придерживается строгих редакционных стандартов, чтобы предоставлять читателям точную информацию и новости. Мы можем получать вознаграждение, если вы переходите по ссылкам на продукты, которые мы рассмотрели.