Искусственный интеллект
Использование Кремния: Как Чипы, Разработанные Внутри Компании, Формируют Будущее ИИ
Искусственный интеллект, как и любое программное обеспечение, опирается на два фундаментальных компонента: программы ИИ, часто называемые моделями, и вычислительное оборудование, или чипы, которые запускают эти программы. До сих пор основной упор в разработке ИИ был на усовершенствовании моделей, в то время как оборудование обычно рассматривалось как стандартный компонент, поставляемый третьими лицами. Однако в последнее время этот подход начал меняться. Крупные компании ИИ, такие как Google, Meta и Amazon, начали разрабатывать свои собственные чипы ИИ. Внутреннее развитие чипов ИИ на заказ знаменует новую эру в развитии ИИ. Эта статья исследует причины этого сдвига в подходе и подчеркивает последние разработки в этой эволюционирующей области.
Почему Внутреннее Разработка Чипов ИИ?
Сдвиг в сторону внутреннего развития чипов ИИ на заказ обусловлен несколькими критическими факторами, которые включают:
Растущий Спрос На Чипы ИИ
Создание и использование моделей ИИ требует значительных вычислительных ресурсов для эффективного обработки больших объемов данных и генерации точных прогнозов или сведений. Традиционные компьютерные чипы не способны справиться с вычислительными требованиями при обучении на триллионах точек данных. Это ограничение привело к созданию передовых чипов ИИ, специально разработанных для удовлетворения высоких требований к производительности и эффективности современных приложений ИИ. По мере продолжения роста исследований и разработок ИИ растет и спрос на эти специализированные чипы.
Nvidia, лидер в производстве передовых чипов ИИ и значительно опережающий своих конкурентов, сталкивается с проблемами, поскольку спрос значительно превышает его производственную мощность. Это привело к списку ожидания для чипов ИИ Nvidia, который продлен на несколько месяцев, задержка, которая продолжает расти по мере роста спроса на их чипы ИИ. Кроме того, рынок чипов, который включает крупных игроков, таких как Nvidia и Intel, сталкивается с проблемами в производстве чипов. Эта проблема возникает из-за их зависимости от тайваньского производителя TSMC для сборки чипов. Эта зависимость от одного производителя приводит к длительным срокам производства этих передовых чипов.
Сделать Вычисления ИИ Энергоэффективными и Устойчивыми
Текущее поколение чипов ИИ, которые предназначены для тяжелых вычислительных задач, склонны потреблять много энергии и генерировать значительное количество тепла. Это привело к существенным экологическим последствиям для обучения и использования моделей ИИ. Исследователи OpenAI отмечают, что: с 2012 года вычислительная мощность, необходимая для обучения передовых моделей ИИ, удваивается каждые 3,4 месяца, что предполагает, что к 2040 году выбросы от сектора информационных и коммуникационных технологий (ИКТ) могут составить 14% от общих глобальных выбросов. Другое исследование показало, что обучение одной крупномасштабной языковой модели может выбросить до 284 000 кг CO2, что примерно эквивалентно энергопотреблению пяти автомобилей за их срок службы. Кроме того, оценивается, что энергопотребление центров обработки данных уврастет на 28 процентов к 2030 году. Эти результаты подчеркивают необходимость найти баланс между разработкой ИИ и экологической ответственностью. В ответ многие компании ИИ сейчас инвестируют в разработку более энергоэффективных чипов, стремясь сделать обучение и эксплуатацию ИИ более устойчивыми и экологически чистыми.
Настройка Чипов Для Специализированных Задач
Различные процессы ИИ имеют разные вычислительные требования. Например, обучение моделей глубокого обучения требует значительной вычислительной мощности и высокой пропускной способности для обработки больших наборов данных и выполнения сложных вычислений быстро. Чипы, предназначенные для обучения, оптимизированы для улучшения этих операций, повышая скорость и эффективность. С другой стороны, процесс вывода, при котором модель применяет свои знания для прогнозирования, требует быстрой обработки с минимальным энергопотреблением, особенно в пограничных устройствах, таких как смартфоны и устройства IoT. Чипы для вывода спроектированы для оптимизации производительности на ватт, обеспечивая быструю реакцию и экономию батареи. Такая специфическая настройка чипов для задач обучения и вывода позволяет каждому чипу быть точно настроенным для его предполагаемой роли, повышая производительность на различных устройствах и приложениях. Этот вид специализации не только поддерживает более прочные функции ИИ, но и способствует большей энергоэффективности и экономичности в целом.
Снижение Финансовых Бремени
Финансовое бремя вычислений для обучения и эксплуатации моделей ИИ остается существенным. OpenAI, например, использует обширный суперкомпьютер, созданный Microsoft, для обучения и вывода с 2020 года. Обучение модели GPT-3 стоило OpenAI примерно 12 миллионов долларов, а расходы возросли до 100 миллионов долларов для обучения GPT-4. Согласно отчету SemiAnalysis, OpenAI нужно примерно 3617 серверов HGX A100, всего 28 936 GPU, для поддержки ChatGPT, что приводит к средней стоимости запроса примерно 0,36 доллара. Учитывая эти высокие затраты, Сэм Альтман, генеральный директор OpenAI, якобы ищет значительные инвестиции для строительства мировой сети производственных предприятий по производству чипов ИИ, согласно отчету Bloomberg.
Освоение Контроля и Инноваций
Чипы ИИ третьих лиц часто имеют ограничения. Компании, полагающиеся на эти чипы, могут обнаружить, что они ограничены готовыми решениями, которые не полностью соответствуют их уникальным моделям или приложениям ИИ. Внутреннее развитие чипов позволяет создавать индивидуальные решения, адаптированные к конкретным случаям использования. Будь то автономные автомобили или мобильные устройства, контроль над оборудованием позволяет компаниям полностью использовать свои алгоритмы ИИ. Специализированные чипы могут улучшить конкретные задачи, снизить задержку и повысить общую производительность.
Последние Достижения в Разработке Чипов ИИ
Этот раздел углубляется в последние достижения Google, Meta и Amazon в области технологии чипов ИИ.
Процессоры Axion от Google
Google последовательно продвигается в области технологии чипов ИИ с момента введения Tensor Processing Unit (TPU) в 2015 году. Основываясь на этом фундаменте, Google недавно представил процессоры Axion, свои первые специальные ЦП, предназначенные для центров обработки данных и рабочих нагрузок ИИ. Эти процессоры основаны на архитектуре Arm, известной своей эффективностью и компактным дизайном. Процессоры Axion направлены на повышение эффективности обучения и вывода ИИ на основе ЦП, сохраняя при этом энергоэффективность. Это достижение также знаменует значительное улучшение производительности для различных общих рабочих нагрузок, включая веб- и приложенческие серверы, контейнеризированные микросервисы, открытое программное обеспечение баз данных, кэширование в памяти, движки анализа данных, медиапроцессинг и многое другое.
MTIA от Meta
Meta продвигается вперед в технологии чипов ИИ с помощью своего Meta Training and Inference Accelerator (MTIA). Этот инструмент предназначен для повышения эффективности процессов обучения и вывода, особенно для алгоритмов ранжирования и рекомендаций. Недавно Meta описал, как MTIA является ключевой частью своей стратегии по укреплению инфраструктуры ИИ за пределами GPU. Первоначально запланированный к запуску в 2025 году, Meta уже ввел в производство обе версии MTIA, демонстрируя более быстрый темп в своих планах разработки чипов. Хотя MTIA в настоящее время фокусируется на обучении определенных типов алгоритмов, Meta стремится расширить его использование для включения обучения для генеративного ИИ, такого как его языковые модели Llama.
Trainium и Inferentia от Amazon
С момента введения своего специального чипа Nitro в 2013 году Amazon значительно расширил разработку чипов ИИ. Компания недавно представила два инновационных чипа ИИ, Trainium и Inferentia. Trainium предназначен для улучшения обучения моделей ИИ и должен быть включен в EC2 UltraClusters. Эти кластеры, способные размещать до 100 000 чипов, оптимизированы для обучения фундаментальных моделей и крупномасштабных языковых моделей энергоэффективным способом. Inferentia, с другой стороны, предназначен для задач вывода, где модели ИИ активно применяются, фокусируясь на снижении задержки и затрат во время вывода для лучшего обслуживания потребностей миллионов пользователей, взаимодействующих с сервисами, основанными на ИИ.
Итог
Движение к внутреннему развитию чипов ИИ на заказ крупными компаниями, такими как Google, Microsoft и Amazon, отражает стратегический сдвиг для решения растущих вычислительных потребностей технологий ИИ. Этот тренд подчеркивает необходимость решений, специально разработанных для эффективной поддержки моделей ИИ, удовлетворяющих уникальным требованиям этих передовых систем. По мере продолжения роста спроса на чипы ИИ лидеры отрасли, такие как Nvidia, вероятно, увидят значительный рост стоимости на рынке, подчеркивая важную роль, которую играют специальные чипы в продвижении инноваций ИИ. Создавая свои собственные чипы, эти технологические гиганты не только улучшают производительность и эффективность своих систем ИИ, но и способствуют более устойчивому и экономически эффективному будущему. Эта эволюция устанавливает новые стандарты в отрасли, стимулируя технологический прогресс и конкурентное преимущество на быстро меняющемся мировом рынке.












