Штучний інтелект

Розробка Кремнію: Як Власні Чіпи Формують Майбутнє Штучного Інтелекту

mm

Штучний інтелект, як і будь-яке програмне забезпечення, залежить від двох фундаментальних компонентів: програм штучного інтелекту, часто званих моделями, і обчислювальної апаратури, або чіпів, які керують цими програмами. До цього часу увага при розробці штучного інтелекту була зосереджена на вдосконаленні моделей, тоді як апаратура вважалася стандартним компонентом, який постачали сторонні постачальники. Однак останнім часом цей підхід почав змінюватися. Великі компанії штучного інтелекту, такі як Google, Meta та Amazon, почали розробляти自己的 чіпи штучного інтелекту. Розробка власних чіпів штучного інтелекту оголошує нову еру в розвитку штучного інтелекту. Ця стаття досліджуватиме причини цього зсуву в підході та висвітлить останні розробки в цій еволюційній галузі.

Чому Розробка Власних Чіпів Штучного Інтелекту?

Зсув до розробки власних чіпів штучного інтелекту обумовлений кількома критичними факторами, до яких належать:

Зростаючий Попит на Чіпи Штучного Інтелекту

Створення та використання моделей штучного інтелекту вимагає значних обчислювальних ресурсів для ефективного оброблення великих об’ємів даних та генерації точних прогнозів чи інсайтів. Традиційні комп’ютерні чіпи не здатні обробляти обчислювальні вимоги під час навчання на трильйонах даних. Це обмеження призвело до створення передових чіпів штучного інтелекту, спеціально розроблених для задоволення високих вимог до продуктивності та ефективності сучасних застосунків штучного інтелекту. По мірі зростання досліджень та розробок штучного інтелекту зростає і попит на ці спеціалізовані чіпи.

Nvidia, лідер у виробництві передових чіпів штучного інтелекту та значно випереджає своїх конкурентів, стикається з труднощами, оскільки попит значно перевищує його виробничі можливості. Ця ситуація призвела до очікування списку Nvidia’s чіпів штучного інтелекту, яке розширилося до декількох місяців, затримка, яка продовжує зростати по мірі зростання попиту на їх чіпи штучного інтелекту. Крім того, ринок чіпів, до якого входять великі гравці, такі як Nvidia та Intel, стикається з труднощами у виробництві чіпів. Ця проблема походить від їх залежності від тайванського виробника TSMC для збірки чіпів. Ця залежність від одного виробника призводить до тривалих термінів виробництва цих передових чіпів.

Зробити Обчислення Штучного Інтелекту Енергоэффективними та Стійкими

Поточне покоління чіпів штучного інтелекту, яке призначене для важких обчислювальних завдань, має тенденцію споживати багато енергії та генерувати значне тепло. Це призвело до суттєвих екологічних наслідків для навчання та використання моделей штучного інтелекту. Дослідники OpenAI зазначають, що: починаючи з 2012 року, обчислювальна потужність, необхідна для навчання передових моделей штучного інтелекту, подвоювалася кожні 3,4 місяці, що свідчить про те, що до 2040 року викиди від сектора інформаційних та комунікаційних технологій (ІКТ) можуть скласти 14% від загальних викидів. Інше дослідження показало, що навчання однієї великомасштабної мовної моделі може викинути до 284 000 кг CO2, що приблизно еквівалентно енергоспоживанню п’яти автомобілів за весь їх термін служби. Крім того, оцінюється, що енергоспоживання центрів даних зросте на 28 відсотків до 2030 року. Ці висновки підкреслюють необхідність знайти баланс між розробкою штучного інтелекту та екологічною відповідальністю. У відповідь багато компаній штучного інтелекту тепер інвестують у розробку більш енергоэффективних чіпів, спрямованих на те, щоб зробити навчання та операції штучного інтелекту більш стійкими та екологічно чистими.

Пристрій Чіпів для Спеціалізованих Завдань

Різні процеси штучного інтелекту мають різні обчислювальні вимоги. Наприклад, навчання глибоких моделей навчання вимагає значної обчислювальної потужності та високої пропускної здатності для оброблення великих наборів даних та виконання складних обчислень швидко. Чіпи, призначені для навчання, оптимізовані для покращення цих операцій, підвищення швидкості та ефективності. З іншого боку, процес висновку, де модель застосовує свої знання для прогнозування, вимагає швидкої обробки з мінімальним енергоспоживанням, особливо в пристроях рівня краю, таких як смартфони та пристрої Інтернету речей. Чіпи для висновку розроблені для оптимізації продуктивності на ват, забезпечуючи швидку реакцію та збереження батареї. Ця специфічна налаштування конструкції чіпів для завдань навчання та висновку дозволяє кожному чіпу бути точно налаштованим для його призначеної ролі, підвищуючи продуктивність по різних пристроях та застосунках. Цей вид спеціалізації не тільки підтримує більш потужні функції штучного інтелекту, але також сприяє більшій енергоефективності та вартісній ефективності в цілому.

Зменшення Фінансового Тягаря

Фінансовий тягар обчислень для навчання та операцій моделей штучного інтелекту залишається суттєвим. OpenAI, наприклад, використовує великий суперкомп’ютер, створений Microsoft, для навчання та висновку з 2020 року. Вартість навчання моделі GPT-3 склала близько 12 мільйонів доларів, а витрати зросли до 100 мільйонів доларів для навчання GPT-4. За даними звіту SemiAnalysis, OpenAI потребує близько 3617 серверів HGX A100, загалом 28 936 графічних процесорів, для підтримки ChatGPT, що доводить середню вартість за запит до приблизно 0,36 долара. З урахуванням цих високих витрат Сем Алтман, генеральний директор OpenAI, як повідомляється, шукає суттєві інвестиції для будівництва всесвітньої мережі виробничих підприємств чіпів штучного інтелекту, згідно з повідомленням Bloomberg.

Керування та Інновації

Чіпи штучного інтелекту третіх сторін часто мають обмеження. Компанії, які залежать від цих чіпів, можуть виявитися обмеженими готовими рішеннями, які не повністю відповідають їхнім унікальним моделям або застосункам штучного інтелекту. Розробка власних чіпів дозволяє здійснювати налаштування, адаптоване до конкретних випадків використання. Чи то автономні автомобілі, чи мобільні пристрої, контроль апаратури дозволяє компаніям повністю використовувати свої алгоритми штучного інтелекту. Налаштовані чіпи можуть покращити конкретні завдання, зменшити затримку та покращити загальну продуктивність.

Останні Підходи в Розробці Чіпів Штучного Інтелекту

Ця секція досліджує останні кроки, зроблені Google, Meta та Amazon у будівництві технології чіпів штучного інтелекту.

Процеси Axion від Google

Google поступово просунувся у сфері технології чіпів штучного інтелекту з моменту введення одиниці обробки тензорів (TPU) у 2015 році. Будучи основою цього досвіду, Google недавно представив процеси Axion, свої перші спеціальні процесори, спеціально розроблені для центрів даних та завдань штучного інтелекту. Ці процесори засновані на архітектурі Arm, відомій своєю ефективністю та компактним дизайном. Процеси Axion спрямовані на підвищення ефективності процесорів, заснованих на CPU, для навчання та висновку штучного інтелекту, зберігаючи при цьому енергоефективність. Цей прогрес також позначає суттєве покращення продуктивності для різних загальних завдань, включаючи веб-сервери та сервери застосунків, контейнеризовані мікросервіси, відкриті джерела баз даних, кеші в пам’яті, інструменти аналізу даних, медіаобробки та багато іншого.

MTIA від Meta

Meta просунувся вперед у технології чіпів штучного інтелекту зі своїм пріскорювачем навчання та висновку Meta (MTIA). Цей інструмент розроблений для підвищення ефективності процесів навчання та висновку, особливо для алгоритмів ранжування та рекомендацій. Недавно Meta описав, як MTIA є ключовою частиною своєї стратегії посилення інфраструктури штучного інтелекту за межі графічних процесорів. Спочатку призначений для запуску у 2025 році, Meta вже ввів обидві версії MTIA у виробництво, демонструючи швидший темп у своїх планах розробки чіпів. Хоча MTIA зараз зосереджується на навчанні певних типів алгоритмів, Meta спрямована на розширення його використання для навчання генеративного штучного інтелекту, як-от свої мовні моделі Llama.

Trainium та Inferentia від Amazon

Від часу введення свого спеціального чипу Nitro у 2013 році Amazon суттєво розширив свою розробку чіпів штучного інтелекту. Компанія недавно представила два інноваційні чіпи штучного інтелекту, Trainium та Inferentia. Trainium спеціально розроблений для підвищення ефективності навчання моделей штучного інтелекту та призначений для включення до EC2 UltraClusters. Ці кластери, здатні розміщувати до 100 000 чіпів, оптимізовані для навчання фундаментальних моделей та великомасштабних мовних моделей енергоефективним способом. Inferentia, з іншого боку, призначений для завдань висновку, де моделі штучного інтелекту активно застосовуються, зосереджуючись на зменшенні затримки та витрат під час висновку для кращого задоволення потреб мільйонів користувачів, які взаємодіють з послугами, що використовують штучний інтелект.

Резюме

Рух до розробки власних чіпів штучного інтелекту великими компаніями, такими як Google, Microsoft та Amazon, відображає стратегічний зсув для вирішення зростаючих обчислювальних потреб технологій штучного інтелекту. Цей тренд підкреслює необхідність рішень, спеціально розроблених для ефективної підтримки моделей штучного інтелекту, задовольняючи унікальні вимоги цих передових систем. По мірі зростання попиту на чіпи штучного інтелекту лідери галузі, такі як Nvidia, ймовірно, побачать суттєвий зростання ринкової вартості, підкреслюючи важливу роль, яку власні чіпи відіграють у розвитку інновацій штучного інтелекту. Створюючи свої власні чіпи, ці технологічні гіганти не тільки підвищують продуктивність та ефективність своїх систем штучного інтелекту, але також сприяють більш стійкому та вартісному майбутньому. Ця еволюція встановлює нові стандарти в галузі, рухаючи технологічний прогрес та конкурентну перевагу на швидко-changing глобальному ринку.

Доктор Техсін Зія є доцентом COMSATS University Islamabad, який має ступінь PhD з штучного інтелекту у Віденському технічному університеті, Австрія. Спеціалізується на штучному інтелекті, машинному навчанні, науці про дані та комп'ютерному баченні, він зробив значний внесок з публікаціями в авторитетних наукових журналах. Доктор Техсін також очолював різні промислові проекти як головний дослідник і служив консультантом з штучного інтелекту.