Connect with us

Моделі Мега Не Є Серцем Комп’ютерної Кризи

Лідери думок

Моделі Мега Не Є Серцем Комп’ютерної Кризи

mm

Кожного разу, коли з’являється нова модель ІІ—GPT оновлення, DeepSeek, Gemini—люди дивуються просто величезній розміру, складності та все частіше комп’ютерному голоду цих мега-моделей. Припущення полягає в тому, що ці моделі визначають потреби ресурсів революції ІІ.

Це припущення неправильне.

Так, великі моделі голодні до обчислень. Але найбільше навантаження на інфраструктуру ІІ не йде від декількох мега-моделей—він йде від безшумного поширення моделей ІІ по галузям, кожна з яких дофільтрована для конкретних застосувань, кожна з яких споживає обчислення в непопередньому масштабі.

Незважаючи на потенційний переможець-бере-усе конкурс, що розвивається серед LLM, ландшафт ІІ в цілому не централізується—він фрагментується. Кожна компанія не просто використовує ІІ—вони тренують, налаштовують та розгортають приватні моделі, адаптовані до їхніх потреб. Саме остання ситуація створить криву попиту на інфраструктуру, на яку постачальники хмарних послуг, підприємства та уряди не готові.

Ми бачили цю модель раніше. Хмара не консолідувала робочі навантаження ІТ; вона створила розгалужену гібридну екосистему. Спочатку це була розсипання серверів. Потім розсипання ВМ. Тепер? Розсипання ІІ. Кожна хвиля обчислень призводила до поширення, а не спрощення. ІІ не відрізняється.

Розсипання ІІ: Чому Майбутнє ІІ — Це Міліон Моделей, А Не Одна

Фінанси, логістика, кібербезпека, обслуговування клієнтів, НД—кожна з них має свою модель ІІ, оптимізовану для своєї функції. Організації не тренують одну модель ІІ, щоб керувати всією їхньою операцією. Вони тренують тисячі. Це означає більше циклів тренування, більше обчислень, більше вимог до сховища та більше розсипання інфраструктури.

Це не теоретично. Навіть у галузях, які традиційно обережно приймають технології, інвестиції в ІІ прискорюються. Звіт McKinsey 2024 року виявив, що організації зараз використовують ІІ у середньому в трьох бізнес-функціях, з ведучими галузями виробництва, ланцюгів постачання та розробки продукції (McKinsey).

Охорона здоров’я — це головний приклад. Navina, стартап, який інтегрує ІІ до електронних медичних записів для надання клінічних висновків,刚 отримав 55 мільйонів доларів у вигляді фінансування серії С від Goldman Sachs (Business Insider). Енергетика не відрізняється—лідери галузі запустили консорціум Open Power AI для оптимізації операцій мережі та заводів (Axios).

Комп’ютерне Навантаження, Про яке Ніхто Не Говорить

ІІ вже ламає традиційні моделі інфраструктури. Припущення про те, що хмара може масштабуватися нескінченно для підтримки зростання ІІ, зовсім неправильне. ІІ не масштабується як традиційні робочі навантаження. Крива попиту не є поступовою—вона експоненційна, а гіпермасштабери не справляються.

  • Обмеження Потужності: Дані центри, спеціалізовані на ІІ, тепер будуються навколо доступності потужності, а не просто мережевих магістралей.
  • Мережеві Затори: Гібридні ІТ-оточення стають некерованими без автоматизації, яку робочі навантаження ІІ тільки погіршать.
  • Економічний Тиск: Робочі навантаження ІІ можуть споживати мільйони за місяць, створюючи фінансову непередбачуваність.

Дані центри вже складають 1% від загального споживання електроенергії у світі. В Ірландії вони зараз споживають 20% національної мережі, частка якої очікується значно зросте до 2030 року (IEA).

До цього додається нависле навантаження на ГП. Bain & Company недавно попередив, що зростання ІІ створює сцену для нестачі напівпровідників, спричиненої вибуховим попитом на чипи даних центрів (Bain).

Тим часом проблема сталості ІІ зростає. Аналіз 2024 року в Світові Сталості та Товариства попереджає, що поширення ІІ в охороні здоров’я може суттєво збільшити споживання енергії та викиди парникових газів цього сектора, якщо не буде компенсуватися націленою ефективністю (ScienceDirect).

Розсипання ІІ — Це Більше, Ніж Ринок — Це Питання Державної Потужності

Якщо ви думаєте, що розсипання ІІ — це корпоративна проблема, подумайте ще раз. Найбільш значущим драйвером фрагментації ІІ не є приватний сектор—це уряди та військові оборони, які розгортають ІІ у масштабі, який жоден гіпермасштабер чи підприємство не може дорівняти.

Сам уряд США розгорнув ІІ у понад 700 застосунках по 27 агентствам, покриваючи аналіз розвідки, логістику та інше (FedTech Magazine).

Канада інвестує до 700 мільйонів доларів для розширення внутрішньої обчислювальної потужності ІІ, запускаючи національний виклик для зміцнення суверенної інфраструктури даних центрів (Innovation, Science and Economic Development Canada).

І є зростаючі заклики до “програми Аполлон” для інфраструктури ІІ—підкреслюючи підвищення ІІ з комерційної переваги до національної першої необхідності (MIT Technology Review).

Військова ІІ не буде ефективною, скоординованою чи оптимізованою за вартістю—вона буде керуватися національними вимогами безпеки, геополітичною терміновістю та потребою у закритих, суверенних системах ІІ. Навіть якщо підприємства приборкують розсипання ІІ, хто зупинить уряди?

Бо коли національна безпека під загрозою, ніхто не зупиняється, щоб запитати, чи може енергосистема впоратися з цим.

Herb Hogue є головним технічним директором глобальної системи інтегратора Myriad360, що має понад 25 років досвіду у стратегічному плануванні, інтеграції технологій, інноваціях та глобальному лідерстві. Експертиза Herb охоплює фінанси, охорону здоров'я, ЗМІ, консалтинг, іпотечні галузі та інтегратори рішень. У Myriad360 він очолює пропозиції рішень, партнерства та керує професійними послугами для Cloud, AI, Networking, Security та Інфраструктури. Його попередні ролі в Insight і PCM підкреслюють його здатність забезпечувати значний рост у хмарних послугах та рішеннях центру даних. Він має ступінь бакалавра наук з кібербезпеки та захисту даних Університету Аризони.

Розкриття інформації про рекламу: Unite.AI дотримується суворих редакційних стандартів, щоб надавати читачам точну інформацію та новини. Ми можемо отримувати компенсацію, якщо ви переходите за посиланнями на продукти, які ми оглядали.