Connect with us

Штучний інтелект

Відкритий AI контратакує з Meta Llama 4

mm

За останні кілька років світ AI змінився від культури відкритої співпраці до культури, домінуючої в тісних пропріетарних системах. OpenAI – компанія, яка була заснована з “відкритим” у своїй назві – змінила свій напрямок на зберігання своїх найпотужніших моделей у секреті після 2019 року. Конкуренти, такі як Anthropic і Google, подібним чином побудували передові AI за API-стінами, доступними лише на їхніх умовах. Цей закритий підхід був виправданий частково питаннями безпеки та бізнес-інтересами, але він залишив багатьох у спільноті, які оплакували втрату раннього відкритого духу.

Тепер цей дух розпочинає свій повернення. Нові моделі Llama 4 від Meta сигналізують про сміливу спробу відродити відкритий AI на вищому рівні – і навіть традиційно охоронювані гравці звертають увагу. CEO OpenAI Сем Алтман недавно визнав, що компанія була “на неправильній стороні історії” щодо відкритих моделей і оголосив про плани щодо “потужної нової відкритої GPT-4 варіанту”. Коротко кажучи, відкритий AI контратакує, і значення та цінність “відкритого” еволюціонують.

(Джерело: Meta)

Llama 4: Відкритий виклик Meta до GPT-4o, Claude та Gemini

Meta представила Llama 4 як ще один прямий виклик новим моделям від важких гравців AI, позиціонуючи її як відкриту альтернативу. Llama 4 доступна у двох варіантах – Llama 4 Scout і Llama 4 Maverick – з ошеломлючими технічними характеристиками. Обидва є моделями суміші експертів (MoE), які активують лише частину своїх параметрів на запит, що дозволяє досягти величезного розміру без придушення витрат на виконання.

Наприклад, Llama 4 Scout має лідерське місце серед галузей – 10 мільйонів токенів контекстного вікна, що є на порядки більше, ніж у більшості суперників. Це означає, що вона може споживати та обґрунтовувати величезні документи або кодові бази за один раз. Незважаючи на свій масштаб, Scout достатньо ефективна, щоб працювати на одному H100 GPU, коли вона висококвантована, що свідчить про те, що розробникам не потрібно буде суперкомп’ютер, щоб експериментувати з нею.

Тим часом Llama 4 Maverick налаштована для максимальної потужності. Ранні тести показують, що Maverick дорівнює або перевершує топові закриті моделі на завданнях з розумінням, кодуванням та баченням. Насправді Meta вже намагається створити ще більшу споріднену модель, Llama 4 Behemoth, яка все ще знаходиться на стадії навчання, і яка внутрішньо “перевершує GPT-4.5, Claude 3.7 Sonnet і Gemini 2.0 Pro на кількох STEM-бенчмарках”. Повідомлення чітке: відкриті моделі більше не є другорядними; Llama 4 претендує на статус найвищого рівня.

Найважливіше, що Meta зробила Llama 4 негайно доступною для завантаження та використання. Розробники можуть завантажити Scout і Maverick з офіційного сайту або Hugging Face під ліцензією Llama 4 Community. Це означає, що будь-хто – від гаражного хакера до компанії Fortune 500 – може зайти під капот, налаштувати модель під свої потреби та розгорнути її на自己的 апаратному чи хмарному забезпеченні. Це різкий контраст з пропріетарними пропозиціями, такими як GPT-4o від OpenAI або Claude 3.7 від Anthropic, які подаються через платні API без доступу до основних ваг.

Meta підкреслює, що відкритість Llama 4 полягає в наданні можливостей користувачам: “Ми ділимося першими моделями у стадії Llama 4, які дозволять людям створювати більш персоналізовані багатомодальні досвіди”. Іншими словами, Llama 4 є інструментом, призначеним для розробників і дослідників усьому світі. Видаючи моделі, які можуть конкурувати з такими, як GPT-4 і Claude, Meta відновлює ідею про те, що топові AI не повинні жити за платним муром.

(Джерело: Meta)

Автентичний ідеалізм чи стратегічний хід?

Meta представляє Llama 4 у величних, майже алтруїстичних термінах. “Наша відкрита модель AI, Llama, була завантажена понад один мільярд разів”, оголосив недавно CEO Марк Цукерберг, додавши, що “відкритість моделей AI є важливою для забезпечення того, щоб люди усьому світі мали доступ до переваг AI”. Це позиціонування зображує Meta як захисника демократизованого AI – компанії, яка готова поділитися своїми коронними моделями заради загального блага. І дійсно, популярність моделей Llama підтверджує це: моделі були завантажені у приголомшливому масштабі (перейшовши від 650 мільйонів до 1 мільярда загальних завантажень за кілька місяців), і вони вже використовуються в продуктивній діяльності компаніями, такими як Spotify, AT&T і DoorDash.

Meta з гордостью зазначає, що розробники цінують “прозорість, налаштування та безпеку” відкритих моделей, які вони можуть запускати самостійно, що “допомагає досягти нових рівнів творчості та інновацій”, порівняно з чорними API. У принципі, це звучить як стара етика відкритого програмного забезпечення (подібна до Linux або Apache), яку застосовують до AI – недвозначна перемога для спільноти.

Однак не можна ігнорувати стратегічний розрахунок за цією відкритістю. Meta не є благодійною організацією, і “відкритість” у цьому контексті супроводжується застереженнями. Зокрема, Llama 4 випускається під спеціальною ліцензією спільноти, а не стандартною перmissive ліцензією – тому, хоча ваги моделі вільні для використання, існують обмеження (наприклад, певні випадки використання з великими ресурсами можуть потребувати дозволу, а ліцензія є “пропріетарною” у тому сенсі, що вона створена Meta). Це не відповідає Відкритій ініціативі програмного забезпечення (OSI), яка затверджує визначення відкритого джерела, що призвело до того, що деякі критики стверджують, що компанії неправильно використовують термін.

На практиці підхід Meta часто описується як “відкритість ваг” або “джерело, доступне для всіх” AI: код і ваги відкриті, але Meta все ще зберігає деякий контроль і не розкриває всього (тренувальні дані, наприклад). Це не зменшує корисності для користувачів, але показує, що Meta стратегічно відкрита – зберігає лише достатньо поводів, щоб захистити себе (і, можливо, свій конкурентний перевагу). Багато фірм приклеюють етикетки “відкритого джерела” на моделі AI, приховуючи при цьому ключові деталі, що підірвало справжній дух відкритості.

Чому Meta взагалі відкрилася? Конкурентний ландшафт пропонує підказки. Видача потужних моделей безкоштовно може швидко створити широку базу розробників і підприємств – Mistral AI, французький стартап, зробив саме це з своїми ранніми відкритими моделями, щоб здобути авторитет як топ-лабораторія.

Відкриваючи ринок своїми моделями, Meta забезпечує, що її технологія стає фундаментальною в екосистемі AI, що може принести дивіденди в довгостроковій перспективі. Це класична стратегія “обійми та розшири”: якщо всі використовують вашу “відкриту” модель, ви непрямо встановлюєте стандарти та, можливо, навіть спрямовуєте людей до ваших платформ (наприклад, продукти AI-помічників Meta використовують Llama). Там також є елемент PR і позиціонування. Meta грає роль благотворного інноватора, особливо на тлі OpenAI – яка зазнала критики за свій закритий підхід. Насправді зміна серця OpenAI щодо відкритих моделей частково підкреслює, наскільки ефективним був крок Meta.

Після появи революційної відкритої китайської моделі DeepSeek-R1 у січні, яка обігнала попередні моделі, Алтман вказав, що OpenAI не хоче бути залишеною на “неправильній стороні історії”. Тепер OpenAI обіцяє відкриту модель з потужними можливостями розуміння в майбутньому, що свідчить про зміну ставлення. Це важко не бачити впливу Meta у цьому зміні. Відкрита позиція Meta є як автентичною, так і стратегічною: вона дійсно розширює доступ до AI, але це також хитра тактика, щоб обігнати суперників і сформувати майбутнє ринку на умовах Meta.

Вплив на розробників, підприємства та майбутнє AI

Для розробників повернення відкритих моделей, таких як Llama 4, є свіжим подихом. Замість того, щоб бути заблокованим в екосистемі одного постачальника та платити за неї, вони тепер мають можливість запускати потужний AI на своєму власному інфраструктурному забезпеченні або вільно налаштовувати його.

Це величезна перевага для підприємств у чутливих галузях – наприклад, фінанси, охорона здоров’я чи уряд – які побоюються передачі конфіденційних даних у чужий чорний ящик. З Llama 4 банк або лікарня можуть розгорнути модель мови найвищого рівня за своєю власною брандмауером, налаштувати її на приватних даних, не поділячись жодним токеном з зовнішньою сутністю. Там також є вигода з точки зору витрат. Хоча використання API для топ-моделей може стрімко зростати, відкрита модель не має жодних витрат на використання – ви платите лише за обчислювальну потужність, необхідну для її запуску. Бізнеси, які нарощують великі робочі навантаження AI, можуть значно заощадити, обираючи відкрите рішення, яке вони можуть масштабувати всередині.

Немає нічого дивного в тому, що ми бачимо більший інтерес до відкритих моделей з боку підприємств; багато з них починають розуміти, що контроль та безпека відкритого AI відповідають їхнім потребам краще, ніж сервіси, закриті для всіх.

Розробники також отримують вигоду в інноваціях. З доступом до внутрішніх моделей вони можуть налаштовувати та покращувати AI для нішевих доменів (право, біотехнології, регіональні мови – ви назовите) способами, яких закритий API ніколи не задовольнить. Вибух спільних проектів навколо попередніх моделей Llama – від чат-ботів, налаштованих на медичні знання, до аматорських застосунків для смартфонів, які запускають мініатюрні версії – довів, яким чином відкриті моделі можуть демократизувати експериментування.

Однак відродження відкритих моделей також піднімає складні питання. Чи відбувається “демократизація” дійсно, якщо тільки ті, хто має значні обчислювальні ресурси, можуть запустити модель з 400 мільярдами параметрів? Хоча Llama 4 Scout і Maverick знижують планку апаратного забезпечення порівняно з монолітними моделями, вони все ще є важкими – це момент, який не втратили деякі розробники, чиї ПК не можуть справитися з ними без допомоги хмарних технологій.

Надія полягає в тому, що техніки, такі як стискання моделі, дистиляція або менші варіанти експертів, зможуть передати силу Llama 4 до більш доступних розмірів. Інша проблема полягає в тому, що відкритість може призвести до неправильного використання. OpenAI та інші довго стверджували, що відкритий випуск потужних моделей може дозволити зловмисним акторам (для генерації дезінформації, коду шкідливого ПЗ тощо).

Ці побоювання залишаються: відкрита модель Claude або GPT могла б бути використана неправильно без безпекових фільтрів, які компанії застосовують до своїх API. З іншого боку, прихильники відкритих моделей стверджують, що відкритість дозволяє спільноті виявляти та виправляти проблеми, роблячи моделі більш стійкими та прозорими з часом, ніж будь-яка секретна система. Є докази того, що спільноти відкритих моделей серйозно ставляться до безпеки, розробляють自己的 захист та діляться найкращими практиками – але це триває.

Що стає все більш очевидним, так це те, що ми рухаємося до гібридного ландшафту AI, в якому відкриті та закриті моделі співіснують, кожна впливаючи на іншу. Закриті постачальники, такі як OpenAI, Anthropic та Google, все ще мають перевагу в абсолютній продуктивності – поки що. Дійсно, станом на кінець 2024 року дослідження показало, що відкриті моделі відставали приблизно на рік від найкращих закритих моделей у можливостях. Але цей розрив швидко закривається.

На сучасному ринку “відкритий AI” вже не означає лише хобі-проекти або старіші моделі – тепер це серце стратегії AI для технологічних гігантів та стартапів. Запуск Llama 4 від Meta є потужним нагадуванням про еволюцію цінності відкритості. Це одночасно філософська позиція за демократизацію технологій та тактичний хід у високих ставках промислової боротьби. Для розробників та підприємств це відкриває нові двері до інновацій та автономії, навіть якщо це ускладнює рішення з новими компромісами. І для ширшої екосистеми це викликає надію, що переваги AI не будуть заблоковані в руках кількох корпорацій – якщо етика відкритого джерела зможе утримати свою позицію.

Алекс Макфарленд - журналіст та письменник з питань штучного інтелекту, який досліджує останні розробки в галузі штучного інтелекту. Він співпрацював з численними стартапами та виданнями з штучного інтелекту у світі.