Connect with us

Рамкова структура навичок Claude тихо стає галузевим стандартом

Штучний інтелект

Рамкова структура навичок Claude тихо стає галузевим стандартом

mm

Коли Anthropic запустив Skills у жовтні, оголошення виглядало як ніша розробника. Два місяці по тому OpenAI прийняла ту саму архітектуру – і тиха конвергенція розкриває щось значуще про те, куди рухаються агенти штучного інтелекту.

Навички – це обманливо прості речі: папки, що містять файли Markdown, які повідомляють системам штучного інтелекту, як виконувати конкретні завдання. Але їхнє прийняття двома великими лабораторіями штучного інтелекту свідчить про те, що галузь знайшла спільну відповідь на фундаментальне питання: як зробити помічників штучного інтелекту постійно хорошими у спеціалізованій роботі?

Що зробила OpenAI

Розробник Elias Judin виявив реалізацію OpenAI 12 грудня під час експериментів з інтерпретатором коду ChatGPT. Надавши модель створити zip-файл своєї директорії /home/oai/skills, він знайшов папки для PDF, електронних таблиць і документів – кожна з яких містила інструкційні файли, структура яких була ідентична специфікації Anthropic.

Ту саму архітектуру було видно в інструменті Codex CLI від OpenAI два тижні раніше, завдяки запиту на додавання функції “експериментальна підтримка skills.md”. Реалізація дублює підхід Anthropic: навички розташовані в локальній директорії (~/.codex/skills), кожна з яких визначається файлом SKILL.md з метаданими та інструкціями.

OpenAI офіційно не оголосила про цю функцію. Але її наявність у ChatGPT і Codex свідчить про свідому стратегію, а не про експеримент.

Чому навички важливі

Традиційний підхід до поліпшення роботи штучного інтелекту з конкретними завданнями полягав у дообученні – дорогому та тривалому процесі навчання моделей на спеціалізованих даних. Навички пропонують легшу альтернативу: інструкції та ресурси, які завантажуються лише тоді, коли це доречно.

Інженерна команда Anthropic описала принцип проектування як “прогресивне розкриття”. Кожна навичка займає лише кілька десятків токенів, коли її підсумовують, а повні деталі завантажуються лише тоді, коли завдання цього вимагає. Це розв’язує практичну проблему: вікна контексту є цінним ресурсом, а завантаження всіх можливих інструкцій у кожен запит марнує ресурси.

Архітектура працює тому, що сучасні моделі штучного інтелекту можуть читати та виконувати інструкції динамічно. Навичка для обробки PDF може включати бібліотеки, обробку країв та форматування виводу – інформацію, яку модель потребує лише під час обробки PDF.

Історія конвергенції

То, що OpenAI прийняла підхід Anthropic, не є незвичайним у ізоляції. Лабораторії штучного інтелекту регулярно вчаться один у одного з опублікованих робіт. Що примітно, так це структурна ідентичність: ті самі конвенції найменування файлів, той самий формат метаданих, та організація директорій.

Ця сумісність може означати, що навички, створені для Claude Code, можуть працювати з інструментом Codex CLI від OpenAI, і навпаки. Розробники можуть поділитися навичками на GitHub, як пакети npm. Екосистема стає сумісною, а не фрагментованою.

Час збігся з більш широкими зусиллями щодо стандартизації. Anthropic пожертвувала протокол контексту моделі Linux Foundation 9 грудня, а обидві компанії заснували фундацію Agentic AI разом з Block. Google, Microsoft та AWS приєдналися як члени.

Фундація буде опікуватися протоколом контексту моделі, проектом goose від Block та специфікацією AGENTS.md від OpenAI. Навички природно вписуються у цю стандартизацію – повторно використовувані модулі можливостей, які працюють на різних платформах.

Що це означає для інструментів кодування штучного інтелекту

Архітектура навичок найважливіша для інструментів кодування штучного інтелекту, де спеціалізовані знання суттєво покращують якість виводу. Навичка для розробки React може вказувати шаблони компонентів, управління станом та конвенції тестування. Навичка для міграції баз даних може включати перевірки безпеки та процедури відкату.

Стартапи з кодування штучного інтелекту, такі як Cursor, побудували свій бізнес на тому, щоб зробити штучний інтелект більш корисним для конкретних завдань розробки. Фреймворк навичок дає постачальникам моделей стандартизований спосіб пропонувати подібну настройку – потенційно загрожуючи чи доповнюючи сторонні інструменти, залежно від реалізації.

Для розробників підприємства сумісні навички означають, що інституційна знання стають переносними. Внутрішні стандарти кодування компанії, вимоги безпеки та переваги робочого процесу можуть бути закодовані один раз і застосовані до будь-яких інструментів штучного інтелекту, які використовує команда.

Стратегічний підтекст

Прийняття OpenAI має стратегічні наслідки. Компанія історично віддавала перевагу пропріетарним підходам – дії GPT, спеціальні GPT, інтеграції, специфічні для платформи. Навички представляють поворот у бік відкритих стандартів, які працюють на різних інструментах.

Одна з інтерпретацій: OpenAI розуміє, що екосистеми розробників важливіші за пропріетарний замикання на цьому етапі. Якщо навички стануть стандартом, сумісність буде важливішою, ніж контроль над специфікацією.

Інша інтерпретація: конкуренція з досвідом розробника Anthropic вимагає відповідності її функцій. Claude Code агресивно зростає, досягнувши 1 мільярда доларів річної виручки та інтегрувавшись у Slack. Навички є частиною того, що робить Claude Code корисним; OpenAI повинна була відреагувати.

Правда, ймовірно, включає обидва фактори. Лабораторії штучного інтелекту інтенсивно конкурують у сфері показників та можливостей, а також співпрацюють над стандартами інфраструктури, які приносять користь усім. Навички входять до другої категорії.

Що далі

Найближча можливість – це ринок навичок – репозиторії GitHub, де розробники діляться спеціалізованими інструкційними наборами для спільних завдань. Anthropic вже має репозиторій anthropics/skills. Чекайте, коли OpenAI наслідує цей приклад, і коли спільні навички будуть поширюватися.

Довгострокове питання полягає в тому, як глибоко навички інтегруються у продукти штучного інтелекту. Наразі вони в основному актуальні для розробників, які використовують інструменти CLI. Але та сама архітектура могла б забезпечити настройку у споживчих продуктах – персоналізовані помічники з написання, спеціалізовані інструменти дослідження, чат-боти, специфічні для домену.

Наразі конвергенція щодо навичок представляє щось рідкісне у сфері штучного інтелекту: конкуруючі компанії погоджуються, що стандартизація служить усім. Чи пошириться це співробітництво на інші спірні області – стандарти безпеки, розкриття можливостей, керівні принципи розгортання – залишається невизначеним.

Але для розробників, які будують на платформах штучного інтелекту, повідомлення чітке: навички стають інфраструктурою. Навчання писати їх зараз означає бути готовим до того, як інструменти штучного інтелекту працюватимуть завтра.

Алекс Макфарленд - журналіст та письменник з питань штучного інтелекту, який досліджує останні розробки в галузі штучного інтелекту. Він співпрацював з численними стартапами та виданнями з штучного інтелекту у світі.