Зв'язатися з нами

Claude 3.7 Sonnet — це відродження ШІ Anthropic

Штучний Інтелект

Claude 3.7 Sonnet — це відродження ШІ Anthropic

(Алекс МакФарланд/Unite AI)

Антропік випустив Клод 3.7 Сонет, довгоочікуване оновлення його велика мовна модель (LLM) родина. Claude 3.7 Sonnet, названий «найрозумнішою моделлю компанії на сьогоднішній день» і першим гібридним штучним інтелектом на ринку, має деякі значні вдосконалення порівняно зі своїм попередником (Клод 3.5 Сонет) у швидкості, розумінні та виконанні завдань у реальному світі. 

Розгортання відбувається на тлі швидкого розвитку таких конкурентів, як нещодавні OpenAI та xAI Грок 3, що змусило багатьох ентузіастів штучного інтелекту (включаючи мене) розглядати цей запуск як відповідь Anthropic на останні інновації. Нова модель має на меті поєднати швидкі розмовні відповіді з глибшим аналітичним мисленням в одній системі – уніфікований підхід, який може показати нам, як виглядатиме майбутня взаємодія зі ШІ. 

Довгоочікуване оновлення до улюбленого AI Assistant

Для багатьох звичайних користувачів штучного інтелекту Claude 3.5 Sonnet вже був популярним інструментом. Його вважали одним із найкращих. Однак останніми місяцями Anthropic зіткнувся зі зростаючим тиском. Індустрія штучного інтелекту божеволіє від нових функцій і моделей – ChatGPT від OpenAI отримав голос, багатоетапні можливості міркування та глибоке дослідження. Grok 3 дебютував з даними X у реальному часі та іншими платформами Розгубленість та Gemini продовжував випуски. Багато спостерігачів почали відзначати, що Anthropic починає відставати. Спільнота з нетерпінням чекала на відповідь Anthropic, сподіваючись, що нова модель Claude з’явиться найближчим часом.

Сонет Клода 3.7 нарешті вийшов, щоб виправдати ці очікування. Це значний крок вперед у порівнянні з Claude 3.5, а не незначне налаштування. Anthropic рекламує його як комплексне оновлення: швидше, розумніше та універсальніше.

Швидкість моделі та якість друку вражають. У моїх власних тестах я виявив, що він неймовірно швидкий порівняно з останньою версією, обробляючи довгі текстові введення майже миттєво. Враховуючи повільний цикл оновлення Anthropic, випуск 3.7 здається довгоочікуваним надолуженням, що рекламує Позиція Клода в гонці ШІ. Claude 3.7 подвоює те, що змусило користувачів полюбити Claude 3.5 – виняткову продуктивність у практичних завданнях – і додає інноваційні можливості міркування під капотом.

Гібридне міркування: швидкі відповіді та глибоке мислення в одному

Головною особливістю Claude 3.7 Sonnet є його здатність гібридного міркування. Простіше кажучи, ця модель може працювати в двох режимах: стандартному режимі для майже миттєвих відповідей і новому режимі «розширеного мислення», де вона працює над проблемами крок за кроком, показуючи свою ланцюг думок користувачеві.

Замість того, щоб випускати окреме видання міркувань Клода, Anthropic об’єднав швидке та глибоке мислення в одному ШІ. «Подібно до того, як люди використовують один мозок як для швидкої відповіді, так і для глибоких роздумів, ми вважаємо, що аргументація має бути інтегрованою здатністю… а не окремою моделлю», компанія пояснила у своєму оголошення, наголошуючи на єдиному підході для бездоганної взаємодії з користувачем.

На практиці це означає, що користувачі можуть вирішувати, коли їм потрібна швидка відповідь, а коли дозволити Клоду довго обдумувати. Простий перемикач дозволяє перемикатися в розширений режим, якщо питання вимагає детального аналізу або багатоетапної логіки. У стандартному режимі Claude 3.7 Sonnet функціонує як покращена версія 3.5 – швидша та досконаліша, але зі знайомим швидким стилем розмови. У розширеному режимі штучний інтелект перед відповіддю «саморефлексує», записуючи свій внутрішній процес міркування (і роблячи його видимим), щоб прийти до більш точних або складних рішень.

Ланцюг думок крок за кроком прокручується на екрані, функція, яка стала популярною в інших передових системах штучного інтелекту і тепер нарешті з’явилася у Клода.

Алекс МакФарланд/Unite AI

Філософія Anthropic тут свідомо контрастує з деякими конкурентами. OpenAI, наприклад, запропонував окремі моделі або режими, якими декому важко жонглювати. Комплексний підхід Claude 3.7 призначений для спрощення речей для користувачів. Перемикання між режимами просте, а стиль підказок залишається незмінним. Досвідчені користувачі можуть навіть точно налаштувати, скільки думає штучний інтелект: за допомогою API розробники можуть установити бюджет маркерів для міркувань, повідомляючи Клоду, скільки часу потрібно розмірковувати (від лише кількох кроків до масивного мисленнєвого процесу з 128 тис. маркерів), перш ніж завершити відповідь. Цей детальний контроль дозволяє замінити швидкість на ретельність на вимогу.

Ключові вдосконалення в Claude 3.7 Sonnet:

Ось деякі з основних покращень, які ми бачимо в Claude 3.7 Sonnet:

  • Гібридні режими міркування – Пропонує як миттєві відповіді, так і режим розширеного мислення, де штучний інтелект обробляє проблеми поетапно з видимим обґрунтуванням. Користувачі обирають режим для кожного запиту, об’єднуючи швидкий чат і глибокий аналіз в одній системі.
  • Філософія єдиної моделі – Інтегрує швидке та рефлексивне мислення в єдиний «мозок» ШІ для простоти використання. Це контрастує з конкурентами, які потребують кількох моделей або плагінів, що зменшує складність для кінцевого користувача.
  • Швидкість і чуйність – Надає відповіді швидше, ніж Claude 3.5. Перші тести показали помітно вищу продуктивність у стандартному режимі.
  • Розширений контроль мислення – За допомогою API користувачі можуть обмежити або розширити довжину міркування штучного інтелекту (до 128,000 XNUMX токенів), щоб за потреби збалансувати швидкість і якість. Це гарантує, що розширений режим використовується лише стільки, скільки необхідно.
  • Фокус реальних завдань – За словами компанії, підготовка Claude 3.7 була зміщена в бік практичних ділових і творчих завдань, а не складних математичних олімпіад. Модель відмінно справляється з повсякденним вирішенням проблем і завдань, які відображають типові випадки використання.
  • Кодування та використання інструментів – Покращена продуктивність у завданнях програмування, особливо передньої веб-розробки. Anthropic навіть запустив супутній інструмент, Клод Код, що дозволяє розробникам використовувати Claude з командного рядка для написання та виправлення коду. Ранні тести показали, що Claude 3.7 найкращий у вирішенні реальних проблем програмного забезпечення.

Обмеження та наступні дії для користувачів ШІ

Незважаючи на все хвилювання, Claude 3.7 Sonnet не безмежний, і це не чарівна куля для всіх викликів ШІ. По-перше, Anthropic свідомо применшив певні аспекти під час навчання цієї моделі. Вони «дещо менше оптимізували завдання з математики та інформатики» на користь більш повсякденних бізнес-завдань. Це означає, що хоча Claude 3.7, безумовно, може розв’язувати математичні запитання та питання кодування (часто краще, ніж 3.5), він може не очолювати таблицю лідерів у кожному академічному тесті чи головоломці. Користувачі, чиї потреби спрямовані в бік складних математичних доказів або спеціалізованих змагань з кодування, все одно можуть знайти області, де відповіді Клода вимагають подвійної перевірки або де модель конкурента, налаштована для цієї ніші, працює краще. Anthropic, схоже, прийняв цей компроміс, націливши модель на практичну корисність, а не на теоретичну майстерність.

Крім того, режим розширеного мислення, хоча й потужний, вносить певну складність. За своєю суттю він повільніший за стандартний режим; коли штучний інтелект глибоко замислюється, користувачі помітять коротку паузу, коли він проробляє свої міркування. Це очікувано – обмінюйте швидкість на ретельність – але це означає, що користувачі повинні вирішити, коли їм справді потрібна додаткова потужність. У багатьох повсякденних запитах чату буде достатньо стандартного режиму, який буде більш ефективним. Існує також той факт, що розширене міркування іноді може перестаратися і дати набагато більше, ніж вам насправді потрібно. У деяких випадках це може перевантажити або збити з курсу. Anthropic потрібно буде переконатися, що готовність ШІ «розвивати» ідеї залишається актуальною та відповідає темі. Користувачі можуть навчитися підказувати точніше або встановлювати ліміти токенів, щоб приборкати випадкові дотичні.

Bottom Line

Випуск Claude 3.7 Sonnet є заявою про те, що Anthropic активно бере участь у грі разом із OpenAI, Google/DeepMind та новими гравцями, такими як xAI. Для ентузіастів і розробників штучного інтелекту він додає ще одну модель найвищого рівня для експериментів, яка пропонує унікальний поворот із гібридними міркуваннями.

У конкурентній індустрії штучного інтелекту останній крок Anthropic також може вплинути на те, як компанії позиціонують свої моделі. Вирішивши не робити масштабного стрибка розміру моделі чи блискучої мультимодальної демонстрації, а натомість вдосконалюючи користувачів (уніфікація режимів, швидкість, приклади практичного використання), Anthropic займає нішу, зосереджену на зручності та надійності. 

Загалом сонет Клода 3.7 є ключовим моментом для Anthropic. Це еволюція серії Claude, яка показує, як компанія вчиться на потребах спільноти – подвоюючи сильні сторони, одночасно усуваючи слабкі сторони. Ще є місця, на які варто звернути увагу (і майбутні ітерації Claude, які слід передбачити), але цей випуск явно оживив базу користувачів Anthropic. 

Алекс МакФарланд — журналіст і письменник, що займається штучним інтелектом, досліджує останні розробки в галузі штучного інтелекту. Він співпрацював з численними стартапами та публікаціями зі штучного інтелекту по всьому світу.