Искусственный интеллект

Meta’s COCONUT: Метод ИИ, который думает без языка

Published December 16, 2024

Updated April 3, 2026

Alex McFarland

Когда исследователи впервые обнаружили, что большие языковые модели (LLM) могут “думать” шаг за шагом через цепочку мыслей, это был прорывной момент – наконец, мы смогли заглянуть в процесс рассуждения этих черных ящиков. Но что если я скажу вам, что заставление моделей ИИ думать на естественном языке может их сдерживать?

Именно это открыли исследователи в Meta и UC San Diego со своей новой методикой COCONUT (Цепочка непрерывных мыслей).

Представьте, что вы пытаетесь решить сложную математическую задачу, одновременно вынужденно описывая каждый шаг вслух. Раздражает, верно? Теперь вы близки к пониманию основной проблемы, с которой сталкиваются языковые модели.

Когда мы заставляем модели ИИ рассуждать на естественном языке:

Большинство токенов, которые они генерируют, являются просто лингвистическим клеем – словами как “следовательно”, “далее” и “в результате”, которые не добавляют никакой ценности рассуждениям
Критические точки принятия решений блокируются необходимостью привязки к конкретным словам
Модель тратит значительные вычислительные усилия на поддержание грамматической связности, а не на решение реальных проблем

Исследователи обнаружили что-то интересное в своих нейровизуальных исследованиях: когда люди решают сложные задачи рассуждения, языковые центры нашего мозга часто остаются удивительно тихими. Однако мы строим системы ИИ, которые делают обратное – заставляют их переводить каждый шаг рассуждения в слова.

Подумайте, как вы решаете головоломку. Ваш ум, вероятно, исследует несколько возможностей одновременно, поддерживает нечеткие гипотезы и только тогда, когда вы делитесь решением, он оформляет свои мысли в язык. Но традиционные подходы к цепочке мыслей заставляют модели ИИ вербализировать каждый промежуточный шаг, создавая “лингвистический узкий место”.

Этот вывод привел к убедительному вопросу: что если мы сможем позволить моделям ИИ рассуждать на их родном “языке” – в непрерывном, высокоразмерном пространстве их скрытых состояний – а не заставлять их переводить все в токены?

Понимание инноваций COCONUT

Представьте разницу между высказыванием своих мыслей вслух и фактическим мыслительным процессом, происходящим в вашем мозге. Этот разрыв – между вербализированными мыслями и нейронной активностью – именно то, на что наткнулись исследователи Meta с COCONUT.

Настоящий прорыв COCONUT заключается в том, как он позволяет моделям ИИ думать двумя различными способами, как и люди. Подумайте, когда вы решаете сложную головоломку – вы не описываете каждый возможный ход в своей голове, верно? Вместо этого вы:

Впитываете проблему: Вы принимаете информацию (например, читаете правила головоломки)
Думаете молча: Ваш мозг исследует несколько возможностей без их вербализации
Делитесь решением: Только тогда вы объясняете свою мысль другим

COCONUT дает моделям ИИ эту же естественную гибкость. Вместо того, чтобы заставлять их “говорить” каждую мысль вслух (как традиционные методы), он позволяет им думать в их естественном нейронном пространстве – то, что исследователи называют “латентным пространством”.

Модель плавно переключает между двумя режимами:

Когда ей нужно понять вопросы или дать ответы, она использует обычный язык
Но для самого процесса мышления? Она использует чистые нейронные закономерности, свободные от ограничений слов

Изображение: Meta

Путь обучения

Одним из наиболее fascинirующих аспектов COCONUT является его учебная программа. То, что делает ее особенной, – это то, как она отражает естественный процесс обучения. Подумайте, как мы учим сложным навыкам – вы не бросаете человека в глубокий конец сразу. Вы строите постепенно, добавляя сложность, когда он осваивает каждый уровень.

Исследователи использовали именно этот подход с COCONUT:

Этап 1: Основание

Сначала модель учится как любая другая ИИ – через традиционное рассуждение в цепочке мыслей. Это дает ей прочное базовое понимание.

Этап 2: Переход

Именно здесь все становится интересным. Постепенно, те написанные шаги рассуждения заменяются непрерывными мыслями. Представьте, что вы медленно удаляете тренировочные колеса, позволяя модели развивать свои собственные внутренние закономерности мышления.

Этап 3: Баланс

Наконец, модель учится бесшовно переключаться между глубоким мышлением в латентном пространстве и общением своих прозрений на ясном языке.

Во время обучения модель развила способности, которые никто явно не запрограммировал – например, рассмотрение нескольких путей рассуждения одновременно. Это возникающее поведение особенно интересно, поскольку оно предполагает, что мы можем приближаться к более естественным формам рассуждения ИИ. Именно такие неожиданные разработки часто приводят к самым большим прорывам.

Помните те нейровизуальные исследования, о которых я упоминал ранее? Они показали, что человеческий мозг часто обрабатывает сложные задачи рассуждения без сильного участия языковых центров. COCONUT, кажется, развивает подобные закономерности – глубоко думая в своем родном нейронном пространстве и только тогда, когда необходимо для общения, переводя в язык.

Цифры рассказывают историю

Несколько ключевых выводов выделяются из исследования:

Математические задачи со словами (GSM8k): Здесь COCONUT достигла 34,1% точности. Хотя это ниже, чем у традиционной цепочки мыслей (42,9%), это значительно лучше, чем базовые подходы.
Логические выведения (ProntoQA): COCONUT достигла 99,8% точности, превзойдя традиционную цепочку мыслей (98,8%). Но вот что интересно – она сделала это, используя только 9 токенов по сравнению с 92,5 у CoT.
Сложное планирование (ProsQA): Самые впечатляющие результаты пришли из этого продвинутого теста рассуждения. COCONUT достигла 97% точности, в то время как традиционные методы достигли только 77,5%. И снова, она сделала это с замечательной эффективностью – 14,2 токена против 49,4.

Что делает эти результаты перспективными, – это не только сырые цифры – это то, что они раскрывают о разных типах мышления. Хотя COCONUT может еще только находить свои ноги в математическом рассуждении, она отлично справляется с задачами, требующими сложного логического планирования и вывода.

COCONUT представляет собой фундаментальный пересмотр того, как системы ИИ могут рассуждать, и он приближает нас к более естественным, эффективным и мощным формам искусственного интеллекта. Путь от языкового рассуждения к непрерывному мышлению – это шаг к более способным и эффективным системам ИИ.

Related Topics:chain of thought reasoning LLMs

Alex McFarland

Алекс Макфарленд - журналист и писатель в области искусственного интеллекта, исследующий последние разработки в этой области. Он сотрудничал с многочисленными стартапами и изданиями в области искусственного интеллекта во всем мире.