Искусственный интеллект
Модели ИИ дают представление о том, как мозг обрабатывает язык

Новое исследование, проведенное Массачусетским технологическим институтом, предполагает, что основная функция вычислительных моделей «предсказания следующего слова» напоминает функцию центров обработки речи в человеческом мозгу.
Значение языка
Новейшие предиктивные языковые модели могут узнать что-то о скрытом значении языка, что станет огромным шагом вперед в этой области. Модели предсказывают следующее слово, но они также выполняют задачи, которые требуют определенной степени подлинного понимания. Эти задачи включают в себя ответы на вопросы, обобщение документов и завершение рассказа.
Модели были разработаны для оптимизации производительности для предсказания текста, не пытаясь имитировать что-либо в отношении того, как человеческий мозг понимает язык. Однако команда нейробиологов Массачусетского технологического института предполагает, что в этом отношении что-то происходит.
Одним из наиболее интересных выводов этого исследования является то, что компьютерные модели, которые хорошо справляются с другими типами языковых задач, не демонстрируют такого сходства с человеческим мозгом. Это рассматривается как свидетельство того, что человеческий мозг может использовать предсказание следующего слова для обработки речи.
Нэнси Канвишер — профессор когнитивной неврологии Уолтера А. Розенблита. Она также является членом Института исследований мозга Макговерна Массачусетского технологического института и Центра изучения мозга, разума и машин (CBMM) и автором исследования.
«Чем лучше модель предсказывает следующее слово, тем больше она соответствует человеческому мозгу», — говорит Канвишер. «Удивительно, что модели так хорошо подходят, и это очень косвенно предполагает, что, возможно, то, что делает система человеческого языка, предсказывает, что произойдет дальше».
Исследование появилось в Труды Национальной академии наук.
В него также входили ведущие авторы Джошу Тененбаум, профессор когнитивных наук Массачусетского технологического института и член CBMM и искусственного интеллекта Массачусетского технологического института (CSAIL); и Эвелин Федоренко, Фредерик А. и Кэрол Дж. Миддлтон по развитию карьеры, адъюнкт-профессор неврологии и член Института Макговерна. Первым автором статьи был Мартин Шримпф, аспирант Массачусетского технологического института.
Исследование
Команда Массачусетского технологического института сравнила центры обработки речи в человеческом мозгу с моделями обработки речи. Они проанализировали 43 различных языковых модели, в том числе те, которые оптимизированы для предсказания следующего слова, такие как GPT-3. Другие модели были разработаны для выполнения других языковых задач, таких как заполнение пропусков.
Каждой модели была представлена строка слов, и исследователи измерили активность узлов, составляющих сеть. Затем паттерны сравнили с активностью мозга, которая измерялась у испытуемых, выполняющих три языковых задания: слушание историй, чтение предложений по одному и чтение предложений, в которых раскрывается одно слово за раз.
Наборы данных о людях включали данные функционального магнитного резонанса (фМРТ) и внутричерепные электрокортикографические измерения, которые были взяты у людей, перенесших операцию на головном мозге по поводу эпилепсии.
Исследователи обнаружили, что самые эффективные модели предсказания следующего слова имеют паттерны активности, очень похожие на те, которые наблюдаются в человеческом мозгу. Те же самые модели также продемонстрировали активность, которая сильно коррелировала с показателями человеческого поведения, например, с тем, насколько быстро люди могут читать текст.
«Мы обнаружили, что модели, которые хорошо предсказывают нейронные реакции, также, как правило, лучше всего предсказывают реакции человеческого поведения в виде времени чтения. И затем оба они объясняются производительностью модели при предсказании следующего слова. Этот треугольник действительно соединяет все воедино», — говорит Шримпф.
Теперь исследователи будут искать варианты моделей обработки языка, которые позволят им увидеть, как небольшие изменения в их архитектуре влияют на производительность и их способность соответствовать данным нейронных сетей человека.