Свяжитесь с нами:

Нейросимволический сдвиг: почему чистые LLM-степени натыкаются на стену

Искусственный интеллект

Нейросимволический сдвиг: почему чистые LLM-степени натыкаются на стену

mm

Индустрия искусственного интеллекта переживает существенный сдвиг, который пока не получил широкого признания. Хотя большие языковые модели (LLM) продолжают доминировать в этой области, новый подход постепенно развивается. Этот подход, называемый здесь нейросимволическими LLM, позволяет LLM на основе нейронных сетей использовать символьные рассуждения для выполнения задачи. В отличие от чистых LLM, которые полагаются исключительно на способность нейронных сетей распознавать образы, нейросимволические LLM сначала преобразуют инструкции естественного языка в символьные программы, а затем используют внешние символьные интерпретаторы, такие как интерпретаторы языков программирования, для их выполнения. Такая интеграция повышает способность модели решать сложные задачи, обеспечивая более высокую точность, прозрачность и интерпретируемость. В этой статье мы рассмотрим причины растущего перехода к нейросимволическим LLM.

Миф о масштабировании рушится

Главное обещание эпохи LLM было простым: более крупные модели дадут лучшие результаты. идея заключалась в том, что с большим объемом данных и вычислительной мощностью ИИ может достигать лучших результатов. Эта теория работала какое-то время, но последние разработки показали её ограниченность. Недавнее исследование пример Grok 4, который использовал в 100 раз большую вычислительную мощность, чем его предшественник, но не показал значительных улучшений в сложных тестах, таких как Последний экзамен человечестваХотя Grok 4 показал лучшие результаты в некоторых областях, прирост оказался гораздо меньше ожидаемого. Однако при интеграции символьных инструментов в эти модели производительность значительно возросла. Это говорит о том, что масштабирование само по себе не является ключом к повышению производительности ИИ, и нейросимволический подход потенциально может превзойти чистые LLM.

Ограничения чистых нейронных сетей

Чистые LLM имеют присущие им слабые которые масштабирование не может преодолеть. Эти ограничения обусловлены тем, как LLM построены с использованием нейронных сетей, которые в первую очередь полагаются на распознавание образов. Несмотря на эффективность во многих контекстах, их зависимость от распознавания образов и отсутствие способности к рассуждению ограничивают их способность выполнять сложные задачи, требующие более глубокого понимания или логического вывода. Например, когда Apple исследователи Добавление нерелевантных условий в математические задачи привело к снижению точности в современных LLM до 65%. В GSM-символике проведенное исследованиеСтуденты LLM показали плохие результаты при перестановке цифр или добавлении дополнительных предложений, даже при наличии идеальной визуальной информации.

Другой пример этого недостатка виден в построение кроссворда. ChatGPT, не понимающий код, испытывает трудности с такими задачами, как построение сетки. Это привело к простым ошибкам, например, распознаваниюРЦРКТ” как допустимое слово. В отличие от этого, o3 от OpenAI, использующий символьный код, может корректно создавать сетки кроссвордов. Это показывает, что чистые LLM не способны надёжно выполнять алгоритмические процессы, отличать корреляцию от причинно-следственной связи или поддерживать логическую последовательность в многошаговых задачах рассуждения.

Расцвет символического ИИ: логическая точность важнее сопоставления с образцом

Символический ИИ использует прозрачную, основанную на правилах систему, которую легче понять и проверить. В отличие от нейронных сетей, которые часто непрозрачны, символические системы обеспечивают чёткие пути рассуждений от ввода до вывода. Это делает символический ИИ идеальным для приложений, требующих прозрачности и подотчётности.

Символические системы также более эффективны. Например, нейросимволическая Концепция учащегося обеспечивает высокую точность, используя всего 10% данных, необходимых традиционным нейронным сетям. Что ещё важнее, символьные системы могут предоставлять понятные человеку объяснения каждого решения, что критически важно для таких областей, как здравоохранение, финансы и юриспруденция.

Недавние исследования показывают эффективность символических подходов в таких задачах, как Задача о Ханойской башне, где модели типа o3 показали лучшие результаты при использовании символического кода. Аналогично, Изучающий абдуктивные правила с распознаванием контекста (ARLC) продемонстрировали почти идеальную точность в арифметических задачах, в то время как чистые LLM с трудом достигали даже 10% точности, поскольку задачи становились сложнее.

Растущий спрос на объяснимый ИИ

По мере ужесточения регулирования систем ИИ будет расти спрос на объяснимый и прозрачный ИИ. Такие секторы, как здравоохранение, финансы и юриспруденция, нуждаются в системах ИИ, способных объяснять свои рассуждения. Нейросимволический ИИ особенно хорошо подходит для удовлетворения этих потребностей. Закон Европейского Союза об искусственном интеллекте и аналогичные правила подталкивают компании к внедрению систем ИИ, которые демонстрируют подотчетность и прозрачность.

Более того, инвестиционные тенденции смещаются в сторону систем искусственного интеллекта, способных сочетать производительность с объяснимостью. Компании, которые ценят как инновации, так и доверие, находят нейросимволические системы с их превосходной способностью объяснять решения всё более привлекательными.

Повышение надежности ИИ с помощью нейросимволической интеграции

Хотя чистые LLM значительно продвинулись вперед, их надежность Остаётся проблема, особенно в таких высокорискованных областях, как здравоохранение, юриспруденция и финансы. Эта ненадёжность обусловлена зависимостью LLM от закономерностей и вероятностей, что может привести к непредсказуемым результатам и ошибкам. Нейросимволические LLM, сочетающие нейронные сети с символьным мышлением, предлагают решение. Используя логику для проверки и организации информации, LLM могут гарантировать точность и надёжность получаемых ответов. Это позволяет снизить количество ошибок, повысить прозрачность и обеспечить согласованность результатов. Этот подход может быть особенно ценным в критически важных секторах, повышая доверие к системам искусственного интеллекта. Пример такого подхода: ГрафРАГ модель показывает, как объединение этих технологий может повысить как креативность, так и точность.

Нейросимволические LLM в действии

Нейросимволические LLM-программы продемонстрировали выдающиеся результаты в решении сложных задач. Системы Google DeepMind, такие как AlphaFold, АльфаДоказательство и АльфаГеометрия, сочетают LLM с символьным мышлением, достигая выдающихся результатов в фолдинге белков, доказательстве математических теорем и решении геометрических задач. Они используют такие методы символического мышления, как поиск и условная итерация, от которых традиционные нейронные сети отказались. Более того, современные модели всё чаще используют символические правила для аугментации данных, демонстрируя, что символическое мышление становится ключевым элементом передовых систем искусственного интеллекта.

Проблемы и возможности

Несмотря на значительный прогресс в области нейросимволических LLM, предстоит ещё много работы. Существующие реализации, такие как добавление интерпретаторов кода к LLM, предлагают функциональные возможности, но они всё ещё не являются полным решением для удовлетворения требований искусственный общий интеллект (AGI). Настоящая задача заключается в разработке систем, в которых нейронные и символьные компоненты будут гармонично работать вместе, позволяя машинам рассуждать и понимать мир подобно людям. Одна из будущих целей нейросимволических LLM — дать им возможность динамически интегрироваться с различными моделями рассуждений без потери согласованности. Это позволит им рассуждать по-разному в разных ситуациях. Однако для этого требуется новая архитектура, способная использовать символические рассуждения наряду с нейронными сетями.

Выводы

Развитие нейросимволического ИИ – это смена парадигмы в развитии искусственного интеллекта. Хотя традиционные программы магистратуры права (LLM) доказали свою эффективность во многих областях, они ограничены зависимостью от распознавания образов и отсутствием способности к рассуждению. Развивающийся нейросимволический подход, сочетающий LLM с символьным мышлением, предлагает значительные преимущества с точки зрения точности, прозрачности и интерпретируемости. Нейросимволические системы превосходны в задачах, требующих сложных рассуждений, логической точности и объяснимости. Эти качества становятся всё более важными в регулируемых отраслях, таких как здравоохранение, финансы и юриспруденция. В связи с растущим спросом на прозрачность и подотчётность ИИ, нейросимволический ИИ становится критически важным решением для разработки более надёжных и понятных систем. Однако сохраняются трудности в полной интеграции нейронных и символических компонентов, и для создания систем, способных к динамическому рассуждению в различных режимах, потребуются постоянные инновации.

Доктор Техсин Зия — штатный доцент Университета COMSATS в Исламабаде, имеет докторскую степень в области искусственного интеллекта, полученную в Венском технологическом университете, Австрия. Специализируясь на искусственном интеллекте, машинном обучении, науке о данных и компьютерном зрении, он внес значительный вклад, публикуя публикации в авторитетных научных журналах. Доктор Техсин также руководил различными промышленными проектами в качестве главного исследователя и консультанта по искусственному интеллекту.