Connect with us

DeepSeek: Эффективность, а не парадигмальный сдвиг в инновациях ИИ

Лидеры мнений

DeepSeek: Эффективность, а не парадигмальный сдвиг в инновациях ИИ

mm

Последняя сенсация вокруг DeepSeek, передовой большой языковой модели (LLM), понятна, учитывая значительное улучшение эффективности, которое она приносит в эту область. Однако некоторые реакции на ее выпуск似乎 неправильно интерпретируют масштаб ее влияния. DeepSeek представляет собой шаг вперед в ожидаемой траектории развития LLM, но она не сигнализирует о революционном сдвиге в сторону искусственного общего интеллекта (AGI), ни не отмечает внезапную трансформацию центра тяжести инноваций ИИ.

РATHER, достижение DeepSeek является естественным прогрессом по хорошо намеченному пути – экспоненциальному росту технологии ИИ. Это не разрушительный парадигмальный сдвиг, а мощное напоминание об ускоряющемся темпе технологических изменений.

Эффективность DeepSeek: шаг вперед по ожидаемой траектории

Суть сенсации вокруг DeepSeek заключается в ее впечатляющих улучшениях эффективности. Ее инновации в основном связаны с тем, чтобы сделать LLM быстрее и дешевле, что имеет значительные последствия для экономики и доступности моделей ИИ. Однако, несмотря на ажиотаж, эти достижения не являются фундаментально новыми, а скорее усовершенствования существующих подходов.

В 1990-х годах высококачественная компьютерная графика требовала суперкомпьютеров. Сегодня смартфоны способны выполнять ту же задачу. Аналогично, распознавание лиц – когда-то нишевая, высокозатратная технология – теперь стала повсеместной, готовой функцией в смартфонах. DeepSeek вписывается в эту модель технологии: оптимизацию существующих возможностей, которая обеспечивает эффективность, но не новый, революционный подход.

Для тех, кто знаком с принципами технологического роста, этот быстрый прогресс не является неожиданным. Теория технологической сингулярности, которая предполагает ускоряющийся прогресс в ключевых областях, таких как ИИ, предсказывает, что прорывы будут становиться более частыми, когда мы приближаемся к точке сингулярности. DeepSeek – это всего лишь один момент в этом непрерывном тренде, и его роль заключается в том, чтобы сделать существующие технологии ИИ более доступными и эффективными, а не представлять внезапный скачок в новые возможности.

Инновации DeepSeek: архитектурные усовершенствования, а не скачок к AGI

Главный вклад DeepSeek заключается в оптимизации эффективности больших языковых моделей, в частности, за счет его смеси экспертов (MoE) архитектуры. MoE – это хорошо известная техника ансамблевого обучения, которая использовалась в исследованиях ИИ в течение многих лет. Что DeepSeek сделал особенно хорошо, так это усовершенствовал эту технику, включив другие меры эффективности для минимизации вычислительных затрат и сделать LLM более доступными.

  • Эффективность параметров: MoE-дизайн DeepSeek активирует только 37 миллиардов из 671 миллиарда параметров в любой момент времени, снижая вычислительные требования до 1/18 от традиционных LLM.
  • Усиление обучения для рассуждений: Модель R1 DeepSeek использует усиление обучения для улучшения цепочки рассуждений, важного аспекта языковых моделей.
  • Много-токенная тренировка: Способность DeepSeek-V3 предсказывать несколько фрагментов текста одновременно увеличивает эффективность тренировки.

Эти улучшения делают модели DeepSeek значительно дешевле в тренировке и запуске по сравнению с конкурентами, такими как OpenAI или Anthropic. Хотя это значительный шаг вперед для доступности LLM, это остается инженерным усовершенствованием, а не концептуальным прорывом в сторону AGI.

Влияние открытого ИИ

Одним из наиболее заметных решений DeepSeek было сделать свои модели открытыми -明显ный отход от проприетарных, закрытых подходов компаний, таких как OpenAI, Anthropic и Google. Этот открытый подход, защищаемый исследователями ИИ, такими как Ян Лекун из Meta, способствует более децентрализованной экосистеме ИИ, где инновации могут процветать благодаря коллективному развитию.

Экономическая логика решения DeepSeek об открытом исходном коде также ясна. Открытый ИИ – это не только философская позиция, но и бизнес-стратегия. Размещая свою технологию в распоряжении широкого круга исследователей и разработчиков, DeepSeek позиционирует себя для получения выгоды от услуг, корпоративной интеграции и масштабируемой установки, а не полагаясь исключительно на продажу проприетарных моделей. Этот подход дает глобальному сообществу ИИ доступ к конкурентным инструментам и снижает зависимость от крупных западных технологических гигантов в этой области.

Растущая роль Китая в гонке ИИ

Для многих тот факт, что прорыв DeepSeek произошел в Китае, может быть удивительным. Однако это развитие не должно рассматриваться с удивлением или как часть геополитического соревнования. Проведя годы наблюдения за ландшафтом ИИ Китая, ясно, что страна сделала значительные инвестиции в исследования ИИ, в результате чего образовался растущий пул талантов и экспертизы.

РATHER, это развитие должно рассматриваться как знак все более глобальной природы исследований ИИ. Открытое сотрудничество, а не националистическое соревнование, является наиболее перспективным путем к ответственной и этической разработке AGI. Децентрализованная, глобально распределенная деятельность намного более вероятна для создания AGI, который принесет пользу всему человечеству, а не будет служить интересам одной нации или корпорации.

Более широкие последствия DeepSeek: взгляд за пределы LLM

Хотя большая часть сенсации вокруг DeepSeek вращается вокруг ее эффективности в области LLM, важно сделать шаг назад и рассмотреть более широкие последствия этого развития.

Несмотря на их впечатляющие возможности, модели на основе трансформеров, такие как LLM, все еще далеки от достижения AGI. Им не хватает необходимых качеств, таких как основанная на абстракции композиция и самоуправляемое рассуждение, которые необходимы для общего интеллекта. Хотя LLM могут автоматизировать широкий спектр экономических задач и интегрироваться в различные отрасли, они не представляют собой основу разработки AGI.

Если AGI появится в течение следующего десятилетия, маловероятно, что она будет основана исключительно на архитектуре трансформера. Альтернативные модели, такие как OpenCog Hyperon или нейроморфные вычисления, могут быть более фундаментальными для достижения истинного общего интеллекта.

Коммодитизация LLM сдвинет инвестиции в ИИ

Улучшения эффективности DeepSeek ускоряют тенденцию к коммодитизации LLM. По мере того, как стоимость этих моделей продолжает снижаться, инвесторы могут начать смотреть за пределы традиционных архитектур LLM для следующего большого прорыва в ИИ. Мы можем увидеть сдвиг в финансировании в сторону архитектур AGI, которые выходят за рамки трансформеров, а также инвестиций в альтернативное оборудование ИИ, такое как нейроморфные чипы или ассоциативные процессорные блоки.

Децентрализация определит будущее ИИ

По мере того, как улучшения эффективности DeepSeek делают его проще развертывать модели ИИ, они также способствуют более широкой тенденции децентрализации архитектуры ИИ. С фокусом на конфиденциальности, взаимодействии и контроле пользователя, децентрализованный ИИ уменьшит нашу зависимость от крупных, централизованных технологических компаний. Эта тенденция имеет решающее значение для обеспечения того, чтобы ИИ служил потребностям глобального населения, а не контролировался горсткой мощных игроков.

Место DeepSeek в камбрийском взрыве ИИ

В заключение, хотя DeepSeek является значительным этапом в эффективности LLM, это не революционный сдвиг в ландшафте ИИ. РATHER, это ускоряет прогресс по хорошо установленной траектории. Более широкое влияние DeepSeek ощущается в нескольких областях:

  • Давление на лидеров: DeepSeek бросает вызов компаниям, таким как OpenAI и Anthropic, пересмотреть свои бизнес-модели и найти новые способы конкуренции.
  • Доступность ИИ: Сделав высококачественные модели более доступными, DeepSeek демократизирует доступ к передовым технологиям.
  • Глобальное соревнование: Растущая роль Китая в разработке ИИ сигнализирует о все более глобальной природе инноваций, которая не ограничивается Западом.
  • Экспоненциальный прогресс: DeepSeek – это яркий пример того, как быстрый прогресс в ИИ становится нормой.

Самое главное, DeepSeek служит напоминанием о том, что, хотя ИИ развивается быстро, истинный AGI, скорее всего, появится через новые, фундаментальные подходы, а не оптимизацию сегодняшних моделей. По мере того, как мы бежим к сингулярности, важно обеспечить, чтобы разработка ИИ оставалась децентрализованной, открытой и сотруднической.

DeepSeek – это не AGI, но это представляет собой значительный шаг вперед в непрерывном пути к трансформационному ИИ.

Доктор Бен Гёрцель является исследователем и предпринимателем в области искусственного общего интеллекта (AGI), машинного обучения и децентрализованных систем ИИ. С более чем тридцатилетним опытом, он возглавлял разработку передовых框架 ИИ, включая проект OpenCog и SingularityNET, децентрализованную платформу ИИ. Он является автором многочисленных книг и исследовательских работ по ИИ, когнитивной науке и сложным системам, и часто выступает на тему трансформационного потенциала AGI.