Угол Андерсона

Личный взгляд на тенденции в литературе по компьютерному зрению в 2025 году

опубликованный 22 декабря 2025

Мартин Андерсон

Изображение, сгенерированное ИИ с помощью gpt-image-1 через ChatGPT-5.2, представляет собой стилизованную изометрическую иллюстрацию ученых в белых халатах в компьютерной лаборатории.

Соблюдение этических норм и использование алгоритма Gaussian Splatting отходят на второй план, а огромный объем представленных научных работ представляет собой новую проблему, которую ИИ предстоит решить в 2026 году.

Обзор Я слежу за исследованиями в области компьютерного зрения и синтеза изображений на arXiv и подобных площадках около семи лет, на разных ресурсах — достаточно долго, чтобы выявить повторяющиеся закономерности и изменения в тенденциях. Но эти наблюдения носят характер отдельных наблюдений. Честно говоря, мне бы очень хотелось иметь время, чтобы использовать огромный массив постоянно растущих данных, представленный одним только потоком публикаций на Arxiv, который, несомненно, богат скрытыми идеями, используя анализ машинного обучения. На данный момент я могу лишь вскользь рассказать о том, что привлекло мое внимание. с тех пор, как я в последний раз рассматривал этот вопрос.

Громкость 11

Многие тенденции в количестве научных работ по искусственному интеллекту, которые я наблюдал в 2024 году, сохранились и в 2025 году; не в последнюю очередь это касается неумолимого и продолжающегося роста... объем количество статей, связанных с ИИ, которые сами по себе подпитываются ИИ, дошло до того, что предполагаемый кризис:

Ежемесячные публикации в области компьютерных наук на Arxiv, октябрь 2023 г. – ноябрь 2025 г., с наложенным скользящим средним за 3 месяца. Источник: https://arxiv.org/stats/monthly_submissions

Ежемесячные публикации по информатике на Arxiv, октябрь 2023 г. – ноябрь 2025 г., с наложенным скользящим средним за 3 месяца.. Источник

Такой темп роста характеризовался экспоненциальным удвоением объема представленных статей по искусственному интеллекту. несколько лет назади это явление лишь укрепилось с недавним появлением мания инвестиций в ИИ Это повысило ставки, а также объем финансирования, доступного для исследований в области искусственного интеллекта.

Полная статистика за 2025 год пока недоступна, а представленные выше сводные данные отражают общий рост показателей по всем категориям. Ниже мы видим, что информатика продолжает демонстрировать доминирующую тенденцию, значительно опережая другие смежные области:

Рост числа заявок на гранты CS в период 2022-2025 гг. Источник: https://info.arxiv.org/about/reports/submission_category_by_year.html

Рост числа заявок на гранты CS в период 2022-2025 годов. Источник

Отсеивание плевел

В октябре начало осеннего сезона конференций, который всегда приносит поток новых исследований, вместо этого принесло... Объем заявок, сопоставимый с уровнем DOS-атакичто придает дополнительный импульс и срочность этому до сих пор недостаточно востребованному направлению исследований. анализ исследовательских тенденцийИными словами, всё чаще появляются статьи и репозитории, которые сами по себе стремятся пробиться сквозь ухудшающееся соотношение сигнал-шум в научной среде.

Последнее событие произошло всего неделю назад и носило следующий характер: НовелтиРэнк, чтобы статье и Репозиторий GitHub которая позволяет дорабатывать такие LLM, как Qwen3-4B-Instruct-2507 и СциБЕРТ чтобы они могли выполнять бинарную классификацию представленных работ (прогнозируя «новизну» на основе предыдущих работ) или же попарное сравнение новизны (сравнивая текущие работы по показателю «новизны»):

Система NoveltyRank сравнивает заголовок и аннотацию представленной работы с аналогичными статьями, опубликованными ранее, обобщает различия с помощью LLM и передает эту информацию в доработанную модель Qwen3-4B, которая определяет, является ли работа «концептуально новой». Источник - https://arxiv.org/pdf/2512.14738

Система NoveltyRank сравнивает заголовок и аннотацию представленной работы с аналогичными работами, опубликованными ранее, обобщает различия с помощью LLM и передает эту информацию в доработанную модель Qwen3-4B, которая определяет, является ли работа «концептуально новой». Источник

Проблема подобных методов «отбора» заключается в сложности… определение значимых переменныхПодход NoveltyRank использует принятие статьи на конференцию в качестве показателя новизны и — возможно, несколько пренебрежительно — использует публикацию на Arxiv в качестве фонового показателя. отрицательный новинка.

Это предполагает две ложные предпосылки: во-первых, что все принятые на конференцию работы являются новыми или значимыми, что явно не так; и во-вторых, что сама новизна имеет безусловную ценность. Любой, кто потратил полчаса на некоторые из этих надуманных, даже нелепых работ, представленных – возможно, – исключительно для того, чтобы… квоты по принципу «публикуй или погибнешь»Они поймут, что новизна часто бывает тривиальной, а постепенная работа зачастую имеет большое значение.

Понимание ценности новой научной статьи относится к области, в которой в настоящее время используется искусственный интеллект. очень слаб - долгосрочный контекстИз-за зачастую неискренней манеры написания статьи, которые кажутся новаторскими, очень часто оказываются незначительными шагами вперед по сравнению с уже существующими работами; однако автоматизированным системам придется развить «интуицию» в таких случаях, не выявляя множественных ложных срабатываний и не полагаясь на честность авторов, подающих статьи.

Этический шаг

Поскольку у меня есть наблюдалось раньшеПорталы, подобные Arxiv, достаточно устойчивы к невмешательства Парсинг данных, а предоставляемые ими дампы данных часто не содержат подробной информации.

Поэтому, даже если бы у меня были ресурсы и время для загрузки и извлечения характеристик из достаточно репрезентативной выборки научных работ по информатике, многие из более тонких тенденций остались бы незамеченными или непроанализированными.

Одним из таких факторов является наличие или отсутствие этические дополнения к этическим заявлениям; длинный и обязательное включение В биологических науках, затрагивающих эксперименты на животных, в 2024 году наблюдался пик тенденции к этической характеристике предлагаемой работы в конце представленных статей в категории «Информатика».

По моим наблюдениям, эта практика резко сократилась к 2025 году. Предполагаю, что активные усилия нынешнего правительства США по дерегулированию развития ИИ дали исследовательскому сообществу как в США, так и за рубежом определенную свободу действий и ощущение неявной защиты от юридических последствий.

Несмотря на поддержка В вопросе регулирования борьбы с дипфейками нынешняя администрация США фактически восстановила большую часть «дикого запада», характерного для эпохи 2021-23 годов, — хотя контекст чистых научных исследований, определявший этот период, с тех пор развился до уровня активных, даже исторически высоких инвестиций.

Статьи о генеративном видео как о «хламе, созданном искусственным интеллектом».

С запуском Хунюань Видео и WAN Серия видеороликов, созданных с помощью генеративного подхода, вышла прошлой зимой, и к 2025 году видео с использованием ИИ претерпит полную трансформацию. Старые препятствия, такие как... сложность создания аватаров, полностью отражающих телосложениеили из получение убедительных просмотров профиля Человека, по всей видимости, смыло течением за одну ночь.

Щедрые, включая весовые категории, релизы подобного рода из Китая, спорноОни задали темп для выпуска генеративного видео в этом году и, по крайней мере, оказывают противодействие тенденции западных архитектур видео на основе ИИ быть гораздо более цензурированными, предкоммерциализированными и предписанными.

The отсутствие рва В этой парадоксально демократичной ситуации, возглавляемой СССР, сотни, если не тысячи компаний стремятся использовать зарождающийся рынок вывода информации, предлагая удобные для пользователей порталы, с участием самых разных игроков. civit.ai и RunPod извлекать выгоду из процедур и технологий, которые во многих случаях можно было бы запускать на домашних компьютерах.

В целом, эти инициативы представляют собой краткосрочные попытки заработать деньги, рассчитывая на то, что в конечном итоге их вытеснит консолидация рынка (хотя, несомненно, их основатели не возражали бы против случайного завоевания доминирующей доли рынка, если бы это произошло).

Та же самая обыденность и повторяемость затронули и направление генеративного видео в материалах, представленных на Arxiv в 2025 году. Как я уже говорил, наблюдалось на прошлой неделеВ этой категории соотношение сигнал/шум достигло ошеломляющего пика, поскольку исследователи публично конкурируют за огромные объемы потенциального финансирования, которые, несомненно, высвободились благодаря открытиям этого года.

Тем не менее, подавляющее большинство подобных разработок представляют собой в лучшем случае лишь незначительные улучшения. Основные проблемы, остающиеся в области генеративного ИИ, в этом году практически не проявились: необходимость поддерживать идентичность, Стиль LoRAна протяжении всего изображения персонажа; необходимость увеличения продолжительности выходных видеороликов при сохранении общей согласованности (т. е. окружения и тем и т. д., а не только идентификатора); и для улучшения генерация звука а также манипуляции в рамках архитектур генеративного видео и видеомонтажа, и многое другое.

Сетчатая лихорадка спадает

В прошлом году я заметил, что в этой области наблюдается заметный рост числа статей, продвигающих системы, использующие традиционную компьютерную графику (т.е. представления на основе сетки (таких, которые появились еще в 1970-х годах), или интегрировать его в нейронные сетиЯ заметил значительное снижение интереса к решениям на основе сетчатых моделей, особенно во второй половине года, в преддверии 2025 года.

Многие из решений, использующих компьютерную графику, представленные в той ранней волне статей, особенно те, которые касаются параметрических «контрольных» фигур человека, таких как... 3D-морфологические моделиВозможно, эти технологии были вытеснены новыми возможностями генеративных фреймворков, основанных на диффузии, таких как Veo, Kling, Hunyuan и WAN, а также многих других.

В то же время, статьи, посвященные Гауссово пятно По всей видимости, на эти подходы также повлияли либо стагнация развития, либо вытеснение системами искусственного интеллекта, основанными на распространении технологий, которые появятся в 2025 году; или и то, и другое.

Год назад я отметил, что первоначальный ажиотаж вокруг GSplat, который вызвал... заметное впечатление в конце 2023 годаРанее это направление исследований сузилось до более узких областей. В этом году я вижу поток статей, направленных, помимо прочих проблем, на решение значительных ресурсных задач, связанных с таким подходом.

Хотя я бы охарактеризовал технологию Gaussian Splatting как «в настоящее время застопорившуюся», следует помнить, что она появилась в начале 1990-х годов и по своей природе является устаревшей.

Одним исключением из общего отказа от подходов, основанных на сетках, является очевидный рост интереса к внедрению ИИ в системы, предназначенные для 3D-печати.

Сокращение количества заявок на исследования в области безопасности ИИ.

В заключение отмечу, что в 2025 году в категории «Безопасность» в разделе «Компьютерные науки» на Arxiv наблюдается заметное снижение частоты и качества публикаций, и трудно предположить, почему.

The Криптография и безопасность Архив, пожалуй, всегда был второсортной площадкой для публикации научных работ, поскольку в этом направлении исследований, как и следовало ожидать, доминирует частная интеллектуальная собственность, большая часть которой практически не встречается в академических журналах и почти ничего не видно на бесплатных платформах, таких как Arxiv.

Кроме того, в работах, представленных в этой категории на Arxiv, встречается больше, чем в среднем, «подводных камней» — завуалированных признаний, часто скрытых в неожиданных местах, которые нивелируют или уменьшают очевидную ценность и новизну статьи. Примером может служить, казалось бы, сенсационный метод нарушения безопасности, который на самом деле основан на каком-то аспекте «белого ящика» — то есть, на привилегированном доступе к данным или процедурам, который злоумышленник вряд ли смог бы обеспечить.

Чего ожидать в 2026 году

Хотя средства массовой информации риффы постоянно о буме искусственного интеллекта как повторении краха доткомов начала 2000-х годов (с некоторые несогласные), это, по сути, представляет собой своего рода ложную уверенность. С точки зрения инфраструктуры, инвестиций, культуры. и По результатам исследований, подобного периода в истории человечества, пожалуй, никогда не было.

Поэтому трудно предсказать, в каком направлении будет развиваться исследовательская сфера в 2026 году, за исключением того, что – как обычно – ряд долгосрочных проектов завершится к апрелю, и их будут отличать определенные «отпечатки» увлечений и тенденций 2025 года.

Одним из факторов, способных помочь в решении проблемы большого количества заявок на Arxiv и других порталах, может стать запрет или ограничение публикаций, созданных с помощью искусственного интеллекта. Недавно Arxiv ввела правила для обзора научных статей. – однако степень участия ИИ в той или иной научной статье может оказаться трудно поддающейся количественной оценке, поскольку ИИ имеет проникла в исследовательскую культуру (И экспертная оценка) подобно тому, как это проникло в другие области – как капля «чернил», которая влияет на весь (существующий) стакан воды, а не радикально меняет среду.

Впервые опубликовано Понедельник, 22 декабря 2025 г.

Похожие темы:ИИ и глубокие исследования Автоматизированные исследования