Ângulo de Anderson
Uma visão pessoal sobre tendências da literatura de visão computacional em 2025

As divulgações éticas e o Gaussian Splatting estão em declínio, enquanto o enorme volume de artigos submetidos representa um novo problema que a IA terá de enfrentar em 2026.
Opinião Acompanho pesquisas em visão computacional e síntese de imagens no arXiv e em outros fóruns há cerca de sete anos, em diversas plataformas – tempo suficiente para identificar padrões recorrentes e mudanças de tendências. Mas essas observações são anedóticas. Sinceramente, gostaria de ter tempo para explorar o vasto conjunto de dados em constante crescimento representado apenas pelo fluxo de publicações do arXiv, que certamente é rico em insights ocultos, usando análise de aprendizado de máquina. No momento, só posso relatar de forma mais informal o que me chamou a atenção. desde a última vez que considerei o assunto.
Volume em 11
Muitas das tendências em submissões de artigos de pesquisa em IA que observei em 2024 se consolidaram em 2025; entre elas, destaca-se o aumento inexorável e contínuo em volume de artigos relacionados à IA, impulsionados pela própria IA, a ponto de uma crise percebida:

Submissões mensais de ciência da computação no arXiv, de outubro de 2023 a novembro de 2025, com média móvel de 3 meses sobreposta.. fonte
Essa taxa de crescimento foi caracterizada como uma duplicação exponencial no volume de submissões de artigos sobre IA. vários anos atrásE essa tendência só se intensificou com o recente advento de Mania de investimento em IA aumentou a importância da pesquisa, bem como a quantidade de financiamento disponível para pesquisas relacionadas à IA.
As estatísticas completas para 2025 ainda não estão disponíveis, e os dados agregados mostrados acima representam o aumento geral em todas as categorias. Abaixo, podemos ver que a ciência da computação continua a apresentar uma tendência dominante, significativamente acima das áreas correlatas:

Aumento no número de submissões de trabalhos de Ciência da Computação entre 2022 e 2025. fonte
Separando o joio
Em outubro, o início da temporada de conferências de outono, que sempre traz uma enxurrada de novas pesquisas, trouxe, em vez disso, volume de submissões equivalente ao de um ataque de negação de serviço (DoS), conferindo maior ímpeto e urgência à linha de pesquisa até então pouco apoiada de análise de tendências de pesquisaEm outras palavras, artigos e repositórios estão surgindo cada vez mais com o objetivo de superar a crescente discrepância entre sinal e ruído no cenário da pesquisa.
A mais recente surgiu apenas na semana passada, na forma de Classificação de Novidade, um papel e Repositório GitHub que aprimora LLMs como Qwen3-4B-Instrução-2507 e SciBERT para que possam realizar a classificação binária dos artigos submetidos (prevendo a 'novidade' a partir de submissões anteriores), ou então a comparação de novidade aos pares (comparando as submissões atuais quanto à 'novidade'):

O sistema NoveltyRank compara o título e o resumo de um artigo submetido com trabalhos semelhantes publicados anteriormente, resume as diferenças usando um modelo de regressão logística (LLM) e passa essa informação para um modelo Qwen3-4B refinado, que decide se o trabalho é considerado "conceitualmente novo". fonte
O problema com essas abordagens de 'peneiramento' é o desafio de Definindo variáveis significativasA abordagem NoveltyRank usa a aceitação de um artigo em uma conferência como um índice de novidade e – talvez de forma um tanto desdenhosa – usa a publicação no arXiv como um índice de contexto. negativo novidade.
Isso pressupõe duas premissas falsas: primeiro, que todos os trabalhos aceitos na conferência sejam inéditos ou relevantes, o que manifestamente não é o caso; e segundo, que a própria novidade tenha valor inquestionável. Qualquer pessoa que tenha perdido meia hora com alguns dos artigos falaciosos, até mesmo ridículos, submetidos – talvez – unicamente para manter cotas do tipo "publique ou pereça"Quem já trabalhou com isso sabe que a novidade muitas vezes é trivial, e o trabalho incremental, muitas vezes, é significativo.
Compreender o valor de um novo artigo envolve uma área em que a IA está atualmente muito fraco – longo prazo contextoDevido à maneira frequentemente desonesta como são escritos, artigos que parecem inovadores podem muitas vezes se revelar como avanços menores em trabalhos já existentes; no entanto, os sistemas automatizados terão que desenvolver uma "intuição" para esses casos, sem sinalizar múltiplos falsos positivos e sem depender da honestidade dos autores que submetem o artigo.
Mergulho Ético
Como eu tenho observado antes, portais como o Arxiv são bastante resistentes a laissez faire A extração de dados e os despejos de dados que ela fornece geralmente carecem de detalhes específicos.
Portanto, mesmo que eu tivesse os recursos e o tempo para baixar e extrair características de uma amostra representativa de artigos de ciência da computação, muitas das tendências mais sutis não teriam sido identificadas ou analisadas.
Uma delas é a presença ou ausência de adendos da declaração ética; longo um inclusão obrigatória Nas ciências biológicas que abordam a experimentação animal, 2024 testemunhou o auge da tendência em direção à caracterização ética de um trabalho proposto, ao final da submissão de artigos na categoria de Ciência da Computação.
De forma anedótica, diria que essa prática entrou em colapso ao longo de 2025. Acredito que os intensos esforços de desregulamentação do atual governo dos EUA, em relação ao desenvolvimento da IA, tenham concedido à comunidade de pesquisa, tanto nos Estados Unidos quanto no exterior, uma certa maior liberdade e uma sensação implícita de proteção contra processos judiciais.
Apesar de sua ajuda Em relação à regulamentação contra deepfakes, o atual governo dos EUA efetivamente restaurou grande parte da postura de "terra sem lei" que caracterizou o período de 2021-23 – embora o contexto de pesquisa científica pura que a definiu tenha evoluído desde então para níveis de investimento fervorosos, até mesmo históricos.
Artigos sobre vídeo generativo são vistos como "lixo de IA"
Com o lançamento do Vídeo Hunyuan e WAN A série de vídeos generativos do último inverno transformou completamente o vídeo com IA em 2025. Antigos obstáculos, como o dificuldade de criar avatares de corpo inteiro, ou de obtendo visualizações de perfil convincentes de uma pessoa, foram arrastados aparentemente durante a noite.
Os lançamentos abundantes deste tipo, provenientes da China e com pesos incluídos, têm, indiscutivelmente, ditaram o ritmo dos lançamentos de vídeo generativo este ano e representam, pelo menos, uma pressão contrária à tendência das arquiteturas de vídeo de IA ocidentais de serem muito mais censuradas, pré-comercializadas e prescritas.
A ausência de fosso Nesse cenário ironicamente democrático liderado pelo PCC, surgiram centenas, senão milhares, de empresas que buscam explorar o mercado nascente de inferência, oferecendo portais fáceis de usar, com participantes tão diversos quanto... civit.ai e RunPod Aproveitando-se de procedimentos e tecnologias que, em muitos casos, poderiam ser executados em computadores domésticos.
Em geral, essas iniciativas são ganhos de curto prazo que se espera serem suplantados por uma eventual consolidação do mercado (embora, sem dúvida, seus fundadores não se oporiam a, por acaso, conquistar uma participação de mercado dominante, caso isso acontecesse).
Essa mesma banalidade e replicação atingiram a vertente de vídeo generativo nas submissões ao arXiv em 2025. Como eu observado na semana passadaA relação sinal-ruído para esta categoria atingiu um pico alarmante, à medida que os pesquisadores competem publicamente pelas enormes quantias de financiamento potencial que as descobertas deste ano, sem dúvida, liberaram.
Dito isso, a grande maioria das submissões desse tipo são, na melhor das hipóteses, meros avanços incrementais. Os principais problemas que ainda persistem na IA generativa não vieram à tona este ano: a necessidade de manter a identidade, Estilo LoRA, ao longo da representação de um personagem; a necessidade de tempos de execução mais longos para vídeos de saída, mantendo a consistência geral (ou seja, de ambientes e temas, etc., não apenas de identidade visual); e para melhoria geração de áudio e manipulação em arquiteturas de vídeo generativo e edição de vídeo; entre outras.
A febre da tela diminui
Observei no ano passado que o setor estava passando por um aumento notável de artigos que promoviam sistemas que utilizavam CGI tradicional (ou seja, representações baseadas em malha do tipo que remonta à década de 1970), ou incorporá-lo em estruturas neuraisObservei uma diminuição significativa do ímpeto em direção a soluções baseadas em malhas, particularmente no segundo semestre do ano, ao longo de 2025.
Muitas das soluções que incorporavam CGI naquela onda anterior de artigos, especialmente aquelas que tratavam de figuras humanas paramétricas de 'controle', como modelos 3D deformáveis, pode ter sido suplantado pelas novas capacidades de estruturas generativas baseadas em difusão, como Veo, Kling, Hunyuan e WAN, entre muitas outras.
Ao mesmo tempo, artigos que tratam de Gaussian Splat Aparentemente, as abordagens também foram afetadas pela estagnação do desenvolvimento ou por terem sido ofuscadas pelos sistemas de IA de geração genérica baseados em difusão de 2025; ou ambos.
Há um ano, observei que a empolgação inicial com o GSplat, que causou um impressão notável no final de 2023, havia se concentrado em linhas de pesquisa mais específicas. Este ano, vejo uma série de artigos que visam abordar as significativas demandas de recursos dessa abordagem, entre outros problemas.
Embora eu caracterize o Gaussian Splatting como 'atualmente estagnado', devemos lembrar que essa tecnologia remonta ao início da década de 1990 e é, por natureza, recorrente.
Uma exceção a esse recuo geral das abordagens baseadas em malhas é um aparente aumento do interesse em incorporar IA em estruturas voltadas para a impressão 3D.
Diminuição nas submissões de segurança de IA
Minha observação final para 2025 é que a categoria de submissões "Segurança" na seção de Ciência da Computação do arXiv apresentou uma queda notável em frequência e qualidade em 2025, e não é fácil adivinhar o motivo.
A Criptografia e Segurança O Arxiv sempre foi, sem dúvida, um local de segunda classe para a publicação de artigos, visto que essa linha de pesquisa é, previsivelmente, dominada por propriedade intelectual do setor privado – da qual pouco aparece em periódicos acadêmicos e quase nada em plataformas gratuitas como o Arxiv.
Além disso, os artigos submetidos a esta categoria no arXiv apresentam um número acima da média de "armadilhas" – admissões pouco exploradas, muitas vezes escondidas em locais inesperados, que negam ou diminuem o valor e a originalidade aparentes do artigo. Um exemplo seria um método aparentemente sensacional de violação de segurança que, na verdade, depende de algum aspecto de "caixa branca" – ou seja, acesso privilegiado de algum tipo a dados ou procedimentos, que um atacante provavelmente não conseguiria proteger.
O que esperar em 2026
Embora a mídia seja riffs constantemente sobre o boom da IA de primeira geração como uma repetição do desastre da bolha da internet do início dos anos 2000 (com alguma discordância), isso na verdade parece representar uma espécie de falsa segurança. Em termos de infraestrutura, investimento, cultura e Pesquisas indicam que provavelmente nunca houve um período como este na história da humanidade.
Portanto, é difícil prever qual será a tendência do cenário de pesquisa em 2026, exceto que – como de costume – uma série de esforços de longo prazo culminarão entre agora e abril, com uma certa "marca" das obsessões e tendências de 2025 distinguindo-os.
Uma medida que pode ajudar a resolver a crise do volume de submissões no arXiv e em outros portais é a proibição ou o controle de artigos gerados ou auxiliados por IA. O arXiv implementou recentemente uma política para artigos de revisão. – no entanto, a extensão do envolvimento da IA em qualquer artigo específico pode ser difícil de quantificar, visto que a IA tem cultura de pesquisa penetrada (E revisão por pares) assim como invadiu outros domínios – como uma gota de 'tinta' que afeta todo o copo de água (existente), em vez de mudar radicalmente o meio.
Primeira publicação segunda-feira, 22 de dezembro de 2025


