Ângulo de Anderson

Uma Visão Pessoal Sobre as Tendências da Literatura de Visão Computacional em 2025

Published December 22, 2025

Updated April 25, 2026

Martin Anderson

AI-generated image, by gpt-image-1 via ChatGPT-5.2, featuring a stylized isometric illustration of white-coated scientists in a computer laboratory.

Divulgações éticas e Gaussian Splatting estão em declínio, enquanto o volume maciço de artigos submetidos representa um novo problema para a IA resolver em 2026.

Opinião Eu tenho seguido a pesquisa em visão computacional e síntese de imagens no arXiv e em outros locais por cerca de sete anos, em várias publicações – tempo suficiente para distinguir padrões recorrentes e mudanças nas tendências. Mas essas observações são anedóticas. Eu sinceramente desejo que tivesse tempo para explorar os vastos corpora de dados em constante crescimento representados pelo fluxo de publicações do Arxiv, que certamente é rico em insights ocultos, usando análise de aprendizado de máquina. Como está, eu só posso relatar mais casualmente o que chamou minha atenção desde que considerei o assunto pela última vez.

Volume em 11

Muitas das tendências em submissões de artigos de pesquisa de IA que observei em 2024 estabeleceram-se como fixas em 2025; não menos importante é o inexorável e contínuo aumento no volume de artigos relacionados à IA, em si alimentado pela IA, a ponto de uma crise percebida:

Submissões mensais de ciência da computação no Arxiv, outubro de 2023-novembro de 2025, com média móvel de 3 meses sobreposta. Fonte

Essa taxa de crescimento foi caracterizada como um dobramento exponencial no volume de submissões de artigos de IA, vários anos atrás, e isso apenas se aprofundou à medida que o recente advento de mania de investimento em IA aumentou as apostas, bem como a quantidade de financiamento disponível para pesquisas relacionadas à IA.

Estatísticas completas para 2025 ainda não estão disponíveis, e as estatísticas agregadas mostradas acima representam os números gerais aumentando em todas as categorias. Abaixo, podemos ver que a ciência da computação continua a liderar uma tendência dominante, significativamente acima de seus companheiros:

Aumento nas submissões de ciência da computação de 2022 a 2025. Fonte

Separando o Joio

Em outubro, o início da temporada de conferências de outono, que sempre traz uma enxurrada de novas pesquisas, trouxe em vez disso um volume de submissões no nível de ataque de negação de serviço, dando impulso e urgência à linha de pesquisa sub-subscrita de análise de tendências de pesquisa; em outras palavras, papéis e repositórios estão aparecendo cada vez mais que, em si mesmos, buscam cortar a pior relação sinal-ruído na cena de pesquisa.

O mais recente veio apenas na semana passada, na forma de NoveltyRank, um artigo e repositório GitHub que ajusta LLMs como Qwen3-4B-Instruct-2507 e SciBERT para que possam realizar classificação binária de artigos submetidos (prevendo ‘novidade’ a partir de submissões anteriores), ou comparar a novidade de submissões atuais:

O sistema NoveltyRank compara o título e o resumo de uma submissão com papéis semelhantes anteriores, resume as diferenças usando um LLM e passa isso para um modelo Qwen3-4B ajustado que decide se o trabalho conta como ‘conceitualmente novo’. Fonte

O problema com essas abordagens de ‘peneiramento’ é o desafio de definir variáveis significativas. A abordagem NoveltyRank usa a aceitação de um artigo em uma conferência como um índice de novidade, e – talvez de forma um pouco descartável – usa a publicação no Arxiv como um índice de novidade negativa.

Isso pressupõe duas premissas falsas: primeiro, que todas as submissões aceitas em conferências são novas ou de consequência, o que manifestamente não é o caso; e segundo, que a novidade em si é de valor inqualificado. Qualquer um que tenha desperdiçado meia hora em alguns dos artigos submetidos especiosos, mesmo ridículos, submetidos – talvez – apenas para manter ‘cotas de publicação ou perecer’, sabe que a novidade é frequentemente trivial e o trabalho incremental é muitas vezes significativo.

Entender o valor de um novo artigo envolve uma área onde a IA é atualmente muito fraca – contexto de longo prazo. Porque de forma frequentemente desonestamente escrita, artigos que parecem romper o terreno podem muito frequentemente ser revelados como avanços menores sobre o trabalho existente; no entanto, sistemas automatizados terão que desenvolver uma ‘intuição’ para esses casos, sem sinalizar múltiplos falsos positivos e sem confiar na honestidade dos autores que submetem.

Mergulho Ético

Como eu observei anteriormente, portais como o Arxiv são bastante resistentes a laissez faire raspagem, e os dumps de dados que fornecem frequentemente carecem de detalhes granulares.

Portanto, mesmo que eu tivesse os recursos e o tempo para baixar e extrair recursos de uma seção transversal representativa de artigos de ciência da computação, muitas das tendências mais sutis não terão sido direcionadas ou analisadas.

Uma delas é a presença ou ausência de códiigos de declarações éticas; longa uma inclusão obrigatória para ciências biológicas que tocam em experimentação animal, 2024 viu o auge da tendência em direção à caracterização ética de um trabalho proposto, no final de artigos submetidos na categoria de Ciência da Computação.

Anecdoticamente, eu digo que essa prática caiu vertiginosamente em 2025. Minha suposição é que os esforços fervorosos de desregulação do governo atual dos EUA em relação ao desenvolvimento de IA deram à comunidade de pesquisa tanto nos EUA quanto no exterior uma certa licença aumentada e um sentido de proteção implícita contra exposição legal.

Não obstante seu apoio à regulamentação anti-deepfake, a administração atual dos EUA efetivamente restaurou grande parte da postura de ‘faroeste selvagem’ que caracterizou o período de 2021-23 – embora o contexto de pesquisa científica pura que o definiu tenha desde então evoluído para níveis fervorosos, mesmo históricos, de investimento.

Vídeos Gerados como ‘Lama de IA’

Com o lançamento da série de vídeos gerados Hunyuan e WAN no último inverno, o vídeo de IA foi completamente transformado em 2025. Antigos obstáculos, como a dificuldade de criar avatares de físico completo, ou de obter vistas de perfil convincentes de uma pessoa, foram varridos aparentemente da noite para o dia.

Os lançamentos generosos com pesos incluídos desse tipo, provenientes da China, argumenta-se, estabeleceram o ritmo para lançamentos de vídeo gerados este ano e são, pelo menos, uma pressão contrária à tendência de arquiteturas de vídeo de IA ocidentais serem muito mais censuradas, pré-comercializadas e prescritas.

A ausência de um fosso nessa cena ironicamente democrática liderada pela China fez com que centenas, se não milhares de empresas, buscassem explorar o mercado nascente para inferência, oferecendo portais de usuário amigáveis, com jogadores tão diversos quanto civit.ai e RunPod lucrando com procedimentos e tecnologias que, em muitos casos, poderiam ser executados em computadores domésticos.

Em geral, essas iniciativas são ganhos de curto prazo que esperam ser suplantados por uma eventual consolidação do mercado (embora, sem dúvida, seus fundadores não se importariam em acidentalmente tropeçar em uma participação de mercado dominante, se isso ocorrer).

Essa mesma mundanidade e replicação atingiu a linha de vídeo gerado nas submissões do Arxiv em 2025. Como eu observei na semana passada, a relação sinal-ruído para essa categoria atingiu um pico entorpecente, à medida que os pesquisadores competem publicamente pelo maciço financiamento potencial que as inovações deste ano liberaram.

Dito isso, a vasta maioria das submissões desse tipo são meros avanços incrementais, na melhor das hipóteses. Os problemas centrais restantes em IA geradora não surgiram muito este ano: a necessidade de manter a identidade, no estilo LoRA, em toda a representação de um personagem; a necessidade de tempos de execução mais longos para vídeos de saída, com consistência geral (i.e., de ambientes e temas, etc., não apenas ID) mantida; e para uma geração e manipulação de áudio aprimoradas dentro de arquiteturas de vídeo gerado e edição de vídeo; entre outros.

Febre de Malha Abate

Eu observei no ano passado que a cena estava experimentando um aumento notável em artigos que promovem sistemas que utilizam CGI tradicional (i.e., representações baseadas em malha do tipo que remonta aos anos 70), ou incorporam-na em frameworks neurais. Eu observei uma diminuição significativa de impulso em direção a soluções baseadas em malha, particularmente na segunda metade do ano, em 2025.

Muitas das soluções que incorporam CGI nessa onda anterior de artigos, especialmente aquelas que lidam com figuras de controle paramétrico humano, como modelos morfáveis 3D, podem ter sido suplantadas pelas novas capacidades de frameworks geradores difusos como Veo, Kling, Hunyuan e WAN, entre muitos outros.

Ao mesmo tempo, artigos que lidam com abordagens Gaussian Splat também aparentemente foram afetados por estagnação de desenvolvimento ou eclipsados por sistemas de IA geradora baseados em difusão de 2025; ou ambos.

Um ano atrás, eu notei que o entusiasmo inicial do GSplat, que fez uma impressão notável no final de 2023, havia se transformado em linhas de pesquisa mais estreitas. Este ano, eu vejo uma corrente de artigos destinados a abordar as demandas significativas de recursos dessa abordagem, entre outros problemas.

Embora eu caracterizaria o Gaussian Splatting como ‘atualmente estagnado’, devemos lembrar que essa tecnologia remonta aos primeiros anos de 1990 e é revenante por natureza.

Uma exceção a essa retirada geral de abordagens baseadas em malha é um aparente aumento de interesse em incorporar IA em frameworks destinados à impressão 3D.

Diminuição nas Submissões de Segurança de IA

Minha última observação para 2025 é que a categoria de submissões ‘Segurança’ na seção de Ciência da Computação no Arxiv evidenciou uma queda notável em frequência e qualidade em 2025, e não é fácil adivinhar por quê.

O arquivo de Criptografia e Segurança arguivelmente sempre foi um lugar de segunda classe para postar artigos, desde que essa linha de pesquisa é surpreendentemente dominada por propriedade intelectual privada – pouco disso surge em jornais acadêmicos, e quase nada é visto em plataformas gratuitas como o Arxiv.

Além disso, submissões para essa categoria no Arxiv têm um número maior do que a média de ‘armadilhas’ – admissões subestimadas, frequentemente enterradas em lugares inesperados, que negam ou diminuem o aparente valor e novidade do artigo. Um exemplo seria um método de violação de segurança aparentemente sensacional que na verdade depende de algum aspecto ‘caixa branca’ – i.e., acesso privilegiado a dados ou procedimentos, como um atacante não poderia segurar.

O que Esperar em 2026

Embora a mídia esteja tocando constantemente no boom da IA geradora como uma repetição do debacle da bolha pontocom do início dos anos 2000 (com alguma dissidência), isso na verdade parece representar uma espécie de falsa segurança. Em termos de infraestrutura, investimento, cultura e pesquisa, não houve um momento como este na história humana.

Portanto, é difícil ver para que lado a cena de pesquisa irá se inclinar em 2026, exceto que – como de costume – uma série de esforços de longo prazo culminará entre agora e abril, com uma certa ‘marca’ das obsessões e tendências de 2025 distinguindo-os.

Um desenvolvimento que pode ajudar a crise de volume de submissões no Arxiv e em outros portais é uma proibição ou verificação de artigos gerados/auxiliados por IA, como o Arxiv recentemente promulgou para artigos de revisão – no entanto, a extensão do envolvimento da IA em qualquer artigo pode provar ser difícil de quantificar, desde que a IA penetrou a cultura de pesquisa (e revisão por pares) tanto quanto em outros domínios – como uma gota de ‘tinta’ que afeta toda a (existente) água no vidro, em vez de radicalmente mudar o meio.

Publicado pela primeira vez na segunda-feira, 22 de dezembro de 2025

Related Topics:AI and deep research Automated Research