A Perspectiva de Anderson – Página 8

Exemplos da página do projeto DreamActor.

4 de abril de 2025

Um avanço notável em vídeo de IA conduzida por humanos

Nota: A página do projeto para este trabalho inclui 33 vídeos de alta resolução de reprodução automática totalizando meio gigabyte, o que desestabilizou meu sistema na carga. Por esse motivo, eu...

Montagem de ilustrações do artigo 'Detectando manipulações localizadas de deepfake usando representações de vídeo guiadas por unidades de ação' (https://arxiv.org/pdf/2503.22121)

2 de abril de 2025

By Martin Anderson

Expondo pequenas, mas significativas edições de IA em vídeo real

Em 2019, a presidente da Câmara dos Representantes dos EUA, Nancy Pelosi, foi alvo de um ataque direcionado e de baixa tecnologia no estilo deepfake, quando um vídeo real dela foi...

Imagem de um robô com pipoca em um cinema, ChatGPt-4+ e Adobe Firefly.

1 de abril de 2025

By Martin Anderson

Ensinando IA para dar melhores críticas de vídeo

Embora os Modelos de Visão-Linguagem de Grande Porte (LVLMs) possam ser ferramentas úteis na interpretação de algumas das questões mais complexas ou desafiadoras na literatura de visão computacional, há uma área...

ChatGPT-4o, Adobe Firefly: canto inferior direito, imagens do artigo FullDiT: Multi-Task Video Generative Foundation Model with Full Attention (https://arxiv.org/pdf/2503.19907)

27 de março de 2025

By Martin Anderson

Rumo ao controle total na geração de vídeos de IA

Modelos de base de vídeo como Hunyuan e Wan 2.1, embora poderosos, não oferecem aos usuários o tipo de controle granular que a produção de filmes e TV (particularmente...

Uma seleção de imagens do conjunto de dados WHOOPS! (https://huggingface.co/datasets/nlphuji/whoops), atrás das imagens centrais do artigo 'Não lute contra alucinações, use-as: estimando o realismo de imagem usando NLI em vez de fatos atômicos' (https://arxiv.org/pdf/2503.15948).

25 de março de 2025

By Martin Anderson

Usando alucinações de IA para avaliar o realismo da imagem

Uma nova pesquisa da Rússia propõe um método não convencional para detectar imagens irrealistas geradas por IA – não melhorando a precisão de grandes modelos de visão e linguagem (LVLMs), mas...

Timothy Chalomet substitui Jack Nicholson em The Shining (1980), graças ao novo sistema HyperLoRA. Fonte: https://arxiv.org/pdf/2503.16944

24 de março de 2025

By Martin Anderson

A luta pela personalização de tiro zero na IA generativa

Se você quer se inserir em uma ferramenta popular de geração de imagens ou vídeos, mas ainda não é famoso o suficiente para usar o modelo de base...

Adobe Firefly, vários prompts e edições.

21 de março de 2025

By Martin Anderson

Melhor vídeo de IA generativa ao embaralhar quadros durante o treinamento

Um novo artigo publicado esta semana na Arxiv aborda uma questão que qualquer pessoa que tenha adotado os geradores de vídeo Hunyuan Video ou Wan 2.1 AI...

Trilhas em uma cena de basquete - fonte: https://www.youtube.com/watch?v=ORfjgE6n2Pc

19 de março de 2025

By Martin Anderson

O desafio de legendar vídeos a mais de 1 fps

A capacidade dos sistemas de aprendizado de máquina de reconhecer os eventos que ocorrem dentro de um vídeo é crucial para o futuro da geração de vídeo baseada em IA – não...

Imagem do ChatGPT/Firefly mostrando um jet-skier deixando um rastro impossível na sua frente.

13 de março de 2025

By Martin Anderson

Por que o vídeo de IA às vezes fica ao contrário

Se 2022 foi o ano em que a IA generativa conquistou a imaginação do público em geral, 2025 será o ano em que a nova geração de frameworks de vídeo generativo surgirá...

Imagens do artigo 'VideoPainter: Repintura e edição de vídeos de qualquer duração com controle de contexto plug-and-play'.

10 de março de 2025

By Martin Anderson

O caminho para uma melhor edição de vídeo baseada em IA

O setor de pesquisa de síntese de vídeo/imagem produz regularmente arquiteturas de edição de vídeo* e, nos últimos nove meses, saídas dessa natureza se tornaram ainda mais frequentes. Dito isso,...

7 de março de 2025

By Martin Anderson

Quase 80% dos conjuntos de dados de treinamento podem ser um risco legal para a IA empresarial

Um estudo recente da LG AI Research sugere que conjuntos de dados supostamente "abertos" usados para treinar modelos de IA podem estar oferecendo uma falsa sensação de segurança –...

Exemplos do artigo 'VideoUFO: Um conjunto de dados focado no usuário em escala de um milhão para geração de texto para vídeo'

5 de março de 2025

By Martin Anderson

Repensando o treinamento de IA em vídeo com dados focados no usuário

O tipo de conteúdo que os usuários podem querer criar usando um modelo generativo como Flux ou Hunyuan Video pode não ser sempre fácil...

Imagens do artigo ' Tight Inversion: Inversão condicionada por imagem para edição de imagem real'

28 de fevereiro de 2025

By Martin Anderson

Melhorando a precisão da edição de imagens de IA

Embora o modelo de difusão latente (LDM) Firefly da Adobe seja indiscutivelmente um dos melhores disponíveis atualmente, os usuários do Photoshop que experimentaram seus recursos generativos certamente notaram...

ChatGPT-4o: 'Visão ortográfica 1792x1024 de um policial semelhante a um SIM levantando a mão para um cidadão para impedi-lo de prosseguir'

27 de fevereiro de 2025

By Martin Anderson

Avisos de proteção contra vazamentos de dados do LLM

Opinião Uma interessante submissão do IBM NeurIPS 2024 do final de 2024 ressurgiu no Arxiv na semana passada. Ela propõe um sistema que pode intervir automaticamente para proteger os usuários...

ChatGPT-4o: ' Imagem de 1792x1024px de uma vista frontal de um tribunal superior britânico composto por três robôs com perucas judiciais. Todos eles estão examinando uma fotografia 8x10, mas não podemos ver o que é a fotografia, porque suas costas estão voltadas para nós. HQ, foto cinematográfica'

24 de fevereiro de 2025

By Martin Anderson

Automatizando a proteção de direitos autorais em imagens geradas por IA

Conforme discutido na semana passada, até mesmo os principais modelos de base por trás dos sistemas populares de IA generativa podem produzir conteúdo que infringe direitos autorais, devido à curadoria inadequada ou desalinhada...

Unir-se.AI

Ângulo de Anderson

Um avanço notável em vídeo de IA conduzida por humanos

Expondo pequenas, mas significativas edições de IA em vídeo real

Ensinando IA para dar melhores críticas de vídeo

Rumo ao controle total na geração de vídeos de IA

Usando alucinações de IA para avaliar o realismo da imagem

A luta pela personalização de tiro zero na IA generativa

Melhor vídeo de IA generativa ao embaralhar quadros durante o treinamento

O desafio de legendar vídeos a mais de 1 fps

Por que o vídeo de IA às vezes fica ao contrário

O caminho para uma melhor edição de vídeo baseada em IA

Quase 80% dos conjuntos de dados de treinamento podem ser um risco legal para a IA empresarial

Repensando o treinamento de IA em vídeo com dados focados no usuário

Melhorando a precisão da edição de imagens de IA

Avisos de proteção contra vazamentos de dados do LLM

Automatizando a proteção de direitos autorais em imagens geradas por IA