Nota: A página do projeto para este trabalho inclui 33 vídeos de alta resolução de reprodução automática totalizando meio gigabyte, o que desestabilizou meu sistema na carga. Por esse motivo, eu...
Em 2019, a presidente da Câmara dos Representantes dos EUA, Nancy Pelosi, foi alvo de um ataque direcionado e de baixa tecnologia no estilo deepfake, quando um vídeo real dela foi...
Embora os Modelos de Visão-Linguagem de Grande Porte (LVLMs) possam ser ferramentas úteis na interpretação de algumas das questões mais complexas ou desafiadoras na literatura de visão computacional, há uma área...
Modelos de base de vídeo como Hunyuan e Wan 2.1, embora poderosos, não oferecem aos usuários o tipo de controle granular que a produção de filmes e TV (particularmente...
Uma nova pesquisa da Rússia propõe um método não convencional para detectar imagens irrealistas geradas por IA – não melhorando a precisão de grandes modelos de visão e linguagem (LVLMs), mas...
Se você quer se inserir em uma ferramenta popular de geração de imagens ou vídeos, mas ainda não é famoso o suficiente para usar o modelo de base...
Um novo artigo publicado esta semana na Arxiv aborda uma questão que qualquer pessoa que tenha adotado os geradores de vídeo Hunyuan Video ou Wan 2.1 AI...
A capacidade dos sistemas de aprendizado de máquina de reconhecer os eventos que ocorrem dentro de um vídeo é crucial para o futuro da geração de vídeo baseada em IA – não...
Se 2022 foi o ano em que a IA generativa conquistou a imaginação do público em geral, 2025 será o ano em que a nova geração de frameworks de vídeo generativo surgirá...
O setor de pesquisa de síntese de vídeo/imagem produz regularmente arquiteturas de edição de vídeo* e, nos últimos nove meses, saídas dessa natureza se tornaram ainda mais frequentes. Dito isso,...
Um estudo recente da LG AI Research sugere que conjuntos de dados supostamente "abertos" usados para treinar modelos de IA podem estar oferecendo uma falsa sensação de segurança –...
O tipo de conteúdo que os usuários podem querer criar usando um modelo generativo como Flux ou Hunyuan Video pode não ser sempre fácil...
Embora o modelo de difusão latente (LDM) Firefly da Adobe seja indiscutivelmente um dos melhores disponíveis atualmente, os usuários do Photoshop que experimentaram seus recursos generativos certamente notaram...
Opinião Uma interessante submissão do IBM NeurIPS 2024 do final de 2024 ressurgiu no Arxiv na semana passada. Ela propõe um sistema que pode intervir automaticamente para proteger os usuários...
Conforme discutido na semana passada, até mesmo os principais modelos de base por trás dos sistemas populares de IA generativa podem produzir conteúdo que infringe direitos autorais, devido à curadoria inadequada ou desalinhada...