Entre em contato

Métodos de lavagem de propriedade intelectual em IA

Ângulo de Anderson

Métodos de lavagem de propriedade intelectual em IA

mm
Imagem da Dama da Justiça gerada por IA, rodeada por dados "lavados". GPT-1.5.

Se houver algum acerto de contas legal sobre o uso da propriedade intelectual no treinamento de IA, também existem vários métodos para ocultar esse uso.

 

Opinião A atual revolução em IA generativa, que avança rapidamente, está se desenrolando no ambiente juridicamente mais precário que já acompanhou qualquer desenvolvimento tecnológico transformador. desde o século XIX.

Até 3 ou 4 anos atrás, a comunidade de pesquisa em aprendizado de máquina tinha uma autorização tácita (muitas vezes explícita) para explorar material protegido por propriedade intelectual no desenvolvimento de novos sistemas; como esses sistemas ainda não eram bem-sucedidos, em termos de maturidade ou viabilidade comercial, os resultados eram, em todos os sentidos, acadêmicos.

Nesse período, houve o sucesso repentino de uma nova geração de Modelos de Linguagem de Grande Porte baseados em difusão (LLMs, como ChatGPT e Claude) e modelos de visão-linguagem (VLM, como Sora) sinalizou que essas linhas de pesquisa abstratas e até então 'inofensivas' haviam se desenvolvido em viabilidade comercial e deixado de ter 'carta branca', no que diz respeito à exploração da propriedade intelectual de outras pessoas.

A partir de agora, os detentores de direitos buscarão uma participação nos frutos dos sistemas de IA treinados em grande parte ou totalmente com seus dados protegidos por direitos autorais ou de outra forma, levando a uma avalanche contínua de processos judiciais isso requere algum esforço até mesmo para acompanhar.

Limitado apenas a casos apresentados nos EUA, novos casos surgem em ritmo frenético nos Estados Unidos e em outros países. Fonte - https://copyrightalliance.org/artificial-intelligence-copyright/court-cases/

Embora este estudo se limite apenas a casos apresentados nos EUA, novos casos surgem em ritmo frenético nos Estados Unidos e em outros países. fonte

Impor um 'almoço grátis'

O compromisso financeiro ocorrendo atualmente Em relação à infraestrutura de suporte à IA, tem sido postulado por algumas vozes como um esforço para consolidar a IA "problemática em termos de direitos autorais" tão profundamente na sociedade econômica que ela se torne não apenas "grande demais para falir", mas também "poderosa demais para ser processada" – ou poderosa demais, pelo menos, para que processos judiciais bem-sucedidos possam interromper a revolução.

Nesse sentido geral, o atual presidente dos Estados Unidos é comprometer-se com a política sua visão que. 'Não se pode esperar que um programa de IA seja bem-sucedido quando cada artigo, livro ou qualquer outra coisa que você tenha lido ou estudado é pago.'.

Sério? Nada remotamente semelhante ou comparável ocorreu na era industrial ocidental, e isso representa um movimento que se opõe fortemente à cultura tradicional americana de litígios e indenizações; talvez as posições mais próximas sejam a expiração obrigatória de patentes de medicamentos após 20 anos (em si). frequentemente sob ataque), e as limitação sobre as expectativas de privacidade em locais públicos.

No entanto, os tempos mudam; na ausência de qualquer garantia de que a atual tendência de "desapropriação por utilidade pública" contra proteções de propriedade intelectual não irá vacilar, ou mesmo ser revertida posteriormente, existem diversas abordagens secundárias que estão se tornando prática padrão no desenvolvimento de sistemas de IA e no tratamento dos dados de treinamento, tão contestados, que os alimentam.

Conjuntos de dados por proxy

Uma dessas abordagens adota uma estratégia notavelmente semelhante à defesa (nem sempre bem-sucedida) dos sites de listagem de torrents de que, na verdade, não hospedam nenhum material contestado – ou material algum.

Além de eliminar a necessidade de armazenar e disponibilizar grandes quantidades de dados de imagem ou vídeo com baixa compressibilidade, coleções desse tipo permitem atualizações rápidas – como a remoção de material a pedido dos detentores de direitos autorais – e o controle de versões.

Assim como os torrents são apenas indicadores de onde o material protegido por direitos autorais pode ser encontrado, diversos conjuntos de dados altamente influentes são, em si, apenas listas de dados existentes, no estilo "ponteiro"; se o usuário final desejar usar essas listas como uma lista de downloads para seu próprio conjunto de dados, a responsabilidade é dele, no que diz respeito à responsabilidade dos curadores.

Entre elas está a do Google Research. Conceitual 12M conjunto de dados, que fornece legendas para imagens, mas apenas aponta para locais na web onde essas imagens existem (ou existiam no momento da curadoria):

Dois exemplos da coleção Conceptual 12M do Google Research. Fonte: https://github.com/google-research-datasets/conceptual-12m/blob/main/images/cc12m_1.jpg

Dois exemplos da curadoria Conceptual 12M do Google Research. fonte

Outro exemplo proeminente, e que agora possui um direito legítimo de ser reverenciado na história da IA, é o Conjunto de dados LAION que facilitou o advento do sistema generativo de Difusão Estável em 2022 – a primeira estrutura desse tipo a oferecer imagens generativas de código aberto poderosas para usuários finais, justamente quando os sistemas proprietários pareciam destinados a estabelecer tais serviços como um domínio puramente comercial e isolado:

Uma das muitas variantes do projeto LAION, apresentando obras de arte modernas e protegidas por direitos autorais. Fonte - https://huggingface.co/datasets/laion/relaion-pop/viewer/default/train

Uma das muitas variantes do projeto LAION, apresentando obras de arte modernas e protegidas por direitos autorais. fonte

Em muitos casos, o tamanho elevado dos arquivos de algumas dessas coleções de "ponteiros" indica a inclusão de conteúdo de imagem em um arquivo hospedado e disponível para download; no entanto, os tamanhos de download consideráveis ​​geralmente se devem ao grande volume de conteúdo textual e, às vezes, à inclusão de elementos incorporados extraídos ou características – resumos ou nós derivados de conteúdo aplicável extraído dos dados de origem durante o processo de treinamento.

O Vídeo Premium

Os conjuntos de dados de vídeo representam um caso ainda mais forte para a abordagem de "conjunto de dados por proxy" ou ponteiro, uma vez que o grande volume de dados de armazenamento necessário para agregar um número significativo e útil de vídeos em uma única coleção para download é proibitivo, e um método "distribuído" é desejável.

No entanto, em ambos os casos – mas particularmente com vídeo – os URLs de origem para download representam dados que precisarão de atenção significativa antes de serem usados ​​em processos de treinamento. Tanto as imagens quanto os vídeos precisarão ser redimensionados, ou então decisões de corte feitos, a fim de criar amostras que se encaixem em espaço disponível na GPUMesmo vídeos com resolução bastante reduzida precisarão ser cortados para durações muito curtas, como 3 a 5 segundos, normalmente.

Conjuntos de dados de vídeo notáveis ​​que usam referências a vídeos online (em vez da curadoria e empacotamento direto de vídeos) incluem os do Google. Conjunto de dados de vídeo de ação humana da Kineticse a gigante das buscas Coleção YouTube-8M, Que usa anotação de segmento Indicar como proceder com cada vídeo após o download – o que, mais uma vez, deixa ao usuário final a responsabilidade de obter os vídeos a partir dos URLs fornecidos.

Fechar e Abrir

Por fim, nesta categoria, dados de efeitos visuais "abertos" podem ser gerados com plataformas fechadas que, posteriormente, publicam e disponibilizam o conjunto de dados resultante. É razoável questionar por que isso acontece e considerar se pode ser porque a empresa de origem deseja higienizar um modelo upstream incompatível com a propriedade intelectual para seu próprio uso; ou se um conjunto "lavado" foi solicitado externamente.

Um exemplo disso é, sem dúvida, o caso da "lavagem geracional" Conjunto de dados Omni-VFX, que incorpora muitos pontos de dados do Conjunto de dados Open-VFX (que por si só faz referência a muitas plataformas fechadas e semiabertas, como Pika e PixVerse).

Sinceramente, a Omni-VFX nem está se esforçando de verdade:

No conjunto de dados de código aberto Omni-VFX, um rosto familiar. Fonte - https://huggingface.co/datasets/GD-ML/Omni-VFX/blob/main/Harley/pixverse%252Fmp4%252Fmedia%252Fweb%252F15e45744-64b1-4a41-84de-626225cf017b_seed734716767.mp4

No conjunto de dados de código aberto Omni-VFX, um rosto familiar. fonte

Responsabilidade ancestral

A segunda abordagem principal para a lavagem de propriedade intelectual (IP-washing) é o uso de material protegido por direitos autorais em um ou vários níveis de transparência. Um dos métodos nessa categoria é o uso de dados sintéticos que foi treinado, em algum ponto anterior, com dados protegidos por direitos autorais. Nesses casos, principalmente quando dados sintéticos conseguem obter resultados com aparência autêntica, o trabalho protegido por direitos autorais fornece transformações que não poderiam ser razoavelmente previstas ou aproximadas por modelos gerais ou modelos não especializados.

Este é o caso, sobretudo, quando os sistemas de vídeo generativo são necessários para gerar eventos 'impossíveis', ou seja, eventos que geralmente se enquadram na categoria de 'efeitos visuais' (VFX).

Na verdade, o que me fez pensar nesse assunto foi o mais recente de uma série de artigos de pesquisa que oferecem a capacidade de "abstrair" diversos tipos de efeitos visuais, como produzir raios laser a partir de partes improváveis ​​do corpo, seja por meio de treinamento com clipes de efeitos visuais personalizados ou de "código aberto" (em vez da fonte mais óbvia, como as cenas de efeitos visuais caríssimas encontradas nas produções do universo cinematográfico da Marvel):

Exemplos do site EffectMaker, onde a 'ação' no clipe de origem (extrema esquerda) é aplicada a uma imagem de origem (centro). fonte

Os exemplos acima provêm de página do projeto para o Criador de Efeitos O EffectMaker nem sequer é a primeira solução deste ano que procura extrair a dinâmica de efeitos visuais de um videoclipe e transpô-la para um novo clipe; na verdade, isso está se tornando uma subtarefa específica na pesquisa de IA para efeitos visuais*.

Cientes de que gigantes da mídia como a Marvel têm uma probabilidade acima da média de vencer processos judiciais relacionados à propriedade intelectual (mesmo no já mencionado clima de "tolerância imposta"), empresas de efeitos visuais e startups estão se esforçando consideravelmente para garantir que suas estruturas de efeitos visuais generativos estejam livres de propriedade intelectual corporativa de outras empresas.

O principal deles é o Meta, que foi relatado no subreddit r/vfx para ter iniciado uma onda de contratações bem remuneradas para o inverno de 2026, oferecendo a artistas de efeitos visuais trabalho no treinamento de modelos de IA para produzir efeitos visuais de nível hollywoodiano. Embora o salário não tenha sido especificado para as diversas vagas, uma delas descreveu-o como 'dinheiro para a aposentadoria'.

Siga o Dinheiro

No entanto, é preciso questionar quanto dinheiro até mesmo empresas como a Meta estão dispostas a pagar por uma verdadeira diversidade e abundância de ad hoc efeitos visuais, considerando que a média de um único efeito visual em um filme de grande sucesso é de um filme. custa cerca de US$ 42,000 – e muitos chegam a valores muito mais altos.

Além disso, é lógico supor que modelos de IA personalizados para geração de efeitos visuais atenderão à demanda popular, incluindo vários recursos de efeitos padrão das categorias de filmes mais populares e caras.

Além da questão de que profissionais de efeitos visuais "remanescentes" poderiam acabar recriando cenas em que trabalharam para um catálogo de filmes já existente. – o que por si só contextualiza o trabalho com o conjunto de dados 'personalizado' como imitativo – em qualquer caso, não há garantia de que essas novas amostras dispendiosas acabarão sendo treinadas 'do zero' em uma arquitetura totalmente nova.

De fato, se tais atividades recreativas forem desviadas para módulos complementares como LoRAs, que dependem de um modelo base, então o processo só é defensável na medida em que o modelo base seja "livre de propriedade intelectual" – e poucos são.

Da mesma forma, se o 'novo' processo utilizar outras técnicas 'híbridas', como afinação, onde o valor do efeito visual depende dos modelos, priores, ou incorporações de coleções mais antigas ou modelos de integridade não comprovada, a originalidade da obra é indiscutivelmente cosmética e sujeita a contestações.

Missões Impossíveis

O domínio da produção de efeitos visuais (VFX) é um estudo de caso particularmente interessante no que diz respeito ao potencial de apropriação indevida de propriedade intelectual (IP-washing) em conjuntos de dados de inteligência artificial (IA), uma vez que as cenas com efeitos visuais frequentemente retratam coisas "impossíveis" para as quais haverá Não há alternativas de código aberto disponíveis..

Por exemplo, enquanto a demolição de um prédio poderia ser treinada em um modelo generativo a partir de vários clipes de domínio público ou de bancos de imagens acessíveis, se você quiser treinar um modelo para produzir raios laser em forma humana, precisará treiná-lo com clipes de efeitos visuais, roubados ou encomendados; coisas assim não acontecem em nenhum outro lugar.

Mesmo no caso de outros tipos de desastres naturais, como inundações dramáticas, é improvável que o material de origem disponível do mundo real consiga reproduzir pontos de vista dramáticos sobre eventos calamitosos, porque (com algumas exceçõesAs pessoas geralmente não fazem transmissões ao vivo de locais catastróficos. Portanto, "visões interessantes" de desastres são raras em conjuntos de dados do mundo real, e qualquer modelo de IA capaz de gerá-las provavelmente obteve as informações de outra fonte.

A maioria dos fluxos de tarefas de IA desejáveis ​​não possui esse nível revelador de especificidade e, nesses casos, a ocultação dos benefícios dos dados protegidos por propriedade intelectual pode não exigir tanto esforço.

Conclusão: Teia emaranhada

Somente aqueles que utilizaram IA generativa de forma extensiva e prolongada compreenderão instintivamente que tais sistemas têm dificuldade em combinar múltiplos conceitos quando não existem exemplos comparáveis ​​em seus dados de treinamento.

Essa limitação é conhecida como emaranhamento, em que as várias facetas dos conceitos aprendidos tendem a se agrupar com elementos relacionados, em vez de se decompor em peças de construção práticas, no estilo Lego, que podem ser organizadas em qualquer nova configuração que o usuário desejar.

O entrelaçamento é um poço gravitacional arquitetônico do qual é praticamente impossível escapar, pelo menos para as abordagens baseadas em difusão que caracterizam todas as principais estruturas de IA genIA atuais. No entanto, é possível que novas abordagens surjam nos próximos anos, mais eficientes na discretização de conceitos treinados, permitindo que sejam combinados de forma mais habilidosa e oferecendo menos indícios de sua origem.

 

* Não faço acusações contra a EffectMaker, mas comento aqui sobre a generalidade de uma prática emergente na pesquisa de vídeo com IA.

Porque essas cenas, nesse tipo de filme, geraram e continuam gerando dinheiro.

Primeira publicação segunda-feira, 16 de março de 2026

Escritor sobre machine learning, especialista em domínio em síntese de imagem humana. Ex-chefe de conteúdo de pesquisa na Metaphysic.ai.
Site pessoal: martinanderson.ai
Contato: [email protected]
Twitter: @manders_ai