El ángulo de Anderson

Métodos de lavado de propiedad intelectual en IA

Publicado Marzo 16, 2026

Martin anderson

Imagen de la Dama de la Justicia generada por IA, rodeada de datos "lavados". GPT-1.5.

Si bien es posible que se produzca un ajuste de cuentas legal por el uso de la propiedad intelectual en el entrenamiento de la IA, también existen varios métodos para ocultar dicho uso.

Opinión La actual y acelerada revolución de la IA generativa se está desarrollando en el entorno legalmente más precario que haya acompañado a cualquier desarrollo tecnológico transformador. desde el siglo XIX.

Hasta hace 3 o 4 años, la comunidad de investigación en aprendizaje automático gozaba de un mandato tácito (a menudo explícito) para explotar material protegido por propiedad intelectual en el desarrollo de nuevos sistemas; dado que estos sistemas aún no habían tenido éxito, en términos de madurez o viabilidad comercial, los resultados eran, en todos los sentidos, académicos.

En ese período, el éxito repentino de una nueva generación de modelos de lenguaje a gran escala basados en la difusión (LLM, como ChatGPT y Claude) y modelos de visión-lenguaje (VLM, como Sora) indicaron que estas líneas de investigación abstractas y hasta entonces "inofensivas" se habían convertido en comercialmente viables y habían superado su "pase libre" en lo que respecta a la explotación de la propiedad intelectual de otras personas.

De ahora en adelante, los titulares de derechos buscarían una participación en los frutos de los sistemas de IA entrenados en gran medida o en parte con sus datos protegidos por derechos de autor o de otro modo protegidos, lo que llevaría a una avalancha continua de casos legales eso requiere algo de esfuerzo para siquiera poder llevar la cuenta.

Limitado únicamente a los casos presentados en EE. UU., surgen nuevos casos a un ritmo vertiginoso tanto en Estados Unidos como en otros países. Fuente: https://copyrightalliance.org/artificial-intelligence-copyright/court-cases/

Aunque aquí nos limitamos únicamente a los casos registrados en EE. UU., están surgiendo nuevos casos a un ritmo frenético tanto en Estados Unidos como en otros países. Fuente

Imponer un "almuerzo gratuito"

El compromiso financiero actualmente ocurriendo En lo que respecta a la infraestructura de servicio de IA, se ha planteado por algunas voces como un esfuerzo por arraigar la IA "riesgosa para los derechos de autor" tan profundamente en la sociedad económica que se vuelva no solo "demasiado grande para fracasar", sino también "demasiado poderosa para demandar", o al menos demasiado poderosa como para que se permita que las demandas exitosas desbaraten la revolución.

Hacia este sentimiento general, el actual presidente de los Estados Unidos es comprometerse con la política su punto de vista que "No se puede esperar que tengas un programa de IA exitoso cuando se supone que debes pagar por cada artículo, libro o cualquier otra cosa que hayas leído o estudiado"..

¿En serio? Nada remotamente similar o comparable ha ocurrido en la era industrial occidental, y esto representa un movimiento que choca severamente con la cultura tradicional estadounidense de litigios y reparaciones; quizás las posiciones más similares sean la expiración obligatoria de las patentes de medicamentos después de 20 años (en sí misma). frecuentemente bajo ataque), y la la limitación sobre las expectativas de privacidad en lugares públicos.

Sin embargo, los tiempos cambian; ante la ausencia de cualquier garantía de que la tendencia actual hacia la "expropiación forzosa" contra las protecciones de propiedad intelectual no flaquee o se revierta posteriormente, existen varios enfoques secundarios que se están convirtiendo en práctica habitual en el desarrollo de sistemas de IA y en el tratamiento de los datos de entrenamiento, muy controvertidos, que los alimentan.

Conjuntos de datos por proxy

Uno de estos enfoques adopta una estrategia notablemente similar a la defensa (no siempre exitosa) de los sitios de listado de torrents, que sostienen que en realidad no alojan ningún material controvertido, ni ningún material en absoluto.

Además de evitar la necesidad de almacenar y distribuir grandes cantidades de datos de imagen o vídeo mínimamente compresibles, este tipo de colecciones permiten una actualización rápida, como la eliminación de material a petición de los titulares de los derechos de autor, y la gestión de versiones.

Así como los torrents son solo indicadores de dónde se puede encontrar material protegido por IP, varios conjuntos de datos muy influyentes son en sí mismos solo listas tipo "puntero" de datos existentes; si el usuario final desea utilizar estas listas como una lista de descarga para su propio conjunto de datos, eso es responsabilidad suya, en lo que respecta a la responsabilidad de los curadores.

Entre ellos se encuentra Google Research. Conceptual 12M conjunto de datos, que proporciona subtítulos para las imágenes, pero solo apunta a ubicaciones en la web donde estas imágenes existen (o existían en el momento de la curación):

Dos ejemplos de la colección Conceptual 12M de Google Research. Fuente: https://github.com/google-research-datasets/conceptual-12m/blob/main/images/cc12m_1.jpg

Dos ejemplos de la recopilación de datos Conceptual 12M de Google Research. Fuente

Otro ejemplo destacado, y uno que ahora tiene un derecho válido a ser venerado en la historia de la IA, es el conjunto de datos LAION que facilitó el advenimiento del sistema generativo de difusión estable en 2022 – el primer marco de este tipo en ofrecer potentes imágenes generativas de código abierto a los usuarios finales, justo cuando los sistemas propietarios parecían destinados a establecer dichos servicios como un dominio comercial puramente cerrado:

Una de las muchas variantes del proyecto LAION, que presenta obras de arte modernas y protegidas por derechos de autor. Fuente

En muchos casos, los grandes tamaños de archivo de algunas de estas colecciones de "punteros" indican la inclusión de contenido de imágenes en un archivo descargable y alojado; sin embargo, los tamaños de descarga no triviales a menudo se deben al gran volumen de contenido de texto y, a veces, a la inclusión de incrustaciones extraídas o Características – Resúmenes derivados o nodos de contenido aplicable extraído de los datos fuente durante el proceso de entrenamiento.

El vídeo premium

Los conjuntos de datos de vídeo constituyen un argumento aún más sólido a favor del enfoque de "conjunto de datos por proxy" o de puntero, ya que el elevado volumen de datos de almacenamiento necesarios para agregar una cantidad significativa y útil de vídeos en una única colección descargable resulta prohibitivo, y se prefiere un método "distribuido".

Sin embargo, en ambos casos, pero particularmente con el video, las URL de origen descargables representan datos que necesitarán una atención significativa adicional antes de ser utilizados en los procesos de capacitación. Tanto las imágenes como los videos deberán ser redimensionados, o bien decisiones de cultivo hecho, con el fin de crear muestras que encajen en espacio disponible para la GPUIncluso los vídeos con una resolución muy reducida requerirán recortes a duraciones muy cortas, como de 3 a 5 segundos, normalmente.

Entre los conjuntos de datos de vídeo notables que utilizan referencias a vídeos en línea (en lugar de la curación y el empaquetado directo de vídeo) se incluye el de Google. Conjunto de datos de vídeo de acción humana de Kineticsy el gigante de búsquedas Colección de YouTube de 8 millones de copias, Que utiliza anotación de segmento para indicar cómo tratar cada vídeo una vez descargado, pero lo que, una vez más, deja al usuario final la tarea de obtener los vídeos desde las URL proporcionadas.

Cerrar y abrir

Finalmente, en esta categoría, los datos de efectos visuales «abiertos» pueden generarse con plataformas cerradas que posteriormente publican y ponen a disposición el conjunto de datos resultante. Cabe preguntarse por qué sucede esto y considerar si se debe a que la empresa de origen desea adaptar un modelo de producción anterior que no respeta la propiedad intelectual, para su propio uso; o bien a que se solicitó un conjunto de datos «previamente modificado» desde fuera.

Un ejemplo de este tipo de "lavado generacional" es, sin duda, el Conjunto de datos Omni-VFX, que incorpora muchos puntos de datos de la Conjunto de datos Open-VFX (que a su vez hace referencia a muchas plataformas cerradas y semicerradas, como Pika y PixVerse).

Para ser honestos, Omni-VFX ni siquiera lo está intentando realmente:

En el conjunto de datos de código abierto Omni-VFX, un rostro familiar. Fuente: https://huggingface.co/datasets/GD-ML/Omni-VFX/blob/main/Harley/pixverse%252Fmp4%252Fmedia%252Fweb%252F15e45744-64b1-4a41-84de-626225cf017b_seed734716767.mp4

En el conjunto de datos de código abierto Omni-VFX, aparece una cara conocida. Fuente

Responsabilidad ancestral

El segundo enfoque principal para el lavado de propiedad intelectual es a través del uso de material protegido por derechos de autor en uno o varios niveles. Uno de los métodos en esta categoría es el uso de datos sintéticos que ha sido entrenado, en algún punto anterior del proceso, con datos protegidos por derechos de autor. En tales casos, sobre todo cuando los datos sintéticos pueden obtener resultados de apariencia auténtica, el trabajo protegido por derechos de autor proporciona transformaciones que no podrían ser razonablemente adivinadas o aproximadas por modelos del mundo general o modelos no especializados.

Este es el caso, sin duda, cuando se requieren sistemas de vídeo generativos para generar eventos "imposibles" y eventos que generalmente se engloban en la categoría de "efectos visuales" (VFX).

De hecho, lo que me hizo pensar en este tema fue el último de una serie de artículos de investigación que ofrecen la capacidad de "abstraer" diversos tipos de efectos visuales, como producir rayos láser desde partes improbables del cuerpo, ya sea mediante el entrenamiento con clips de efectos visuales encargados a medida o de "código abierto" (en lugar de la fuente más obvia, como las tomas de efectos visuales muy costosas que se encuentran en la producción del universo cinematográfico de Marvel):

Ejemplos del sitio web de EffectMaker, donde la "acción" del clip de origen (extremo izquierdo) se aplica a una imagen de origen (centro). Fuente

Los ejemplos anteriores provienen de la página del proyecto para la Creador de efectos proyecto. EffectMaker ni siquiera es la primera oferta de este año que busca extraer la dinámica de los efectos visuales de un videoclip y transponerla a un nuevo clip, y de hecho esto se está convirtiendo en una subtarea discreta en la investigación de efectos visuales con IA*.

Conscientes de que gigantes mediáticos como Marvel tienen una probabilidad superior a la media de ganar litigios por propiedad intelectual (incluso en el mencionado clima de "tolerancia forzosa"), las empresas de efectos visuales y las startups están haciendo grandes esfuerzos para garantizar que sus marcos de efectos visuales generativos estén libres de la propiedad intelectual corporativa de otras empresas.

El principal de ellos es Meta, del que se ha informado en el subreddit r/vfx Se ha lanzado a una oleada de contrataciones bien remuneradas durante el invierno de 2026, ofreciendo a los artistas de efectos visuales trabajo entrenando modelos de IA para producir tomas de efectos visuales de nivel hollywoodiense. Aunque el salario no se especificó en varios puestos, uno Lo describió como "dinero para la jubilación"..

Seguir el Dinero

Sin embargo, uno tiene que preguntarse cuánto dinero están dispuestos a pagar incluso empresas como Meta por una verdadera diversidad y abundancia de ad hoc Tomas de efectos visuales, dado que la toma promedio de efectos visuales para una película taquillera son alrededor de 42,000 dólares estadounidenses. – y muchos llegan a niveles mucho más altos.

Además, es lógico pensar que los modelos de IA personalizados para generar efectos visuales responderán a la demanda popular, incluyendo diversos efectos estándar de las categorías de películas más populares y costosas.

Aparte del punto de vista de que los profesionales de efectos visuales "residuales" podrían terminar recreando tomas en las que trabajaron para un catálogo de películas existente.^† – lo cual, en sí mismo, contextualiza el trabajo con conjuntos de datos "personalizados" como imitativo – en cualquier caso, no hay garantía de que estas costosas muestras nuevas terminen entrenadas "desde cero" en una arquitectura completamente nueva.

De hecho, si tales recreaciones se desvían a módulos adjuntos como LoRA, que se basan en un modelo base, entonces el proceso es tan defendible como el modelo base esté "libre de propiedad intelectual" y no muchos lo están.

De manera similar, si el "nuevo" proceso utiliza otras técnicas "híbridas" como sintonia FINAdonde el valor del efecto visual depende de los modelos, anterioresSi se trata de elementos incorporados de colecciones más antiguas o modelos de integridad no comprobada, la originalidad de la obra es, sin duda, superficial y susceptible de ser cuestionada.

Misiones imposibles

El ámbito de la producción de efectos visuales es un caso de estudio particularmente interesante en lo que respecta al posible lavado de propiedad intelectual en conjuntos de datos de IA, ya que las tomas de efectos visuales a menudo representan cosas "imposibles" para las que habrá No hay alternativas de código abierto disponibles..

Por ejemplo, si bien la demolición de un edificio podría entrenarse en un modelo generativo a partir de diversos clips de archivo de dominio público o asequibles, si se quiere entrenar un modelo para producir rayos láser humanos, será necesario entrenarlo con clips de efectos visuales, robados o encargados; ese tipo de cosas no suceden en ningún otro lugar.

Incluso en el caso de otros tipos de desastres naturales, como inundaciones dramáticas, es poco probable que el material fuente del mundo real disponible pueda reproducir puntos de vista dramáticos sobre eventos calamitosos, porque (con algunas excepcionesLa gente no suele transmitir en directo desde lugares donde ocurren catástrofes. Por lo tanto, las "vistas impactantes" de desastres son raras en los conjuntos de datos del mundo real, y cualquier modelo de IA que pueda generarlas probablemente obtuvo la información de otra fuente.

La mayoría de los flujos de trabajo de IA deseables no tienen este nivel de especificidad tan revelador, y en tales casos, ocultar los beneficios de los datos protegidos por propiedad intelectual podría no requerir tanto esfuerzo.

Conclusión: Red enredada

Solo aquellos que hayan utilizado la IA generativa de forma extensiva y durante un período prolongado comprenderán instintivamente que dichos sistemas tienen dificultades para combinar múltiples conceptos cuando no existen ejemplos comparables en sus datos de entrenamiento.

Esta limitación se conoce como enredo, en el que las diversas facetas de los conceptos aprendidos tienden a agruparse con elementos relacionados, en lugar de descomponerse en prácticos bloques de construcción al estilo Lego que se pueden organizar en cualquier configuración nueva que el usuario desee.

El entrelazamiento es un pozo gravitatorio arquitectónico del que es prácticamente imposible escapar, al menos para los enfoques basados en la difusión que caracterizan a todos los principales marcos de trabajo de IA genómica actuales. Sin embargo, es posible que en los próximos años surjan nuevos enfoques que discreticen mejor los conceptos entrenados para que puedan integrarse con mayor destreza y ofrezcan menos indicios sobre su origen.

* No pretendo acusar a EffectMaker, sino que comento aquí la generalidad de una práctica emergente en la investigación de vídeo con IA.

^†Porque estas tomas, en este tipo de películas, han generado y siguen generando dinero.

Publicado por primera vez el lunes 16 de marzo de 2026

Martin anderson

Escritor sobre aprendizaje automático, especialista en síntesis de imágenes humanas. Exdirector de contenido de investigación en Metaphysic.ai.
sitio personal: martinanderson.ai
Contacto: [email protected]
Gorjeo: @manders_ai