Unghiul lui Anderson

Metode de spălare a IP-urilor în IA

mm
An AI-generated image of Lady Justice surrounded by 'laundered' data. GPT-1.5.

Dacă există o reglementare legală care urmează să aibă loc cu privire la utilizarea proprietății intelectuale în antrenarea IA, există și mai multe metode de a ascunde astfel de utilizări.

 

Opinie Revolutionarea actuală, în plină desfășurare, a inteligenței artificiale generative se desfășoară în cel mai precar mediu legal care a însoțit orice dezvoltare tehnologică transformațională de la începutul secolului al XIX-lea.

Până acum 3-4 ani, comunitatea de cercetare a învățării automate a avut un mandat tacit (adesea explicit) de a exploata materialul protejat de drepturi de autor în cursul dezvoltării de noi sisteme; deoarece aceste sisteme nu erau încă mature sau viabile comercial, rezultatele erau, în orice sens, academice.

În acea perioadă, succesul brusc al unei noi generații de modele de limbă mare bazate pe difuzie (LLM, cum ar fi ChatGPT și Claude) și modele de limbă și viziune (VLM, cum ar fi Sora) a semnalat că aceste fire abstracte și până atunci “inofensive” de cercetare s-au transformat în viabilitate comercială și au depășit “trecerea gratuită”, în ceea ce privește exploatarea proprietății intelectuale a altor persoane.

De acum înainte, deținătorii de drepturi vor căuta o cotă-parte din roadele sistemelor de IA antrenate în mare măsură sau în parte pe datele lor protejate prin drepturi de autor, ceea ce a dus la o avalanșă în curs de desfășurare a cazurilor legale care necesită un anumit efort pentru a ține pasul.

Limitat doar la cauzele intentate în SUA, noile cauze apar la un ritm frenetic în Statele Unite și în afara lor. Sursă - https://copyrightalliance.org/artificial-intelligence-copyright/court-cases/

Aici, limitat doar la cauzele intentate în SUA, noile cauze apar la un ritm frenetic în Statele Unite și în afara lor. Sursă

Impunerea unui “prânz gratuit”

Angajamentul financiar care are loc în prezent în ceea ce privește infrastructura care deservește IA a fost considerat de unii ca o încercare de a înrădăcina IA “periculoasă din punct de vedere al drepturilor de autor” atât de adânc în economia societății, încât să devină nu numai “prea mare pentru a eșua”, ci și “prea puternică pentru a fi dată în judecată” – sau cel puțin atât de puternică, încât procesele de succes să nu poată fi lăsate să submineze revoluția.

Spre acest sentiment general, președintele actual al Statelor Unite își însușește în politica sa punctul de vedere‘Nu puteți fi așteptați să aveți un program de succes de IA atunci când fiecare articol, carte sau orice altceva pe care l-ați citit sau studiat, trebuie să plătiți pentru el’.

Chiar așa? Nimic nu s-a întâmplat vreodată în era industrială occidentală, și aceasta reprezintă o mișcare care se opune puternic culturii tradiționale americane de litigiu și reparație; poate că pozițiile similare sunt expirarea obligatorie a brevetelor de medicamente după 20 de ani (care este în sine frecvent atacat), și limitarea așteptărilor de confidențialitate în locuri publice.

Cu toate acestea, timpurile se schimbă; în absența oricărei garanții că tendința actuală de “domeniu eminent” împotriva protecțiilor IP nu va eșua sau nu va fi inversată mai târziu, există mai multe abordări secundare care devin practică standard în dezvoltarea sistemelor de IA și a datelor de antrenament controversate care le alimentează.

Datele prin proxy

Una dintre aceste abordări adoptă o abordare remarcabil de similară cu apărarea (nu întotdeauna de succes) a site-urilor de listare a torrent-urilor, care afirmă că nu găzduiesc niciun material contestat – sau niciun material deloc.

Pe lângă faptul că elimină nevoia de a stoca și de a furniza cantități mari de date de imagine sau video minim comprimabile, colecțiile de acest fel permit actualizări rapide – cum ar fi înlăturarea materialului la cererea deținătorilor de drepturi de autor – și versionare.

La fel cum torrent-urile sunt doar indicatori către locurile unde pot fi găsite materiale protejate de drepturi de autor, o serie de seturi de date foarte influente sunt în sine doar liste “pointer” de date existente; dacă utilizatorul final dorește să utilizeze aceste liste ca listă de descărcare pentru propriul set de date, aceasta este problema lui, în ceea ce privește răspunderea curatorilor.

Printre acestea se numără setul de date Conceptual 12M al Google Research, care oferă subtitrări pentru imagini, dar indică doar locuri pe web unde aceste imagini există (sau existau la momentul curatoririi):

Două exemple din curation-ul Conceptual 12M al Google Research. Sursă - https://github.com/google-research-datasets/conceptual-12m/blob/main/images/cc12m_1.jpg

Două exemple din curation-ul Conceptual 12M al Google Research. Sursă

Un alt exemplu proeminent, și unul care are acum o revendicare valabilă la reverență în istoria IA, este setul de date LAION care a facilitat apariția sistemului generativ de difuzie stabilă în 2022 – primul astfel de cadru care a oferit imagini generative puternice și deschise utilizatorilor finali, exact când sistemele proprietare păreau să stabilească astfel de servicii ca un domeniu comercial închis:

Una dintre variantele multiple ale proiectului LAION, care prezintă opere de artă moderne și protejate prin drepturi de autor. Sursă - https://huggingface.co/datasets/laion/relaion-pop/viewer/default/train

Una dintre variantele multiple ale proiectului LAION, care prezintă opere de artă moderne și protejate prin drepturi de autor. Sursă

În multe cazuri, dimensiunile mari ale unor astfel de “colecții pointer” indică includerea conținutului de imagine într-un fișier descărcabil și găzduit; cu toate acestea, dimensiunile de descărcare ne-triviale sunt adesea cauzate de volumul mare de conținut text, și uneori de includerea extrasă a încorporărilor sau a caracteristicilor – rezumate sau noduri derivate din conținutul sursă în timpul procesului de antrenament.

Prețul video

Seturile de date video prezintă un caz și mai puternic pentru abordarea “dataset-by-proxy” sau pointer, deoarece volumul mare de date de stocare necesare pentru a agregă într-o colecție descărcabilă și utilă un număr semnificativ de videoclipuri este prohibitiv, și o metodă “distribuită” este de dorit.

Cu toate acestea, în ambele cazuri – dar mai ales cu video – URL-urile descărcabile reprezintă date care vor necesita o atenție semnificativă suplimentară înainte de a fi utilizate în procesele de antrenament. Atât imaginile, cât și videoclipurile vor trebui să fie redimensionate sau vor necesita decizii de decupare, pentru a crea mostre care să se potrivească în spațiul disponibil GPU. Chiar și videoclipurile puternic subspecificate vor necesita, de asemenea, tăierea la lungimi foarte scurte, de obicei de 3-5 secunde.

Seturile de date video notabile care utilizează referințe la videoclipuri online (în loc de curatorierea și ambalarea directă a videoclipurilor) includ setul de date Kinetics Human Action Video al Google și colecția YouTube-8M a gigantului căutării, care utilizează annotarea segmentului pentru a indica modul în care să se procedeze cu fiecare videoclip odată descărcat – dar care, din nou, lasă utilizatorul final să obțină videoclipurile de la URL-urile furnizate.

Închis și deschis

În cele din urmă, în această categorie, datele VFX “deschise” pot fi generate cu platforme închise care publică și pun la dispoziție ulterioară setul de date. Este rezonabil să ne întrebăm de ce se întâmplă acest lucru și să considerăm dacă se poate datora faptului că compania care generează datele dorește să “spăle” un model ne-prietenos cu drepturile de autor, pentru uzul propriu; sau că un set “spălat” a fost solicitat din exterior.

Un astfel de caz de “spălare generativă” este, probabil, setul de date Omni-VFX, care incorporează multe puncte de date din setul de date Open-VFX (care, la rândul său, se referă la multe platforme închise și semi-închise, cum ar fi Pika și PixVerse).

Să fim onești, Omni-VFX nu se străduiește nici măcar să o facă:

În setul de date deschis Omni-VFX, o față familiară. Sursă - https://huggingface.co/datasets/GD-ML/Omni-VFX/blob/main/Harley/pixverse%252Fmp4%252Fmedia%252Fweb%252F15e45744-64b1-4a41-84de-626225cf017b_seed734716767.mp4

În setul de date deschis Omni-VFX, o față familiară. Sursă

Răspundere ancestrală

A doua abordare majoră pentru “spălarea” IP-urilor este prin utilizarea materialului protejat de drepturi de autor la una sau mai multe etape. Una dintre metodele din această categorie este utilizarea datelor sintetice care au fost antrenate, la un moment dat, pe date protejate de drepturi de autor. În astfel de cazuri, mai ales atunci când datele sintetice pot obține rezultate autentice, lucrările protejate de drepturi de autor oferă transformări care nu ar fi putut fi ghicite sau aproximate de modelele generale ale lumii sau de modelele nespecializate.

Acest lucru este în mod special cazul în care sistemele generative de video necesită să genereze “evenimente imposibile” și evenimente care ar cădea, în general, în categoria “efecte vizuale” (VFX).

De fapt, ceea ce a adus acest subiect în minte a fost ultimul dintr-o serie de lucrări de cercetare care oferă capacitatea de a “abstractiza” diverse tipuri de efecte vizuale, cum ar fi producerea de laser din părți improbable ale corpului, fie prin antrenarea pe clipuri VFX comandate special sau “deschise” (în loc de sursa mai evidentă, cum ar fi scumpul VFX din universul cinematografic Marvel):

Exemple de pe site-ul EffectMaker, în care “acțiunea” din clipul sursă (în stânga) este aplicată unei imagini sursă (în centru). Sursă

Exemplele de mai sus provin de pe pagina proiectului EffectMaker. EffectMaker nu este primul care oferă astfel de capacități în acest an și, de fapt, aceasta se transformă într-o sub-întreprindere distinctă în cercetarea IA VFX*.

Conștient că gigantii mass-media, cum ar fi Marvel, au o șansă mai mare de a câștiga cazuri legale cu privire la drepturile de autor (chiar și în climatul actual de “toleranță forțată”), companiile de efecte vizuale și startup-urile se străduiesc în prezent să asigure că cadrele lor generative de efecte vizuale sunt lipsite de IP-urile corporative ale altor companii.

Cel mai important dintre acestea este Meta, care a fost raportat pe subreddit-ul r/vfx ca fiind angajat într-o perioadă de iarnă bine plătită în 2026, oferind artiștilor VFX oportunitatea de a lucra la antrenarea modelelor de IA pentru a produce efecte vizuale de nivel Hollywood. Deși salariul nu a fost specificat în diverse postări, unul a descris-o ca “bani de pensionare”.

Urmați banii

Cu toate acestea, trebuie să ne întrebăm cât de mult sunt dispuși să plătească chiar și cei ca Meta pentru o diversitate și o abundență adevărată de clipuri VFX “ad-hoc” – având în vedere că un singur clip VFX pentru un film de blockbuster costă în jur de 42.000 de dolari – și multe dintre ele costă mult mai mult.

Mai mult, este logic să presupunem că modelele de IA VFX personalizate vor cădea sub presiunea cererii, inclusiv diverse efecte standard din categoriile de filme cele mai populare și scumpe.

Pe lângă faptul că profesioniștii VFX “rămași” ar putea recrea clipuri pe care le-au lucrat pentru un catalog de filme existent – ceea ce contextualizează “lucrarea de set de date personalizat” ca imitativ – nu există nicio garanție că aceste mostre scumpe noi vor fi antrenate “de la zero” într-o arhitectură complet nouă.

Într-adevăr, dacă astfel de recreări sunt deviate în module auxiliare, cum ar fi LoRAs, care se bazează pe un model de bază, atunci procesul este la fel de justificabil pe cât este de “curat” modelul de bază – și nu multe dintre ele sunt.

La fel, dacă “noul” proces utilizează tehnici “hibride” cum ar fi reglarea fină, în care valoarea efectului vizual depinde de modele, priori, sau încorporări din colecții sau modele mai vechi de integritate neconfirmată, originalitatea lucrării este, în mod evident, cosmetică și supusă challenge-ului.

Misiuni imposibile

Domeniul de ieșire VFX este un studiu de caz particular de interes cu privire la “spălarea” potențială a IP-urilor în seturile de date de IA, deoarece efectele vizuale adesea reprezintă “lucruri imposibile” pentru care nu vor exista alternative deschise.

De exemplu, în timp ce demolarea unei clădiri ar putea fi antrenată într-un model generativ din diverse clipuri publice sau ieftine; dacă doriți să antrenați un model pentru a produce laser uman, veți trebui să o faceți pe clipuri VFX, furate sau comandate; astfel de lucruri nu se întâmplă nicăieri altundeva.

Chiar și în cazul altor tipuri de dezastre naturale, cum ar fi inundații dramatice, materialul sursă disponibil în lumea reală este puțin probabil să poată reproduce puncte de vedere dramatice asupra evenimentelor catastrofale, deoarece (cu câteva excepții) oamenii nu transmit în direct de la locurile catastrofale. Prin urmare, “puncte de vedere cool” asupra dezastrelor sunt rare în seturile de date reale, și orice model de IA care poate genera astfel de puncte de vedere a obținut, probabil, informația de undeva.

Cele mai dorite fluxuri de lucru de IA nu au acest nivel de specificitate, și în astfel de cazuri, ascunderea beneficiilor datelor protejate de drepturi de autor poate să nu necesite atât de mult efort.

Concluzie: Rețea încurcată

Doar cei care au utilizat IA generativă pe o perioadă extinsă și în mod susținut vor înțelege instinctiv că astfel de sisteme se luptă să combine multiple concepte atunci când nu există exemple comparabile în datele lor de antrenament.

Această limitare este cunoscută sub numele de încurcătură, în care diversele fețe ale conceptelor antrenate tind să se grupeze împreună cu elemente asociate, în loc să se descompună în piese utile, de tip Lego, care pot fi aranjate în orice nouă configurație pe care utilizatorul o dorește.

Încurcătura este o gaură de gravitație arhitecturală care este practic imposibil de evitat, cel puțin pentru abordările bazate pe difuzie care caracterizează toate cadrului actual de IA de generație curentă. Cu toate acestea, se poate ca abordări noi să apară în următorii ani, care sunt mai bune la discretizarea conceptelor antrenate, astfel încât acestea să poată fi lipite împreună cu mai multă ușurință și să ofere mai puține indicii cu privire la proveniența lor.

 

* Nu aduc acuzații împotriva EffectMaker, dar comentez aici despre generalitatea unei practici emergente în cercetarea video IA.

Deoarece aceste cadre, în acest tip de filme, au generat și continuă să genereze bani.

Publicat pentru prima dată luni, 16 martie 2026

Scriitor pe machine learning, specialist în domeniul sintezei de imagini umane. Foster head of research content la Metaphysic.ai.