Andersonův úhel
Metody IP-Washing v AI

Pokud existuje právní vyúčtování, které má přijít ohledně používání duševního vlastnictví při školení AI, existují také několik metod, jak toto použití zakrýt.
Opinion Běžící, rychle se rozvíjející revoluce v generativní AI se odehrává v nejprávně nejistějším prostředí, které doprovázelo jakoukoli transformační technologický vývoj od 19. století.
Až před 3-4 lety, komunita výzkumu strojového učení měla tacitní (často explicitní) povolení k využívání materiálu chráněného duševním vlastnictvím při vývoji nových systémů; jelikož tyto systémy nebyly dosud úspěšné, co se týče zralosti nebo komerční životaschopnosti, výsledky byly ve všech směrech akademické.
V tomto období, náhlý úspěch nové generace difuzních Large Language Models (LLM, jako je ChatGPT a Claude) a Vision-Language Models (VLM, jako je Sora) signál, že tyto abstraktní a dříve “neškodné” směry výzkumu se vyvinuly do komerční životaschopnosti a vyrostly z “volné karty”, pokud jde o využívání duševního vlastnictví jiných lidí.
Od nynějška, držitelé práv budou usilovat o podíl na plodech AI systémů, které byly školeny převážně nebo zčásti na jejich autorsky chráněných nebo jinak chráněných datech, což povede k běžící lavině právních případů, které vyžadují nějakou snahu, aby se jim mohlo věnovat.

Omezené pouze na případy podané v USA, nové případy vznikají v rychlém tempu ve Spojených státech a jinde. Zdroj
Povinnost “Bezplatného Oběda”
Finanční závazek právě probíhající v souvislosti s infrastrukturou pro AI byl některými hlasy označen jako pokus o zakotvení “copyright-hazardous” AI tak hluboko v ekonomice společnosti, aby se stalo nejen “příliš velkým na to, aby selhalo”, ale také “příliš mocným na to, aby bylo možné jej úspěšně žalovat” – nebo alespoň tak mocným, aby úspěšné žaloby nemohly být dovoleny, aby převrátili revoluci.
V tomto směru, současný prezident Spojených států zavádí do politiky svůj názor, že “Nemůžete očekávat, že budete mít úspěšný AI program, když každá jednotlivá článek, kniha nebo cokoliv jiného, co jste četli nebo studovali, musíte platit”.
Skutečně? Nic podobného nebo srovnatelného se nestalo v západní průmyslové éře a toto představuje hnutí, které se ostře dotýká tradiční americké kultury žalob a náhrad; možná nejbližší podobné pozice jsou povinné vypršení patentů na léky po 20 letech (což je samo o sobě často napadáno), a omezení očekávání soukromí na veřejných místech.
Nicméně, časy se mění; v nepřítomnosti jakéhokoli zajištění, že současný trend směrem k “vyvlastnění” proti ochraně duševního vlastnictví nebude selhat nebo nebude později zrušen, existují several sekundární přístupy, které se stávají standardní praxí ve vývoji AI systémů a zpracování sporných školicích dat, která je pohání.
Datové soubory zprostředkovatele
Jeden z těchto přístupů využívá podobnou strategii jako (ne vždy úspěšná) obhajoba torrent-listing stránek, že ve skutečnosti nehostují žádné sporné materiály – nebo jakýkoli materiál vůbec.
Kromě toho, že se eliminuje potřeba ukládat a poskytovat velké množství minimálně komprimovatelných obrazových nebo video dat, tyto kolekce umožňují rychlé aktualizace – jako je odstranění materiálu na žádost držitelů autorských práv – a verzi.
Stejně jako torrenty jsou pouze ukazatele na místa, kde lze najít chráněný materiál, řada vysoce vlivných datových souborů je sama o sobě pouze “ukazatelem” – seznamem existujících dat; pokud uživatel chce tyto seznamy použít jako seznam ke stažení pro svou vlastní datovou sadu, je to na něm, pokud jde o odpovědnost kurátorů.
Mezi nimi je datová sada Conceptual 12M od Google Research, která poskytuje popisky pro obrázky, ale pouze ukazuje lokace na webu, kde tyto obrázky existují (nebo existovaly v době kurátorství):

Dva příklady z kurátorství Google Research Conceptual 12M. Zdroj
Dalším prominentním příkladem, který nyní má platný nárok na úctu v historii AI, je LAION datová sada, která umožnila vznik generativního systému Stable Diffusion v roce 2022 – první takový rámec, který nabídl silné otevřené zdrojové generativní obrázky koncovým uživatelům, právě když se zdálo, že proprietární systémy budou tyto služby etablovat jako ryze uzavřenou, komerční doménu:

Jedna z mnoha variant projektu LAION, zobrazující moderní a autorsky chráněná díla. Zdroj
Ve mnoha případech velikost souborů těchto “ukazatelů” naznačuje, že obrazová data jsou zahrnuta v stažitelném a hostovaném souboru; nicméně, nezanedbatelné velikosti stažení jsou často způsobeny vysokým objemem textového obsahu a někdy zahrnují extrahované vlastnosti – odvozené souhrny nebo uzly jinak použitelného obsahu extrahovaného z původních dat během školicího procesu.
Video Premium
Video datové soubory představují ještě silnější případ pro “datový soubor zprostředkovatele” nebo ukazatelový přístup, protože vysoké objemy úložného prostoru vyžadované pro agregaci významného a užitečného počtu videí do jediné stažitelné kolekce jsou prohibitive, a “distribuovaný” metoda je žádoucí.
Nicméně, v obou případech – ale zejména u videa – stažitelné zdrojové URL představují data, která budou vyžadovat významnou další pozornost před použitím ve školicích procesech. Obrazy i videa budou muset být přepočteny, nebo rozhodnutí o ořezání budou muset být učiněna, aby se vytvořily vzorky, které budou.fit do dostupného GPU prostoru. I vážně downsamplovaná videa budou také vyžadovat krátké délky, jako je 3-5 sekund, typicky.
Značné video datové soubory, které používají odkazy na online videa (místo kurátorství a přímého balení videa), zahrnují Kinetics Human Action Video Dataset od Google a sbírku YouTube-8M od stejné společnosti, která používá segment anotaci, aby označila, jak zacházet s každým videem, jakmile je staženo – ale které opět ponechává koncovému uživateli, aby získal videa z dodaných URL.
Zavřené a Otevřené
Nakonec, v této kategorii, “otevřená” VFX data mohou být generována s uzavřenou platformou, která následně publikuje a zpřístupňuje výsledný datový soubor. Je rozumné se divit, proč se to děje, a zda se to může stát, protože původní společnost chce sanitovat IP-nepřátelský upstream model pro svou vlastní potřebu; nebo že “vypraný” datový soubor byl vyžádán zvenčí.
Jedním z takových případů “generační pračky” je, zřejmě, Omni-VFX datová sada, která zahrnuje mnoho datových bodů z Open-VFX datové sady (která sama odkazuje na mnoho uzavřených a semi-uzavřených platforem, jako je Pika a PixVerse).
Chcete-li být upřímní, Omni-VFX se ani nesnaží:

V otevřeném zdrojovém datovém souboru Omni-VFX, známá tvář. Zdroj
Odpovědnost Předků
Druhý hlavní přístup k IP-washing je prostřednictvím používání autorsky chráněného materiálu na jedné nebo více úrovních vzdálenosti. Jednou z metod v této kategorii je použití syntetických dat, která byla školená, v某 bodě upstream, na autorsky chráněných datech. V takových případech, zejména tam, kde syntetická data jsou schopna získat autenticky vypadající výsledky, autorsky chráněné dílo poskytuje transformace, které by nebylo možné rozumně uhodnout nebo aproximovat obecnými světovými modely nebo nespecializovanými modely.
To je zejména případ, kdy generativní video systémy jsou povinny generovat “nemožné” události a události, které by obecně spadaly do kategorie “vizuálních efektů” (VFX).
Ve skutečnosti, to, co přivedlo tuto problematiku do mého vědomí, byla poslední z řady výzkumných prací, které nabízejí schopnost “abstrahovat” různé typy vizuálních efektů, jako je například produkce laserových paprsků z nepravděpodobných částí těla, buď tím, že byly školeny na zakázkových nebo “otevřených” VFX klipech (místo zjevnějšího zdroje, jako je velmi drahý VFX ve výstupu z Marvel cinematic universe):
Příklady z webové stránky EffectMaker, kde je “akce” ve zdrojovém klipu (daleko vlevo) aplikována na zdrojový obrázek (střed). Zdroj
Výše uvedené příklady pocházejí z projektové stránky pro EffectMaker projekt. EffectMaker není ani první nabídka tohoto roku, která se snaží extrahovat VFX dynamiku z jednoho video klipu a přenést ji do nového klipu, a ve skutečnosti se to stává samostatným úkolem ve výzkumu AI VFX*.
Je si vědom, že mediální giganti, jako je Marvel, mají vyšší než průměrnou šanci vyhrát právní případy týkající se duševního vlastnictví (i v uvedeném klimatu “vynucené tolerance”), vizuální efektové společnosti a startupy nyní jdou na značné délky, aby zajistily, že jejich generativní VFX rámce jsou zdarma od korporátního duševního vlastnictví jiných společností.
Především z nich je Meta, která byla hlášena na r/vfx subreddit, že šla na dobře placenou zimní náborovou akci do roku 2026, nabízející VFX umělcům práci na školení AI modelů pro produkci Hollywood-level vizuálních efektů. Ačkoli plat nebyl specifikován v různých příspěvcích, jeden popisoval jej jako “penzijní peníze”.
Sledujte Peníze
Nicméně, je třeba se divit, kolik peněz jsou dokonce společnosti, jako je Meta, ochotny zaplatit za skutečnou rozmanitost a hojnost ad hoc VFX shotů, vzhledem k tomu, že průměrný jediný VFX shot pro blockbuster film je kolem 42 000 USD – a mnohé z nich jsou mnohem vyšší.
Dále je rozumné předpokládat, že zakázkové VFX-generující AI modely budou ustupovat populární poptávce, včetně různých standardních efektů tropů z nejpopulárnějších a nejdražších kategorií filmů.
Kromě skutečnosti, že “zbytkoví” VFX profesionálové mohou nakonec rekreovat shoty, na kterých pracovali pro stávající filmový katalog† – což samo o sobě kontextualizuje “zakázkovou” datovou práci jako imitační – neexistuje žádná záruka, že tyto drahé nové vzorky budou nakonec školeny “od nuly” v brand new architektuře.
Skutečně, pokud takové rekreace jsou odbočeny do pomocných modulů, jako je LoRAs, které spoléhají na základní model, pak je proces tak defenzivní, jako je základní model “IP-čistý” – a mnoho z nich není.
Podobně, pokud “nový” proces používá jiné “hybridní” techniky, jako je fine-tuning, kde hodnota vizuálního efektu závisí na modelech, přípustných nebo embeddingech ze starších sbírek nebo modelů nejasné integrity, originalita práce je zřejmě kosmetická a podléhá výzvě.
Nemožné Mise
Doména VFX výstupu je zvláště zajímavým případovým studiem ve vztahu k potenciálnímu IP-washing v AI datech, protože vizuální efektové shoty často zobrazují “nemožné” věci, pro které nebudou žádné otevřené zdrojové alternativy k dispozici.
Například, zatímco demolice budovy by mohla být školená do generativního modelu z různých veřejně dostupných nebo jinak dostupných stock klipů, pokud chcete školení modelu, aby produkoval lidské laserové paprsky, budete muset školení na VFX klipech, ukradených nebo zadaných; takové věci se nestávají nikde jinde.
I v případě jiných typů přírodních katastrof, jako je dramatické zatopení, dostupný reálný zdroj materiálu je nepravděpodobný, aby mohl reprodukovat dramatické POVs na katastrofických událostech, protože (s některými výjimkami) lidé obvykle nelivestreamují z katastrofických míst. Proto “cool views” na katastrofy jsou vzácné ve skutečných datech, a jakýkoli AI model, který může generovat je, likely dostal informace z jiného zdroje.
Většina žádoucích AI úkolů nemá tento level specifičnosti, a v takových případech by zakrytí výhod autorsky chráněných dat nemuselo vyžadovat téměř tolik úsilí.
Závěr: Propletená Síť
Jen ti, kteří použili generativní AI extenzivně a po dlouhou dobu, budou instinktivně rozumět, že takové systémy bojují s kombinací více konceptů, když neexistují žádné srovnatelné příklady ve svých školicích datech.
Tato omezení je známo jako propletení, kde různé aspekty školených konceptů tendují k shlukování s souvisejícími prvky, spíše než rozkládají se do užitečných, Lego-stylu stavebních bloků, které lze uspořádat do jakéhokoli nového uspořádání, které by uživatel mohl požadovat.
Propletení je architektonická gravitační jáma, která je téměř nemožné uniknout, alespoň pro difuzní přístupy, které charakterizují všechny hlavní současné genAI rámce. Nicméně, může se stát, že se objeví nové přístupy v příštích letech, které budou lépe schopny diskrétně rozkládat školené koncepty, aby je bylo možné lépe skládat, a nabízet méně indikací o jejich původu.
* Nechci činit žádné obvinění proti EffectMaker, ale komentuji zde obecnost vznikající praxe ve výzkumu AI videa.
† Protože tyto shoty, v těchto typech filmů, generují a pokračují v generování peněz.
Poprvé publikováno v pondělí, 16. března 2026










