Connect with us

IP-Washing Menetelmät AI:ssa

Andersonin kulma

IP-Washing Menetelmät AI:ssa

mm
An AI-generated image of Lady Justice surrounded by 'laundered' data. GPT-1.5.

Jos on oikeudellinen selvittely tuleva älyomaisuuden käytöstä tekoälyssä, on myös useita menetelmiä tällaisen käytön peittämiseksi.

 

Mielipide Tekoälyssä tapahtuva nykyinen nopeasti etenevä vallankumous on tapahtumassa oikeudellisesti epävakaa ympäristö, joka on seurannut mitä tahansa muunnostavaa teknologista kehitystä 1800-luvun jälkeen.

Kolme-neljä vuotta sitten koneoppimistutkimusyhteisöllä oli oletettu (usein eksplisiittinen) lupa hyödyntää tekijänoikeuksien suojamaista materiaalia uusien järjestelmien kehittämisessä; koska nämä järjestelmät eivät olleet vielä onnistuneita, niiden tulokset olivat kaikissa suhteissa akateemisia.

Tänä aikana uuden sukupolven difuusiopohjaisen Large Language Modelien (LLM, kuten ChatGPT ja Claude) ja Vision-Language Modelien (VLM, kuten Sora) yllättävä menestys merkitsi, että nämä abstraktit ja aiemmin “harmittomat” tutkimuksen suunnat olivat kehittyneet kaupallisesti kannattaviksi ja kasvaneet “vapaan kulkukortin” yli, mitä tuli tekijänoikeuksien suojatun datan hyödyntämiseen.

Tästä lähtien oikeuksienomistajat tavoittelivat osuutta tekoälyjärjestelmien hedelmistä, jotka oli koulutettu suurelta osin tai osittain heidän tekijänoikeuksien suojatuilla tai muilla tavoin suojatuilla tiedoillaan, johtaen jatkuvaan lainsäädäntökuorman vaatii jonkin verran ponnistelua vain pysyäkseen perillä.

Rajoitettu vain Yhdysvalloissa käynnistettyihin tapauksiin, uudet tapaukset nousevat frenetiikan tahdissa Yhdysvalloissa ja muualla. Lähde - https://copyrightalliance.org/artificial-intelligence-copyright/court-cases/

Tässä rajoitettu vain Yhdysvalloissa käynnistettyihin tapauksiin, uudet tapaukset nousevat frenetiikan tahdissa Yhdysvalloissa ja muualla. Lähde

Määrätty “Ilmainen lounas”

Teollisuuden taloudellinen sitoutuminen tekoälypalveluinfrastruktuuriin on esitetty joissakin äänissä pyrkimyksenä juurtaa “tekijänoikeuksellisesti vaarallinen” tekoäly niin syvälle taloudelliseen yhteiskuntaan, että se tulee “liian suureksi epäonnistumiseksi” tai “liian voimakkaaksi haastettavaksi” – tai ainakin niin voimakas, ettei onnistuneet oikeudenkäynnit voisi saada kääntymään vallankumousta vastaan.

Tähän yleiseen mielipiteeseen nykyinen Yhdysvaltain presidentti on sitoutunut politiikkaansa hänen näkemyksensä mukaan, että ‘Et voi odottaa menestyvää tekoälyohjelmaa, kun jokaisen artikkelin, kirjan tai mitä tahansa muuta, mitä olet lukenut tai opiskellut, on maksettava’.

Oikeasti? Mitään vastaavaa tai vertailukelpoista ei ole tapahtunut länsimaisessa teollisessa aikakaudesta, ja tämä edustaa liikettä, joka kulkee voimakkaasti vastakkaiseen suuntaan kuin perinteinen Yhdysvaltain kulttuuri oikeudenkäynneistä ja korvauksista; ehkä lähimmät samanlaiset asemat ovat pakollinen lääkepatenttien vanheneminen 20 vuoden jälkeen (joka itsessään usein hyökätty), ja rajoitus yksityisyyden odotuksille julkisilla paikoilla.

Kuitenkin ajat muuttuvat; puuttuessa mitään takeita siitä, ettei nykyinen suunta “julkinen omistusoikeus” tekijänoikeuksien suojaa vastaan epäonnistuisi tai kääntyisi myöhemmin, on useita toissijaisia lähestymistapoja, jotka tulevat standardikäytännöksi tekoälyjärjestelmien kehittämisessä ja kiistanalaisen koulutusdatan kohtelussa, joka voimistaa sitä.

Tietokannat Välittäjänä

Yksi näistä lähestymistavoista noudattaa hämmästyttävästi samanlaista puolustusta kuin (ei aina onnistunut) puolustus torrent-listauspaikoilla, jotka eivät itse isännöi mitään kiistanalaista materiaalia – tai mitään materiaalia lainkaan.

Lisäksi siihen, että tällaiset kokoelmat mahdollistavat nopean päivittämisen – kuten kiistanalisen aineiston poistamisen tekijänoikeuksien haltijoiden pyynnöstä – ja versionoinnin.

Samoin kuin torrentit ovat vain opasteita siihen, missä tekijänoikeuksien suojattu materiaali voidaan löytää, useat erittäin vaikutusvaltaiset tietokannat ovat itsessään vain “osoitin”-tyylisiä listoja olemassaolevasta datasta; jos loppukäyttäjä haluaa käyttää näitä listoja latausluettelona omalle tietokannalleen, se on heidän vastuullaan, mitä tietokantojen vastuulla näyttäisi olevan.

Tällaisia ovat esimerkiksi Google Researchin Conceptual 12M -tietokanta, joka tarjoaa kuvien kuvauksia, mutta osoittaa vain verkkosivustoihin, joilla nämä kuvat ovat olemassa (tai olivat kuratointiaikana):

Kaksi esimerkkiä Google Researchin Conceptual 12M -kuratoinnista. Lähde - https://github.com/google-research-datasets/conceptual-12m/blob/main/images/cc12m_1.jpg

Kaksi esimerkkiä Google Researchin Conceptual 12M -kuratoinnista. Lähde

Toinen merkittävä esimerkki, ja yksi, jolla on nyt oikeutettu vaatimus kunnioitukseen tekoälyn historiassa, on LAION-tietokanta, joka mahdollisti Stable Diffusion -generatiivisen järjestelmän syntymän vuonna 2022 – ensimmäinen tällainen kehys, joka tarjosi voimakkaita avoimia generatiivisia kuvia loppukäyttäjille, kun omistajajärjestelmät näyttivät vakiinnuttavan tällaiset palvelut puhtaasti kaupallisiksi alueiksi:

Yksi monista LAION-projektin variantteja, joka esittelee modernia ja tekijänoikeuksien suojattua taidetta. Lähde - https://huggingface.co/datasets/laion/relaion-pop/viewer/default/train

Yksi monista LAION-projektin variantteja, joka esittelee modernia ja tekijänoikeuksien suojattua taidetta. Lähde

Video Premium

Video-tietokannat esittävät vielä vahvemman tapauksen “tietokanta-välittäjä”- tai osoitinlähestymistavan puolesta, koska suuren määrän tallennustiedon kokoaminen merkittävään ja hyödylliseen määrään videoita yhteen ladattavaan kokoelmaan on esteettä, ja “jakautunut” menetelmä on toivottava.

Kuitenkin sekä tapauksissa – mutta erityisesti videon kanssa – ladattavien lähde-URL-osoitteiden edustama data vaatii merkittävää lisähuomiota ennen kuin sitä voidaan käyttää koulutusprosesseissa. Sekä kuvat että videot vaativat uudelleenkokoa tai sitten leikkauspäätöksiä tehdään, jotta voidaan luoda näytteitä, jotka sopivat saatavilla olevaan GPU-tilaan. Jopa vakavasti alennettuja videoita vaaditaan myös leikkaamista hyvin lyhyiksi kestoihin, kuten 3-5 sekuntia, tyypillisesti.

Merkittäviä video-tietokantoja, jotka käyttävät viittauksia verkkovideoihin (sen sijaan, että ne pakkaavat suoraan videot) ovat Googlein Kinetics Human Action Video Dataset ja hakukoneen YouTube-8M-kokoelma, joka käyttää segmentointia osoittaakseen, miten kohdella kunkin videota, kun se on ladattu – mutta joka jättää loppukäyttäjän hankkimaan videot toimittamista URL-osoitteista.

Lähellä ja Avoin

Lopulta, tässä luokassa, “avoin” VFX-data voidaan generoida suljetuilla alustoilla, jotka julkaisevat ja tekevät tulokset saataville tietokannan. On järkevää ihmetellä, miksi tämä tapahtuu, ja harkita, voitaisiiko se johtua siitä, että alkuperäinen yritys haluaa puhdistaa IP-vastaisen ylävirta- mallin omiin tarkoituksiinsa; tai että “pesitty” joukko pyydettiin ulkoa.

Yksi tällainen “sukupolven pesu” on, argumentoi, Omni-VFX-tietokanta, joka sisältää monia tietopisteitä Open-VFX-tietokannasta (joka itsessään viittaa moniin suljettuihin ja osittain suljettuihin alustoihin, kuten Pika ja PixVerse).

Rehellisesti, Omni-VFX ei edes yritä:

Avoimessa Omni-VFX-tietokannassa tuttu kasvo. Lähde - https://huggingface.co/datasets/GD-ML/Omni-VFX/blob/main/Harley/pixverse%252Fmp4%252Fmedia%252Fweb%252F15e45744-64b1-4a41-84de-626225cf017b_seed734716767.mp4

Avoimessa Omni-VFX-tietokannassa tuttu kasvo. Lähde

Esivanhempi Vastuu

Toinen tärkeä lähestymistapa IP-pesuun on tekijänoikeuksien suojatun materiaalin käyttäminen yhdellä tai useammalla etäisyydellä. Yksi menetelmistä tässä luokassa on synteettisen datan käyttäminen, joka on koulutettu jossakin vaiheessa ylävirrassa tekijänoikeuksien suojatuilla tiedoilla. Tällaisissa tapauksissa, erityisesti kun synteettinen data pystyy saavuttamaan aidon näköisiä tuloksia, tekijänoikeuksien suojattu työ tarjoaa muunnoksia, joita ei voi järkevästi arvata tai approksimoida yleisillä maailmanmalleilla tai erikoistumattomilla malleilla.

Tämä on vahvasti tapahtumassa silloin, kun generatiiviset videosysteemit vaativat “mahdottomien” tapahtumien generoimista, ja tapahtumia, jotka kuuluvat yleisesti “visuaalisten efektiiden” (VFX) luokkaan.

Itse asiassa, se, mikä toi tämän aiheen mieleeni, oli viimeisin tutkimusraportti, joka tarjosi mahdollisuuden “abstrahoida” erilaisia visuaalisen efekti-tyyppejä, kuten laser-säteiden tuottamista epätodennäköisistä kehon osista, joko tilaamalla custom-VFX-klippejä (sen sijaan, että olisi käytetty ilmeisempää lähdettä, kuten Marvelin elokuvasarjan hyvin kalliita VFX-otoksia):

Esimerkit EffectMakerin verkkosivuilta, joissa “toiminta” lähdeklipissä (kaukana vasemmalla) sovelletaan lähdekuvaan (keskellä). Lähde

Yllä olevat esimerkit ovat EffectMaker-projektin sivuilta. EffectMaker ei ole edes ensimmäinen tarjous tänä vuonna, joka pyrkii erottamaan VFX-dynaamikoita yhdestä videoklipistä ja siirtämään sen uuteen klippiin, ja se on muuttumassa erilliseksi tehtäväksi tekoäly-VFX-tutkimuksessa*.

Tietoisina siitä, että mediajätit, kuten Marvel, ovat korkeamman todennäköisyyden saavuttaneet oikeudenkäynneissä tekijänoikeuksien ympärillä (jopa mainitussa ilmapiirissä “pakkotoleranssi”), visuaalisten efekti-yhtiöt ja startupit tekevät parhaansa varmistamaan, että heidän generatiiviset VFX-kehyksensä ovat vapaita muiden yhtiöiden yritys-IP:stä.

Ennen kaikkea Meta on raportoitu r/vfx-alustalla menneen hyvin palkatun talven palkkaamiskierroksen vuonna 2026, tarjoten VFX-taiteilijoille työtä kouluttamassa tekoälymallit tuottamaan Hollywood-tasoisia visuaalisia efekti-otoksia. Vaikka palkkaa ei mainittu eri postauksissa, yksi kuvasi sitä “eläke-rahaksi”.

Seuraa Rahoitusta

Kuitenkin on ihmeteltävä, kuinka paljon rahaa edes Meta on valmis maksamaan todellisesta monimuotoisuudesta ja runsaudesta “ad hoc” VFX-otoksia varten, kun keskivertoinen yksittäinen VFX-otoksa elokuvassa on noin 42 000 USD – ja monet tulevat paljon kalliimmaksi.

Lisäksi on järkevää olettaa, että mukautettavat VFX-generoivat tekoälymallit tulevat suosimaan suosiota, mukaan lukien erilaisia standardiefekti-kliseitä suosituimmista ja kalleimmista elokuvista.

Puheenjohtajan näkökulmasta “jäännös”-VFX-ammattilaiset voivat lopulta luoda uudelleen otoksia, joissa he ovat työskennelleet olemassa olevaan elokuvakatalogiin – mikä itsessään kontekstualisoi “mukautetun” tietokantatyön jäljitelmäksi – on siinä, että nämä kalliit uudet näytteet eivät välttämättä pääty hämmästyttävästi uuteen arkkitehtuuriin “nollasta”.

Itse asiassa, jos nämä rekonstruktioita ohjataan sivumoduuleihin, kuten LoRAs, jotka riippuvat perusmallista, prosessi on vain niin puolustettavissa kuin perusmalli on “IP-puhdas” – ja monet eivät ole.

Samoin, jos “uusi” prosessi käyttää muita “hybridi”-tekniikoita, kuten hienosäätöä, jossa visuaalisen efekti-arvo perustuu malleihin, prioriteetteihin tai upotukseen vanhemmista kokoelmista tai malleista, joiden alkuperä on epävarma, alkuperäisyys on kiistelyn alainen.

Mahdottomat Tehtävät

Visuaalisten efekti-otosten alue on erityisesti mielenkiintoinen tapaustutkimus IP-pesun suhteen tekoälytietokannoissa, koska visuaaliset efekti-otokset usein esittävät “mahdottomia” asioita, joille ei ole avoimia vaihtoehtoja saatavilla.

Esimerkiksi, vaikka rakennuksen purkaminen voidaan kouluttaa generatiiviseen malliin eri julkisen alan tai muuten edullisten stock-klipien avulla, jos haluat kouluttaa mallin tuottamaan ihmisten laser-säteitä, sinun on koulutettava se VFX-klippejä, varastettuja tai tilattuja; sellaisia asioita ei tapahdu muualla.

Jopa muiden luonnonkatastrofien, kuten dramaattisen tulvivuodon, tapauksessa saatavissa oleva reaaliaineisto ei välttämättä pysty tuottamaan dramaattisia näkökulmia katastrofaalisista tapahtumista, koska (joillakin poikkeuksilla) ihmiset eivät yleensä lähettä suoraa lähetystä katastrofaalisista paikoista. Siksi “cool views” katastrofeista ovat harvinaisia reaaliaineistoissa, ja mikä tahansa tekoälymalli, joka voi generoida niitä, on todennäköisesti saanut tiedon jostakin muualta.

Useimmat toivottavat tekoälytehtävät eivät ole tässä määrin spesifiä, ja tällaisissa tapauksissa IP-suojatun datan hyödyntämisen peittäminen ei välttämättä vaadi läheskään niin paljon vaivaa.

Johtopäätös: Sekaannus

Vain ne, jotka ovat käyttäneet generatiivista tekoälyä laajasti ja pitkään, ymmärtävät vaistomaisesti, että tällaiset järjestelmät kamppailevat yhdistämällä useita käsitteitä, kun vertaisia esimerkkejä ei ole heidän koulutusdatassa.

Tämä rajoitus tunnetaan sekavana, jossa koulutettujen käsitteiden eri puolet taipuvat usein ryhmiin liittyviksi alaryhmiksi, sen sijaan, että ne hajoaisivat käteviksi, Lego-tyylisiksi rakennuspalikoiksi, jotka voidaan järjestää mihin tahansa uuteen konfiguraatioon, jonka käyttäjä haluaa.

Sekaannus on arkkitehtoninen painovoimainen kuilu, josta on lähes mahdotonta paeta, ainakin difuusiopohjaisille lähestymistavoille, jotka ovat kaikkien nykyisten päätekoälykehysten ominaisuuksia. Kuitenkin on mahdollista, että uudet lähestymistavat tulevat kehittymään seuraavien vuosien aikana, jotka ovat parempia diskreettisempien koulutettujen käsitteiden yhdistämisessä, jotta ne voidaan liittää yhteen taitavammin ja tarjoavat vähemmän osoituksia niiden alkuperästä.

 

* En esitä syytöksiä EffectMakeria vastaan, vaan kommentoin yleisyyttä nousevasta käytännöstä tekoäly-videotutkimuksessa.

Koska nämä otokset, näissä elokuvissa, ovat tuottaneet ja jatkavat tuottamaan rahaa.

Julkaistu ensimmäisen kerran maanantaina 16. maaliskuuta 2026

Kirjailija tekoälystä, alan erikoisosaaja ihmiskuvien synteesissä. Entinen tutkimussisällön johtaja Metaphysic.ai:lla.
Henkilökohtainen sivu: martinanderson.ai
Ota yhteyttä: [email protected]