Connect with us

Euroopan komission uusi GPAI-malli – Mitä tämä merkitsee tekoälykoulutukselle?

Ajatusjohtajat

Euroopan komission uusi GPAI-malli – Mitä tämä merkitsee tekoälykoulutukselle?

mm

Heinäkuussa Euroopan komissio (EC) julkaisi uuden yleispätevän tekoäly (GPAI) -mallin. Tämä tarkoittaa, että tekoälytarjoajien on julkaistava sisältö, jota on käytetty mallien kouluttamiseen. Tämä tapahtuu kuukausien ja kuukausien jälkeen otsikoita, joissa luoja väittää, että sisältöä on käytetty ilman lupaa tekoälyn kouluttamiseen.

Uuden mallin myötä EU on tehnyt kannanottonsa selväksi: avoimuus ei ole enää neuvottelukelpoinen. Musta laatikon koulutus, jossa jotain luodaan ilman sen sisäisten toimintatapojen paljastamista, ei ole vaihtoehto tekoälykehittäjille. Tämä merkitsee merkittävää muutosta, sillä Euroopassa toimiminen vaatii nyt täydellisen näkyvyyden mallien syötteisiin ja koulutusdatan alkuperään, mikä pakottaa tarkastelemaan uudelleen datakeräystä ja -käyttöä.

Monet ovat korostaneet selvää eroa tämän ja äskettäin julkistetun US AI Action Planin välillä, joka painottaa voimakkaasti sääntelyn purkamista. Kuten minkä tahansa uuden lain tai sääntelyn kanssa, yritysten on nyt arvioitava tarkasti, miten GPAI-malli vaikuttaa toimintaan.

Jos ne toimivat useilla alueilla, he tekevät samaa Yhdysvaltain AI-toimintasuunnitelman kanssa, mikä lisää epäselvyyttä. Niden monimutkaisten sääntöjen ja sen vuoksi, että tekoälykehityksen sääntely tällä tavoin on tutkimattoman aluetta, kehittäjien tulokset ovat todennäköisesti hyvin erilaisia.

Yleispätevän tekoälymallin purkaminen

Heinäkuussa tänä vuonna Euroopan komissio julkaisi pakollisen mallin GPAI-tarjoajille, jotta he voivat julkaista julkisen yhteenvedon koulutusdatasta, jota heidän mallejaan varten on käytetty. EU:n tekoälylain mukaisesti tarjoajien on ilmoitettava datakategoriat, kuten julkisesti saatavilla olevat tietokannat, yksityiset lisensoidut tiedot, verkkosisällön kerääminen, käyttäjätiedot ja synteettiset tiedot. Tavoitteena on mahdollistaa tekijänoikeuden haltijoiden, käyttäjien ja alihankkijakehittäjien oikeuksien käyttäminen EU-lainsäädännön mukaisesti.

GPT:t koulutetaan suurilla määrillä dataa; kuitenkin nykyisessä markkinassa on rajallisesti tietoa saatavilla datan alkuperästä. Julkisen yhteenvedon, jonka tämä malli esittää, antaa kattavan katsauksen koulutukseen käytetystä datasta, luetellaan pääasialliset datakokoelmat ja selitetään muita käytettyjä lähteitä.

Vertaile ja kontrastoi, US AI Action Plan

Vertailussa Yhdysvallat on sitoutunut voittamaan tekoälykilpailun ja ylläpitämään kilpailukykyään Kiinaa vastaan, kun Trumpin hallinto julkaisi tekoälytoimintasuunnitelmansa aiemmin kesällä. Tämä uusi tekoälykehys pyrkii kiihdyttämään energiankulutukselle alttiiden datakeskusten rakentamista, jotka voimittavat tekoälyjärjestelmiä, helpottamalla ympäristösääntelyä. Samalla se pyrkii lisäämään amerikkalaisten tekoälytekniikoiden maailmanlaajuista vientiä. 90 suositusta sisältävän suunnitelman ansiosta Yhdysvallat pyrkii pysymään edellä kilpailijoitaan.

Suunnitelma perustuu kolmeen pilarin: innovaation kiihdyttämiseen, Amerikan tekoäly-infrastruktuurin rakentamiseen ja johtajuuden edistämiseen kansainvälisessä tekoäly-diplomatia- ja turvallisuuspolitiikassa.

Suunnitelman myötä Yhdysvallat aikoo sujuvoittaa kaikki nykyiset teknologiasäännöt, erityisesti ympäristönsääntelyjä, varmistaakseen, ettei lainsäädäntö hidasta kasvua, ja rohkaista laajempaa kansainvälistä jakelua Yhdysvaltain tekoälyohjelmistoja ja -laitteita. Tämä “sääntelyn vastainen” lähestymistapa merkitsee selvää muutosta aikaisemmista kehyksistä, jotka olivat keskittyneet eettisyyteen, avoimuuteen ja vastuulliseen innovaatioon – siirtymällä kohti aggressiivisempaa “innovaatio ensin” -toimintasuunnitelmaa.

Puuttuva palanen

On syytä ottaa askel taaksepäin ja miettiä, voivatko nämä toimet, vaikka ne ovat erilaisia, kärsiä samasta virheestä, joka aiheuttaa kehittäjille arvon puutteen noudattamisessa. EU:n ja Yhdysvaltain lähestymistavat jättävät kriittisen aukon tekoälykoulutusdataan liittyvän immateriaalioikeuden ympärille. EU:n tekoälylaki edellyttää koulutusdatan yhteenvedon ja tekijänoikeuspolitiikan noudattamista, mutta se ei perustaa skaalautuvaa kehystä tekijänoikeuksien tunnistamiseen tai lisensointiin.

Yhdysvalloissa ei ole erityisiä sääntöjä – jättäen tekoälyyritykset navigoimaan kehittyvässä oikeudellisessa kehyksessä, jota muokkaavat oikeudenkäynnit ja jatkuvat riidat tekijänoikeuksien haltijoiden kanssa. Oikeudellisen tekstin ulkopuolella puuttuu käytännön puoli; kumpikaan lähestymistapa ei esitä toimivia, alanlaajuisia menetelmiä suojatun sisällön havaitsemiseksi suuressa mittakaavassa, laillisen käytön vahvistamiseksi tai lisensointiprosessin sujuvoittamiseksi. Kunnes nämä ratkaisut määritellään, epävarmuus tekijänoikeuksissa tekoälykoulutuksessa pysyy merkittävänä haasteena alan kehittäjille.

Liiketoiminnan piilotettu kustannus tekoälyn jäljittämättömyydestä

Jotkut virheistä huolimatta, oletetaan, että nämä säännöt aiheuttavat tekoälykehittäjien keskittymisen siihen, miten pysyä pinnalla oikeudellisesta näkökulmasta – mutta tämä ei aina ole tapausten tila. Itse asiassa todellinen ero tekoälyssä nyt ei ole EU:n ja Yhdysvaltain sääntelyn välillä, vaan yritysten välillä, jotka panostavat jäljittävyyteen tänään ja niiden, jotka uhkapelaa siitä, etteivät heidän tarvitse. Tämä on toisto siitä, mitä näimme vuosia sitten, kun yleinen tietosuoja-asetus (GDPR) toteutettiin – yritykset, jotka rakensivat yksityisyyden suunnittelun alusta alkaen, välttivät sakkoja ja saivat kuluttajien luottamuksen ja sujuvamman pääsyn muihin markkinoihin, jotka myöhemmin jäljittivät GDPR-standardeja.

Sama malli saattaa olla kehittymässä tekoälyssä. Koulutusdatan ja mallipäätösten jäljittäminen tulee todennäköisesti olemaan globaali perusta, ja yritykset, jotka viivästyvät, joutuvat suunnittelemaan järjestelmiään uudelleen tulevaisuudessa. Palata ja lisätä dokumentaatiota, alkuperän seurantaa ja tarkastusominaisuuksia olemassa olevaan järjestelmään on paljon kalliimpaa ja monimutkaisempaa kuin rakentaa ne alusta alkaen, ja se vie fokus pois enemmän tuloksellisista rakennuskohteista, joita yritys haluaa toteuttaa.

Toisin sanoen jäljittäminen ja avoimuus eivät ole vapaaehtoisia lisäominaisuuksia; ne on upotettava tekoälyjärjestelmiin alusta alkaen. Liiketoiminnat, jotka kohdeltavat niitä jälkiohjelmina, vaarantavat innovaation tyrehtymisen, kohtaavat sääntelyn takaiskun ja menettävät kilpailun lopullisesti.

Eettinen tekoäly vaatii globaalia ykseyttä

Makrotasolla nämä polarisoituneet lähestymistavat luo todellisen ongelman globaaleille liiketoiminnille. Yritykset kevyemmissä markkinoissa, kuten Yhdysvalloissa, voivat kasvaa nopeammin lyhyellä aikavälillä, mutta kun he päättävät astua EU-markkinoille, he kohtaavat sääntelyseinän: tekoälylain jäljittävyyden ja dokumentaation säännöt vaativat kykyjä, joita he eivät koskaan rakentaneet.

Jäljittävyyden, dokumentaation ja tarkastusominaisuuksien lisääminen olemassa olevaan järjestelmään on kallista, hidasta ja häiritsevää, erityisesti koska jäljittäminen on yksi sääntelyn resursseja vaativimmista osista. Se on samaa mallia, mitä näimme GDPR:n kanssa, jossa myöhässä olevat yritykset kamppailivat kalliiden uudelleenrakennusten ja myöhästyneen markkinoiden pääsyn kanssa, kun taas varhaiset siirtymiset saivat pysyvän etulyöntiaseman.

Viktorija Lapenyte on Oxylabs:n tuotteen oikeudellisen neuvonantajan johtaja. Yli kymmenen vuoden oikeudellisen kokemuksen IT-sektorilla, Viktorija Lapėnytė on kehittänyt syvän asiantuntemuksen monimutkaisten liiketoimintaa ja sääntelyhaasteiden navigoimisessa sisäisen oikeudellisen neuvonantajan ominaisuudessa. Nykyään Viktorija on Oxylabs:n tuotteen oikeudellisen neuvonantajan johtaja, joka on markkinajohtaja verkkotiedonkeruumarkkinoilla. Viktorijan tiimi keskittyy uusimpien tietoteknologioiden oikeudellisiin monimutkaisuuksiin, joihin kuuluvat muun muassa vaatimustenmukaisuus, sääntelyyn liittyvän riskien hallinta, tietosuojelu ja alanlaajuinen keskustelu vastuullisesta tietojen hankinnasta.