Connect with us

Ajatusjohtajat

Uudelleenarviointi avoimen lähdekoodin merkitystä generatiivisen tekoälyn aikakaudella

mm

Avoimen lähdekoodin malli – ohjelmistokehityksen etos, jossa lähdekoodi on vapaasti saatavilla julkiselle uudelleenjako- tai muokkaamistarkoituksiin – on pitkään ollut innovaation katalysaattori. Idea syntyi vuonna 1983, kun ohjelmistokehittäjä Richard Stallman pettyi suljetun lähdekoodin mustaan laatikkoon perustuvan tulostimensa vuoksi.

Hänen visiossaan syntyi vapaan ohjelmistoliikkeen idea, joka loi pohjan nykyiselle avoimen lähdekoodin ekosysteemille, joka mahdollistaa suuren osan nykyisestä internetistä ja ohjelmistoinnovaatiosta.

Mutta se oli yli 40 vuotta sitten.

Nykyään generatiivinen tekoäly, jolla on ainutlaatuinen tekninen ja eettinen haaste, muuttaa “avomuuden” määritelmää, vaatien meitä arvioimaan ja uudelleenarvioimaan avoimen lähdekoodin paradigman – ei hylätäkseen sitä, vaan sopeuttaakseen sen.

Teckoäly ja avoimen lähdekoodin vapaudet

Avoimen lähdekoodin ohjelmistojen neljä perusvapautta – mahdollisuus suorittaa, tutkia, muokata ja uudelleenjako mitä tahansa ohjelmakoodia – ovat ristiriidassa generatiivisen tekoälyn luonteen kanssa useilla tavoilla:

  • Suorita: Teckoälymallit vaativat usein erittäin korkeat infrastruktuuri- ja laskentakustannukset, jotka rajoittavat pääsyä resurssirajoitusten vuoksi.
  • Tutki ja muokkaa: Teckoälymallit ovat erittäin monimutkaisia, joten ymmärtäminen ja muokkaaminen niitä ilman pääsyä sekä koodiin että siihen perustuvaan dataan on merkittävä haaste.
  • Uudelleenjako: Monet teckoälymallit rajoittavat uudelleenjakoa suunnittelun vuoksi, erityisesti niillä, joilla on koulutetut painot ja alustan tarjoajan omistamat omistajat.

Näiden perusperiaatteiden eroosio ei johdu pahantahtoisesta aikomuksesta, vaan modernien tekoälyjärjestelmien valtavan monimutkaisuuden ja kustannusten vuoksi. Totuus on, että valtionlaajuisten tekoälymallien koulutuskustannukset ovat kasvaneet dramaattisesti viime vuosina – OpenAI:n GPT-4:n koulutuskustannukset olivat jopa 78 miljoonaa dollaria, henkilöstökustannusten ulkopuolella, ja yhteiskustannukset ylittivät 100 miljoonaa dollaria. ​

”Avoimen lähdekoodin” tekoälyn monimutkaisuus

Todella avoin tekoälymalli vaatisi täydellisen avoimuuden laskentakoodin, koulutuslähdekoodin, mallipainojen ja koulutusdatan osalta. Kuitenkin monet “avoinna” merkityt mallit julkaisevat vain laskentakoodin tai osittaisia painoja, kun taas toiset tarjoavat rajoitetun lisenssin tai rajoittavat kaupallista käyttöä kokonaan.

Tämä puolueeton avoimuus luo illuusion avoimen lähdekoodin periaatteista, vaikka se ei toteudu käytännössä.

Tarkastele, että Open Source -aloitteen analyysi osoitti, että useat suositut suuret kielimallit, jotka väittävät olevansa avoimia – mukaan lukien Llama2 ja Llama 3.x (kehitetty Meta), Grok (X), Phi-2 (Microsoft) ja Mixtral (Mistral AI) – ovat rakenteellisesti ristiriidassa avoimen lähdekoodin periaatteiden kanssa.

Kestävyyden ja kannustimien haasteet

Useimmat avoimen lähdekoodin ohjelmistot on rakennettu vapaaehtoisvoimin tai avustuksin rahoitettujen ponnistelujen varaan, eikä laskennan vaativille, kalliille infrastruktuureille. Tekoälymallit ovat kalliita kouluttaa ja ylläpitää, ja kustannukset ovat vain odotettavissa kasvavan. Anthropicin toimitusjohtaja Dario Amodei ennustaa, että se voi lopulta maksaa jopa 100 miljardia dollaria valtionlaajuisten mallien kouluttamiseen.

Ilman kestävää rahoitusmallia tai kannustimien rakennetta kehittäjät joutuvat valitsemaan suljettujen tai ei-kaupallisten lisenssien rajoittamisen tai taloudellisen romahduksen riskin.

”Avoimien painojen” ja lisenssien harha

Tekoälymallien saatavuus on muuttunut yhä sekavammaksi, ja monet alustat markkinoivat itseään “avoimina”, vaikka ne asettavat rajoituksia, jotka ovat perustavanlaatuisesti ristiriidassa todellisten avoimen lähdekoodin periaatteiden kanssa. Tämä “sleight-of-hand” ilmenee useilla tavoilla:

  • Mallit, jotka on merkitty “avoimiksi painoiksi”, voivat estää kaupallisen käytön kokonaan, pitäen niitä enemmän akateemisina kuriositeetteina kuin käytännön liiketoimintatyökaluina yleisölle tutkittaviksi ja kehittämiskelpoisiksi.
  • Jotkut tarjoajat tarjoavat pääsyn esikoulutetuille malleille, mutta vartioivat innokkaasti koulutusdatansa ja menetelmiään, tehden siitä mahdottomaksi toistaa tai vahvistaa heidän löytöjään merkittävällä tavalla.
  • Monet alustat asettavat uudelleenjako-rajoituksia, jotka estävät kehittäjiä kehittämästä tai parantamasta malleja yhteisöjensä hyväksi, vaikka he voivat “päästä käsiksi” koodiin.

Näissä tapauksissa “avoimet tutkimukselle” on vain kaksoiskieli “suljettu liiketoiminnalle”. Tuloksena on epärehellinen muoto alihankkijoiden lukko, jossa organisaatiot panostavat aikaa ja resursseja alustoihin, jotka näyttävät avoimilta, mutta löytävät kriittiset rajoitukset, kun yrittävät laajentaa tai kaupallistaa sovelluksia.

Tuloksena oleva sekavuus ei vain ärsytä kehittäjiä. Se vahingoittaa avoimuutta tekoälyekosysteemissä. Se luo epärealistisia odotuksia sidosryhmien keskuudessa, jotka olettavat, että “avoin” tekoäly on verrattavissa avoimen lähdekoodin yhteisöihin, joissa avoimuus, muokkausoikeudet ja kaupallinen vapaus toteutuvat.

Lakien viive

GenAI:n nopea kehitys on jo ohittanut asianmukaisen lainsäädännön kehityksen, luoden monimutkaisen verkon älyomaisuuden haasteita, jotka lisäävät aiempia huolenaiheita.

Ensimmäinen suuri oikeudellinen taistelukenttä keskittyy koulutusdatan käyttöön. Syvät oppimismallit keräävät suuria tietoja internetistä, kuten julkisesti saatavilla olevia kuvia ja verkkosivujen tekstiä. Tämä massiivinen datakeräys on syttynyt kiivaisiin keskusteluihin tekijänoikeuksista. Teknologiayritykset väittävät, että heidän tekoälyjärjestelmänsä tutkivat ja oppivat tekijänoikeuksien alaisista materiaaleista luodakseen uutta, muunneltua sisältöä. Tekijänoikeuksien omistajat väittävät, että nämä tekoälyyritykset laittomasti kopioidaan heidän teoksiaan, luoden kilpailevaa sisältöä, joka uhkaa heidän elinkeinojaan.

Tekoälyllä luotujen johdannaisteosten omistajuus edustaa toista oikeudellista epäselvyyttä. Kukaan ei tiedä, miten luokitella tekoälyllä luotua sisältöä, paitsi Yhdysvaltain Tekijänoikeusvirasto, joka toteaa, että “jos tekoäly luo kokonaan sisällön, sitä ei voida suojella tekijänoikeuksilla”.

Oikeudellinen epävarmuus GenAI:ssa – erityisesti tekijänoikeusloukkauksia, tekoälyllä luotujen teosten omistajuutta ja luvattoman sisällön koulutusdatassa – muuttuu entistä monimutkaisemmaksi, kun perustavanlaatuiset tekoälymallit kehittyvät geopolitiikan välineiksi: Kansat, jotka kilpailevat kehittääkseen ylivoimaisia tekoälykykyjä, saattavat olla vähemmän taipuvaisia rajoittamaan dataa, asettaen maat, joilla on tiukemmat immateriaalioikeudet, kilpailuhaittaan.

Mihin avoimen lähdekoodin on kehittymistä tekoälyn aikakaudella

GenAI-juna on jo lähtenyt liikkeelle eikä näytä hidastuvan. Toivomme rakentavamme tulevaisuutta, jossa tekoäly edistää innovaatiota sen sijaan, että se tukahduttaa sitä. Tässä tapauksessa teknologiajohtajien on luotava kehys, joka takaa turvallisen ja avoimen kaupallisen käytön, edistää vastuullista innovaatiota, käsittelee datan omistajuutta ja lisenssiä ja erottaa “avoin” ja “ilmainen”.

Nouseva käsite, Avoimen kaupallisen lähdekoodin lisenssi, voi tarjota tien eteenpäin ehdottamalla ilmaista pääsyä ei-kaupalliseen käyttöön, lisensoidun pääsyn kaupalliseen käyttöön ja tunnustaa ja kunnioittaa datan alkuperää ja omistajuutta.​​

Sopeuduttaakseen tähän uuteen todellisuuteen avoimen lähdekoodin yhteisön on kehitettävä tekoälyyn erityomaisia avoimia lisenssimalleja, muodostettava julkis-yksityisiä kumppanuuksia rahoittamaan näitä malleja ja perustettava luotettavia standardeja avoimuuden, turvallisuuden ja eettisyyden osalta.

Avoimen lähdekoodin muutti maailmaa kerran. Generatiivinen tekoäly muuttaa sitä jälleen. Säilyttääksemme avoimuuden hengen, meidän on kehittymistä avoimen lähdekoodin kirjaimen mukaan, tunnustamalla tekoälyn ainutlaatuiset vaatimukset ja ratkaisemalla haasteet suoraan, jotta voidaan luoda kattava ja kestävä ekosysteemi.

Tohtori Yair Adato on Bria:n perustaja ja toimitusjohtaja, jonka tehtävänä on luoda riskitön avoin generatiivisen tekoälyn alusta. Hänen visiossaan on luoda generatiivisen tekoälyn alusta, joka noudattaa vastuullisia tekoälyperiaatteita ja määrittelee uudelleen tekijänoikeuden ja immateriaalioikeuden käsitteet, jotta dataomistus ja generatiivinen tekoäly voivat coexistoida.

Alallaan visionääri, tohtori Adato on suorittanut tietojenkäsittelytieteen tohtorin tutkinnon tietokoneen näön alalla Ben-Gurionin yliopistossa yhteistyössä Harvardin yliopiston kanssa. Yli 50 patentilla, jotka rakentavat sillan tekoälyn ja kaupallisen käytön välille, tohtori Adato on merkittävässä asemassa edistämässä tekoälyinnovaatioita. Ennen Briaa johtamista tohtori Adato toimi Trax Retailin CTO:na, mikä mahdollisti Traxin nopean kasvun varhaisesta startup-vaiheesta 20 työntekijällä yli 1000 työntekijän yritykseksi. Hän on toiminut tai toimii useiden yritysten, kuten Sparx, Vicomi, Tasq, DataGen ja Anima, neuvottelukunnan jäsenenä.