Liity verkostomme!

Ajatusten johtajat

Kiinan tekoälyn mirage: Kuinka "avoin lähdekoodi" piilottaa tärkeimmät asiat

mm

Kun suuret teknologiayritykset, kuten Google, Microsoft ja Meta, kilpailevat tekoälymarkkinoiden hallinnasta, Kiinan High Flyer, Baidu, Moonshot ja Alibaba ovat päässeet otsikoihin julkaistuaan... DeepSeekERNIE 4.5Kimi K2ja Qwen3 suuret kielimallit avoimen lähdekoodin ohjelmina. Tätä siirtymistä suojattujen, suljettujen GenAI-mallien julkaisemisesta on pidetty merkkinä siitä, että Kiinan tekoälyteollisuus on omaksumassa avoimen lähdekoodin voiman tekoälykehityksen demokratisoimiseksi ja innovaatioiden vauhdittamiseksi.

Kuten monet muutkin toimijat, jotka mainostavat tarjontaansa avoimen lähdekoodin tuotteina ja jopa mainitsevat sen yritystensä nimissä, High Flyer, Baidu ja Moonshot eivät ole itse asiassa jakaneet kriittisiä osia, kuten malliensa ytimessä olevia datajoukkoja. Näiden suurten mallien pyrkiessä hyödykkeiksi, joihin kehittäjät luottavat, aidon avoimen lähdekoodin läpinäkyvyys, jota voidaan testata, tutkia ja iteroida, on ratkaisevan tärkeää puolueettoman, eettisen ja hyödyllisen teknologian luomiseksi, johon voimme kaikki luottaa. Kaikki nämä "avoimen lähdekoodin" mallit ovat itse asiassa "avoimen painon" mallit, mikä tarkoittaa, että ne voidaan ladata ja käyttää, mutta niitä ei voida tarkastaa millään mielekkäällä tavalla ilman dataa.

Kuten yhdysvaltalaiset pelaajat tykkäävät Avaa AI ja Meta Vaikka Baidu näyttää vetäytyvän avoimen lähdekoodin projekteista, sen avoin kutsu hyödyntää vapaasti saatavilla olevaa ERNIE 4.5 -mallistoaan voi todellakin kannustaa innovaatioihin ja yhteistyöhön kehittäjien kanssa, jotka haluavat luoda pienempiä ja tehokkaampia sovelluksia. Samaan aikaan yritys, joka on samanlainen kuin Kiinan Google, on antanut itselleen kilpailuedun kannustamalla malliensa käyttöönottoon ja juurruttamalla ne kukoistavaan tekoälyekosysteemiin.

Samaa voidaan sanoa DeepSeekistä, edullisesta Kimi K2:sta ja päivitetystä Qwen3:sta – jonka vertailuarvot haastavat suljettuja malleja, kuten Claude Opus 4 ja GPT-4o-0327.

Nämä tekoälytoimijat ovat asemoineet itsensä hyvin kilpailussa halutuimmaksi hyödykemalliksi, ja jopa Qwen3:n uusin innovatiivinen päivitys sai inspiraationsa avoimen lähdekoodin yhteisön palautteesta.

Kuten monet muutkin, jotka mainostavat suurta tekoälymalliaan avoimen lähdekoodin ohjelmistona, kiinalainen tekoälyyhteisö ei kuitenkaan itse asiassa jaa dataa tai muita tekoälyjärjestelmiensä kriittisiä osia. Sen sijaan he pyytävät globaaleja kehittäjiä uskomaan sokeasti malleihin, joita he eivät voi todella ymmärtää tai tutkia.

Tulevaisuuden panostaminen avoimen lähdekoodin tekoälymallien avulla

Kun iPhone tuli markkinoille vuonna 2007, jotkut olettivat, että Mac hallitsisi älypuhelinten maailmaa iOS:n myötä, mutta Avoimen lähdekoodin osallistuminen on olennaista startup-yrityksilleja samalla vauhditti yrittäjyys- ja talouskasvua maailmanlaajuisesti – ja Android, Googlen vuonna 2005 ostama startup-yritys, seurasi tätä polkua voittoon.

Julkaisemalla avoimen lähdekoodin ohjelmistoja, joita voitiin katsella, muokata, ottaa käyttöön ja jakaa, Android kutsui akateemikkoja, kehittäjiä ja jopa kilpailijoita yhteistyöhön ohjelmiston parissa. Tämä nopeutti innovaatioprosessia, demokratisoi pelikenttää ja lopulta laski hintoja. Android tuli markkinoille vuotta ensimmäisen iPhonen jälkeen ja tämän vuoden alkuun mennessä... ylpeili 71.88 prosentin osuudella maailmanlaajuisista markkinoista iOS:n 27.65 prosentin osuuteen.

Teknologisessa vallankumouksessa, joka näytti tapahtuvan yhdessä yössä, älypuhelimista tuli kaikkialla läsnä olevia, ja vaikka ohjelmistojen, laitteistojen ja käyttöliittymien kehitys jatkuu, teollisuus on kasvanut kauas älypuhelinten toimintatapojen mullistamista koskevien yritysten ohi. Koska matkapuhelimet ovat nykyään hyödyke, innovaatio on nykyään niillä toimivissa sovelluksissa, ja kilpailijoina pysyäkseen älypuhelintoimittajien on ylläpidettävä ekosysteemiä, joka houkuttelee kehittäjiä.

Vajaan kolmen vuoden jälkeen ChatGPT:n lanseerauksesta tekoälyala on joutunut samankaltaiseen tilanteeseen. Jokainen globaalin tekoälyalan toimija tavoittelee mallejaan, joista tulisi seuraava Android tai jopa iOS, ja siirtymällä avoimen lähdekoodin tuotteisiin DeepSeek-, ERNIE 4.5- ja Kimi K2 -mallien avulla kiinalaiset innovaattorit pyrkivät valtaamaan orastavan ekosysteemin.

Vaikka tämä voisi toimia heidän edukseen, se ei kuitenkaan edistä avoimen lähdekoodin todellista läpinäkyvyyttä, joka on ollut olennaista paitsi innovaatioiden, myös luotettavien innovaatioiden jalostamiselle.

Data on puuttuva pala useimmissa avoimen lähdekoodin tekoälyissä

Koska tekoälymallien luominen ja jakaminen on paljon monimutkaisempaa kuin perinteisten ohjelmistojen, täysin avoimen lähdekoodin tekoälyn kysyntä ei ole pieni. Yksinkertaisen lähdekoodin sijaan tekoälyjärjestelmät koostuvat seitsemän komponenttia—mukaan lukien lähdekoodi, malliparametrit, tietojoukko, hyperparametrit, koulutuslähdekoodi, satunnaislukujen generointi ja ohjelmistokehykset.

Jotta malli tuottaa halutut tulokset, jokaisen osan on toimittava yhdessä. Tämä tarkoittaa, että kehittäjillä on oltava täysi näkyvyys järjestelmän jakamiseen, muokkaamiseen ja käyttöönottoon sekä tapahtumien ymmärtämiseen. Tieteellisen menetelmän perustana olevan toistettavuuden myötä tekoälyalalla on kuitenkin... tapa termin "avoimen lähdekoodin" käyttämisestä viittaamaan ilmaisiin tai edullisiin julkaisuihin, jotka ovat saatavilla ja joiden kautta pääsee käsiksi muutamaan palaseen palapelistä.

Esimerkiksi Baidu julkaisi ilmaiseksi kymmenen ERNIE 4.5 -mallia. Mallin ja parametrien jakamisen lisäksi yritys julkaisi avoimen lähdekoodin ERNIEKitin ja FastDeploy-käyttöönottotyökalupaketit. Näiden avulla kehittäjät voivat rakentaa tehokkaita tekoälysovelluksia tarjoamalla teollisuustason ominaisuuksia, resurssitehokkaita koulutus- ja päättelytyönkulkuja sekä useiden laitteiden yhteensopivuuden.

Toisin sanoen Baidu on tarjonnut kehittäjille jännittäviä työkaluja, jotka antavat heille mahdollisuuden vapauttaa innovaatioita nopeammin, minkä he toivovat puolestaan houkuttelevan heitä valitsemaan ERNIE 4.5:n kilpailijoiden sijaan.

ERNIE 4.5:tä hyödyntäviä kehittäjiä pyydetään kuitenkin luottamaan malliin sokeasti, koska Baidu on pitänyt paljon piilossa, mukaan lukien malliensa tiedot ja opetukset sisältävät tietojoukot.

Läpinäkyvien avoimen lähdekoodin tekoälymallien voima

Vaikka jokainen tekoälypalapelin palanen on kriittinen mallin toiminnan kannalta, 80 prosenttia tekoälyprojekteista epäonnistuu, ja data on ongelman ytimessäEpätarkat, epätäydelliset ja vinoutuneet tietojoukot johtavat malleihin, jotka eivät toimi ennustettavasti tai toivotulla tavalla.

- Äskettäin julkaistu kohtalokas Tesla Full-Self-Driving (FSD) -onnettomuusvideo vuodelta 2023esimerkiksi paljasti pahimman mahdollisen skenaarion siitä, mitä voi tapahtua, kun tietojoukko ja malli jäävät vajaiksi. Kun Tesla Model Y kiihdytti kirkkaaseen, laskevaan aurinkoon, osittain automatisoitu järjestelmä ei pystynyt ymmärtämään tai reagoimaan asianmukaisesti siihen, mitä sen kamerat näkivät – tai eivät nähneet. Ihmisten ajamien autojen hidastaessa ja pysäytettäessä FSD:n hämmennys johti naisen kuolemaan.

Tämä tuhoisa vika johtui epätäydellisistä visuaalisista tiedoista sekä turvamekanismin puutteesta, joka olisi ottanut huomioon tällaiset sokeat pisteet. Kun kehittäjillä ei ole näkymää dataansa, he eivät näe, miten se on vuorovaikutuksessa mallin kanssa, mikä tarkoittaa, että he eivät voi paljastaa tällaisia virheitä ja iteroida vankan suorituskyvyn saavuttamiseksi.

Vielä huolestuttavampaa on, että ilman mallia pyörittävää dataa heidän on pakko luottaa siihen sokeasti.

Kun datajoukot ovat avoimen lähdekoodin, tekoälyyhteisö on kuitenkin osoittanut kitkevänsä ongelmalliset ongelmat pois, kuten se teki paljastamalla yli 1,000 5 URL-osoitetta, jotka sisältävät varmennettua lasten seksuaaliseen hyväksikäyttöön liittyvää materiaalia LAION XNUMXB:ssäKoska tekoälyn tekstistä kuvaksi -generointimalleissa käytetty tietojoukko on perustavanlaatuinen sovellusten, kuten Stable Diffusionin ja Midjourneyn, luomisessa, olisi ollut tuhoisaa tekoälyalalle, jos käyttäjät olisivat alkaneet tuottaa laittomia fotorealistisia kuvia. Sen sijaan tämän tietojoukon avoin luonne mahdollisti yhteisön paljastaa vaarallisen sisällön ja motivoida korjauksen, yhteyshenkilö B.

Lisäksi suuri osa ensimmäisestä datajoukosta hyödynsi valtavan Common Crawlin suorittamaa verkkokaavintaa, jota hyödynnettiin myös ChatGPT- ja LLAMA-malleissa. Jopa silloin Tekoälyhakurobotit herättävät edelleen huolta copywritingista, yksityisyydestä sekä puolueellisesta ja rasistisesta leimaamisesta.tekoälyyhteisön kehittäjät ovat kuitenkin työskentelemme tapojen parissa puhdistaa Common Crawlin kasvavan avoimen lähdekoodin tietoaineiston osia turvallisempaa käyttöä varten.

Koska kehittäjien tavoitteena on rakentaa paitsi tehokasta tekoälyä, myös tekoälyä, johon voimme luottaa, sekä käyttäjät että teollisuus ovat suojattuja aidon avoimen lähdekoodin läpinäkyvyyden ja yhteistyön ansiosta.

Avoimen lähdekoodin polun omaksuminen

Vaikka monet suhtautuvat edelleen varauksella tähän nopeasti kasvavaan teknologiaan, on käynnissä kilpailu siitä, kuka on suurten tekoälymallien iOS tai Android – ja kuka on niiden perusta. Maailmanlaajuisen tekoälyyhteisön kirjaimellisesti rakentaessa tulevaisuuden standardia tekoälyjärjestelmillä, jotka jo ohjaavat autoja ja tarjoavat lääketieteellisiä arviointeja, luottamuksen rakentaminen puolueettoman, luotettavan ja turvallisen tekoälyn avulla ei ole koskaan ollut tärkeämpää.

Kiinan tekoälyyhteisön pyrkiessä asemoitumaan avoimen innovaation edelläkävijäksi, turvallisen tekoälyn ainoa tie löytyy aidon avoimen lähdekoodin läpinäkyvyydestä, jonka on todistanut vuosikymmenten ohjelmistoinnovaatioiden kokemus. Termin käyttäminen järjestelmiin, jotka eivät jaa kriittisiä osia, kuten dataa, ei anna kehittäjille mahdollisuutta tutkia, replikoida ja iteroida. Vaikka helposti saatavilla olevien mallien, kuten DeepSeekin, ERNIE 4.5:n, Kimi K2:n ja Qwen3:n, houkuttelevuus on kiistaton, niitä hyödyntävät kehittäjät vaihtavat yhteistyötä ja innovaatioita edistävän läpinäkyvyyden kätevyyden hyväksi.

Tekoälyyhteisön on valittava: omaksua radikaali läpinäkyvyys aidon avoimen lähdekoodin kautta tai ottaa riski rakentaa huomisen kriittiset järjestelmät tämän päivän mustille laatikoille.

Tohtori Jason Corso on yksi perustajista ja tiedejohtaja yrityksessä vokseli51ja robotiikan, sähkötekniikan ja tietojenkäsittelytieteen professori Michiganin yliopistossa. Konenäön alan veteraani, tohtori Corso, on omistanut yli 20 vuotta akateemiseen tutkimukseen videon ymmärtämisen, robotiikan ja datatieteen aloilla.