Povežite se s nama

Vođe misli

Kineska AI fatamorgana: Kako "otvoreni kod" skriva ono što je najvažnije

mm

Objavljeno

 on

S velikim tehnološkim igračima poput Googlea, Microsofta i Mete koji se bore za dominaciju na tržištu umjetne inteligencije, kineski High Flyer, Baidu, Moonshot i Alibaba dospjeli su na naslovnice objavljivanjem svojih DeepSeekERNIE 4.5Kimi K2Qwen3 velike jezične modele, odnosno, kao otvoreni kod. Ovaj pomak od objavljivanja zaštićenih, vlasničkih GenAI modela primljen je kao znak da kineska industrija umjetne inteligencije prihvaća moć otvorenog koda kako bi demokratizirala razvoj umjetne inteligencije i potaknula inovacije.

Kao i mnogi igrači koji svoje ponude reklamiraju kao otvoreni kod, pa čak i stavljaju to u nazive svojih tvrtki, High Flyer, Baidu i Moonshot zapravo nisu podijelili ključne dijelove poput skupova podataka u središtu svojih modela. Kako ovi veliki modeli nastoje postati roba na koju se programeri oslanjaju, transparentnost pravog otvorenog koda koji se može testirati, istraživati i ponavljati ključna je za stvaranje nepristrane, etičke i korisne tehnologije kojoj svi možemo vjerovati. Svi ovi modeli "otvorenog koda" zapravo su "otvorene težine", što znači da se mogu preuzeti i koristiti, ali ih se ne može smisleno pregledati bez podataka.

Kao što američki igrači vole Otvori AI međutim Meta Čini se da se Baidu povlači od otvorenog koda, ali otvoreni poziv Baidua da iskoristi svoj besplatno dostupan paket ERNIE 4.5 modela doista može potaknuti inovacije i suradnju s programerima koji žele stvoriti manje, moćne aplikacije. Istovremeno, tvrtka, koja je slična kineskom Googleu, stekla je konkurentsku prednost poticanjem usvajanja i učvršćivanjem svojih modela u rastućem ekosustavu umjetne inteligencije.

Isto se može reći za DeepSeek, jeftini Kimi K2 i ažurirani Qwen3 - koji se može pohvaliti referentnim vrijednostima koje dovode u pitanje zatvorene modele poput Claude Opus 4 i GPT-4o-0327.

Ovi AI igrači dobro su se pozicionirali u utrci da postanu model izbora za robu široke potrošnje, a najnovije inovativno ažuriranje Qwen3-a čak je inspirirano povratnim informacijama zajednice otvorenog koda.

Međutim, poput mnogih koji svoj veliki AI model reklamiraju kao otvoreni kod, kineska AI zajednica zapravo ne dijeli podatke ili druge ključne dijelove svojih AI sustava. Umjesto toga, traže od globalnih programera da slijepo vjeruju modelima koje ne mogu istinski razumjeti ili istražiti.

Zauzimanje prava na budućnost s modelima umjetne inteligencije otvorenog koda za robu

Kada se iPhone pojavio na tržištu 2007. godine, neki su pretpostavljali da će Mac s iOS-om dominirati tržištem pametnih telefona, ali Sudjelovanje u otvorenom kodu je sastavni dio startupa, a istovremeno je potaknuo poduzetnički i gospodarski rast diljem svijeta - a Android, startup koji je Google preuzeo 2005. godine, slijedio je taj put do pobjede.

Objavljivanjem softvera otvorenog koda koji se mogao pregledavati, mijenjati, usvajati i dijeliti, Android je pozvao akademike, razvojne programere, pa čak i konkurente na suradnju na softveru. To je ubrzalo proces inovacija, demokratiziralo uvjete igre i u konačnici snizilo cijene. Android se pojavio na tržištu godinu dana nakon prvog iPhonea, a početkom ove godine, imao je 71.88 posto globalnog tržišta u odnosu na 27.65 posto iOS-a.

U tehnološkoj revoluciji koja se činila kao da se dogodila preko noći, pametni telefoni postali su sveprisutni i čak i uz kontinuirana poboljšanja softvera, hardvera i korisničkog sučelja, industrija je daleko od pokušaja revolucioniranja načina rada pametnih telefona. S obzirom na to da su mobiteli sada roba, inovacija koja je danas dostupna nalazi se u aplikacijama koje se na njima pokreću, a da bi bili konkurentni, dobavljači pametnih telefona moraju održavati ekosustav koji potiče razvojne programere.

Ni tri godine nakon lansiranja ChatGPT-a, industrija umjetne inteligencije nalazi se na sličnoj ivici. Svaki igrač u globalnoj industriji umjetne inteligencije teži da njegovi modeli postanu sljedeći Android ili čak iOS, a prelaskom na otvoreni kod s modelima DeepSeek, ERNIE 4.5 i Kimi K2, kineski inovatori žele zauzeti svoje mjesto u ekosustavu u nastajanju.

Iako bi im to moglo ići u korist, to ne potiče istinsku transparentnost otvorenog koda koja je bila ključna ne samo za stvaranje inovacija, već za stvaranje inovacija kojima možemo vjerovati.

Podaci su nedostajući dio većine umjetne inteligencije otvorenog koda

S obzirom na to da su modeli umjetne inteligencije daleko složeniji za stvaranje i dijeljenje od tradicionalnog softvera, potreba za potpuno otvorenim izvornim kodom umjetne inteligencije nije mala. Umjesto jednostavnog izvornog koda, sustavi umjetne inteligencije sastoje se od sedam komponenti—uključujući izvorni kod, parametre modela, skup podataka, hiperparametre, izvorni kod za učenje, generiranje slučajnih brojeva i softverske okvire.

Svaki dio mora raditi usklađeno kako bi model pružio željene rezultate, što znači da programeri trebaju potpunu vidljivost kako bi dijelili, mijenjali i usvajali sustav te razumjeli što se događa. Međutim, s ponovljivošću kao temeljem znanstvene metode, industrija umjetne inteligencije ima navika korištenja termina otvoreni kod za besplatna ili jeftina izdanja koja su dostupna s pristupom nekolicini dijelova slagalice.

Baidu je, na primjer, besplatno stavio na raspolaganje deset ERNIE 4.5 modela. Uz dijeljenje modela i parametara, tvrtka je također otvorila izvorni kod ERNIEKit i FastDeploy alata za implementaciju. Oni omogućuju programerima izgradnju moćnih AI aplikacija pružajući mogućnosti industrijske razine, resursno učinkovite radne procese obuke i zaključivanja te kompatibilnost s više hardvera.

Drugim riječima, Baidu je programerima pružio uzbudljive alate koji im omogućuju brže oslobađanje inovacija, za koje se nadaju da će ih zauzvrat potaknuti da odaberu ERNIE 4.5 u odnosu na konkurenciju.

Međutim, od programera koji koriste ERNIE 4.5 traži se da slijepo vjeruju modelu, jer je Baidu mnogo toga sakrio, uključujući skupove podataka koji informiraju i podučavaju njegove modele.

Moć transparentnih modela umjetne inteligencije otvorenog koda

Iako je svaki dio slagalice umjetne inteligencije ključan za funkcioniranje modela, 80 posto projekata umjetne inteligencije propadne, a podaci su srž problemaNetočni, nepotpuni i pristrani skupovi podataka dovode do modela koji se ne ponašaju predvidljivo ili kako je željeno.

The Nedavno objavljen video kobne nesreće Tesle s potpuno autonomnim vozilom (FSD) iz 2023., na primjer, otkrio je najgori mogući scenarij onoga što se može dogoditi kada skup podataka i model ne uspiju. Dok je Tesla Model Y jurio prema jarkom, zalazećem suncu, djelomično automatizirani sustav nije mogao razumjeti ili reagirati na odgovarajući način na ono što su njegove kamere vidjele - ili nisu vidjele. Dok su automobili kojima su upravljali ljudi usporavali i zaustavljali se, zbunjenost FSD-a rezultirala je smrću žene.

Ovaj razoran neuspjeh odražavao je nepotpune vizualne podatke, kao i nedostatak sigurnosnog mehanizma koji bi objasnio takve slijepe točke. Kada programeri nemaju uvid u svoje podatke, ne mogu vidjeti kako oni interagiraju s modelom, što znači da ne mogu otkriti takve pogreške i iterirati za robusne performanse.

Još je više zabrinjavajuće to što bez podataka koji pokreću model, prisiljeni su mu slijepo vjerovati.

Međutim, kada su skupovi podataka otvorenog koda, zajednica umjetne inteligencije dokazala je da će iskorijeniti problematične probleme, kao što je to učinila otkrivanjem preko 1,000 URL-ova koji sadrže provjereni materijal o seksualnom zlostavljanju djece u LAION 5BS obzirom na to da je skup podataka korišten za modele generiranja teksta u sliku pomoću umjetne inteligencije bio temelj za stvaranje aplikacija poput Stable Diffusion i Midjourney, bilo bi pogubno za industriju umjetne inteligencije da su korisnici počeli proizvoditi ilegalne fotorealistične slike. Umjesto toga, otvorena priroda ovog skupa podataka omogućila je zajednici da otkrije opasan sadržaj i motivira ispravak, rekao je Liaison B.

Osim toga, velik dio tog prvog skupa podataka koristio se za web scraping koji je izvršio ogromni Common Crawl, koji je također korišten za modele ChatGPT i LLAMA. Čak i kao AI crawleri i dalje izražavaju zabrinutost zbog pisanja tekstova, privatnosti te pristranog i rasističkog označavanja, međutim, programeri u AI zajednici su radi se na načinima čišćenja dijelova rastućeg skupa podataka otvorenog koda Common Crawla za sigurniju upotrebu.

Budući da programeri ne žele samo izgraditi moćnu umjetnu inteligenciju, već i umjetnu inteligenciju kojoj možemo vjerovati, i korisnici i industrija su zaštićeni transparentnošću i suradnjom istinski otvorenog koda.

Prihvaćanje puta otvorenog koda

Dok su mnogi još uvijek oprezni prema ovoj rastućoj tehnologiji, utrka za postajanjem iOS-a ili Androida velikih robnih modela umjetne inteligencije je u tijeku - i dok globalna zajednica umjetne inteligencije doslovno gradi ono što će postati standard za budućnost, a sustavi umjetne inteligencije već voze automobile i nude medicinske procjene, uspostavljanje povjerenja stvaranjem nepristrane, pouzdane i sigurne umjetne inteligencije nikada nije bilo važnije.

S obzirom na to da se kineska zajednica umjetne inteligencije pokušava pozicionirati kao predvodnik otvorenih inovacija, put do sigurne umjetne inteligencije nalazi se samo u transparentnosti istinski otvorenog koda koja je dokazana desetljećima softverskih inovacija. Primjena tog pojma na sustave koji ne dijele ključne dijelove poput podataka ne dopušta programerima da istražuju, repliciraju i ponavljaju. Iako je privlačnost lako dostupnih modela poput DeepSeek-a, ERNIE 4.5, Kimi K2 i Qwen3 neosporna, programeri koji ih koriste žrtvuju transparentnost koja potiče suradnju i inovacije za praktičnost.

Zajednica umjetne inteligencije mora birati: prihvatiti radikalnu transparentnost kroz istinski otvoreni kod ili riskirati izgradnju sutrašnjih kritičnih sustava na današnjim crnim kutijama.

Dr. Jason Corso je suosnivač i glavni znanstveni direktor u voxel51, i profesor robotike te elektrotehnike i računarstva na Sveučilištu Michigan. Kao veteran u području računalnog vida, dr. Corso posvetio je više od 20 godina akademskim istraživanjima u područjima razumijevanja videa, robotike i znanosti o podacima.