Lidhu me ne

Udhëheqësit e mendimit

DeepSeek: Fitimet e efikasitetit, jo një ndryshim paradigme në inovacionin e AI

mm

La emocionet e fundit rreth DeepSeek, një model i avancuar i gjuhës së madhe (LLM), është i kuptueshëm duke pasur parasysh përmirësimin e ndjeshëm të efikasitetit që sjell në hapësirë. Megjithatë, disa reagime ndaj lëshimit të tij duket se keqinterpretojnë madhësinë e ndikimit të tij. DeepSeek përfaqëson një hap përpara në trajektoren e pritshme të zhvillimit të LLM, por nuk sinjalizon një zhvendosje revolucionare drejt inteligjencë e përgjithshme artificiale (AGI), as nuk shënon një transformim të papritur në qendrën e gravitetit të inovacionit të AI.

Përkundrazi, arritja e DeepSeek është një progres i natyrshëm përgjatë një shtegu të përcaktuar mirë - një nga rritjet eksponenciale në teknologjinë AI. Nuk është një ndryshim paradigme përçarëse, por një kujtesë e fuqishme e ritmit të përshpejtuar të ndryshimeve teknologjike.

Fitimet e efikasitetit të DeepSeek: Një kërcim përgjatë trajektores së pritur

Thelbi i eksitimit që rrethon DeepSeek qëndron në mbresëlënjen e tij përmirësimet e efikasitetit. Inovacionet e tij kanë të bëjnë kryesisht me bërjen e LLM-ve më të shpejta dhe më të lira, gjë që ka implikime të rëndësishme për ekonominë dhe aksesin e modeleve të AI. Megjithatë, përkundër zhurmës, këto përparime nuk janë thelbësisht të reja, por më tepër përmirësime të qasjeve ekzistuese.

Në vitet 1990, grafika kompjuterike e nivelit të lartë kërkon superkompjuterë. Sot, telefonat inteligjentë janë të aftë për të njëjtën detyrë. Në mënyrë të ngjashme, njohja e fytyrës - dikur një teknologji e veçantë, me kosto të lartë - tani është bërë një funksion i kudondodhur dhe i disponueshëm në telefonat inteligjentë. DeepSeek përshtatet brenda këtij modeli teknologjie: një optimizim i aftësive ekzistuese që ofron efikasitet, por jo një qasje e re, novator.

Për ata që njihen me parimet e rritjes teknologjike, ky përparim i shpejtë nuk është i papritur. Teoria e Singularitetit Teknologjik, e cila parashtron përparim të përshpejtuar në fusha kyçe si AI, parashikon se përparimet do të bëhen më të shpeshta ndërsa i afrohemi pikës së singularitetit. DeepSeek është vetëm një moment në këtë trend të vazhdueshëm dhe roli i tij është të bëjë teknologjitë ekzistuese të AI më të aksesueshme dhe efikase, në vend që të përfaqësojë një kërcim të papritur drejt aftësive të reja.

Inovacionet e DeepSeek: Ndryshime arkitekturore, jo një hap drejt AGI

Kontributi kryesor i DeepSeek është në optimizimin e efikasitetit të modeleve të mëdha gjuhësore, veçanërisht nëpërmjet Përzierje e ekspertëve arkitekturë (MM). MM është një teknikë e mirë-krijuar e të mësuarit të ansamblit që është përdorur në kërkimin e AI për vite me rradhë. Ajo që DeepSeek ka bërë veçanërisht mirë është përsosja e kësaj teknike, duke përfshirë masa të tjera të efikasitetit për të minimizuar kostot llogaritëse dhe për t'i bërë LLM-të më të përballueshme.

  • Efikasiteti i parametrave: Dizajni i MM i DeepSeek aktivizon vetëm 37 miliardë nga 671 miliardë parametrat e tij në çdo kohë të caktuar, duke reduktuar kërkesat llogaritëse në vetëm 1/18 e LLM-ve tradicionale.
  • Të mësuarit përforcues për arsyetim: Modeli R1 i DeepSeek përdor të mësuarit përforcues për të përmirësuar arsyetimin e zinxhirit të mendimit, një aspekt jetik i modeleve gjuhësore.
  • Trajnim me shumë shenja: Aftësia e DeepSeek-V3 për të parashikuar pjesë të shumta të tekstit në të njëjtën kohë rrit efikasitetin e trajnimit.

Këto përmirësime i bëjnë modelet DeepSeek në mënyrë dramatike më të lira për t'u trajnuar dhe ekzekutuar kur krahasohen me konkurrentët si OpenAI ose Anthropic. Ndërsa ky është një hap i rëndësishëm përpara për aksesin e LLM-ve, ai mbetet një përsosje inxhinierike dhe jo një përparim konceptual drejt AGI.

Ndikimi i AI me burim të hapur

Një nga vendimet më të dukshme të DeepSeek ishte të bënte modelet e saj burim të hapur—një largim i qartë nga qasjet pronësore, me kopshte me mure të kompanive si OpenAI, Anthropic dhe Google. Kjo qasje me burim të hapur, e përkrahur nga studiues të AI si Yann LeCun i Metës, nxit një ekosistem më të decentralizuar të AI ku inovacioni mund të lulëzojë përmes zhvillimit kolektiv.

Arsyeja ekonomike pas vendimit me burim të hapur të DeepSeek është gjithashtu e qartë. AI me burim të hapur nuk është vetëm një qëndrim filozofik, por një strategji biznesi. Duke e vënë teknologjinë e tij të disponueshme për një gamë të gjerë studiuesish dhe zhvilluesish, DeepSeek po pozicionohet për të përfituar nga shërbimet, integrimi i ndërmarrjeve dhe hostimi i shkallëzuar në vend që të mbështetet vetëm në shitjen e modeleve të pronarit. Kjo qasje i jep komunitetit global të AI qasje në mjetet konkurruese dhe redukton mbytjen e gjigantëve të mëdhenj të teknologjisë perëndimore në hapësirë.

Roli në rritje i Kinës në garën e AI

Për shumë njerëz, fakti që zbulimi i DeepSeek erdhi nga Kina mund të jetë befasues. Megjithatë, ky zhvillim nuk duhet parë me tronditje apo si pjesë e një gare gjeopolitike. Pasi ka kaluar vite duke vëzhguar peizazhin e AI të Kinës, është e qartë se vendi ka bërë investime të konsiderueshme në kërkimin e AI, duke rezultuar në një grup në rritje talentesh dhe ekspertize.

Në vend që të inkuadrohet ky zhvillim si një sfidë ndaj dominimit perëndimor, ai duhet parë si një shenjë e natyrës gjithnjë e më globale të kërkimit të AI. Bashkëpunimi i hapur, jo konkurrenca nacionaliste, është rruga më premtuese drejt zhvillimit të përgjegjshëm dhe etik të AGI. Një përpjekje e decentralizuar, e shpërndarë globalisht, ka shumë më tepër gjasa të prodhojë një AGI që përfiton të gjithë njerëzimin, sesa një që i shërben interesave të një kombi apo korporate të vetme.

Implikimet më të gjera të DeepSeek: Duke parë përtej LLM-ve

Ndërsa pjesa më e madhe e eksitimit rreth DeepSeek sillet rreth efikasitetit të tij në hapësirën LLM, është thelbësore të tërhiqeni dhe të merrni parasysh implikimet më të gjera të këtij zhvillimi.

Pavarësisht aftësive të tyre mbresëlënëse, modelet e bazuara në transformator si LLM janë ende larg arritjes së AGI. Atyre u mungojnë cilësitë thelbësore si abstraksioni i bazuar në përbërje dhe arsyetimi i vetëdrejtuar, të cilat janë të nevojshme për inteligjencën e përgjithshme. Ndërsa LLM-të mund të automatizojnë një gamë të gjerë detyrash ekonomike dhe të integrohen në industri të ndryshme, ato nuk përfaqësojnë thelbin e zhvillimit të AGI.

Nëse AGI do të shfaqet në dekadën e ardhshme, nuk ka gjasa të bazohet thjesht në arkitekturën e transformatorëve. Modelet alternative, të tilla si OpenCog Hyperon ose llogaritja neuromorfike, mund të jenë më thelbësore në arritjen e inteligjencës së përgjithshme të vërtetë.

Komoditizimi i LLM-ve do të zhvendosë investimet në AI

Fitimet e efikasitetit të DeepSeek përshpejtojnë prirjen drejt komoditizimi i LLM-ve. Ndërsa kostot e këtyre modeleve vazhdojnë të bien, investitorët mund të fillojnë të shikojnë përtej arkitekturave tradicionale LLM për zbulimin tjetër të madh në AI. Ne mund të shohim një zhvendosje në financim drejt arkitekturave AGI që shkojnë përtej transformatorëve, si dhe investime në pajisje alternative të AI, të tilla si çipat neuromorfikë ose njësitë e përpunimit shoqërues.

Decentralizimi do të formësojë të ardhmen e AI

Ndërsa përmirësimet e efikasitetit të DeepSeek e bëjnë më të lehtë vendosjen e modeleve të AI, ato po kontribuojnë gjithashtu në tendencën më të gjerë të decentralizimit të arkitekturës së AI. Me fokus në privatësinë, ndërveprueshmërinë dhe kontrollin e përdoruesve, AI e decentralizuar do të zvogëlojë varësinë tonë nga kompanitë e mëdha dhe të centralizuara të teknologjisë. Ky trend është kritik për të siguruar që AI u shërben nevojave të një popullsie globale, në vend që të kontrollohet nga një pjesë e vogël e lojtarëve të fuqishëm.

Vendi i DeepSeek në shpërthimin Kambrian të AI

Si përfundim, ndërsa DeepSeek është një moment historik i madh në efikasitetin e LLM-ve, ai nuk është një ndryshim revolucionar në peizazhin e AI. Përkundrazi, ai përshpejton përparimin përgjatë një trajektoreje të vendosur mirë. Ndikimi më i gjerë i DeepSeek ndihet në disa fusha:

  • Presion mbi pushtetarët: DeepSeek sfidon kompani si OpenAI dhe Anthropic që të rimendojnë modelet e tyre të biznesit dhe të gjejnë mënyra të reja për të konkurruar.
  • Aksesueshmëria e AI: Duke i bërë modelet me cilësi të lartë më të përballueshme, DeepSeek demokratizon aksesin në teknologjinë më të avancuar.
  • Konkurrenca globale: Rritja e rolit të Kinës në zhvillimin e AI sinjalizon natyrën globale të inovacionit, e cila nuk kufizohet vetëm në Perëndim.
  • Përparim eksponencial: DeepSeek është një shembull i qartë se sa përparimi i shpejtë në AI po bëhet normë.

Më e rëndësishmja, DeepSeek shërben si një kujtesë se ndërsa AI po përparon me shpejtësi, AGI e vërtetë ka të ngjarë të shfaqet përmes qasjeve të reja, themelore në vend që të optimizojë modelet e sotme. Ndërsa ne garojmë drejt Singularitetit, është thelbësore të sigurohemi që zhvillimi i AI të mbetet i decentralizuar, i hapur dhe bashkëpunues.

DeepSeek nuk është AGI, por përfaqëson një hap të rëndësishëm përpara në udhëtimin e vazhdueshëm drejt AI transformuese.

Dr Ben Goertzel është një studiues dhe sipërmarrës i AI i specializuar në inteligjencën e përgjithshme artificiale (AGI), mësimin e makinerive dhe sistemet e decentralizuara të AI. Me mbi tre dekada përvojë, ai ka udhëhequr zhvillimin e kornizave të avancuara të AI, duke përfshirë projektin OpenCog dhe SingularityNET, një platformë e decentralizuar e AI. Ai është autor i shumë librave dhe punimeve kërkimore mbi AI, shkencën njohëse dhe sistemet komplekse, dhe shpesh flet për potencialin transformues të AGI.