Umelá inteligencia
Meta's COCONUT: Metóda AI, ktorá myslí bez jazyka

Keď vedci prvýkrát zistili, že veľké jazykové modely (LLM) môžu „premýšľať“ krok za krokom reťazové nabádanie, bol to prelomový moment – konečne sme mohli nahliadnuť do procesu uvažovania týchto čiernych skriniek. Ale čo keby som vám povedal, že prinútiť modely AI premýšľať v prirodzenom jazyku ich môže brzdiť?
To je to, čo výskumníci z Meta a UC San Diego odhalili svojimi nová metóda COCONUT (Chain of Continuous Thought)..
Predstavte si, že sa pokúšate vyriešiť zložitý matematický problém a zároveň ste nútení nahlas rozprávať každý jeden krok. Nepríjemné, však? Teraz sa blížite k pochopeniu základnej výzvy, ktorej čelia jazykové modely.
Keď vytvárame modely AI, argumentujeme prirodzeným jazykom:
- Väčšina tokenov, ktoré generujú, sú len lingvistické lepidlo – slová ako „preto“, „ďalší“ a „následne“, ktoré nepridávajú nulovú hodnotu uvažovania
- Kritické rozhodovacie body sú obmedzené potrebou zaviazať sa ku konkrétnym slovám
- Model vynakladá značné výpočtové úsilie na udržanie gramatickej koherencie, a nie na skutočné riešenie problémov
Výskumníci vo svojich neuroimagingových štúdiách našli niečo zaujímavé: keď ľudia riešia zložité úlohy uvažovania, jazykové centrá nášho mozgu zostávajú často prekvapivo tiché. Napriek tomu vytvárame systémy AI, ktoré robia pravý opak – nútime ich prekladať každý krok uvažovania do slov.
Zamyslite sa nad tým, ako vyriešite hádanku. Vaša myseľ pravdepodobne skúma viacero možností súčasne, zachováva nejasné hypotézy a iba pri zdieľaní riešenia kryštalizuje svoje myšlienky do jazyka. Tradičné prístupy založené na myšlienkovom reťazci však nútia modely AI verbalizovať každý medzikrok, čím vytvárajú „jazykové úzke miesto“.
Tento pohľad viedol k presvedčivej otázke: Čo keby sme mohli nechať modely AI uvažovať v ich rodnom „jazyku“ – kontinuálnom, vysokorozmernom priestore ich skrytých stavov – namiesto toho, aby sme ich prinútili prekladať všetko do tokenov?
Pochopenie inovácií COCONUT
Predstavte si rozdiel medzi vyslovením svojich myšlienok nahlas a skutočným mentálnym procesom, ktorý sa odohráva vo vašom mozgu. Táto priepasť – medzi verbalizovanými myšlienkami a nervovou aktivitou – je presne to, čo výskumníci Meta využili s KOKOSOM.
Skutočný prielom COCONUT spočíva v tom, ako umožňuje modelom AI myslieť dvoma odlišnými spôsobmi, podobne ako to robia ľudia. Zamyslite sa nad tým, keď riešite zložitú hádanku – nerozprávate si každý možný ťah v hlave, však? Namiesto toho vy:
- Absorbujte problém: Prijímate informácie (napríklad čítanie pravidiel hádaniek)
- Myslite potichu: Váš mozog skúma viacero možností bez toho, aby ich dal do slov
- Zdieľajte riešenie: Až potom vysvetlíte ostatným svoje myslenie
COCONUT dáva modelom AI rovnakú prirodzenú flexibilitu. Namiesto toho, aby ich nútil „hovoriť“ každú myšlienku nahlas (ako to robia tradičné metódy), umožňuje im myslieť v ich prirodzenom nervovom priestore – čo vedci nazývajú „latentný priestor“.
Model plynulo prepína medzi dvoma režimami:
- Keď potrebuje porozumieť otázkam alebo odpovedať, používa bežný jazyk
- Ale pre skutočný proces myslenia? Používa čisté nervové vzorce, bez slov

Obrázok: Meta
Výcviková cesta
Jedným z najfascinujúcejších aspektov KOKOSU sú jeho tréningové osnovy. To, čo ho robí výnimočným, je to, že odzrkadľuje prirodzený postup učenia. Zamyslite sa nad tým, ako učíme komplexné zručnosti – nikoho hneď nezavrhnete do úzadia. Budujete postupne a pridávate na zložitosti, keď zvládajú každú úroveň.
Výskumníci zvolili tento presný prístup s COCONUT:
Fáza 1: Nadácia
Po prvé, model sa učí ako ktorákoľvek iná AI – prostredníctvom tradičného myšlienkového uvažovania. To mu dáva pevný základ porozumenia.
2. fáza: Prechod
Tu to začína byť zaujímavé. Postupne sa tieto napísané uvažovacie kroky nahrádzajú nepretržitými myšlienkami. Predstavte si, že pomaly odstraňujete tréningové kolieska a necháte model, aby si vytvoril svoje vlastné vnútorné vzorce myslenia.
Fáza 3: Rovnováha
Nakoniec sa model naučí plynulo prepínať medzi hlbokým myslením v latentnom priestore a komunikovaním svojich poznatkov jasným jazykom.
Počas tréningu model vyvinul schopnosti, ktoré nikto explicitne nenaprogramoval – napríklad zvažovanie viacerých spôsobov uvažovania súčasne. Toto vznikajúce správanie je obzvlášť vzrušujúce, pretože naznačuje, že by sme sa mohli približovať k prirodzenejším formám uvažovania AI. Práve tento neočakávaný vývoj často vedie k tým najväčším prelomom.
Pamätáte si na tie neuroimagingové štúdie, ktoré som už spomenul? Ukázali, že ľudské mozgy často spracovávajú zložité úlohy uvažovania bez toho, aby silne zapájali jazykové centrá. Zdá sa, že COCONUT vyvíja podobné vzorce – myslí hlboko vo svojom natívnom nervovom priestore a na jazyk sa premieňa len vtedy, keď je to potrebné na komunikáciu.
Čísla rozprávajú príbeh
Z výskumu vyplynulo niekoľko ďalších kľúčových zistení:
- Úlohy s matematickými slovami (GSM8k): Tu COCONUT dosiahol presnosť 34.1 %. Aj keď to nedosahuje tradičný reťazec myšlienok (42.9 %), je to výrazne lepšie ako základné prístupy.
- Logická dedukcia (ProntoQA): COCONUT dosiahol presnosť 99.8 %, čím prekonal tradičný reťazec myšlienok 98.8 %. Ale tu je to kicker – podarilo sa to pri použití iba 9 tokenov v porovnaní s CoT 92.5.
- Komplexné plánovanie (ProsQA): Najpôsobivejšie výsledky priniesol tento pokročilý test uvažovania. COCONUT dosiahol presnosť 97 %, zatiaľ čo tradičné metódy dosiahli iba 77.5 %. A opäť to urobilo s pozoruhodnou účinnosťou – 14.2 tokenov oproti 49.4.
To, čo robí tieto výsledky sľubnými, nie sú len hrubé čísla – je to to, čo odhaľujú o rôznych typoch myslenia. Aj keď KOKOS stále nachádza svoju základňu s matematickým uvažovaním, vyniká v úlohách vyžadujúcich zložité logické plánovanie a dedukciu.
COCONUT predstavuje zásadné prehodnotenie toho, ako môžu systémy AI uvažovať, a posúva nás bližšie k prirodzenejším, efektívnejším a výkonnejším formám umelej inteligencie. Cesta od uvažovania založeného na jazyku k nepretržitému mysleniu je krokom k schopnejším a efektívnejším systémom AI.