Umělá inteligence
Nová intuice AI: Proč je důležité přemýšlet chytřeji než déle

Pokroky v oblasti umělé inteligence (AI) byly dlouho poháněny vírou, že zvýšení dat a výpočetní síly může zlepšit výkon. Tento “brutální” přístup vedl k působivým AI systémům, jako je GPT-3, které se během let výborně osvědčily. Nicméně, tento paradigm je dosahující svých limitů. Jak se AI problémy stávají složitějšími, je zřejmé, že jednoduše přidání více výpočetní síly nebude udržitelným nebo efektivní řešením pro dlouhodobý pokrok. Tato realizace vedla výzkumníky k přehodnocení svého přístupu k AI vývoji. V tomto kontextu, Deep Cogito’s Cogito v2 model představuje nový přístup, který by mohl změnit budoucnost AI vývoje. Místo toho, aby se spoléhal na více výpočetní síly nebo prodloužené myšlení, Cogito v2 vyvíjí vnitřní “intuici”, která vede model k identifikaci správných cest, než dokonce začne hledání. To je posun v paradigmatu, jak je AI vyvíjen, zaměřením se na lepší myšlení, ne na delší.
Pošup v AI Vývoji
Po mnoho let, hnací silou za AI pokroky byla myšlenka, že “více je lepší.” Tento přístup vedl k AI modelům, které generují rozsáhlé myšlení řetězce, aby řešily složitými problémy. OpenAI’s modely, jako GPT-3, jsou příkladem tohoto přístupu, kde delší myšlení řetězce vedly k působivým výsledkům na obtížných úkolech. Zatímco tato metoda produkovala působivé výsledky, má významné nevýhody. Delší myšlení řetězce vyžadují více výpočetních zdrojů, což vede k pomalejším inferenčním časům a vyšším provozním nákladům. Kromě toho, výzkum ukázal, že tyto prodloužené procesy často vedou k klesajícím návratům, kde delší myšlení vede k většímu zkreslení a menší efektivitě. Základní problém je, že spoléhání se na dlouhé myšlení řetězce a zvýšení výpočetní síly již není efektivní řešením pro řešení složitých AI problémů. Tyto přístupy jsou omezeny jejich obrovskými výpočetními časy a paměťovými požadavky.
Proč “intuice” záleží v AI
Na rozdíl od současných AI systémů, které se spoléhají na prodloužené myšlení, lidé často spoléhají na to, co se nazývá “intuice” (forma rychlé, intuitivní úsudku), aby řešili problémy. Zatímco intuice může vypadat jako abstraktní koncept, je často výsledkem let zkušeností, učení a kontextové zpracování, které umožňuje lidem dělat rychlé rozhodnutí, aniž by museli plně analyzovat každý detail. Je to tento typ intuice, který odděluje surovou výpočetní sílu od lidského myšlení. Lidé budují tuto “intuici” prostřednictvím rozpoznávání vzorců a nahromaděných zkušeností a umožňuje jim dělat rozhodnutí, aniž by museli vyčerpávajícím způsobem prozkoumat každou možnou možnost. Nová “intuice” AI se snaží replikovat tento proces.
Tato idea, také nazývaná “inteligence předchozí”, by mohla být klíčem k povýšení AI systémů s lidským myšlením a dělat je více efektivními. AI modely se silnou inteligencí předchozí mohou předpovědět, které řešení je pravděpodobně úspěšné, aniž by musely projít rozsáhlým výpočtem. Místo spoléhání se na vyčerpávající vyhledávací metody, intuice umožňuje AI systémům využít předchozí znalosti, zaměřením se na nejúčinnější cesty k řešení.
Jak Cogito v2 zahrnulo “intuici”
Cogito zahrnulo ideu “intuice” (více technicky, inteligence předchozí) do svého nedávno vydaného modelu Cogito v2. Zahrnuli tuto ideu pomocí mechanismu nazývaného Iterated Distillation and Amplification (IDA). Tento mechanismus umožňuje modelu učit se ze svého vlastního myšlení procesu a rafinovat své problémové dovednosti v průběhu času. Místo spoléhání se na statické podněty nebo pevné učitele, IDA umožňuje AI distilovat úspěšné myšlení cesty zpět do jeho jádra modelu parametrů. Tento proces sebezdokonalování rafinuje modelovy myšlení schopnosti v průběhu času, optimalizuje nejen pro přesné odpovědi, ale pro nejúčinnější metody myšlení.
-
Iterated Distillation and Amplification (IDA)
Chcete-li pochopit, jak IDA funguje, můžeme se podívat na duální proces teorii, která dělí lidské myšlení na dva systémy: Systém 1 a Systém 2. Systém 1 se týká rychlé, intuitivní rozhodování, zatímco Systém 2 je pomalejší, s více úmyslným myšlením. Teorie naznačuje, že lidé spoléhají na Systém 1 pro většinu úkolů, ale přepínají na Systém 2, když jsou konfrontováni s více složitými rozhodnutími.
IDA je dvoufázový cyklus: amplifikace a destilace. V amplifikační fázi, model používá intenzivní výpočetní metody, aby generoval vysoce kvalitní řešení nebo myšlení stopy. To je jako Systém 2 myšlení, kde AI bere čas, aby pečlivě vyhodnotil potenciální řešení. V destilační fázi, model pak internalizuje poznatky z amplifikační fáze, transformuje myšlení proces z Systému 2 na Systém 1. Stejně jako lidský řidič se stává více intuitivním po získání zkušeností, AI model s IDA může dělat rychlejší, více efektivní rozhodnutí v průběhu času.
Klíčová idea za IDA je použít výpočetně intenzivní myšlení v amplifikační fázi, pak destilovat vylepšené myšlení zpět do modelu parametrů. Tento proces umožňuje modelu internalizovat efektivní myšlení strategie, které budují jeho kapacitu myslet intuitivně, když řeší problémy. Opakováním tohoto cyklu, AI systém neustále zlepšuje svou schopnost dělat rozhodnutí s méně výpočetními zdroji.
Výhody integrace “intuice” do AI
Jednou z hlavních výhod AI “intuice” je její efektivita. Modely, jako Cogito v2, demonstrují myšlení řetězce, které jsou až o 60% kratší než ty u konkurenčních modelů. To znamená, že mohou dosáhnout odpovědí s méně vnitřními kroky, snižují čas a zdroje vyžadované pro inferenci. Například, problém, který by mohl vyžadovat DeepSeek R1 více než 200 tokenů, aby jej vyřešil, může být dokončen Cogito v2 v méně než 100 tokenů.
Kromě toho, náklady na školení Cogito v2 jsou významně nižší než u tradičních AI modelů. Celý proces školení pro Cogito v2, pokrývající širokou škálu parametrů, stál méně než 3,5 milionu dolarů, což je mnohem méně než náklady spojené s velkými modely, jako je GPT-4.
Cogito v2 také prokázalo emergentní schopnosti v oblastech, pro které nebyl explicitně trénován. Například, přestože byl trénován primárně na textu, Cogito v2 může myslet o obrazech, získává poznatky o kompozici a habitatech. Tato cross-modální myšlení schopnost je významným krokem směrem k generalizované inteligenci, důležité milníku na cestě k Umělé obecné inteligenci (AGI).
Přehodnocení AI Vývoje
Úspěch inteligence předchozí naznačuje, že AI vývojové strategie potřebují fundamentální posun. Místo toho, aby se jednoduše škálovaly modely nebo zvyšovaly výpočetní zdroje, AI vývoj by se měl zaměřit na budování systémů, které mohou vyvíjet a rafinovat své vlastní kognitivní strategie. Tento posun odráží lidský kognitivní vývoj, kde inteligence není výsledkem většího mozku nebo více myšlení času, ale spíše lepšími mentálními modely a myšleními strategiemi. Tato změna přístupu by mohla mít dlouhodobé důsledky. Zlepšováním inteligentního myšlení nad surovou výpočetní sílu, AI může stát se více všestranným, přizpůsobivým a schopným zvládat nové výzvy. Tento posun by mohl urychlit aplikaci AI v odvětvích, jako je zdravotnictví, kybernetická bezpečnost a autonomní doprava, dělají AI systémy více efektivními, nákladově efektivními a dopadovými.
Závěrečné shrnutí
Úspěch Cogito v2 demonstruje, že budoucnost AI leží ne ve škálování modelů nebo zvyšování výpočetní síly, ale v rafinování myšlení architektur a optimalizaci pro chytřejší řešení problémů. Tento posun slibuje více udržitelnou a přístupnou budoucnost pro AI, kde systémy mohou neustále zlepšovat a adaptovat se méně závislostí na obrovských výpočetních zdrojích. Zlepšováním inteligentního myšlení nad brutální výpočetní sílu, AI může stát se více schopným řešit složitými, reálnými problémy.












