Myslitelé
Přicházející „exoluce“ AI

Dnes, když jsme na hranici technologické zlomové linie, sledujeme cestu od LLMs k agentům a nakonec k agentic AI a AGI, a nejde jen o větší modely nebo rychlejší odpovědi. Jde také o to, že se stroje mění z pasivních asistentů na aktivní spolupracovníky, a možná jednoho dne i na nezávislé myslitele.
Zkusme sledovat tuto cestu a prozkoumat, co to znamená pro práci, odbornost a samotnou roli lidí při formování inteligence zítřka.
Rozdíl mezi LLMs, agentními systémy a agentic AI
Pro lepší pochopení rozdílu je zde příklad. Pokud se zeptám LLM na něco jako: „Chci cestovat z Chicaga do Austinu, jet maximálně čtyři hodiny denně a zastavit se v malebných místech“, běžný LLM vrátí statickou odpověď v textovém formátu založenou na generaci jazyka. Pravděpodobně bude reagovat pouze na žádost bez provedení důkladné analýzy.
Agent by nejprve klasifikoval žádost jako cestovní. Poté by určil, jaké údaje jsou potřebné: trasy pomocí mapovacích služeb, informace o počasí, náklady na palivo, hotely, restaurace atd. Po té by agent rozdělil žádost na podúkoly a směroval je na specializované moduly nebo LLMs školené na relevantních zdrojích. To je orchestrace a koordinace více modelů a nástrojů pod jednotnou logikou.
Dnes jsou většina hlavních systémů, jako je ChatGPT nebo Claude z Anthropic, vlastně již agenti. Ačkoli to může vypadat, že uživatel interaguje s jediným modelem, ve skutečnosti je za scénou komplexní architektura zahrnující mnoho modelů a systémů. Už mohou zpracovat složité dotazy, ale jejich schopnosti jsou většinou omezeny na poskytování informací;尚 nekonají.
Plně autonomní agent je systém, který shromažďuje informace a může, například, nezávisle rezervovat hotel, koupit lístek nebo zahájit platbu, pokud má přístup k relevantním API nebo uživatelským údajům. Takoví agenti jsou目前 ve fázi raného vývoje. V tomto okamžiku jsou více jako semi-agenti, schopní zpracovat informace, ale尚 nekonají autonomní akce.
Zajímavá oblast diskuse ve výzkumné komunitě je agentic AI. Na rozdíl od běžného agenta, jehož chování je skriptováno vývojáři, agentic AI je systém, který nezávisle rozhoduje, které úkoly provádět, jaké údaje potřebuje a dokonce i jak pokračovat ve svém vlastním školení. To jde za hranice provádění instrukcí; zahrnuje autonomní rozhodování. Agentic AI však zůstává teoretická v této fázi; takové systémy尚 neexistují v praxi.
AGI – nová hranice. Ale je dosažitelná?
Meta investovala do Scale AI před třemi měsíci. Cílem bylo spojit síly na cestě ke stavbě AGI, umělé obecné inteligence, schopné provádět jakoukoli úlohu na úrovni člověka nebo dokonce ji přesahující. Pokud dnešní AI je technologická revoluce, AGI bude skutečná mega revoluce; někdy ji nazývám „exolucí“, což znamená „exodus“ AI ze stínů. Kdo ji první dosáhne, získá globální strategickou výhodu.
Co se týče toho, jak blízko jsme k skutečnému AGI, to závisí silně na tom, jak ji definujeme. Souhlasím s názorem Ilyi Sutskevera: AGI je systém schopný provádět jakoukoli intelektuální úlohu, kterou může člověk. Nejen odpovídat na otázky, ale také rozumět, rozhodovat, generalizovat a interpretovat napříč doménami. Skutečná AGI je univerzální a není omezena na úzké hranice úkolů.
Žádný z aktuálních modelů nedosáhl této úrovně. Pohybujeme se tímto směrem, ale skutečná AGI, v teoretickém smyslu,尚 neexistuje. A možná že je to nejlepší. Jsme尚 ve fázi aproximace a je pravděpodobné, že v ní zůstaneme po nějakou dobu.
Základ AGI bude pravděpodobně založen na agentním systému. Nebude nutně záviset na jediném LLM, protože stejně jako žádný jediný člověk, bez ohledu na to, jak géniovský, nemůže ovládnout všechny domény znalostí a dovedností, žádný jediný LLM nemůže zvládnout celý spektrum úkolů AGI sám. Co budeme potřebovat, je druh „kolektivní inteligence“: architektura schopná koordinovat více modelů a komponent.
AGI pravděpodobně nevznikne z jediného specifického průlomu. Ne z větších LLMs, chytřejších agentů nebo zcela nových architektur, ale spíše z syntézy všech tří. Nejpravděpodobněji něco фундаментálně nového, co přesahuje kategorie, které目前 používáme.
„Poslední zkouška lidstva“ a další AGI benchmarky
„Poslední zkouška lidstva“ (HLE) je jedna z ambicióznějších benchmarků目前 diskutovaných v kontextu LLMs, Agentů a AGI. Základní je to test složený z around 2 500 otázek pokrývajících širokou škálu akademických disciplín – matematiku, fyziku, biologii, chemii, inženýrství, počítačové vědy a dokonce i šachy. Nápad je vyhodnotit, zda může AI systém řešit problémy na úrovni skutečného lidského porozumění.
Aktuální jazykové modely fungují velmi špatně na HLE, často skórují méně než 5% přesnost. To je v ostrém kontrastu s jinými benchmarky, jako je MMLU nebo GPQA, kde modely dosahují výrazně vyšších skórů. Obtíž, kterou modely mají s HLE, zdůrazňuje, jak daleko jsou尚 od skutečné obecné inteligence.
Je důležité poznamenat, že vysoký výkon na benchmarcích s známými nebo úzkými datovými sadami neznamená nutně přítomnost skutečné obecné inteligence. Model může být fine-tuned nebo „školený na test“, což může nafouknout jeho zdánlivé schopnosti. Takže i perfektní skór na HLE by neznamenal, že jsme dosáhli AGI; by to znamenalo pouze to, že jsme prošli jedním konkrétním testem.
Co pohání AGI
Plně souhlasím, že jádrem AGI jsou data, výpočetní výkon a talent. Situace s výpočetním výkonem je jasná. Klíčoví hráči, jako je Meta, se pokusili vyprodukovat vlastní čipy, investovali miliardy do vlastního procesu vývoje čipů. Ale společnosti尚 silně závisí na čipech a výpočetním výkonu jiných hráčů, jako je Nvidia, kteří nejen dodávají potřebné hardware, ale také rozumějí důležitosti škálování produkce.
Více otázek se týká dat a talentů. Internet se vyčerpal — neexistuje žádný kus lidsky vytvořeného textu z otevřených zdrojů, který by尚 nebyl použit pro školení. Celkový objem informací, který lidstvo dosud vyprodukovalo, se ukázal být překvapivě malý. Proto společnosti začínají aktivně spolupracovat s těmi, kteří mohou generovat vysoce kvalitní lidská data.
Plná automatizace nebo human-in-the-loop?
Další bod — pokles poptávky po manuální anotaci dat. Před několika lety se průmysl rozvíjel plnou parou. Tisíce anotátorů byly najaty, aby uspokojily hlad AI potrubí. Dnes se většina tohoto impetu přesunula směrem k automatizaci. Modely dospěly a stejně tak i nástroje kolem nich.
Vezměme si rozpoznávání obličeje. Předtím to bylo jedním z hlavních taháků objemu anotace obrázků. Ale tato kategorie je nyní z velké části vyřešena. Modely jako YOLO, SAM a Samurai rychle absorbují rutinní práci. Tyto systémy komprimují týdny manuální práce do minut, často s ohromující přesností. Implementovali jsme také mnoho ML-pomocných nástrojů v naší proprietární platformě Keylabs. Skutečně pomáhá snížit rutinní workflow.
Ale všechny tyto modely jsou omezeny svou generalizací a jsou vhodné pro automatizaci standardních a uniformních operací. Složité nebo unikátní případy尚 vyžadují lidskou pozornost.
Odcházíme od starého paradigmatu, kde anotátor byl prostě detailně zaměřená osoba, která mohla rozpoznat objekt nebo emoci. V nové realitě jsou potřeba profesionálové: lékaři k anotaci lékařských obrázků, programátoři kódování, architekti vytvářející modré tiskopisy, marketéři pro zákaznické informace a vojenský expert pro obranné scénáře.
Už jsme viděli reálné případy, jako jsou bojoví piloti anotující data pro AI a vydělávající 1 000 dolarů za hodinu za svou odbornost. Protože tito specialisté jsou vzácní a jejich znalosti jsou kritické pro školení vysoce výkonného AI.
Svět se mění: více a více lidí se stává operátory a „trenéry“ umělé inteligence. Před několika dny jsem dostal zprávu na LinkedIn, abych zkontroloval datovou sadu pro AI aplikaci navrženou pro CEO. V budoucnosti může kdokoli z nás dostat nabídku pracovat jako anotátor, ne jen někdo, kdo kliká na tlačítka, ale odborník, jehož znalosti formují inteligenci zítřka.
Už žijeme v této nové realitě, světě anotace dat a školení AI. Ti, kteří to rozpoznají a přizpůsobí se, získáají významnou výhodu.












