Connect with us

Myslitelé

Přicházející „exoluce“ AI

mm

Dnes, když jsme na hranici technologické zlomové linie, pozorujeme cestu od LLM (Large Language Models) k agentům a nakonec k agentic AI a AGI, a nejde jen o větší modely nebo rychlejší odpovědi. Jde také o to, že se stroje mění z pasivních asistentů na aktivní spolupracovníky, a možná jednou i na nezávislé myslitele.

Počneme touto cestou a prozkoumáme, co to znamená pro práci, odbornost a samotnou roli lidí při formování inteligence zítřka.

Rozdíl mezi LLM, agentními systémy a agentic AI

Abychom lépe pochopili rozdíl, uvádím příklad. Pokud se zeptám LLM na něco jako: „Chci cestovat z Chicaga do Austinu, řídit maximálně čtyři hodiny denně a zastavit se v malebných místech“, běžný LLM vrátí statickou odpověď v textovém formátu založenou na generaci jazyka. Pravděpodobně pouze zareaguje na žádost bez provedení důkladné analýzy.

Agent nejprve klasifikuje žádost jako cestovní. Poté určí, jaké údaje jsou potřebné: trasy pomocí mapovacích služeb, informace o počasí, náklady na palivo, hotely, restaurace atd. Poté agent rozdělí žádost na podúkoly a směruje je na specializované moduly nebo LLM trénované na relevantních zdrojích. To je orchestrace a koordinace多ných modelů a nástrojů pod jednotnou logikou.

Dnes jsou většina hlavních systémů, jako je ChatGPT nebo Claude od Anthropic, vlastně agenti. Ačkoli to může vypadat, že uživatel interaguje s jediným modelem, ve skutečnosti je za scénou komplexní architektura zahrnující mnoho modelů a systémů. Už mohou zpracovat složité dotazy, ale jejich schopnosti jsou většinou omezeny na poskytování informací;尚 nekonají.

Plně autonomní agent je systém, který shromažďuje informace a může, například, nezávisle rezervovat hotel, zakoupit lístek nebo zahájit platbu, pokud má přístup k relevantním API nebo uživatelským údajům. Takoví agenti jsou目前 ve fázi raného vývoje. V tomto okamžiku jsou více jako semi-agenti, schopní zpracovat informace, ale尚 nekonají autonomní akce.

Zajímavá oblast diskuse ve výzkumné komunitě je agentic AI. Na rozdíl od běžného agenta, jehož chování je skriptováno vývojáři, agentic AI je systém, který nezávisle rozhoduje, které úkoly má provádět, jaké údaje potřebuje a dokonce i jak pokračovat ve svém vlastním tréninku. To jde za hranice provádění instrukcí; zahrnuje autonomní rozhodování. Agentic AI však zůstává teoretická na této úrovni; takové systémy尚 neexistují v praxi.

AGI – nová hranice. Ale je dosažitelná?

Meta investovala do Scale AI před třemi měsíci. Cílem bylo spojit síly na cestě ke stavbě AGI, umělé obecné inteligence, schopné provádět jakýkoli úkol na úrovni člověka nebo dokonce ho přesahující. Pokud dnešní AI je technologická revoluce, AGI bude skutečná mega revoluce; někdy ji nazývám „exolucí“, znamenající „exodus“ AI ze stínů. Kdo ji první dosáhne, získá globální strategickou výhodu.

Co se týče toho, jak blízko jsme k skutečné AGI, závisí to silně na tom, jak ji definujeme. Souhlasím s názorem Ilyi Sutskevera: AGI je systém schopný provádět jakýkoli intelektuální úkol, který může člověk. Nejen zodpovědět otázky, ale také usuzovat, rozhodovat, generalizovat a interpretovat napříč doménami. Skutečná AGI je univerzální a není omezena na úzké hranice úkolů.

Žádný z aktuálních modelů nedosáhl této úrovně. Pohybujeme se tímto směrem, ale skutečná AGI, v teoretickém smyslu,尚 neexistuje. A možná že je to nejlepší. Jsme尚 v fázi aproximace a pravděpodobně v ní zůstaneMequite dlouho.

Základ AGI bude pravděpodobně založen na agentním systému. Nebude se nutně spoléhat na jediný LLM, protože stejně jako žádný jediný člověk, jakkoli brilantní, nemůže zvládnout všechny domény znalostí a dovedností, žádný jediný LLM nemůže zvládnout plný rozsah úkolů AGI sám. Co budeme potřebovat, je druh „kolektivní inteligence“: architektura schopná koordinovat多né modely a komponenty.

AGI pravděpodobně nevznikne z jediného specifického průlomu. Ne z větších LLM, chytřejších agentů nebo zcela nových architektur, ale spíše ze syntézy všech tří. Nejpravděpodobněji něco фундаментálně nového, co přesahuje kategorie, které目前 používáme.

„Poslední zkouška lidstva“ a další AGI benchmarky

„Poslední zkouška lidstva“ (HLE) je jednou z ambicióznějších benchmarků目前 diskutovaných v kontextu LLM, agentů a AGI. Základní je to test složený z asi 2 500 otázek pokrývajících širokou škálu akademických disciplín – matematiku, fyziku, biologii, chemii, inženýrství, počítačové vědy a dokonce i šachy. Nápad je vyhodnotit, zda může AI systém řešit problémy na úrovni, která odráží skutečné lidské porozumění.

Aktuální jazykové modely fungují velmi špatně na HLE, často skórují méně než 5% přesnost. To je v ostrém kontrastu s jinými benchmarky, jako je MMLU nebo GPQA, kde modely dosahují výrazně vyšších skórů. Obtíže, se kterými modely zápasí na HLE, poukazují na to, jak daleko jsou尚 od skutečné obecné inteligence.

Je důležité poznamenat, že vysoký výkon na benchmarcích s známými nebo úzkými datovými sadami neznamená nutně přítomnost skutečné obecné inteligence. Model lze fine-tunovat nebo „trénovat na test“, což může nafouknout jeho zdánlivé schopnosti. Takže i perfektní skóre na HLE by neznamenalo, že jsme dosáhli AGI; pouze by to znamenalo, že jsme prošli jedním konkrétním testem.

Co pohání AGI

Plně souhlasím, že jádrem AGI jsou data, výpočetní výkon a talent. Situace s výpočetním výkonem je jasná. Klíčoví hráči, jako je Meta, se snažili vyprodukovat vlastní čipy, investovali miliardy do vlastního procesu vývoje čipů. Ale společnosti尚 silně závisí na čipech a výpočetním výkonu jiných hráčů, jako je Nvidia, kteří nejen dodávají potřebné hardware, ale také rozumějí důležitosti navýšení produkce.

Více otázek se týká dat a talentů. Internet se vyčerpal — není žádný kus lidsky vytvořeného textu z otevřených zdrojů, který nebyl použit pro trénink v současnosti. Celkový objem informací, který lidstvo dosud vyprodukovalo, se ukázal být překvapivě malým. Proto společnosti začínají aktivně spolupracovat s těmi, kteří mohou generovat vysoce kvalitní lidská data.

Plná automatizace nebo člověk v smyčce?

Další bod – pokles poptávky po manuální anotaci dat. Před několika lety se průmysl rozvíjel plnou parou. Tisíce anotátorů byly najaty, aby uspokojily hlad AI potrubí. Dnes se většina tohoto impetu přesunula směrem k automatizaci. Modely dospěly a také nástroje kolem nich.

Vezměme si rozpoznávání obličeje. Předtím to bylo jedním z hlavních hnacích sil objemu anotace obrázků. Ale tato kategorie je大部分 vyřešena. Modely jako YOLO, SAM a Samurai rychle absorbují rutinní práci. Tyto systémy komprimují týdny manuálního úsilí do několika minut, často s ohromující přesností. Implementovali jsme také mnoho ML-pomocných nástrojů v naší proprietární platformě Keylabs. Skutečně pomáhá snížit rutinní workflow.

Ale všechny tyto modely jsou omezeny svou generalizací a jsou vhodné pro automatizaci standardních a uniformních operací. Složité nebo unikátní případy尚 vyžadují lidskou pozornost.

Odcházíme od starého paradigmatu, kde anotátor byl prostě detailně zaměřená osoba, která mohla rozpoznat objekt nebo emoci. V nové realitě jsou potřební profesionálové: lékaři pro anotaci medicínských obrázků, programátoři pro kódování, architekti pro vytváření plánů, marketéři pro zákaznické vhledy a vojenský experti pro obranné scénáře.

Už vidíme reálné případy, jako jsou bojoví piloti anotující data pro AI a vydělávající 1 000 dolarů za hodinu za svou odbornost. Protože tito specialisté jsou vzácní a jejich znalosti jsou kritické pro trénink vysoce výkonného AI.

Svět se mění: více a více lidí se stává operátory a „trénéry“ umělé inteligence. Před několika dny jsem dostal zprávu na LinkedIn, abych zkontroloval dataset pro AI aplikaci navrženou pro CEO. V budoucnosti může kdokoli z nás dostat nabídku pracovat jako anotátor, ne jen někdo, kdo kliká na tlačítka, ale odborník, jehož znalosti formují inteligenci zítřka.

Už žijeme v této nové realitě, světě označování dat a tréninku AI. Ti, kteří to rozpoznají a přizpůsobí se, získáMequite značnou výhodu.

Michael Abramov je zakladatel a CEO Introspector, který přináší více než 15 let zkušeností se softwarovým inženýrstvím a systémy počítačového vidění AI do budování nástrojů pro označování podnikové třídy.

Michael začal svou kariéru jako softwarový inženýr a manažer výzkumu a vývoje, budování škálovatelných datových systémů a řízení mezioborových inženýrských týmů. Do roku 2025 působil jako CEO Keymakr, společnosti poskytující služby označování dat, kde průkopnickým způsobem zaváděl pracovní postupy s lidskou účastí, pokročilé systémy QA a speciální nástroje na podporu velkých počítačových vidění a autonomních datových potřeb.

Vystudoval bakalářský studijní program v oboru počítačové vědy a má背景 v inženýrství a tvůrčích uměních, což mu umožňuje přistupovat k řešení složitých problémů z mezioborového hlediska. Michael žije na rozhraní technologických inovací, strategického produktového vedení a skutečného dopadu, přičemž pohání další hranice autonomních systémů a inteligentní automatizace.