Umělá inteligence

Odhalení Manus AI: Čínský průlom v plně autonomních agentech AI

mm

Stejně jako se začíná usazovat prach na DeepSeek, další průlom od čínského startupu otřásá internetem. Tentokrát se nejedná o generativní model AI, ale o plně autonomního agenta AI, Manus, spuštěného čínskou společností Monica 6. března 2025. Na rozdíl od generativních modelů AI, jako je ChatGPT a DeepSeek, které jednoduše reagují na podněty, je Manus navržen tak, aby pracoval nezávisle, činil rozhodnutí, prováděl úkoly a generoval výsledky s minimálním lidským zásahem. Tento vývoj signalizuje posun v oblasti vývoje AI, přecházející od reaktivních modelů k plně autonomním agentům. Tento článek zkoumá architekturu Manus AI, jeho silné a slabé stránky a jeho potenciální dopad na budoucnost autonomních systémů AI.

Prozkoumání Manus AI: Hybridní přístup k autonomnímu agentovi

Název “Manus” je odvozen z latinské fráze Mens et Manus, která znamená Mysl a Ruka. Tato nomenklatura dokonale popisuje dvojí schopnosti Manus myslet (zpracovávat komplexní informace a činit rozhodnutí) a jednat (provádět úkoly a generovat výsledky). Pro myšlení se Manus spoléhá na velké jazykové modely (LLM), a pro akci integruje LLM s tradičními automaťáky.

Manus následuje neuro-symbolický přístup pro provádění úkolů. V tomto přístupu využívá LLM, včetně Anthropic’s Claude 3.5 Sonnet a Alibaba’s Qwen, pro interpretaci přirozených jazykových podnětů a generování akčních plánů. LLM jsou doplněny deterministickými skripty pro zpracování dat a systémové operace. Například, zatímco LLM může vytvořit Python kód pro analýzu datové sady, backend Manus provede kód v kontrolovaném prostředí, ověří výstup a upraví parametry, pokud dojde k chybám. Tento hybridní model vyvažuje kreativitu generativního AI s spolehlivostí naprogramovaných pracovních postupů, umožňující mu provádět komplexní úkoly, jako je nasazení webových aplikací nebo automatizace interakcí napříč platformami.

V jádru Manus AI funguje prostřednictvím strukturované smyčky agenta, která napodobuje lidské rozhodovací procesy. Když je dán úkol, nejprve analyzuje požadavek, aby identifikoval cíle a omezení. Následně vybere nástroje ze svého nástrojového boxu – jako webové scrapeři, procesory dat nebo interpretery kódu – a provede příkazy v bezpečném Linux sandboxovém prostředí. Tento sandbox umožňuje Manus nainstalovat software, manipulovat soubory a interagovat s webovými aplikacemi, zatímco zabraňuje neoprávněnému přístupu k externím systémům. Po každé akci AI vyhodnotí výsledky, iteruje na svém přístupu a rafinuje výsledky, dokud úkol nesplní předem stanovená kritéria úspěchu.

Architektura agenta a prostředí

Jednou z hlavních funkcí Manus je jeho multi-agentní architektura. Tato architektura se主要ně spoléhá na centrální “executor” agent, který je zodpovědný za správu různých specializovaných sub-agentů. Tyto sub-agenty jsou schopny zpracovat specifické úkoly, jako je prohlížení webu, analýza dat nebo dokonce kódování, což umožňuje Manus pracovat na multi-krokových problémech bez potřeby dalšího lidského zásahu. Kromě toho Manus funguje v cloudovém asynchronním prostředí. Uživatelé mohou přiřadit úkoly Manus a poté se odpojit, vědouce, že agent bude pokračovat v práci na pozadí, a výsledky budou odeslány, jakmile budou dokončeny.

Provedení a benchmarking

Manus AI již dosáhl významného úspěchu v průmyslových standardních testech výkonu. Prokázal špičkové výsledky v GAIA Benchmark, testu vytvořeném Meta AI, Hugging Face a AutoGPT pro vyhodnocení výkonu agenticích systémů AI. Tento benchmark hodnotí schopnost AI logicky uvažovat, zpracovávat multi-modální data a provádět reálné úkoly pomocí externích nástrojů. Provedení Manus AI v tomto testu jej staví před zavedené hráče, jako je OpenAI’s GPT-4 a modely Google, čímž se stává jedním z nej pokrokovějších obecných agentů AI dostupných dnes.

Případy použití

Pro demonstraci praktických schopností Manus AI, vývojáři předvedli řadu působivých případů použití během jeho spuštění. V jednom takovém případě byl Manus AI požádán o zpracování náborového procesu. Když dostal kolekci životopisů, Manus je neonly filtroval podle klíčových slov nebo kvalifikací. Šel dále tím, že analyzoval každý životopis, křížově odkazy dovedností s trendy na trhu práce a nakonec předložil uživateli podrobnou náborovou zprávu a optimalizované rozhodnutí. Manus dokončil tento úkol bez potřeby dalšího lidského zásahu nebo dohledu. Tento případ ukazuje jeho schopnost zpracovat komplexní workflow autonomně.

Podobně, když byl požádán o generování personalizovaného cestovního itineráře, Manus zohlednil nejen preference uživatele, ale také vnější faktory, jako jsou počasí, lokální statistiky zločinnosti a trendů pronájmu. To šlo za jednoduchým získáním dat a odrazilo hlubší pochopení nestátých potřeb uživatele, ilustrující schopnost Manus provádět nezávislé, kontextově vědomé úkoly.

V další demonstraci byl Manus požádán o napsání biografie a vytvoření osobní webové stránky pro technického spisovatele. V několika minutách Manus získal data ze sociálních médií, složil komplexní biografii, navrhl webovou stránku a nasadil ji. Dokonce i opravil problémy s hostováním autonomně.

V sektoru financí byl Manus požádán o provedení korelační analýzy cen akcií NVDA (NVIDIA), MRVL (Marvell Technology) a TSM (Taiwan Semiconductor Manufacturing Company) za posledních tři roky. Manus začal shromažďováním relevantních dat z YahooFinance API. Poté automaticky napsal nezbytný kód pro analýzu a vizualizaci dat o cenách akcií. Následně Manus vytvořil webovou stránku pro zobrazení analýzy a vizualizací, generující sdílený odkaz pro snadný přístup.

Výzvy a etické úvahy

Navzdory jeho pozoruhodným případům použití, Manus AI také čelí několika technickým a etickým výzvám. Raní adoptéři hlásili problémy se systémem, který vstupuje do “smůlek”, kde opakovaně provádí neúčinné akce, vyžadující lidský zásah k resetování úkolů. Tyto závady zdůrazňují výzvu při vývoji AI, která může konzistentně navigovat v neuspořádaných prostředích.

Kromě toho, zatímco Manus funguje v izolovaných sandboxových prostředích z bezpečnostních důvodů, jeho webové automatizační schopnosti vyvolávají obavy o potenciální zneužití, jako je získávání chráněných dat nebo manipulace s online platformami.

Transparentnost je dalším klíčovým problémem. Vývojáři Manus zdůrazňují úspěchy, ale nezávislé ověření jeho schopností je omezené. Například, zatímco jeho demo generování dashboardu funguje hladce, uživatelé pozorovali nekonzistence, když aplikovali AI na nové nebo komplexní scénáře. Tento nedostatek transparentnosti činí obtížným budovat důvěru, zejména když podniky zvažují delegování citlivých úkolů autonomním systémům. Kromě toho absence jasných metrik pro hodnocení “autonomie” agentů AI zanechává prostor pro skepsi, zda Manus představuje skutečný pokrok nebo pouze sofistikovanou marketingovou strategii.

Závěrečné shrnutí

Manus AI představuje další hranici v oblasti umělé inteligence: autonomní agenty schopné provádět úkoly napříč širokým spektrem odvětví, nezávisle a bez lidského dohledu. Jeho vznik signalizuje začátek nové éry, ve které AI dělá více než jen asistuje – jedná se o plně integrovaný systém, schopný zpracovat komplexní workflow od začátku do konce.

Zatímco je stále brzy ve vývoji Manus AI, potenciální implikace jsou zřejmé. Jak se systémy AI, jako je Manus, stanou sofistikovanějšími, mohly by předefinovat odvětví, přebudovat trh práce a dokonce zpochybnit naše chápání toho, co znamená pracovat. Budoucnost AI již není omezena na pasivní asistenty – jedná se o vytváření systémů, které myslí, jednají a učí se samy. Manus je teprve začátek.

Dr. Tehseen Zia je docent s trvalým úvazkem na COMSATS University Islamabad, držitel titulu PhD v oblasti AI z Vienna University of Technology, Rakousko. Specializuje se na umělou inteligenci, strojové učení, datové vědy a počítačové vidění, a významně přispěl publikacemi v renomovaných vědeckých časopisech. Dr. Tehseen také vedl různé průmyslové projekty jako hlavní výzkumník a působil jako konzultant pro umělou inteligenci.