Моделі та платформи ШІ

Розкриття Manus AI: Гібридний підхід до автономного агента

mm

Як тільки пил починає осідати на DeepSeek, інший прорив від китайського стартапу викликав бурю в інтернеті. Цього разу це не генераційний модель штучного інтелекту, а повністю автономний агент штучного інтелекту, Manus, запущений китайською компанією Monica 6 березня 2025 року. На відміну від генераційних моделей штучного інтелекту, таких як ChatGPT і DeepSeek, які просто реагують на запити, Manus призначений для незалежної роботи, прийняття рішень, виконання завдань і отримання результатів з мінімальним втручанням людини. Це розвиток сигналізує про зміну парадигми розвитку штучного інтелекту, рух від реактивних моделей до повністю автономних агентів. Ця стаття досліджує архітектуру Manus AI, його сильні сторони та обмеження, а також його потенційний вплив на майбутнє автономних систем штучного інтелекту.

Дослідження Manus AI: Гібридний підхід до автономного агента

Назва “Manus” походить від латинської фрази Mens et Manus, яка означає “Розум і рука”. Ця номенклатура досконало описує подвійні можливості Manus мислити (обробляти складну інформацію та приймати рішення) і діяти (виконувати завдання та генерувати результати). Для мислення Manus спирається на великі мовні моделі (LLM), а для дії він інтегрує LLM з традиційними інструментами автоматизації.

Manus слідує за нейро-символічним підходом для виконання завдань. У цьому підході він використовує LLM, включаючи Anthropic’s Claude 3.5 Sonnet і Alibaba’s Qwen, для інтерпретації природної мови та генерації дієвого плану. LLM доповнюються детерміністичними скриптами для обробки даних та системних операцій. Наприклад, тоді як LLM може створити код Python для аналізу набору даних, бекенд Manus виконує код у контрольованому середовищі, перевіряє результати та коригує параметри, якщо виникають помилки. Ця гібридна модель балансує креативність генераційних моделей штучного інтелекту з надійністю запрограмованих робочих процесів, дозволяючи йому виконувати складні завдання, такі як розгортання веб-додатків або автоматизація взаємодії між платформами.

У своєму ядрі Manus AI працює через структурований агентський цикл, який імітує процеси прийняття рішень людини. Коли йому доручають завдання, він спочатку аналізує запит для визначення цілей та обмежень. Далі він вибирає інструменти з свого інструментарію – таких як веб-скрейпери, обробники даних або інтерпретатори коду – і виконує команди у безпечному середовищі Linux sandbox. Це середовище sandbox дозволяє Manus встановлювати програмне забезпечення, маніпулювати файлами та взаємодіяти з веб-додатками, одночасно запобігаючи несанкціонованому доступу до зовнішніх систем. Після кожної дії штучний інтелект оцінює результати, ітерує свій підхід та уточнює результати до тих пір, поки завдання не буде виконано згідно з визначеними критеріями успіху.

Архітектура агента та середовище

Однією з ключових особливостей Manus є його багатозадачна архітектура. Ця архітектура головним чином спирається на центральний “виконавчий” агент, який відповідає за управління різними спеціалізованими суб-агентами. Ці суб-агенти здатні виконувати конкретні завдання, такі як перегляд веб-сторінок, аналіз даних або навіть програмування, що дозволяє Manus працювати над багатокроковими проблемами без необхідності додаткового втручання людини. Крім того, Manus працює в хмарному асинхронному середовищі. Користувачі можуть призначити завдання Manus, а потім роз’єднатися, знаючи, що агент продовжить роботу в тлі, надсилаючи результати після завершення.

Продуктивність та бенчмаркінг

Manus AI вже досяг значного успіху в промислових стандартах продуктивності. Він продемонстрував результати рівня стану мистецтва в GAIA Benchmark, тесті, створеному Meta AI, Hugging Face та AutoGPT для оцінки продуктивності агентських систем штучного інтелекту. Цей бенчмарк оцінює здатність штучного інтелекту логічно мислити, обробляти мульти-модальні дані та виконувати реальні завдання за допомогою зовнішніх інструментів. Продуктивність Manus AI в цьому тесті ставить його попереду встановлених гравців, таких як OpenAI’s GPT-4 та моделі Google, встановлюючи його одним з найбільш просунутих загальних агентів штучного інтелекту, доступних сьогодні.

Використання випадків

Для демонстрації практичних можливостей Manus AI розробники показали серію вражаючих випадків використання під час його запуску. У одному з таких випадків Manus AI був запитаний на обробку процесу найму. Коли йому було надано колекцію резюме, Manus не просто відсортував їх за ключовими словами або кваліфікацією. Він пішов далі, проаналізувавши кожне резюме, перехрестивши навички з тенденціями ринку праці та в кінцевому підсумку представивши користувачеві детальний звіт про найм та оптимізоване рішення. Manus виконав це завдання без необхідності додаткового втручання людини або нагляду. Цей випадок демонструє його здатність обробляти складний робочий процес автономно.

Аналогічно, коли його запитали на генерацію персоналізованого маршруту подорожі, Manus врахував не тільки переваги користувача, але й зовнішні фактори, такі як погодні умови, місцеві статистичні дані злочинності та тенденції оренди. Це вийшло за рамки простого отримання даних і відображало глибше розуміння неявних потреб користувача, демонструючи здатність Manus виконувати незалежні, контекстно-чутливі завдання.

У іншому демонстраційному прикладі Manus був доручений написати біографію та створити особистий веб-сайт для технічного письменника. За кілька хвилин Manus зібрав дані з соціальних мереж, склав повну біографію, спроектував веб-сайт та розгорнув його онлайн. Він навіть виправив проблеми з хостингом автономно.

У фінансовому секторі Manus був доручений виконати аналіз кореляції цін акцій NVDA (NVIDIA), MRVL (Marvell Technology) та TSM (Taiwan Semiconductor Manufacturing Company) за останні три роки. Manus почав з збору відповідних даних з YahooFinance API. Потім він автоматично написав необхідний код для аналізу та візуалізації даних про ціни акцій. Після цього Manus створив веб-сайт для відображення аналізу та візуалізацій, згенерувавши посилання для легкого доступу.

Виклики та етичні розгляди

Незважаючи на свої вражаючі випадки використання, Manus AI також стикається з кількома технічними та етичними викликами. Ранні адоптери повідомили про проблеми з системою, яка потрапляє у “цикли”, де вона повторно виконує неефективні дії, вимагаючи втручання людини для скидання завдань. Ці глічі підкреслюють складність розробки штучного інтелекту, який може постійно орієнтуватися в неструктурованих середовищах.

Крім того, хоча Manus працює в ізольованих sandbox заради безпеки, його можливості веб-автоматизації викликають занепокоєння щодо потенційного зловживання, такого як збирання захищених даних або маніпулювання онлайн-платформами.

Прозорість також є ключовим питанням. Розробники Manus підкреслюють історії успіху, але незалежна верифікація його можливостей обмежена. Наприклад, тоді як його демонстрація генерації панелі інструментів працює гладко, користувачі спостерігали несумісності, коли застосовували штучний інтелект до нових або складних сценаріїв. Ця відсутність прозорості робить складним будівництво довіри, особливо коли бізнес розглядає можливість делегування чутливих завдань автономним системам. Крім того, відсутність чітких метрик для оцінки “автономності” агентів штучного інтелекту залишає місце для скептицизму щодо того, чи представляє Manus справжній прогрес чи просто розвинену маркетингову стратегію.

Основне

Manus AI представляє наступний рубіж у штучному інтелекті: автономні агенти, здатні виконувати завдання в широкому спектрі галузей, незалежно та без нагляду людини. Його появу сигналізує про початок нової ери, в якій штучний інтелект робить більше, ніж просто допомагає – він діє як повністю інтегрована система, здатна обробляти складні робочі процеси від початку до кінця.

Хоча ще рано в розвитку Manus AI, потенційні наслідки ясні. Як системи штучного інтелекту, подібні до Manus, стають більш просунутими, вони можуть переінакшити галузі, змінити ринки праці та навіть викликати питання про те, що означає робота. Майбутнє штучного інтелекту вже не обмежується пасивними помічниками – воно полягає у створенні систем, які думають, діють та вчаться самостійно. Manus – це тільки початок.

Доктор Техсін Зія є доцентом COMSATS University Islamabad, який має ступінь PhD з штучного інтелекту у Віденському технічному університеті, Австрія. Спеціалізується на штучному інтелекті, машинному навчанні, науці про дані та комп'ютерному баченні, він зробив значний внесок з публікаціями в авторитетних наукових журналах. Доктор Техсін також очолював різні промислові проекти як головний дослідник і служив консультантом з штучного інтелекту.