Kontakt med oss

Kunstig intelligens

Avduking av Manus AI: Kinas gjennombrudd i fullt autonome AI-agenter

mm

Akkurat som støvet begynner å legge seg DeepSeek, har nok et gjennombrudd fra en kinesisk startup tatt internett med storm. Denne gangen er det ikke en generativ AI-modell, men en fullstendig autonom AI-agent, Manus, lansert av det kinesiske selskapet Monica 6. mars 2025. I motsetning til generative AI-modeller som ChatGPT og DeepSeek som bare reagerer på forespørsler, er Manus designet for å jobbe uavhengig, ta beslutninger, utføre oppgaver og produsere resultater med minimal menneskelig involvering. Denne utviklingen signaliserer et paradigmeskifte i AI-utvikling, og går fra reaktive modeller til fullstendig autonome agenter. Denne artikkelen utforsker Manus AIs arkitektur, dens styrker og begrensninger, og dens potensielle innvirkning på fremtiden til autonome AI-systemer.

Utforsker Manus AI: A Hybrid Approach to Autonomous Agent

Navnet "Manus" er avledet fra det latinske uttrykket Mens og Manus som betyr sinn og hånd. Denne nomenklaturen beskriver perfekt Manus doble evner til å tenke (behandle kompleks informasjon og ta beslutninger) og handle (utføre oppgaver og generere resultater). For tenkning er Manus avhengig av store språkmodeller (LLM), og for handling integrerer den LLM med tradisjonelle automatiseringsverktøy.

Manus følger en nevro-symbolsk tilnærming for oppgaveutførelse. I denne tilnærmingen bruker den LLM-er, inkludert Anthropics Claude 3.5 sonet og Alibabas Qwen, for å tolke oppfordringer fra naturlig språk og generere handlingsplaner. LLM-ene er utvidet med deterministiske skript for databehandling og systemoperasjoner. For eksempel, mens en LLM kan utarbeide Python-kode for å analysere et datasett, kjører Manus sin backend koden i et kontrollert miljø, validerer utdataene og justerer parametere hvis det oppstår feil. Denne hybridmodellen balanserer kreativiteten til generativ AI med påliteligheten til programmerte arbeidsflyter, slik at den kan utføre komplekse oppgaver som å distribuere nettapplikasjoner eller automatisere interaksjoner på tvers av plattformer.

I kjernen opererer Manus AI gjennom en strukturert agentløkke som etterligner menneskelige beslutningsprosesser. Når den får en oppgave, analyserer den først forespørselen for å identifisere mål og begrensninger. Deretter velger den verktøy fra verktøysettet – for eksempel nettskrapere, databehandlere eller kodetolkere – og utfører kommandoer i en sikker Linux sandkassemiljø. Dette sandkasse lar Manus installere programvare, manipulere filer og samhandle med nettapplikasjoner samtidig som den forhindrer uautorisert tilgang til eksterne systemer. Etter hver handling evaluerer AI resultatene, gjentar sin tilnærming og finjusterer resultatene til oppgaven oppfyller forhåndsdefinerte suksesskriterier.

Agent Arkitektur og Miljø

En av hovedtrekkene til Manus er multiagent-arkitekturen. Denne arkitekturen er hovedsakelig avhengig av en sentral "utøver"-agent som er ansvarlig for å administrere ulike spesialiserte underagenter. Disse underagentene er i stand til å håndtere spesifikke oppgaver, for eksempel nettsurfing, dataanalyse eller til og med koding, som lar Manus jobbe med flertrinnsproblemer uten å trenge ekstra menneskelig inngripen. I tillegg opererer Manus i et skybasert asynkront miljø. Brukere kan tildele oppgaver til Manus og deretter koble fra, vel vitende om at agenten vil fortsette å jobbe i bakgrunnen og sende resultater når de er fullført.

Ytelse og benchmarking

Manus AI har allerede oppnådd betydelig suksess i industristandard ytelsestester. Den har vist toppmoderne resultater i GAIA Benchmark, en test laget av Meta AI, Hugging Face og AutoGPT for å evaluere ytelsen til agentiske AI-systemer. Denne referansen vurderer en AIs evne til å resonnere logisk, behandle multimodale data og utføre virkelige oppgaver ved hjelp av eksterne verktøy. Manus AIs ytelse i denne testen setter den foran etablerte aktører som f.eks OpenAIs GPT-4 og Googles modeller, og etablerer den som en av de mest avanserte generelle AI-agentene som er tilgjengelige i dag.

Brukstilfeller

For å demonstrere de praktiske egenskapene til Manus AI, utviklerne showcased en rekke imponerende brukstilfeller under lanseringen. I et slikt tilfelle ble Manus AI bedt om å håndtere ansettelsesprosessen. Når man fikk en samling av CVer, sorterte Manus dem ikke bare etter nøkkelord eller kvalifikasjoner. Det gikk videre ved å analysere hver CV, kryssreferanser ferdigheter med arbeidsmarkedstrender, og til slutt presentere brukeren for en detaljert ansettelsesrapport og en optimalisert beslutning. Manus fullførte denne oppgaven uten å trenge ytterligere menneskelig innspill eller tilsyn. Denne saken viser sin evne til å håndtere en kompleks arbeidsflyt autonomt.

På samme måte, da Manus ble bedt om å generere en personlig reiseplan, vurderte han ikke bare brukerens preferanser, men også eksterne faktorer som værmønstre, lokal kriminalitetsstatistikk og leietrender. Dette gikk utover enkel datainnhenting og reflekterte en dypere forståelse av brukerens uuttalte behov, noe som illustrerte Manus' evne til å utføre uavhengige, kontekstbevisste oppgaver.

I en annen demonstrasjon fikk Manus i oppgave å skrive en biografi og lage et personlig nettsted for en teknisk forfatter. I løpet av minutter skrapet Manus data fra sosiale medier, komponerte en omfattende biografi, designet nettstedet og distribuerte det live. Det fikset til og med hostingproblemer autonomt.

I finanssektoren fikk Manus i oppgave å utføre en korrelasjonsanalyse av NVDA (NVIDIA), MRVL (Marvell Technology) og TSM (Taiwan Semiconductor Manufacturing Company) aksjekurser de siste tre årene. Manus begynte med å samle inn relevante data fra YahooFinance API. Den skrev deretter automatisk den nødvendige koden for å analysere og visualisere aksjekursdataene. Etterpå opprettet Manus et nettsted for å vise analysen og visualiseringene, og genererte en delbar lenke for enkel tilgang.

Utfordringer og etiske hensyn

Til tross for sine bemerkelsesverdige brukstilfeller, står Manus AI også overfor flere tekniske og etiske utfordringer. Early adopters har rapportert problemer med at systemet går inn i "løkker", der det gjentatte ganger utfører ineffektive handlinger, som krever menneskelig inngripen for å tilbakestille oppgaver. Disse feilene fremhever utfordringen med å utvikle AI som konsekvent kan navigere i ustrukturerte miljøer.

I tillegg, mens Manus opererer i isolerte sandkasser for sikkerhetsformål, vekker webautomatiseringsfunksjonene bekymringer om potensielt misbruk, for eksempel skraping av beskyttede data eller manipulering av nettplattformer.

Åpenhet er et annet sentralt tema. Manus sine utviklere fremhever suksesshistorier, men uavhengig verifisering av evnene er begrenset. For eksempel, mens generasjonen av demovisningsinstrumentpanelet fungerer problemfritt, har brukere observert inkonsekvenser når de bruker AI på nye eller komplekse scenarier. Denne mangelen på åpenhet gjør det vanskelig å bygge tillit, spesielt ettersom virksomheter vurderer å delegere sensitive oppgaver til autonome systemer. Videre gir fraværet av klare beregninger for å evaluere "autonomi" til AI-agenter rom for skepsis til hvorvidt Manus representerer genuin fremgang eller bare sofistikert markedsføring.

Bunnlinjen

Manus AI representerer den neste grensen innen kunstig intelligens: autonome agenter som er i stand til å utføre oppgaver på tvers av et bredt spekter av bransjer, uavhengig og uten menneskelig tilsyn. Dens fremvekst signaliserer begynnelsen på en ny æra der AI gjør mer enn bare å hjelpe – den fungerer som et fullt integrert system, i stand til å håndtere komplekse arbeidsflyter fra start til slutt.

Selv om det fortsatt er tidlig i Manus AIs utvikling, er de potensielle implikasjonene klare. Etter hvert som AI-systemer som Manus blir mer sofistikerte, kan de redefinere bransjer, omforme arbeidsmarkeder og til og med utfordre vår forståelse av hva det vil si å jobbe. Fremtiden til AI er ikke lenger begrenset til passive assistenter – det handler om å lage systemer som tenker, handler og lærer på egenhånd. Manus er bare begynnelsen.

Dr. Tehseen Zia er en fast førsteamanuensis ved COMSATS University Islamabad, med en doktorgrad i AI fra Wiens teknologiske universitet, Østerrike. Med spesialisering i kunstig intelligens, maskinlæring, datavitenskap og datasyn, har han gitt betydelige bidrag med publikasjoner i anerkjente vitenskapelige tidsskrifter. Dr. Tehseen har også ledet ulike industrielle prosjekter som hovedetterforsker og fungert som AI-konsulent.