Tankeledere
Den kommende “Exolution” af AI

I dag, hvor vi befinder os på kanten af en teknologisk forkastningslinje, observerer vi rejsen fra LLMs til agenter og til sidst til agens AI og AGI, og det handler ikke kun om større modeller eller hurtigere svar. Det handler også om maskiner, der bevæger sig fra at være passive assistenter til aktive samarbejdspartnere, og måske en dag, uafhængige tænkere.
Lad os følge denne vej og udforske, hvad det betyder for arbejde, ekspertise og den rol, mennesker spiller i formning af intelligensen i morgen.
Forskellen mellem LLMs, agentbaserede systemer og agens AI
For bedre at forstå forskellen, er her et eksempel. Hvis jeg spørger en LLM om noget som: “Jeg vil rejse fra Chicago til Austin, køre ikke mere end fire timer om dagen og stoppe på maleriske steder,” vil en almindelig LLM returnere et statisk svar i tekstformat baseret på sproggenerering. Det vil sandsynligvis kun svare på anmodningen uden at udføre en grundig analyse.
En agent vil først klassificere anmodningen som rejse-relateret. Derefter vil den bestemme, hvilke data der er nødvendige: ruter ved hjælp af korttjenester, vejrinformation, brændstofomkostninger, hoteller, restauranter osv. Efter det vil agenten opdele anmodningen i underopgaver og sende dem til specialiserede moduler eller LLMs, der er trænet på de relevante kilder. Dette er orkestrering og koordinering af multiple modeller og værktøjer under en samlet logik.
I dag er de fleste store systemer som ChatGPT eller Claude fra Anthropic essentielt allerede agenter. Selvom det kan synes brugeren, at de interagerer med en enkelt model, er der bag scenen en kompleks arkitektur, der involverer mange modeller og systemer. De kan allerede håndtere komplekse forespørgsler, men deres evner er mest begrænsede til at give information; de tager ikke handling endnu.
En fuldt autonom agent er et system, der indsamler information og kan f.eks. uafhængigt booke et hotel, købe en billet eller initiere en betaling, hvis det har adgang til de relevante API’er eller brugerdata. Sådanne agenter er i øjeblikket i tidlige udviklingsfaser. På dette punkt er de mere som semi-agenter, der kan behandle information, men ikke endnu udføre autonome handlinger.
Et interessant diskussionsområde i forskningsmiljøet er agens AI. I modsætning til en almindelig agent, hvis adfærd er skrevet af udviklere, er agens AI et system, der uafhængigt beslutter, hvilke opgaver der skal udføres, hvilke data det behøver og sogar, hvordan det skal fortsætte sin egen træning. Dette går ud over at udføre instruktioner; det involverer at træffe autonome beslutninger. Imidlertid forbliver agens AI teoretisk på dette stadium; sådanne systemer findes ikke i praksis endnu.
AGI – den nye horisont. Men er det opnåeligt?
Meta har investeret i Scale AI for tre måneder siden. Målet var at samarbejde på vejen til at bygge AGI, Artificial General Intelligence, der kan udføre enhver opgave på et menneskeligt niveau eller endda overgå det. Hvis i dagens AI er en teknologisk revolution, vil AGI være en sand mega-revolution; nogle gange kalder jeg det “exolution”, hvilket betyder “exodus” af AI fra skyggen. Den, der opnår det først, vil få en global strategisk fordel.
Vedrørende, hvor tæt vi er på at opnå rigtig AGI, afhænger det stærkt af, hvordan vi definerer det. Jeg er enig med Ilya Sutskevers synspunkt: AGI er et system, der kan udføre enhver intellektuel opgave, som et menneske kan. Ikke kun at svare på spørgsmål, men også at resonere, træffe beslutninger, generalisere og fortolke på tværs af domæner. Sand AGI er universel og ikke begrænset til snævre opgavegrænser.
Ingen af de nuværende modeller har nået dette niveau. Vi bevæger os i den retning, men sand AGI i den teoretiske forstand findes stadig ikke. Og måske er det bedst sådan. Vi er stadig i en fase af tilnærmelse, og det er sandsynligt, at vi vil forblive der i en længere periode.
Grundlaget for AGI vil sandsynligvis være et agentbaseret system. Det behøver ikke nødvendigvis at afhænge af en enkelt LLM, for ligesom ingen enkelt menneske, uanset hvor brillant, kan mestre alle domæner af viden og færdigheder, kan ingen enkelt LLM håndtere det fulde spektrum af AGI-opgaver på egen hånd. Hvad vi har brug for, er en slags “kollektiv intelligens”: en arkitektur, der kan koordinere multiple modeller og komponenter.
AGI vil sandsynligvis opstå ikke kun som et menneskeskabt agent, men som en meta-agent. Det vil være et system, der delvist er udviklet og udvikler sig med hjælp af AI selv. Dette er vigtigt, fordi systemer, der er designet helt af mennesker, kan have indbyggede begrænsninger. At inddrage AI i designprocessen kan hjælpe med at overvinde disse begrænsninger og gøre systemet mere tilpasningsdygtigt.
AGI kommer sandsynligvis ikke fra et enkelt specifikt gennembrud. Ikke særlig større LLMs, smartere agenter eller helt nye arkitekturer, men snarere fra en syntese af alle tre. Sandsynligvis noget fundamentalt nyt, der transcenderer de kategorier, vi bruger i øjeblikket.
“Menneskehedens sidste eksamen” og andre AGI-benchmarks
“Menneskehedens sidste eksamen” (HLE) er en af de mere ambitiøse benchmarks, der i øjeblikket diskuteres i sammenhæng med LLMs, agenter og AGI. Det er grundlæggende en test, der består af omkring 2.500 spørgsmål, der dækker et bredt spektrum af akademiske discipliner – matematik, fysik, biologi, kemi, ingeniørvidenskab, datalogi og endda skak. Idéen er at evaluere, om et AI-system kan løse problemer på et niveau, der afspejler ægte menneskelig forståelse.
De nuværende sprogmodeller performer meget dårligt på HLE, ofte scorer under 5% nøjagtighed. Dette er i skarp kontrast til andre benchmarks som MMLU eller GPQA, hvor modeller opnår væsentligt højere score. Modellernes svigt på HLE understreger blot, hvor langt de endnu er fra sand generel intelligens.
Det er vigtigt at bemærke, at høj præstation på benchmarks med kendte eller snævre datasæt ikke nødvendigvis indikerer tilstedeværelsen af sand generel intelligens. En model kan være finjusteret eller “trænet til testen”, hvilket kan pumpe op dens synlige evner. Så selv en perfekt score på HLE ville ikke betyde, at vi har opnået AGI; det ville kun betyde, at vi har bestået en enkelt test.
Hvad driver AGI
Jeg er fuldt enig i, at de centrale piller i AGI er data, beregning og talent. Situationen med beregning er klar. Nøgleaktører som Meta har forsøgt at producere deres egne chip, investeret milliarder i deres egen chipudviklingsproces. Men selskaberne er stadig afhængige af andres chip og beregningskraft, som f.eks. Nvidia, der ikke kun leverer den nødvendige hardware, men også forstår vigtigheden af at skala op produktionen.
Der er flere spørgsmål om data og talenter. Internettet er løbet tør — der er ikke en eneste tekst, der er skabt af mennesker fra åbne kilder, der ikke er blevet brugt til træning på nuværende tidspunkt. Den samlede mængde af information, som menneskeheden har produceret indtil nu, viser sig at være overraskende lille. Derfor begynder selskaber at aktivt samarbejde med dem, der kan generere højkvalitets menneskelig data.
Fuld automation eller menneske-i-løkken?
Et andet punkt – faldet i efterspørgsel på manuel dataannotation. For nogle år siden var industrien i fuld gang. Tusindvis af annotatorer blev hyret for at mætte AI-pipelines’ sult. I dag er meget af denne fremdrift skiftet mod automation. Modellerne er modnet, og værktøjerne omkring dem også.
Tag ansigtsgenkendelse. Det var tidligere en af de største drivkræfter bag billedannotationens volumen. Men denne kategori er stort set løst nu. Modeller som YOLO, SAM og Samurai absorberer hurtigt det rutinemæssige arbejde. Disse systemer komprimerer uger af manuelt arbejde til minutter, ofte med forbløffende nøjagtighed. Vi har også implementeret mange ML-assisterede værktøjer i vores proprietære platform Keylabs. Det hjælper virkelig med at reducere det rutinemæssige workflow.
Men alle disse modeller er begrænset af deres generalisering og er egnet til at automatisere standard- og ensartede operationer. Komplekse eller unikke tilfælde kræver stadig menneskelig opmærksomhed.
Vi bevæger os væk fra den gamle paradigm, hvor en annotator blot var en detaljeorienteret person, der kunne genkende et objekt eller en emotion. I den nye virkelighed er professionelle nødvendige: læger til at annotere medicinske billeder, programmører til at kode, arkitekter til at skabe tegninger, markedsførere til kundes indsigt og militæreksperten til forsvarsscenarier.
Vi ser allerede virkelige tilfælde, som f.eks. jagerpiloter, der annoterer data til AI og tjener 1.000 dollars i timen for deres ekspertise. Fordi sådanne specialister er sjældne, og deres viden er kritisk for at træne højpræstations-AI.
Verden ændrer sig: mere og mere mennesker bliver operatører og “trænere” af kunstig intelligens. Lige for nylig modtog jeg en LinkedIn-besked om at tjekke en datasæt til en AI-app designet til CEO’er. I fremtiden kan enhver af os modtage et tilbud om at arbejde som annotator, ikke kun en person, der klikker på knapper, men en ekspert, hvis viden former intelligensen i morgen.
Vi lever allerede i denne nye virkelighed, en verden af datamærkning og AI-træning. De, der erkender det og tilpasser sig, vil opnå en betydelig fordel.












