Kunstig intelligens

DeepMinds Sindsevolution: Empowerment af store sprogmodeller til løsning af virkelighedsbaserede problemer

Published February 6, 2025

Updated April 26, 2026

Dr. Tehseen Zia

I de seneste år er kunstig intelligens (AI) blevet en praktisk værktøj til at drive innovation på tværs af brancher. I fremhøjet position er store sprogmodeller (LLM’er) kendt for deres evne til at forstå og generere menneskesprog. Mens LLM’er fungerer godt til opgaver som konversations-AI og indholdsskabelse, kæmper de ofte med komplekse virkelighedsbaserede udfordringer, der kræver struktureret resonnering og planlægning.

For eksempel, hvis du beder LLM’er om at planlægge en forretningsrejse til flere byer, der indebærer koordinering af flyschemer, mødetider, budgetbegrænsninger og tilstrækkelig hvile, kan de give forslag til enkeltaspekter. Men de kæmper ofte med at integrere disse aspekter for effektivt at afbalancere konkurrerende prioriteringer. Denne begrænsning bliver endnu mere tydelig, da LLM’er i stigende grad bruges til at opbygge AI-agenter, der kan løse virkelighedsbaserede problemer autonomt.

Google DeepMind har nyligt udviklet en løsning til at løse dette problem. Inspireret af naturlig selektion, denne tilgang, kendt som Mind Evolution, raffinerer problemløsningsstrategier gennem iterativ tilpasning. Ved at guide LLM’er i realtid, giver det dem mulighed for at tackle komplekse virkelighedsbaserede opgaver effektivt og tilpasse sig til dynamiske scenarier. I denne artikel vil vi udforske, hvordan denne innovative metode fungerer, dens potentielle anvendelser og hvad det betyder for fremtiden for AI-drevet problemløsning.

Hvorfor LLM’er kæmper med kompleks resonnering og planlægning

LLM’er er trænet til at forudsige det næste ord i en sætning ved at analysere mønstre i store tekstdata, såsom bøger, artikler og online-indhold. Dette giver dem mulighed for at generere svar, der synes logiske og kontekstligt passende. Men denne træning er baseret på at genkende mønstre snarere end at forstå betydning. Som resultat kan LLM’er producere tekst, der synes logisk, men kæmpe med opgaver, der kræver dybere resonnering eller struktureret planlægning.

Kernebegrænsningen ligger i, hvordan LLM’er behandler information. De fokuserer på sandsynligheder eller mønstre snarere end logik, hvilket betyder, at de kan håndtere isolerede opgaver – som at foreslå flymuligheder eller hotelanbefalinger – men fejler, når disse opgaver skal integreres i en samlet plan. Dette gør det også svært for dem at fastholde kontekst over tid. Komplekse opgaver kræver ofte, at man holder styr på tidligere beslutninger og tilpasser sig, når nye oplysninger opstår. LLM’er har dog tendens til at tabe fokus i forlængede interaktioner, hvilket fører til fragmenterede eller inkonsistente udgangspunkter.

How Mind Evolution fungerer

DeepMinds Mind Evolution løser disse udfordringer ved at antage principper fra naturlig evolution. I stedet for at producere et enkelt svar på en kompleks forespørgsel, genererer denne tilgang multiple potentielle løsninger, raffinerer dem iterativt og vælger den bedste udfald gennem en struktureret vurderingsproces. For eksempel kan man forestille sig en brainstormingsession, hvor et hold kommer med idéer til et projekt. Nogle idéer er gode, andre mindre så. Holdet vurderer alle idéer, holder de bedste og forkaster resten. De forbedrer herefter de bedste idéer, introducerer nye variationer og gentager processen, indtil de når frem til den bedste løsning. Mind Evolution anvender denne princip til LLM’er.

Her er en gennemgang af, hvordan det fungerer:

Generation: Processen begynder med, at LLM’en genererer multiple svar på en given opgave. For eksempel kan modellen i en rejseplanlægningsopgave udarbejde forskellige itinerarer baseret på budget, tid og brugerpræferencer.
Vurdering: Hvert svar vurderes i forhold til en fitness-funktion, en måling af, hvor godt det tilfredsstiller opgavens krav. Lavkvalitets-svar forkastes, mens de mest lovende kandidater går videre til næste fase.
Raffinering: En unik innovation i Mind Evolution er dialogen mellem to personer inden for LLM’en: Forfatteren og Kritikeren. Forfatteren foreslår løsninger, mens Kritikeren identificerer fejl og giver feedback. Denne strukturerede dialog spejler, hvordan mennesker raffinerer idéer gennem kritik og revision. For eksempel, hvis Forfatteren foreslår en rejseplan, der inkluderer et restaurantbesøg, der overstiger budgettet, påpeger Kritikeren dette. Forfatteren reviderer herefter planen for at imødekomme Kritikerens bekymringer. Dette proces giver LLM’er mulighed for at udføre dyb analyse, som de ikke kunne udføre tidligere ved hjælp af andre prompt-teknikker.
Iterativ optimering: De raffinerede løsninger undergår yderligere vurdering og rekombination for at producere raffinerede løsninger.

Ved at gentage denne cyklus forbedrer Mind Evolution iterativt kvaliteten af løsningerne, hvilket giver LLM’er mulighed for at tackle komplekse udfordringer mere effektivt.

Mind Evolution i praksis

DeepMind testede denne tilgang på benchmarks som TravelPlanner og Natural Plan. Ved at anvende denne tilgang opnåede Google’s Gemini en succesrate på 95,2% på TravelPlanner, hvilket er en bemærkelsesværdig forbedring fra en baseline på 5,6%. Med den mere avancerede Gemini Pro steg succesraterne til næsten 99,9%. Denne transformative præstation viser effekten af Mind Evolution i at løse praktiske udfordringer.

Interessant nok øges modellens effektivitet med opgavens kompleksitet. For eksempel, mens single-pass-metoder kæmpede med multi-dags-itinerarer, der involverede flere byer, overgik Mind Evolution konsekvent, mens den fastholdt høje succesrater, selv når antallet af begrænsninger øgedes.

Udfordringer og fremtidige retninger

Trods dens succes er Mind Evolution ikke uden begrænsninger. Tilgangen kræver betydelige beregningsressourcer på grund af de iterative vurderings- og raffineringsprocesser. For eksempel forbrugte løsningen af en TravelPlanner-opgave med Mind Evolution tre millioner tokens og 167 API-kald – væsentligt mere end konventionelle metoder.

Derudover kan design af effektive fitness-funktioner for visse opgaver være en udfordrende opgave. Fremtidig forskning kan fokusere på at optimere beregnings-effektiviteten og udvide teknikken til en bredere række af problemer, såsom kreativ skrivning eller kompleks beslutningstagning.

En anden interessant område for udforskning er integration af domænespecifikke evalueringer. For eksempel kan inkorporering af ekspertråd i fitness-funktionen i medicinsk diagnose yderligere forbedre modellens nøjagtighed og pålidelighed.

Anvendelser ud over planlægning

Selv om Mind Evolution primært er vurderet på planlægningsopgaver, kan det anvendes på forskellige domæner, herunder kreativ skrivning, videnskabelig opdagelse og selv kodegenerering. For eksempel har forskere introduceret en benchmark kaldet StegPoet, der udfordrer modellen til at kode hemmelige beskeder inden for digte. Selv om denne opgave stadig er vanskelig, overgår Mind Evolution traditionelle metoder ved at opnå succesrater på op til 79,2%.

Evnen til at tilpasse og udvikle løsninger i naturligt sprog åbner nye muligheder for at tackle problemer, der er svære at formalisere, såsom forbedring af arbejdsgange eller generering af innovative produkt-designs. Ved at anvende kraften fra evolutionære algoritmer giver Mind Evolution en fleksibel og skalerbar ramme for at forbedre problemløsnings-evnen hos LLM’er.

Det endelige punkt

DeepMinds Mind Evolution introducerer en praktisk og effektiv måde at overvinde nøglebegrænsninger i LLM’er. Ved at anvende iterativ raffinering inspireret af naturlig selektion forbedrer det evnen hos disse modeller til at håndtere komplekse, multi-trins-opgaver, der kræver struktureret resonnering og planlægning. Tilgangen har allerede vist betydelig succes i udfordrende scenarier som rejseplanlægning og viser løfte på tværs af diverse domæner, herunder kreativ skrivning, videnskabelig forskning og kodegenerering. Mens udfordringer som høje beregningsomkostninger og behov for vel-designede fitness-funktioner stadig eksisterer, giver tilgangen en skalerbar ramme for at forbedre AI-kapaciteter. Mind Evolution sætter scenen for mere kraftfulde AI-systemer, der kan resonere og planlægge for at løse virkelighedsbaserede udfordringer.

Dr. Tehseen Zia

Dr. Tehseen Zia er en fastansat lektor ved COMSATS University Islamabad, med en ph.d. i AI fra Vienna University of Technology, Østrig. Specialiseret i kunstig intelligens, maskinlæring, datavidenskab og computer vision, har han gjort betydelige bidrag med publikationer i anerkendte videnskabelige tidsskrifter. Dr. Tehseen har også ledet forskellige industrielle projekter som hovedundersøger og fungeret som AI-rådgiver.