Artificiell intelligens

DeepMinds utveckling av Medvetande: Att ge stora språkmodeller kraft för att lösa verkliga problem

Published February 6, 2025

Updated April 26, 2026

Dr. Tehseen Zia

På senare tid har artificiell intelligens (AI) uppstått som ett praktiskt verktyg för att driva innovation över hela branschen. I framkanten av denna utveckling finns stora språkmodeller (LLM) som är kända för sin förmåga att förstå och generera mänskligt språk. Medan LLM fungerar bra på uppgifter som konversations-AI och innehållsskapande, har de ofta svårt med komplexa verkliga utmaningar som kräver strukturerad resonemang och planering.

Till exempel, om du ber LLM att planera en affärsresa till flera städer som innefattar samordning av flygscheman, mötestider, budgetbegränsningar och tillräcklig vila, kan de ge förslag för enskilda aspekter. Men de har ofta svårt att integrera dessa aspekter för att effektivt balansera konkurrerande prioriteringar. Denna begränsning blir ännu tydligare när LLM används alltmer för att bygga AI-agenter som kan lösa verkliga problem på egen hand.

Google DeepMind har nyligen utvecklat en lösning för att åtgärda detta problem. Inspirerad av naturlig selektion, kallas denna metod Medvetandets utveckling, och den förfinar lösningstrategier genom iterativ anpassning. Genom att guida LLM i realtid, möjliggör den att de kan hantera komplexa verkliga uppgifter effektivt och anpassa sig till dynamiska scenarier. I den här artikeln kommer vi att undersöka hur denna innovativa metod fungerar, dess potentiella tillämpningar och vad den betyder för framtiden för AI-drivna lösningar.

Varför LLM har svårt med komplex resonemang och planering

LLM tränas för att förutsäga nästa ord i en mening genom att analysera mönster i stora textdatabaser, som böcker, artiklar och onlineinnehåll. Detta möjliggör för dem att generera svar som verkar logiska och kontextuellt lämpliga. Men denna utbildning baseras på att känna igen mönster snarare än att förstå betydelse. Som ett resultat kan LLM producera text som verkar logisk men har svårt med uppgifter som kräver djupare resonemang eller strukturerad planering.

Kärnbegränsningen ligger i hur LLM bearbetar information. De fokuserar på sannolikhet eller mönster snarare än logik, vilket innebär att de kan hantera isolerade uppgifter – som att föreslå flygalternativ eller hotellrekommendationer – men misslyckas när dessa uppgifter behöver integreras i en sammanhängande plan. Detta gör det också svårt för dem att upprätthålla kontext över tid. Komplexa uppgifter kräver ofta att man håller reda på tidigare beslut och anpassar sig när ny information uppstår. LLM tenderar dock att förlora fokus i utdragna interaktioner, vilket leder till fragmenterade eller inkonsekventa utdata.

Hur Medvetandets utveckling fungerar

DeepMinds Medvetandets utveckling åtgärdar dessa brister genom att anta principer från naturlig evolution. Istället för att producera ett enda svar på en komplex fråga, genererar denna metod flera potentiella lösningar, förfinar dem iterativt och väljer det bästa resultatet genom en strukturerad utvärderingsprocess. Till exempel, överväg ett team som brainstormar idéer för ett projekt. Vissa idéer är bra, andra mindre så. Teamet utvärderar alla idéer, behåller de bästa och kastar bort resten. De förbättrar sedan de bästa idéerna, introducerar nya variationer och upprepar processen tills de kommer fram till den bästa lösningen. Medvetandets utveckling tillämpar denna princip på LLM.

Här är en nedbrytning av hur det fungerar:

Generering: Processen börjar med att LLM skapar flera svar på en given uppgift. Till exempel, i en reseplaneringsuppgift, kan modellen utarbeta olika resplaner baserat på budget, tid och användarpreferenser.
Utvärdering: Varje lösning utvärderas mot en fitnessfunktion, ett mått på hur väl den tillfredsställer uppgiftens krav. Lågkvalitativa svar kastas bort, medan de mest lovande kandidaterna går vidare till nästa steg.
Förfining: En unik innovation i Medvetandets utveckling är dialogen mellan två personligheter inom LLM: Författaren och Kritikern. Författaren föreslår lösningar, medan Kritikern identifierar brister och erbjuder feedback. Denna strukturerade dialog speglar hur människor förfinar idéer genom kritik och revision. Till exempel, om Författaren föreslår en reseplan som inkluderar ett restaurangbesök som överstiger budgeten, pekar Kritikern på detta. Författaren reviderar sedan planen för att tillgodose Kritikerns bekymmer. Denna process möjliggör för LLM att utföra djup analys som den inte kunde utföra tidigare med hjälp av andra uppmaningstekniker.
Iterativ optimering: De förfinade lösningarna genomgår ytterligare utvärdering och rekombination för att producera förbättrade lösningar.

Genom att upprepa denna cykel, förbättrar Medvetandets utveckling iterativt lösningarnas kvalitet, vilket möjliggör för LLM att hantera komplexa utmaningar mer effektivt.

Medvetandets utveckling i aktion

DeepMind testade denna metod på benchmark som TravelPlanner och Natural Plan. Med denna metod uppnådde Googles Gemini en framgångsgrad på 95,2% på TravelPlanner, vilket är en utmärkt förbättring från en baslinje på 5,6%. Med den mer avancerade Gemini Pro ökade framgångsgraden till nästan 99,9%. Denna transformerande prestation visar effektiviteten i Medvetandets utveckling för att hantera praktiska utmaningar.

Intressant nog ökar modellens effektivitet med uppgiftens komplexitet. Till exempel, medan enkel-pass metoder kämpade med flerdagarsresor som involverade flera städer, överträffade Medvetandets utveckling konsekvent, med en hög framgångsgrad även när antalet begränsningar ökade.

Utmaningar och framtida riktningar

Trots sin framgång är Medvetandets utveckling inte utan begränsningar. Metoden kräver betydande beräkningsresurser på grund av de iterativa utvärderings- och förfiningsprocesserna. Till exempel, att lösa en TravelPlanner-uppgift med Medvetandets utveckling förbrukade tre miljoner token och 167 API-samtal – avsevärt mer än konventionella metoder. Men metoden förblir mer effektiv än brute-force-strategier som uttömmande sökning.

Dessutom kan det vara en utmaning att utforma effektiva fitnessfunktioner för vissa uppgifter. Framtida forskning kan fokusera på att optimera beräknings-effektivitet och utöka teknikens tillämpbarhet till en bredare range av problem, som kreativt skrivande eller komplex beslutsfattning.

En annan intressant område för utforskning är integrationen av domänspecifika utvärderare. Till exempel, inom medicinsk diagnos, kan inkorporering av expertkunskap i fitnessfunktionen ytterligare förbättra modellens noggrannhet och tillförlitlighet.

Tillämpningar bortom planering

Även om Medvetandets utveckling främst utvärderas på planeringsuppgifter, kan den tillämpas på olika domäner, inklusive kreativt skrivande, vetenskaplig upptäckt och till och med kodgenerering. Till exempel, har forskare introducerat en benchmark som kallas StegPoet, som utmanar modellen att koda dolda meddelanden inom dikter. Även om denna uppgift fortfarande är svår, överträffar Medvetandets utveckling traditionella metoder genom att uppnå en framgångsgrad på upp till 79,2%.

Förmågan att anpassa och utveckla lösningar i naturligt språk öppnar nya möjligheter för att hantera problem som är svåra att formalisera, som att förbättra arbetsflöden eller generera innovativa produktutformningar. Genom att utnyttja kraften i evolutionära algoritmer, tillhandahåller Medvetandets utveckling ett flexibelt och skalbart ramverk för att förbättra LLM:s förmåga att lösa problem.

Sammanfattning

DeepMinds Medvetandets utveckling introducerar ett praktiskt och effektivt sätt att övervinna nyckelbegränsningar i LLM. Genom att använda iterativ förfining inspirerad av naturlig selektion, förbättrar den LLM:s förmåga att hantera komplexa, flerstegs-uppgifter som kräver strukturerat resonemang och planering. Metoden har redan visat betydande framgång i utmanande scenarier som reseplanering och visar löfte över olika domäner, inklusive kreativt skrivande, vetenskaplig forskning och kodgenerering. Medan utmaningar som höga beräkningskostnader och behovet av väl utformade fitnessfunktioner kvarstår, tillhandahåller metoden ett skalbart ramverk för att förbättra AI-förmågor. Medvetandets utveckling sätter scenen för kraftfullare AI-system som kan resonera och planera för att lösa verkliga utmaningar.

Dr. Tehseen Zia

Dr. Tehseen Zia är en fast anställd biträdande professor vid COMSATS University Islamabad, med en doktorsexamen i AI från Vienna University of Technology, Österrike. Specialiserad på artificiell intelligens, maskinlärning, datavetenskap och datorseende, har han gjort betydande bidrag med publikationer i ansedda vetenskapliga tidskrifter. Dr. Tehseen har också lett olika industriprojekt som huvudutredare och tjänstgjort som AI-konsult.