AGI
AlphaEvolve: Google DeepMinds banebrytende skritt mot AGI

Google DeepMind har lansert AlphaEvolve, en evolusjonær kodeagent designet for å autonomt oppdage nye algoritmer og vitenskapelige løsninger. Presentert i papiret med tittelen “AlphaEvolve: En kodeagent for vitenskapelig og algoritmisk oppdagelse,” representerer denne forskningen en grunnleggende skritt mot Artificial General Intelligence (AGI) og sogar Artificial Superintelligence (ASI). I stedet for å basere seg på statisk finjustering eller menneske-labelede datasett, tar AlphaEvolve en helt annen vei – en som handler om autonom kreativitet, algoritmisk innovasjon og kontinuerlig selvforbedring.
I hjertet av AlphaEvolve ligger en selvinnholdende evolusjonær pipeline drevet av store språkmodeller (LLM). Denne pipeline genererer ikke bare utdata, men muterer, evaluerer, velger og forbedrer kode over generasjoner. AlphaEvolve begynner med en initial program og refinerer det iterativt ved å introdusere nøye strukturerte endringer.
Disse endringene tar form av LLM-genererte diffs – kodeendringer foreslått av en språkmodell basert på tidligere eksempler og eksplisitte instruksjoner. En ‘diff’ i programvareutvikling refererer til forskjellen mellom to versjoner av en fil, vanligvis med hensyn på linjer som skal fjernes eller erstattes og nye linjer som skal legges til. I AlphaEvolve genererer LLM disse diffene ved å analysere den nåværende programmet og foreslå små redigeringer – legge til en funksjon, optimere en løkke eller endre en hyperparameter – basert på en prompt som inkluderer ytelsesmetrikk og tidligere suksessfulle redigeringer.
Hver modifisert program testes ved hjelp av automatiserte evalueringer tilpasset oppgaven. De mest effektive kandidatene lagres, refereres og kombineres som inspirasjon for fremtidige iterasjoner. Over tid fører denne evolusjonære løkken til fremveksten av stadig mer sofistikerte algoritmer – ofte overgående de som er designet av menneskelige eksperter.
Forståelsen av vitenskapen bak AlphaEvolve
I sin kjernesubstans er AlphaEvolve bygget på prinsippene om evolusjonær beregning – en undergren av kunstig intelligens inspirert av biologisk evolusjon. Systemet begynner med en grunnleggende implementering av kode, som det behandler som en initial “organisme”. Gjennom generasjoner modifiserer AlphaEvolve denne koden – introduserer variasjoner eller “mutasjoner” – og evaluerer fitnessen til hver variasjon ved hjelp av en veldefinert scoringsfunksjon. De best ytende variantene overlever og fungerer som maler for den neste generasjonen.
Denne evolusjonære løkken koordineres gjennom:
- Prompt Sampling: AlphaEvolve konstruerer prompter ved å velge og innlemme tidligere suksessfulle kodeeksempler, ytelsesmetrikk og oppgave-spesifikke instruksjoner.
- Kode-mutasjon og forslag: Systemet bruker en blanding av kraftfulle LLM-er – Gemini 2.0 Flash og Pro – for å generere spesifikke modifikasjoner av den nåværende kodebasen i form av diffs.
- Evaluering-mekanisme: En automatisert evaluering-funksjon vurderer hver kandidats ytelse ved å kjøre den og returnere skalarverdier.
- Database og kontroller: En distribuert kontroller orkestrerer denne løkken, lagrer resultater i en evolusjonær database og balanserer utforskning med utnytting gjennom mekanismer som MAP-Elites.
Denne tilbakemeldingsrike, automatiske evolusjonære prosessen skiller seg radikalt fra standard finjusteringsteknikker. Den gir AlphaEvolve mulighet til å generere nye, høytytende og noen ganger motintuitive løsninger – og utvider grensen for hva maskinlæring kan autonomt oppnå.

Sammenligning av AlphaEvolve og RLHF
For å verdsette AlphaEvolve’s innovasjon, er det viktig å sammenligne det med Reinforcement Learning from Human Feedback (RLHF), en dominant tilnærming brukt til å finjustere store språkmodeller.
I RLHF brukes menneskelige preferanser til å trene en belønning-modell, som leder læreprosessen til en LLM via forsterkingslæring-algoritmer som Proximal Policy Optimization (PPO). RLHF forbedrer alignement og nytte av modeller, men det krever omfattende menneskelig involvering for å generere tilbakemeldingsdata og opererer vanligvis i en statisk, en-gangs finjustering-regime.
AlphaEvolve, i kontrast:
- Fjerner menneskelig tilbakemelding fra løkken til fordel for maskin-eksekverbare evalueringer.
- Støtter kontinuerlig læring gjennom evolusjonær seleksjon.
- Utforsker mye bredere løsningsrom på grunn av stokastiske mutasjoner og asynkron kjøring.
- Kan generere løsninger som ikke bare er alignert, men nye og vitenskapelig betydningsfulle.
Hvor RLHF finjusterer atferd, oppdager og oppfinner AlphaEvolve. Denne distinksjonen er kritisk når man vurdere fremtidige trajektorier mot AGI: AlphaEvolve gjør ikke bare bedre prediksjoner – det finner nye veier til sannhet.
Anvendelser og gjennombrudd
1. Algoritmisk oppdagelse og matematiske fremsteg
AlphaEvolve har demonstrert sin kapasitet for banebrytende oppdagelser i kjerneproblem med algoritmer. Mest merkbart oppdaget det en ny algoritme for å multiplisere to 4×4 komplekse matriser med bare 48 skalar-multiplikasjoner – overgående Strassens resultat fra 1969 på 49 multiplikasjoner og brutt en 56 år gammel teoretisk tak. AlphaEvolve oppnådde dette gjennom avanserte tensor-dekomposisjonsteknikker som det utviklet over mange iterasjoner, overgående flere state-of-the-art-tilnærminger.
Forbi matrisemultiplikasjon har AlphaEvolve bidratt betydelig til matematisk forskning. Det ble evaluert på over 50 åpne problemer over felt som kombinatorikk, tallteori og geometri. Det matchet de beste kjente resultater i omtrent 75% av tilfellene og overgikk dem i omtrent 20%. Disse suksessene inkluderte forbedringer av Erdős’ Minimum Overlap Problem, en tettere løsning på Kissing Number Problem i 11 dimensjoner og mer effektive geometriske pakking-konfigurasjoner. Disse resultater understreker dens evne til å fungere som en autonom matematisk utforsker – finjustere, iterere og utvikle stadig mer optimale løsninger uten menneskelig involvering.
2. Optimering over Googles beregningsstak
AlphaEvolve har også levert konkrete ytelsesforbedringer over Googles infrastruktur:
- I data-senter planlegging oppdaget det en ny heuristikk som forbedret jobb-plassering, gjenvant 0,7% av tidligere strandede beregningsressurser.
- For Geminis trening-kjerner utviklet AlphaEvolve en bedre tiling-strategi for matrisemultiplikasjon, resulterende i en 23% kjern-hastighet og en 1% total reduksjon i treningstid.
- I TPU-kretsdesign identifiserte det en forenkling av aritmetisk logikk på RTL (Register-Transfer Level), verifisert av ingeniører og inkludert i neste-generasjons TPU-chip.
- Det optimaliserte også compiler-generert FlashAttention-kode ved å redigere XLA-mellomrepresentasjoner, kutte inferenstid på GPU med 32%.
Disse resultater sammen bekrefter AlphaEvolves kapasitet til å operere på flere abstraksjonsnivåer – fra symbolsk matematikk til lav-nivå maskinoptimering – og levere reelle ytelsesforbedringer.
- Evolusjonær programmering: En AI-paradigme som bruker mutasjon, seleksjon og arv til å iterativt forbedre løsninger.
- Kode-superoptimering: Den automatiske søken etter den mest effektive implementeringen av en funksjon – ofte resulterende i overraskende, motintuitive forbedringer.
- Meta-prompt-evolusjon: AlphaEvolve evoluerer ikke bare kode, men også hvordan det kommuniserer instruksjoner til LLM-er – muliggjør selvforbedring av kodeprosessen.
- Discretiseringstab: En regulariseringsterm som oppmuntre utdata til å alignere med halv-integer eller integer-verdier, kritisk for matematisk og symbolsk klarhet.
- Hallusinasjonstab: En mekanisme for å injisere tilfeldighet i mellomliggende løsninger, oppmuntre til utforskning og unngå lokale minima.
- MAP-Elites-algoritme: En type kvalitets-mangfold-algoritme som opprettholder en divers populasjon av høytytende løsninger over egenskapsdimensjoner – muliggjør robust innovasjon.
Konsekvenser for AGI og ASI
AlphaEvolve er mer enn en optimizer – det er et glimt inn i en fremtid hvor intelligente agenter kan demonstrere kreativ autonomi. Systemets evne til å formulere abstrakte problemer og designe sine egne tilnærminger til å løse dem representerer en betydelig skritt mot Artificial General Intelligence. Dette går utenfor dataprediksjon: det involverer strukturert resonnering, strategi-dannelse og tilpasning til tilbakemelding – kjennetegn på intelligent atferd.
Dets kapasitet til å iterativt generere og forbedre hypoteser signaliserer også en evolusjon i hvordan maskiner lærer. I motsetning til modeller som krever omfattende overvåket trening, forbedrer AlphaEvolve seg selv gjennom en løkke av eksperimentering og evaluering. Denne dynamiske formen for intelligens tillater det å navigere komplekse problem-rom, forkaste svake løsninger og elevere sterkere løsninger uten direkte menneskelig tilsyn.
Ved å kjøre og validere sine egne ideer, fungerer AlphaEvolve både som teoretiker og eksperimentalist. Det flytter seg bort fra å utføre forhåndsdefinerte oppgaver og inn i området for oppdagelse, simulering en autonom vitenskapelig prosess. Hver foreslått forbedring testes, benchmarkes og re-integreres – tillater kontinuerlig forbedring basert på reelle resultater i stedet for statiske mål.
Kanskje mest merkbart er AlphaEvolve et tidlig eksempel på rekursiv selvforbedring – hvor et AI-system ikke bare lærer, men også forbedrer komponenter av seg selv. I flere tilfeller forbedret AlphaEvolve trening-infrastrukturen som støtter sine egne grunnmodeller. Selv om det fortsatt er begrenset av nåværende arkitekturer, setter denne kapasiteten en presedens. Med flere problemer rammet i vurderbare miljøer, kunne AlphaEvolve skala mot stadig mer sofistikert og selv-optimerende atferd – en grunnleggende egenskap ved Artificial Superintelligence (ASI).
Begrensninger og fremtidig trajektorie
AlphaEvolves nåværende begrensning er dens avhengighet av automatiske evaluering-funksjoner. Dette begrenser dens nytte til problemer som kan formaliseres matematisk eller algoritmisk. Det kan ikke ennå operere meningsfullt i domener som krever implisitt menneskelig forståelse, subjektiv dømmekraft eller fysisk eksperimentering.
Likevel inkluderer fremtidige retninger:
- Integrasjon av hybrid-evaluering: kombinere symbolsk resonnering med menneskelige preferanser og naturlig-språklig kritikk.
- Utrolighet i simuleringsmiljøer, muliggjør inkarnert vitenskapelig eksperimentering.
- Destillasjon av utviklede utdata til grunn-LLM-er, skaper mer kapable og prøve-effektive grunnmodeller.
Disse retningene peker mot stadig mer agente systemer i stand til autonom, høy-utsatt problem-løsning.
Konklusjon
AlphaEvolve er et betydelig skritt fremover – ikke bare i AI-verktøy, men i vår forståelse av maskinintelligens selv. Ved å kombinere evolusjonær søk med LLM-resonnering og tilbakemelding, redefinere det hva maskiner kan autonomt oppdage. Det er et tidlig, men betydelig signal om at selv-forbedrende systemer kapable til virkelig vitenskapelig tenkning ikke lenger er teoretiske.
Ser fremover, kunne arkitekturen under AlphaEvolve bli rekursivt anvendt på seg selv: evolusjonær evalueringer, forbedring av mutasjonslogikken, finjustering av scoringsfunksjonene og optimalisering av underliggende trening-pipelines for modellene det avhenger av. Denne rekursive optimaliseringsløkken representerer en teknisk mekanisme for å bootstrappe mot AGI, hvor systemet ikke bare fullfører oppgaver, men også forbedrer den underliggende infrastrukturen som muliggjør dens læring og resonnering.
Over tid, mens AlphaEvolve skalerer over mer komplekse og abstrakte domener – og mens menneskelig involvering i prosessen minsker – kan det vise akselererende intelligens-gevinster. Denne selv-forsterkende syklusen av iterativ forbedring, anvendt ikke bare på eksterne problemer, men innover til sin egen algoritmiske struktur, er en nøkkel-teoretisk komponent av AGI og alle de fordeler det kan gi samfunnet. Med sin blanding av kreativitet, autonomi og rekurs, kan AlphaEvolve bli husket ikke bare som et produkt av DeepMind, men som en mal for de første virkelig generelle og selv-utviklende kunstige sinn.












