Connect with us

AGI

AlphaEvolve: Google DeepMinds banebrydende skridt mod AGI

mm

Google DeepMind har præsenteret AlphaEvolve, en evolutionær kodningsagent designet til at autonomt opdage nye algoritmer og videnskabelige løsninger. Præsenteret i artiklen med titlen AlphaEvolve: En kodningsagent for videnskabelig og algoritmisk opdagelse,” repræsenterer denne forskning et grundlæggende skridt mod Kunstig Almindelig Intelligens (AGI) og sogar Kunstig Superintelligens (ASI). I stedet for at afhænge af statisk finjustering eller menneske-labelede datasets, tager AlphaEvolve en helt anden vej – en, der handler om autonom kreativitet, algoritmisk innovation og kontinuerlig selvforbedring.

I hjertet af AlphaEvolve ligger en selvstændig evolutionær pipeline drevet af store sprogmodeller (LLM). Denne pipeline genererer ikke kun outputs – den muterer, evaluerer, vælger og forbedrer kode over generationer. AlphaEvolve starter med en initial program og refinerer det iterativt ved at introducere omhyggeligt strukturerede ændringer.

Disse ændringer tager form af LLM-genererede diffs – kodeændringer foreslået af en sprogmodel baseret på tidligere eksempler og eksplisitte instruktioner. En ‘diff’ i softwareingeniørarbejde refererer til forskellen mellem to versioner af en fil, typisk fremhæver linjer, der skal fjernes eller erstattes, og nye linjer, der skal tilføjes. I AlphaEvolve genererer LLM disse diffs ved at analysere den aktuelle program og foreslå små redigeringer – tilføje en funktion, optimere en løkke eller ændre en hyperparameter – baseret på en prompt, der inkluderer performance-metrikker og tidligere succesfulde redigeringer.

Hver ændret program testes derefter ved hjælp af automatiserede evalueringer tilpasset opgaven. De mest effektive kandidater gemmes, refereres og kombineres som inspiration for fremtidige iterationer. Over tid fører denne evolutionære løkke til opdukken af stadig mere avancerede algoritmer – ofte overgående dem, der er designet af menneskelige eksperter.

Forståelsen af videnskaben bag AlphaEvolve

I sin kerne er AlphaEvolve bygget på principperne om evolutionær beregning – en underdisciplin af kunstig intelligens inspireret af biologisk evolution. Systemet starter med en grundlæggende implementering af kode, som det behandler som en initial “organisme”. Gennem generationer ændrer AlphaEvolve denne kode – introducerer variationer eller “mutationer” – og evaluerer fitness af hver variation ved hjælp af en veldefineret scorefunktion. De bedst performende varianter overlever og fungerer som skabeloner for den næste generation.

Denne evolutionære løkke koordineres gennem:

  • Prompt Sampling: AlphaEvolve konstruerer prompts ved at vælge og indlejre tidligere succesfulde kodeeksempler, performance-metrikker og opgave-specifikke instruktioner.
  • Kode-mutation og forslag: Systemet bruger en blanding af kraftfulde LLM – Gemini 2.0 Flash og Pro – til at generere specifikke ændringer af den aktuelle kodebase i form af diffs.
  • Evaluationsmekanisme: En automatiseret evaluationsfunktion vurderer hver kandidats performance ved at udføre den og returnere scalar scores.
  • Database og controller: En distribueret controller orkestrerer denne løkke, gemmer resultater i en evolutionær database og balancerer eksploration med udnyttelse gennem mekanismer som MAP-Elites.

Denne feedback-rike, automatiserede evolutionære proces adskiller sig radikalt fra standard finjusteringsteknikker. Den giver AlphaEvolve mulighed for at generere nye, højtydende og nogle gange modsigende løsninger – og udvider grænserne for, hvad maskinel læring kan opnå autonomt.

Sammenligning af AlphaEvolve og RLHF

For at værdsætte AlphaEvolve’s innovation, er det afgørende at sammenligne det med Reinforcement Learning from Human Feedback (RLHF), en dominerende tilgang brugt til at finjustere store sprogmodeller.

I RLHF bruges menneskelige præferencer til at træne en belønningsmodel, som vejleder læreprocessen for en LLM via reinforcement learning algoritmer som Proximal Policy Optimization (PPO). RLHF forbedrer alignment og nyttighed af modeller, men det kræver omfattende menneskelig indblanding til at generere feedback-data og opererer typisk i en statisk, en-gangs finjusteringsregime.

AlphaEvolve, til gengæld:

  • Fjerner menneskelig feedback fra løkken til fordel for maskin-eksekverbare evalueringer.
  • Støtter kontinuerlig læring gennem evolutionær udvælgelse.
  • Udforsker meget bredere løsningsrum på grund af stokastiske mutationer og asynkron udførelse.
  • Kan generere løsninger, der ikke kun er alignet, men nye og videnskabeligt betydningsfulde.

Hvor RLHF finjusterer adfærd, opdager og opfinder AlphaEvolve. Denne forskel er kritisk, når man overvejer fremtidige trajektorier mod AGI: AlphaEvolve gør ikke kun bedre forudsigelser – det finder nye veje til sandheden.

Anvendelser og gennembrud

1. Algoritmisk opdagelse og matematisk fremgang

AlphaEvolve har demonstreret sin kapacitet for banebrydende opdagelser i kernealgoritme-problemer. Mest bemærkelsesværdigt opdagede det en ny algoritme for at multiplicere to 4×4 komplekse matricer ved hjælp af kun 48 skalar-multiplicationer – overgående Strassens resultat fra 1969 på 49 multiplicationer og brækkede en 56-årig teoretisk loft. AlphaEvolve opnåede dette gennem avancerede tensor-dekompositionsteknikker, som det udviklede over mange iterationer, og overgik flere state-of-the-art-tilgange.

Ud over matrix-multiplication bidrog AlphaEvolve væsentligt til matematisk forskning. Det blev evaluere på over 50 åbne problemer på tværs af fag som kombinatorik, talteori og geometri. Det matchede de bedst kendte resultater i ca. 75% af tilfældene og overgik dem i ca. 20%. Disse succeser inkluderede forbedringer af Erdős’s Minimum Overlap Problem, en tættere løsning til Kissing Number Problem i 11 dimensioner og mere effektive geometriske pakning-konfigurationer. Disse resultater understreger dets evne til at fungere som en autonom matematisk udforsker – til at raffinere, iterere og udvikle stadig mere optimale løsninger uden menneskelig indblanding.

2. Optimering på tværs af Googles compute-stack

AlphaEvolve har også leveret konkrete performance-forbedringer på tværs af Googles infrastruktur:

  • I data center scheduling opdagede det en ny heuristik, der forbedrede job-placering, og genvandt 0,7% af tidligere strandede compute-resourcer.
  • For Geminis træningskerner designede AlphaEvolve en bedre tiling-strategi for matrix-multiplication, hvilket resulterede i en 23% kernel-hastighedsforbedring og en 1% overall-reduktion i træningstid.
  • I TPU-cirkel-design identificerede det en forenkling af aritmetisk logik på RTL (Register-Transfer Level), verificeret af ingeniører og inkluderet i næste-generations TPU-chips.
  • Det optimerede også compiler-genereret FlashAttention-kode ved at redigere XLA-mellemrepræsentationer, hvilket reducerede inference-tid på GPU’er med 32%.

Sammen validere disse resultater AlphaEvolve’s kapacitet til at operere på multiple abstraktionsniveauer – fra symbolisk matematik til lavniveau-hardware-optimering – og levere reel-verdenens performance-forbedringer.

  • Evolutionær programmering: En AI-paradigme, der bruger mutation, udvælgelse og arv til at iterativt forbedre løsninger.
  • Kode-superoptimering: Den automatiserede søgning efter den mest effektive implementering af en funktion – ofte resulterende i overraskende, modsigende forbedringer.
  • Meta-prompt-evolution: AlphaEvolve udvikler ikke kun kode, men også, hvordan det kommunikerer instruktioner til LLM – muliggørende selv-forbedring af kodningsprocessen.
  • Discretization-tab: En regulariserings-term, der opmuntrer outputs til at alignere med halv-integer eller integer-værdier, kritisk for matematisk og symbolisk klarhed.
  • Hallucination-tab: En mekanisme til at indføre tilfældighed i mellemvarige løsninger, opmuntrende til eksploration og undgåelse af lokale minima.
  • MAP-Elites-algoritme: En type kvalitets-mangfoldighedsalgoritme, der vedligeholder en divers population af højtydende løsninger på tværs af funktion-dimensioner – muliggørende robust innovation.

Konsekvenser for AGI og ASI

AlphaEvolve er mere end en optimizer – det er et glimt ind i en fremtid, hvor intelligente agenter kan demonstrere kreativ autonomi. Systemets evne til at formulerer abstrakte problemer og designe sine egne tilgange til at løse dem repræsenterer et betydeligt skridt mod Kunstig Almindelig Intelligens. Dette går ud over data-forudsigelse – det indebærer struktureret resonnering, strategi-dannelse og tilpasning til feedback – kendetegn for intelligent adfærd.

Dets kapacitet til at iterativt generere og raffinere hypoteser signalerer også en evolution i, hvordan maskiner lærer. I modsætning til modeller, der kræver omfattende overvåget træning, forbedrer AlphaEvolve sig selv gennem en løkke af eksperimentation og evaluering. Denne dynamiske form for intelligens giver det mulighed for at navigere komplekse problemrum, afvise svage løsninger og hæve stærkere løsninger uden direkte menneskelig tilsyn.

Ved at udføre og validere sine egne idéer fungerer AlphaEvolve som både teoretikeren og eksperimentalisten. Det flytter sig ud over udførelse af foruddefinerede opgaver og ind i opdagelsens rige – simulerer en autonom videnskabelig proces. Hver foreslået forbedring testes, benchmarkes og gen-integreres – muliggørende kontinuerlig forbedring baseret på reelle resultater snarere end statiske mål.

Måske mest bemærkelsesværdigt er AlphaEvolve et tidligt eksempel på rekursiv selvforbedring – hvor et AI-system ikke kun lærer, men også forbedrer komponenter af sig selv. I flere tilfælde forbedrede AlphaEvolve trænings-infrastrukturen, der understøtter dets egne grundlæggende modeller. Selv om det stadig er begrænset af nuværende arkitekturer, sætter denne kapacitet en præcedens. Med flere problemer formuleret i evaluerbare miljøer kunne AlphaEvolve skale mod stadig mere avanceret og selv-optimerende adfærd – en grundlæggende egenskab af Kunstig Superintelligens (ASI).

Begrænsninger og fremtidig trajektorie

AlphaEvolve’s nuværende begrænsning er dens afhængighed af automatiserede evaluationsfunktioner. Dette begrænser dets nytte til problemer, der kan formaliseres matematisk eller algoritmisk. Det kan ikke endnu operere meningsfuldt i domæner, der kræver implicit menneskelig forståelse, subjektiv vurdering eller fysisk eksperimentation.

Dog inkluderer fremtidige retninger:

  • Integration af hybrid-evaluering: kombinerer symbolisk resonnering med menneskelige præferencer og naturligt-sproglige kritik.
  • Udrulning i simulations-miljøer, der muliggør inkarneret videnskabelig eksperimentation.
  • Destillation af udviklede outputs til grundlæggende LLM, skabende mere kapable og prøve-effektive grundlæggende modeller.

Disse retninger peger mod stadig mere agente systemer, der er i stand til autonom, høj-stakes-problemløsning.

Konklusion

AlphaEvolve er et betydeligt skridt fremad – ikke kun i AI-værktøjer, men i vores forståelse af maskinintelligens i sig selv. Ved at kombinere evolutionær søgning med LLM-resonnering og feedback, redefinerer det, hvad maskiner kan opdage autonomt. Det er et tidligt, men væsentligt signal om, at selv-forbedrende systemer, der er i stand til rigtig videnskabelig tanke, ikke længere er teoretiske.

I fremtiden, da AlphaEvolve’s arkitektur kan anvendes rekursivt på sig selv – udvikle sine egne evalueringer, forbedre mutation-logikken, raffinere score-funktionerne og optimere den underliggende trænings-pipeline for modellerne, det afhænger af – repræsenterer denne rekursive optimerings-løkke en teknisk mekanisme for at bootstrappe mod AGI, hvor systemet ikke kun udfører opgaver, men forbedrer den underliggende infrastruktur, der muliggør dets læring og resonnering.

Over tid, da AlphaEvolve skalerer på tværs af mere komplekse og abstrakte domæner – og da menneskelig indblanding i processen mindskes – kan det måske udvise accelererende intelligens-gevinster. Denne selv-forstærkende cyklus af iterativ forbedring, anvendt ikke kun på eksterne problemer, men indadtil på dets egen algoritmiske struktur, er en nøgle-teoretisk komponent af AGI og alle de fordele, det kan give samfundet. Med dets blanding af kreativitet, autonomi og rekursion kan AlphaEvolve måske huskes ikke kun som et produkt af DeepMind, men som en skitse for de første rigtigt almindelige og selv-udviklende kunstige sind.

Antoine er en visionær leder og medstifter af Unite.AI, drevet af en urokkelig passion for at forme og fremme fremtiden for AI og robotteknologi. En serieiværksætter, han tror, at AI vil være lige så omvæltende for samfundet som elektricitet, og bliver ofte fanget i at tale begejstret om potentialet for omvæltende teknologier og AGI.

Som en futurist, er han dedikeret til at udforske, hvordan disse innovationer vil forme vores verden. Derudover er han grundlægger af Securities.io, en platform, der fokuserer på at investere i skærende teknologier, der gendefinerer fremtiden og omformer hele sektorer.