Algemene kunstmatige intelligentie

AlphaEvolve: Google DeepMind's baanbrekende stap richting AGI

gepubliceerd May 17, 2025

Antoine Tardif, CEO en oprichter van Unite.AI

Google DeepMind heeft onthuld AlphaEvolve, een evolutionaire coderingsagent die is ontworpen om autonoom nieuwe algoritmen en wetenschappelijke oplossingen te ontdekken. Gepresenteerd in het artikel getiteld "AlphaEvolve: een coderingsagent voor wetenschappelijke en algoritmische ontdekking' Dit onderzoek vertegenwoordigt een fundamentele stap in de richting van Kunstmatige algemene intelligentie (AGI) en zelfs Kunstmatige superintelligentie (ASI)In plaats van te vertrouwen op statische finetuning of door mensen gelabelde datasets, bewandelt AlphaEvolve een geheel andere weg: een weg die zich richt op autonome creativiteit, algoritmische innovatie en continue zelfverbetering.

De kern van AlphaEvolve is een op zichzelf staande evolutionaire pijplijn die wordt aangestuurd door grote taalmodellen (LLM's)Deze pijplijn genereert niet alleen output, maar muteert, evalueert, selecteert en verbetert code over generaties heen. AlphaEvolve begint met een initieel programma en verfijnt dit iteratief door zorgvuldig gestructureerde wijzigingen aan te brengen.

Deze wijzigingen nemen de vorm aan van door de LLM gegenereerde diffs – codewijzigingen die worden voorgesteld door een taalmodel op basis van eerdere voorbeelden en expliciete instructies. Een 'diff' in software engineering verwijst naar het verschil tussen twee versies van een bestand, waarbij doorgaans regels worden gemarkeerd die moeten worden verwijderd of vervangen en nieuwe regels die moeten worden toegevoegd. In AlphaEvolve genereert de LLM deze diffs door het huidige programma te analyseren en kleine bewerkingen voor te stellen – het toevoegen van een functie, het optimaliseren van een lus of het wijzigen van een hyperparameter – op basis van een prompt met prestatiegegevens en eerdere succesvolle bewerkingen.

Elk aangepast programma wordt vervolgens getest met behulp van geautomatiseerde evaluatoren die specifiek zijn afgestemd op de taak. De meest effectieve kandidaten worden opgeslagen, gerefereerd en opnieuw gecombineerd als inspiratie voor toekomstige iteraties. Na verloop van tijd leidt deze evolutionaire cyclus tot de opkomst van steeds geavanceerdere algoritmen – die vaak de algoritmen van menselijke experts overtreffen.

De wetenschap achter AlphaEvolve begrijpen

In de kern is AlphaEvolve gebaseerd op de principes van evolutionaire berekening—een subgebied van kunstmatige intelligentie, geïnspireerd door biologische evolutie. Het systeem begint met een basisimplementatie van code, die het beschouwt als een initieel "organisme". Door de generaties heen wijzigt AlphaEvolve deze code – door variaties of "mutaties" te introduceren – en evalueert de geschiktheid van elke variatie met behulp van een goed gedefinieerde scorefunctie. De best presterende varianten blijven bestaan en dienen als sjablonen voor de volgende generatie.

Deze evolutionaire lus wordt gecoördineerd door:

Snelle bemonstering: AlphaEvolve maakt prompts door eerder succesvolle codevoorbeelden, prestatiegegevens en taakspecifieke instructies te selecteren en in te sluiten.
Codemutatie en voorstel: Het systeem maakt gebruik van een combinatie van krachtige LLM's (Gemini 2.0 Flash en Pro) om specifieke wijzigingen aan de huidige codebase te genereren in de vorm van diffs.
Evaluatiemechanisme: Een geautomatiseerde evaluatiefunctie beoordeelt de prestaties van elke kandidaat door deze uit te voeren en scalaire scores te retourneren.
Database en controller: Een gedistribueerde controller orkestreert deze lus, slaat de resultaten op in een evolutionaire database en zorgt voor een evenwicht tussen exploratie en exploitatie via mechanismen als MAP-Elites.

Dit feedbackrijke, geautomatiseerde evolutionaire proces verschilt radicaal van standaard finetuningtechnieken. Het stelt AlphaEvolve in staat om nieuwe, hoogwaardige en soms contra-intuïtieve oplossingen te genereren – en zo de grenzen te verleggen van wat machine learning autonoom kan bereiken.

AlphaEvolve vergelijken met RLHF

Om de innovatie van AlphaEvolve te waarderen, is het cruciaal om deze te vergelijken met Versterking leren van menselijke feedback (RLHF), een dominante aanpak om grote taalmodellen te verfijnen.

Bij RLHF worden menselijke voorkeuren gebruikt om een beloningsmodel te trainen, dat het leerproces van een LLM begeleidt via versterking van leren algoritmen zoals Proximale beleidsoptimalisatie (PPO)RLHF verbetert de uitlijning en bruikbaarheid van modellen, maar vereist uitgebreide menselijke betrokkenheid om feedbackgegevens te genereren en werkt doorgaans in een statisch, eenmalig fijnafstemmingsregime.

AlphaEvolve daarentegen:

Verwijdert menselijke feedback uit de lus ten gunste van door machines uitvoerbare evaluators.
Ondersteunt continu leren door evolutionaire selectie.
Verkent veel bredere oplossingsruimten dankzij stochastische mutaties en asynchrone uitvoering.
Kan oplossingen genereren die niet alleen op elkaar zijn afgestemd, maar roman en wetenschappelijk significant.

Waar RLHF het gedrag verfijnt, AlphaEvolve ontdekt en bedenktDit onderscheid is cruciaal bij het overwegen van toekomstige trajecten richting AGI: AlphaEvolve doet niet alleen betere voorspellingen, het vindt ook nieuwe wegen naar de waarheid.

Toepassingen en doorbraken

1. Algoritmische ontdekking en wiskundige vooruitgang

AlphaEvolve heeft zijn vermogen tot baanbrekende ontdekkingen in fundamentele algoritmische problemen aangetoond. Het meest opvallende is de ontdekking van een nieuw algoritme voor het vermenigvuldigen van twee complexe 4x4 matrices met slechts 48 scalaire vermenigvuldigingen – waarmee het de 1969 vermenigvuldigingen van Strassen uit 49 overtrof en een 56 jaar oud theoretisch plafond doorbrak. AlphaEvolve bereikte dit met behulp van geavanceerde tensordecompositietechnieken die het in de loop van vele iteraties ontwikkelde en daarmee verschillende state-of-the-art benaderingen overtrof.

Naast matrixvermenigvuldiging leverde AlphaEvolve substantiële bijdragen aan wiskundig onderzoek. Het werd geëvalueerd op meer dan 50 openstaande problemen in vakgebieden zoals combinatoriek, getaltheorie en meetkunde. Het voldeed in ongeveer 75% van de gevallen aan de meest bekende resultaten en overtrof deze in ongeveer 20%. Deze successen omvatten verbeteringen aan Erdős' Minimum Overlap Problem, een dichtere oplossing voor het Kissing Number Problem in 11 dimensies en efficiëntere geometrische pakkingsconfiguraties. Deze resultaten onderstrepen het vermogen van AlphaEvolve om te fungeren als een autonome wiskundige ontdekkingsreiziger – die steeds optimalere oplossingen verfijnt, itereert en ontwikkelt zonder menselijke tussenkomst.

2. Optimalisatie in de Compute Stack van Google

AlphaEvolve heeft ook tastbare prestatieverbeteringen opgeleverd in de infrastructuur van Google:

In datacenterplanningwerd een nieuwe heuristiek ontdekt die de arbeidsbemiddeling verbeterde en 0.7% van de voorheen gestrande computerbronnen terugwon.
Voor Gemini's trainingskernenAlphaEvolve ontwikkelde een betere tegelstrategie voor matrixvermenigvuldiging, wat resulteerde in een kernelsnelheidsverhoging van 23% en een algehele vermindering van de trainingstijd met 1%.
In TPU-circuitontwerp, werd een vereenvoudiging van de rekenkundige logica op RTL (Register-Transfer Level) geïdentificeerd, geverifieerd door technici en opgenomen in TPU-chips van de volgende generatie.
Het is ook geoptimaliseerd door de compiler gegenereerde FlashAttention-code door het bewerken van XLA-tussenliggende representaties, waardoor de inferentietijd op GPU's met 32% werd verkort.

Samen bevestigen deze resultaten de capaciteit van AlphaEvolve om op meerdere abstractieniveaus te werken – van symbolische wiskunde tot hardware-optimalisatie op laag niveau – en daadwerkelijke prestatieverbeteringen te leveren.

Evolutionaire programmering: Een AI-paradigma dat gebruikmaakt van mutatie, selectie en overerving om oplossingen iteratief te verfijnen.
Code-superoptimalisatie: De geautomatiseerde zoektocht naar de meest efficiënte implementatie van een functie, wat vaak verrassende, tegenintuïtieve verbeteringen oplevert.
Meta Prompt Evolutie: AlphaEvolve verbetert niet alleen de code, maar verbetert ook de manier waarop instructies aan LLM's worden gecommuniceerd. Hierdoor kan het coderingsproces zelf worden verfijnd.
Discretisatieverlies: Een regularisatieterm die de uitvoer aanmoedigt om af te stemmen op halve gehele getallen of gehele getallen, wat essentieel is voor de wiskundige en symbolische duidelijkheid.
Hallucinatieverlies: Een mechanisme om willekeur in tussenoplossingen te injecteren, waardoor exploratie wordt aangemoedigd en lokale minima worden vermeden.
MAP-Elites-algoritme: Een type algoritme voor kwaliteitsdiversiteit dat een diverse populatie van goed presterende oplossingen in alle functiedimensies in stand houdt, wat robuuste innovatie mogelijk maakt.

Implicaties voor AGI en ASI

AlphaEvolve is meer dan een optimizer – het biedt een blik op een toekomst waarin intelligente agenten creatieve autonomie kunnen tonen. Het vermogen van het systeem om abstracte problemen te formuleren en zijn eigen aanpak te ontwerpen om ze op te lossen, is een belangrijke stap in de richting van kunstmatige algemene intelligentie (AI). Dit gaat verder dan datavoorspelling: het vereist gestructureerd redeneren, strategievorming en het aanpassen aan feedback – kenmerken van intelligent gedrag.

Het vermogen om iteratief hypothesen te genereren en te verfijnen, duidt ook op een evolutie in de manier waarop machines leren. In tegenstelling tot modellen die uitgebreide begeleide trainingAlphaEvolve verbetert zichzelf door middel van een lus van experimenten en evaluaties. Deze dynamische vorm van intelligentie stelt het in staat om complexe probleemgebieden te navigeren, zwakke oplossingen te verwerpen en sterkere te verbeteren zonder direct menselijk toezicht.

Door eigen ideeën uit te voeren en te valideren, fungeert AlphaEvolve zowel als theoreticus als experimentator. Het gaat verder dan het uitvoeren van vooraf gedefinieerde taken en begeeft zich op het gebied van ontdekkingen, waarbij het een autonoom wetenschappelijk proces simuleert. Elke voorgestelde verbetering wordt getest, gebenchmarkt en opnieuw geïntegreerd, wat zorgt voor continue verfijning op basis van echte resultaten in plaats van statische doelstellingen.

Het meest opvallende is misschien wel dat AlphaEvolve een vroeg voorbeeld is van recursieve zelfverbetering – waarbij een AI-systeem niet alleen leert, maar ook componenten van zichzelf verbetert. In verschillende gevallen verbeterde AlphaEvolve de trainingsinfrastructuur die zijn eigen basismodellen ondersteunt. Hoewel nog steeds beperkt door de huidige architecturen, schept deze mogelijkheid een precedent. Met meer problemen in evalueerbare omgevingen zou AlphaEvolve kunnen opschalen naar steeds geavanceerder en zelfoptimaliserend gedrag – een fundamenteel kenmerk van kunstmatige superintelligentie (ASI).

Beperkingen en toekomstige trajecten

De huidige beperking van AlphaEvolve is de afhankelijkheid van geautomatiseerde evaluatiefuncties. Dit beperkt de bruikbaarheid tot problemen die wiskundig of algoritmisch geformaliseerd kunnen worden. Het kan nog niet zinvol functioneren in domeinen die impliciet menselijk begrip, subjectief oordeel of fysieke experimenten vereisen.

Toekomstige richtingen zijn onder meer:

Integratie van hybride evaluatie: symbolisch redeneren combineren met menselijke voorkeuren en natuurlijke-taalkritiek.
Implementatie in simulatieomgevingen, waardoor geïntegreerde wetenschappelijke experimenten mogelijk worden.
Destillatie van de ontwikkelde uitkomsten in basis-LLM's, waardoor er capabelere en monsterefficiëntere basismodellen ontstaan.

Deze ontwikkelingen wijzen in de richting van steeds meer agentsystemen die in staat zijn tot autonome, risicovolle probleemoplossing.

Conclusie

AlphaEvolve is een enorme stap voorwaarts – niet alleen in AI-tools, maar ook in ons begrip van machine-intelligentie zelf. Door evolutionair zoeken te combineren met LLM-redeneringen en feedback, herdefinieert het wat machines autonoom kunnen ontdekken. Het is een vroeg maar belangrijk signaal dat zelfverbeterende systemen die in staat zijn tot echt wetenschappelijk denken, niet langer theoretisch zijn.

Vooruitkijkend zou de architectuur die ten grondslag ligt aan AlphaEvolve recursief op zichzelf kunnen worden toegepast: door eigen evaluatoren te ontwikkelen, de mutatielogica te verbeteren, de scorefuncties te verfijnen en de onderliggende trainingspipelines te optimaliseren voor de modellen waarvan het afhankelijk is. Deze recursieve optimalisatielus vertegenwoordigt een technisch mechanisme voor bootstrapping richting AGI, waarbij het systeem niet alleen taken voltooit, maar ook de infrastructuur verbetert die leren en redeneren mogelijk maakt.

Naarmate AlphaEvolve zich in de loop van de tijd opschaalt naar complexere en abstractere domeinen – en naarmate de menselijke tussenkomst in het proces afneemt – kan het steeds sneller intelligentiewinst boeken. Deze zichzelf versterkende cyclus van iteratieve verbetering, die niet alleen wordt toegepast op externe problemen maar ook op de eigen algoritmische structuur, is een belangrijk theoretisch onderdeel van AGI en alle voordelen die het de maatschappij kan biedenMet zijn mix van creativiteit, autonomie en recursie kan AlphaEvolve niet alleen herinnerd worden als een product van DeepMind, maar als een blauwdruk voor de eerste werkelijk algemene en zichzelf ontwikkelende kunstmatige geesten.

Gerelateerde onderwerpen:AGI AlphaEvolve ASI DeepMind

Hoe AGI een universele taal zal creëren om het menselijk denken te transformeren

Mis het niet

PRISM wordt gelanceerd als 's werelds eerste non-profitorganisatie die zich toelegt op onderzoek naar intelligente AI

Antoine Tardif

Antoine is een visionair leider en oprichter van Unite.AI, gedreven door een onwrikbare passie voor het vormgeven en promoten van de toekomst van AI en robotica. Als serieel ondernemer gelooft hij dat AI net zo ontwrichtend voor de maatschappij zal zijn als elektriciteit, en wordt hij vaak betrapt op het uiten van lyrische verhalen over de potentie van ontwrichtende technologieën en AGI.

Als futuristisch, hij is toegewijd aan het onderzoeken hoe deze innovaties onze wereld zullen vormgeven. Daarnaast is hij de oprichter van Effecten.io, een platform dat zich richt op investeringen in geavanceerde technologieën die de toekomst opnieuw definiëren en hele sectoren opnieuw vormgeven.

Verenig.AI