Futurist-serie

AI lost Erdős-problemen. Wat komt hierna?

mm

Slechts een paar maanden geleden voelde de vraag voornamelijk filosofisch aan: als kunstmatige intelligentie kan helpen bij het oplossen van open wiskundige problemen, wat gebeurt er dan met het idee van menselijk genie?

Die vraag is niet langer theoretisch. Twee recente ontwikkelingen met betrekking tot OpenAI en Google DeepMind suggereren dat AI van wiskundig assistent naar wiskundig deelnemer beweegt. Niet in de zin dat het wiskundigen volledig vervangt, maar in de meer precieze en belangrijke zin dat het argumenten kan genereren, zoeken, controleren en soms ontdekken die expertonderzoek kunnen doorstaan.

De eerste ontwikkeling kwam van OpenAI, dat aankondigde dat een intern algemeen model voor redeneren een doorbraak had behaald op het planaire eenheidsafstandprobleem, een beroemde vraag gesteld door Paul Erdős in 1946. Het probleem vraagt hoeveel paren punten in een vlak exact één eenheid uit elkaar kunnen liggen. Decennialang was de heersende overtuiging dat vierkante roosters de beste constructies waren. Het model van OpenAI vond een nieuwe familie van constructies die die overtuiging weerlegde.

De tweede kwam van onderzoekers van Google DeepMind, die een paper publiceerden met de titel Advancing Mathematics Research with AI-Driven Formal Proof Search. Hun systeem, AlphaProof Nexus, beoordeelde AI-gestuurde bewijsgeneratie op open onderzoeksproblemen en rapporteerde dat de sterkste agent 9 van de 353 open Erdős-problemen autonoom had opgelost. Het bewees ook 44 van de 492 open conjecturen uit de Online Encyclopedia of Integer Sequences.

Samen markeren deze resultaten een verschuiving. Het belangrijke verhaal is niet dat AI plotseling wiskunde heeft opgelost. Dat heeft het niet. Het belangrijke verhaal is dat AI-systemen beginnen te opereren binnen de onderzoeksloop zelf.

Waarom Erdős-problemen een serieuze test voor AI zijn

Paul Erdős was een van de meest productieve wiskundigen in de geschiedenis, en de problemen die met zijn werk zijn verbonden, nemen een speciale plaats in de wiskunde in. Velen zijn gemakkelijk te formuleren, moeilijk op te lossen en verbonden met diepe gebieden zoals combinatoriek, getaltheorie, grafentheorie en discrete meetkunde.

Dat maakt ze ongewoon nuttig als benchmark voor AI-redenering. Ze zijn geen schooloefeningen. Ze zijn ook niet altijd reusachtige, theorie-veranderende conjecturen zoals de Riemann-hypothese. In plaats daarvan liggen veel Erdős-problemen in het middengebied waarvooruitzichten afhankelijk zijn van het vinden van de juiste verbinding, de juiste constructie of de juiste over het hoofd geziene lemma.

Dit is precies waar AI het meest nuttig kan zijn in het begin. Moderne redeneringssystemen zijn niet alleen rekenmachines. Ze kunnen veel mogelijke bewijsroutes verkennen, partiële strategieën vergelijken, verre ideeën uit aangrenzende velden ophalen en testen of een argument rigoureus kan worden gemaakt.

Het resultaat van OpenAI is opvallend omdat het model niet alleen een bekende route heeft gepolijst. Het heeft een onverwachte brug tussen discrete meetkunde en algebraïsche getaltheorie gevonden. Dat is het soort conceptuele sprong dat wiskundigen gewoonlijk associëren met echte creativiteit.

OpenAI en de doorbraak van de eenheidsafstand

Het planaire eenheidsafstandprobleem is eenvoudig te beschrijven. Plaats n punten in het vlak. Tel hoeveel paren punten exact één eenheid uit elkaar liggen. Het doel is om te begrijpen hoe groot die telling kan zijn als n groeit.

Voor bijna 80 jaar vermoedden wiskundigen dat de beste constructies niet dramatisch beter zouden presteren dan vierkante roosterachtige arrangementen. Het model van OpenAI daagde die veronderstelling uit door een oneindige familie van voorbeelden te produceren die de verwachte grens met een polynomiale verbetering overtroffen.

Dat is belangrijk om twee redenen. Ten eerste verandert het de wiskundige afbeelding. Het suggereert dat getaltheoretische constructies meer kunnen bijdragen aan discrete meetkunde dan veel onderzoekers aannamen. Ten tweede verandert het de AI-afbeelding. Het model dat betrokken was, werd beschreven als een algemeen redeneringsmodel, niet als een systeem dat specifiek voor dit specifieke probleem was gebouwd.

Met andere woorden, het systeem lijkt redeneringskracht te hebben overgedragen naar een onbekende onderzoeksomgeving. Het heeft niet alleen een bekend bewijs gememoriseerd. Het heeft een resultaat gegenereerd dat externe wiskundigen als een belangrijke bijdrage behandelden.

Google DeepMind en formele bewijszoektocht

Het paper van Google DeepMind behandelt een andere maar even belangrijke vraag: hoe kan AI-genererende wiskunde betrouwbaar worden gemaakt?

Taalmodellen kunnen elegante bewijzen produceren die subtiele fouten bevatten. In normale proza kunnen die fouten moeilijk te detecteren zijn. In wiskunde kan één verkeerde stap het hele bewijs ongeldig maken. Daarom zijn formele bewijsystemen zoals Lean belangrijk. Lean maakt niet uit of een argument overtuigend klinkt. Elke logische stap moet worden gecontroleerd.

AlphaProof Nexus gebruikt die beperking als onderdeel van de workflow. AI-agents genereren bewijspogingen in Lean, ontvangen feedback van de compiler, passen hun aanpak aan en gaan door met zoeken. De sterkere versie coördineert subagents en gebruikt geavanceerdere bewijsinstrumenten om de zoektocht te richten.

Ontwikkeling AI-methode Waarom het belangrijk is
OpenAI-eenheidsafstandsresultaat Algemeen redeneringsmodel Laat zien dat AI een originele constructie kan produceren voor een prominent open probleem
Google DeepMind AlphaProof Nexus LLM-geleide Lean-bewijszoektocht Laat zien dat AI meerdere open Erdős-problemen formeel kan oplossen
Formele bewijsverificatie Compiler-gecontroleerde logica Verkleint het risico van overtuigende maar ongeldige wiskundige output

Het resultaat van DeepMind is vooral belangrijk omdat het AI-redenering verbindt met verificatie. Het systeem hoeft niet op dezelfde manier te worden vertrouwd als een natuurlijke taalchatbot. Zijn bewijs compileert of het doet het niet.

Wat dit betekent voor wiskundig onderzoek

De huidige les is niet dat wiskundigen overbodig zijn. Het is dat de bottleneck in de wiskunde mogelijk verandert.

Historisch gezien moest een onderzoeker bijna alles zelf doen: het probleem formuleren, de literatuur onderzoeken, ideeën testen, het bewijs opbouwen, elke stap controleren en het resultaat communiceren. AI dreigt nu die arbeid te herverdelen. Sommige delen van de workflow kunnen sneller, goedkoper en geautomatiseerder worden.

  • AI kan veel bewijsroutes verkennen voordat een mens tijd aan een ervan besteedt.
  • Formele systemen kunnen stappen verifiëren die anders langdurige expertcontrole zouden vereisen.
  • Onderzoekers kunnen AI gebruiken om te zoeken in verre wiskundige deelgebieden.

Dit kan een nieuwe onderzoeksstijl produceren. In plaats van een AI om een antwoord te vragen, zullen wiskundigen steeds vaker toezicht houden op vloten van bewijsagents. De menselijke rol wordt minder een rekenmachine en meer een onderzoeksleider: het kiezen van de juiste problemen, het interpreteren van de resultaten, het detecteren van conceptuele significantie en het beslissen welke paden diepere aandacht verdienen.

De grenzen zijn nog steeds reëel

Het is belangrijk om de situatie niet te overdrijven. Het systeem van Google DeepMind loste 9 van de 353 geprobeerde Erdős-problemen op. Dat is indrukwekkend, maar het betekent ook dat de meeste onopgelost bleven. De doorbraak van OpenAI is een mijlpaal, maar het impliceert niet dat elke beroemde conjectuur nu binnen bereik ligt.

AI-systemen worstelen nog steeds wanneer een probleem een nieuw conceptueel kader vereist, wanneer de relevante wiskunde slecht is geformaliseerd, of wanneer een bewijs afhankelijk is van lange ketens van inzicht die niet gemakkelijk in doorzoekbare stappen kunnen worden opgedeeld. Formele bewijsbibliotheken zijn ook onevenwichtig. Gebieden met volwassen Lean-dekking zijn toegankelijker voor AI-agents dan gebieden waar het fundamentaal materiaal nog moet worden gecodeerd.

  • De systemen blijven afhankelijk van menselijke probleemselectie en interpretatie.
  • Formalisatie kan moeilijk zijn wanneer definities vaag of onderontwikkeld zijn.
  • AI-gegenereerde bewijspogingen kunnen nog steeds hard werken verbergen in onbewezen hulpclaims.

Deze grenzen zijn geen falen. Ze verduidelijken waar de volgende vooruitgang moet plaatsvinden. Betere stellingenbewijzende agents, rijkere formele bibliotheken, sterkere verificatie-workflows en effectievere mens-AI-interfaces zullen allemaal belangrijk zijn.

Wat komt hierna als AI Erdős-problemen oplost?

De meest waarschijnlijke nabije toekomst is niet één dramatisch moment waarop AI alle wiskunde oplost. Het is een gestage uitbreiding van AI-ondersteund onderzoek naar domeinen met schone probleemverklaringen, sterke formele bibliotheken en grote hoeveelheden gefragmenteerde eerdere werk.

Combinatoriek, grafentheorie, getaltheorie, optimalisatie en discrete meetkunde zijn natuurlijke vroege doelen. Deze gebieden bevatten vaak problemen waarvoor de vraag concies is, maar de oplossing afhankelijk is van het samenstellen van ideeën uit verre plaatsen. AI is hier goed voor geschikt.

Na verloop van tijd kan hetzelfde patroon zich uitbreiden tot verder dan wiskunde. Als een model een moeilijk argument bijeen kan houden, tussentijdse claims kan testen en ideeën kan verbinden over velden heen, zijn die mogelijkheden belangrijk in fysica, biologie, materiaalkunde, cryptografie en AI-onderzoek zelf.

De diepere consequentie is cultureel. Wiskunde heeft altijd bewijs gewaardeerd, maar het heeft ook smaak gewaardeerd: de mogelijkheid om te weten welke vraag ertoe doet, welke abstractie de moeite waard is om uit te vinden, en welk resultaat de vorm van een veld verandert. Naarmate bewijszoektocht meer geautomatiseerd wordt, kan smaak belangrijker worden, niet minder.

Conclusie: Genie gaat omhoog in de stapel

Het antwoord op de eerdere vraag is nu duidelijker. Als AI open wiskundige problemen kan oplossen, verdwijnt menselijk genie niet. Het gaat omhoog in de stapel.

De schaarse vaardigheid zal niet de mogelijkheid zijn om elke technische stap alleen te doorlopen. Het zal de mogelijkheid zijn om de juiste vragen te stellen, de juiste abstracties te formuleren, de betekenis van machine-ontdekte resultaten te beoordelen en AI-systemen naar problemen te leiden die ertoe doen.

De doorbraak van OpenAI en de formele bewijszoektocht van Google DeepMind sluiten het boek over menselijke wiskundige creativiteit niet. Ze openen een nieuw hoofdstuk waarin wiskundigen kunnen werken met systemen die het terrein sneller kunnen verkennen dan enig individueel brein.

De toekomst van de wiskunde hoeft niet toe te behoren aan mensen of machines alleen. Het kan toebehoren aan de onderzoekers die leren hoe ze beiden samen laten denken.

Daniel is een groot voorstander van hoe AI uiteindelijk alles zal verstoren. Hij ademt technologie en leeft om nieuwe gadgets uit te proberen.