Futurist-serien
AI löser ErdĆs-problem. Vad hĂ€nder sedan?

Bara för några månader sedan kändes frågan mest filosofisk: om artificiell intelligens kan hjälpa till att lösa öppna matematiska problem, vad händer med idén om mänskligt geni?
Den frågan är inte längre teoretisk. Två nyliga utvecklingar som involverar OpenAI och Google DeepMind tyder på att AI flyttar från att vara en matematisk assistent till att vara en matematisk deltagare. Inte i den meningen att AI ersätter matematiker helt och hållet, utan i den mer precisa och viktigare meningen att generera, söka, kontrollera och ibland upptäcka argument som kan överleva expertgranskning.
Den första utvecklingen kom från OpenAI, som meddelade att en intern allmän modell för resonemang hade gjort ett genombrott på problemet med planar enhetsavstånd, ett berömt problem som Paul Erdős ställde 1946. Problemet handlar om hur många par av punkter i en plan som kan vara exakt ett enhetsavstånd ifrån varandra. Under decennier trodde man att kvadratiska gitterliknande konstruktioner var i princip optimala. OpenAI:s modell fann en ny familj av konstruktioner som motbevisade den uppfattningen.
Den andra utvecklingen kom från Google DeepMind-forskare, som publicerade en artikel med titeln “Att främja matematisk forskning med AI-driven formell bevisning”. Deras system, AlphaProof Nexus, utvärderade AI-genererad bevisning på öppna forskningsnivåproblem och rapporterade att dess starkaste agent autonomt löste 9 av 353 öppna Erdős-problem. Det bevisade också 44 av 492 öppna konjekturer från Online Encyclopedia of Integer Sequences.
Tillsammans markerar dessa resultat en förändring. Den viktiga historien är inte att AI plötsligt har löst matematiken. Det har det inte. Den viktiga historien är att AI-system börjar verka inom forskningscykeln själv.
Varför Erdős-problem är en allvarlig test för AI
Paul Erdős var en av de mest produktiva matematikerna i historien, och problemen som är förknippade med hans arbete intar en särskild plats i matematiken. Många är lätta att formulera, svåra att lösa och kopplade till djupa områden som kombinatorik, talteori, grafteori och diskret geometri.
Det gör dem ovanligt användbara som en benchmark för AI-resonemang. De är inte skolövningar. De är inte heller alltid jättestora, teori-omstörtande konjekturer som Riemannhypotesen. Istället ligger många Erdős-problem i mitten, där framsteg beror på att hitta rätt koppling, rätt konstruktion eller rätt förbisedd lemma.
Det är exakt där AI kan vara mest användbart tidigt. Moderna resonemangssystem är inte bara kalkylatorer. De kan utforska många möjliga bevisvägar, jämföra delvisa strategier, hämta avlägsna idéer från angränsande fält och testa om ett argument kan göras rigoröst.
OpenAI-resultatet är slående eftersom modellen inte bara polerade en känd väg. Den fann en oväntad bro mellan diskret geometri och algebraisk talteori. Det är den typen av konceptuell hopp som matematiker vanligtvis förknippar med äkta kreativitet.
OpenAI och genombrottet med enhetsavstånd
Problemet med planar enhetsavstånd är enkelt att beskriva. Placera n punkter i planet. Räkna hur många par av punkter som är exakt ett enhetsavstånd ifrån varandra. Målet är att förstå hur stort det antalet kan vara när n växer.
För nästan 80 år sedan misstänkte matematiker att de bästa konstruktionerna inte skulle dramatiskt överträffa kvadratiska gitterbaserade arrangement. OpenAI:s modell utmanade den antagandet genom att producera en oändlig familj av exempel som slog den förväntade gränsen med en polynomisk förbättring.
Det spelar roll av två skäl. För det första förändrar det den matematiska bilden. Det antyder att talteoriska konstruktioner kan ha mer att bidra till diskret geometri än många forskare antog. För det andra förändrar det AI-bilden. Modellen som var inblandad beskrevs som en allmän resonemangsmodell, inte ett system som byggts enbart för detta specifika problem.
Med andra ord verkar systemet ha överfört resonemangsarbete till en obekant forskningsmiljö. Det memoriserade inte bara ett känt bevis. Det genererade ett resultat som yttre matematiker behandlade som ett stort bidrag.
Google DeepMind och formell bevisning
Google DeepMinds artikel behandlar en annan men lika viktig fråga: hur kan AI-genererad matematik göras tillförlitlig?
Språkmodeller kan producera elegant utseende argument som innehåller subtila misstag. I vanlig prosa kan dessa misstag vara svåra att upptäcka. I matematik kan ett felaktigt steg ogiltigförklara hela beviset. Det är därför formella bevisystem som Lean är viktiga. Lean bryr sig inte om ett argument låter övertygande. Varje logisk steg måste kontrolleras.
AlphaProof Nexus använder den begränsningen som en del av arbetsflödet. AI-agenter genererar bevisförsök i Lean, får feedback från kompilatorn, reviderar sin strategi och fortsätter att söka. Den starkare versionen samordnar underagenter och använder mer avancerade bevisverktyg för att fokusera sökningen.
| Utveckling | AI-metod | Varför det är viktigt |
|---|---|---|
| OpenAI:s enhetsavståndsresultat | Allmän resonemangsmodell | Visade att AI kan producera en originalkonstruktion för ett framstående öppet problem |
| Google DeepMind AlphaProof Nexus | LLM-styrd Lean-bevisning | Visade att AI kan formellt lösa flera öppna Erdős-problem |
| Formell bevisverifiering | Kompilator-kontrollerad logik | Minskar risken för övertygande men ogiltiga matematiska utdata |
Google DeepMind-resultatet är särskilt viktigt eftersom det kopplar AI-resonemang till verifiering. Systemet behöver inte lita på samma sätt som en naturlig språkchatbot måste lita. Dess bevis antingen kompilera eller så gör det inte.
Vad det här betyder för matematisk forskning
Den nuvarande lärdomen är inte att matematiker är föråldrade. Det är att flaskhalsen i matematiken kan vara på väg att förändras.
Historiskt sett behövde en forskare göra nästan allt: formulera problemet, undersöka litteraturen, testa idéer, bygga beviset, kontrollera varje steg och kommunicera resultatet. AI hotar nu att omfördela det arbetet. Vissa delar av arbetsflödet kan bli snabbare, billigare och mer automatiserade.
- AI kan utforska många bevisvägar innan en människa ägnar tid åt en.
- Formella system kan verifiera steg som annars skulle kräva långsam expertkontroll.
- Forskare kan använda AI för att söka över avlägsna matematiska underfält.
Detta kan producera en ny forskningsstil. Istället för att be AI om ett svar kan matematiker alltmer övervaka flottor av bevisagenter. Den mänskliga rollen blir mindre som en kalkylator och mer som en forskningsledare: välja rätt problem, tolka resultaten, upptäcka konceptuell betydelse och bestämma vilka vägar som förtjänar djupare uppmärksamhet.
Gränserna är fortfarande verkliga
Det är viktigt att inte överdriva ögonblicket. Google DeepMinds system löste 9 av 353 försökta Erdős-problem. Det är imponerande, men det betyder också att de flesta förblev olösta. OpenAI:s enhetsavståndsresultat är en milstolpe, men det antyder inte att varje berömd konjektur nu är inom räckhåll.
AI-system kämpar fortfarande när ett problem kräver en ny konceptuell ram, när den relevanta matematiken är dåligt formaliserad eller när ett bevis beror på långa kedjor av insikt som inte kan dekomponeras i sökbara steg. Formella bevisbibliotek är också ojämna. Områden med mogen Lean-täckning är mer tillgängliga för AI-agenter än områden där det grundläggande materialet fortfarande behöver kodas.
- Systemen förblir beroende av mänsklig problemval och tolkning.
- Formalisering kan vara svår när definitioner är tvetydiga eller outvecklade.
- AI-genererade bevisförsök kan fortfarande dölja hårt arbete inuti obestyrkta hjälpanspråk.
Dessa begränsningar är inte misslyckanden. De klargör var nästa framsteg måste ske. Bättre bevisagenter, rikare formella bibliotek, starkare verifieringsarbetsflöden och mer effektiva mänskliga-AI-gränssnitt kommer alla att spela roll.
Vad händer sedan efter att AI har löst Erdős-problem?
Den mest sannolika nära framtiden är inte ett dramatiskt ögonblick där AI löser all matematik. Det är en stadig expansion av AI-assisterad forskning inom områden med rena problemformuleringar, starka formella bibliotek och stora mängder fragmenterad tidigare forskning.
Kombinatorik, grafteori, talteori, optimering och diskret geometri är naturliga tidiga mål. Dessa fält innehåller ofta problem där frågan är koncis, men lösningen beror på att sy ihop idéer från avlägsna platser. AI är väl lämpad för den typen av sökning.
Över tiden kan samma mönster utvidgas bortom matematik. Om en modell kan hålla ett svårt argument samman, testa mellanliggande påståenden och koppla idéer över fält, så spelar dessa förmågor roll i fysik, biologi, materialvetenskap, kryptografi och AI-forskning i sig.
Den djupare konsekvensen är kulturell. Matematik har alltid värderat bevis, men det har också värderat smak: förmågan att veta vilken fråga som är viktig, vilken abstraktion som är värd att uppfinna och vilket resultat som förändrar formen på ett fält. När bevisning blir mer automatiserad kan smak bli viktigare, inte mindre.
Slutsats: Geni flyttar uppåt i stacken
Uppföljaren till den tidigare frågan är nu tydligare. Om AI kan lösa öppna matematiska problem, försvinner inte mänskligt geni. Det flyttar uppåt i stacken.
Förmågan som kommer att vara sällsynt kommer inte att vara förmågan att malande gå igenom varje teknisk steg ensam. Det kommer att vara förmågan att ställa rätt frågor, ramla in rätt abstraktioner, bedöma meningen av maskinupptäckta resultat och guida AI-system mot problem som betyder något.
OpenAI:s enhetsavståndsgenombrott och Google DeepMinds formella bevisresultat stänger inte boken om mänsklig matematisk kreativitet. De öppnar ett nytt kapitel där matematiker kan arbeta med system som kan utforska terrängen snabbare än någon enskild sinne.
Matematikens framtid tillhör kanske inte människor eller maskiner ensamma. Den tillhör kanske forskarna som lär sig att få båda att tänka tillsammans.












