Anslut dig till vÄrt nÀtverk!

Artificiell intelligens

AI vid International Mathematical Olympiad: How AlphaProof and AlphaGeometry 2 Achieved Silver-Medal Standard

mm

Matematiskt resonemang Àr en viktig aspekt av mÀnniskans kognitiva förmÄgor, som driver framsteg i vetenskapliga upptÀckter och teknisk utveckling. NÀr vi strÀvar efter att utveckla artificiell allmÀn intelligens som matchar mÀnsklig kognition Àr det viktigt att utrusta AI med avancerade matematiska resonemangsmöjligheter. Medan nuvarande AI-system kan hantera grundlÀggande matematiska problem, kÀmpar de med de komplexa resonemang som behövs för avancerade matematiska discipliner som algebra och geometri. Detta kan dock komma att förÀndras, som Google DeepMind har gjort betydande framsteg i att utveckla ett AI-systems matematiska resonemangsförmÄga. Detta genombrott görs vid Internationell matematikolympiad (IMO) 2024. IMO grundades 1959 och Àr den Àldsta och mest prestigefyllda matematiktÀvlingen, som utmanar gymnasieelever vÀrlden över med problem inom algebra, kombinatorik, geometri och talteori. Varje Är tÀvlar lag av unga matematiker om att lösa sex mycket utmanande problem. I Är introducerade Google DeepMind tvÄ AI-system: AlphaProof, som fokuserar pÄ formella matematiska resonemang, och AlphaGeometry 2, som specialiserat sig pÄ att lösa geometriska problem. Dessa AI-system lyckades lösa fyra av sex problem och presterade pÄ samma nivÄ som en silvermedaljör. I den hÀr artikeln kommer vi att utforska hur dessa system fungerar för att lösa matematiska problem.

AlphaProof: Kombinera AI och formellt sprÄk för att bevisa matematiska teorem

AlphaProof Àr ett AI-system designat för att bevisa matematiska pÄstÄenden med det formella sprÄket Lean. Det integrerar tvillingarna, en förutbildad sprÄkmodell, med Alpha Zero, en förstÀrkningsinlÀrningsalgoritm kÀnd för att behÀrska schack, shogi och Go.

Gemini-modellen översÀtter naturliga problemformuleringar till formella, vilket skapar ett bibliotek med problem med olika svÄrighetsnivÄer. Detta tjÀnar tvÄ syften: att konvertera oprecisa naturligt sprÄk till exakt formellt sprÄk för att verifiera matematiska bevis och anvÀnda prediktiva förmÄgor hos Tvillingarna för att generera en lista över möjliga lösningar med formell sprÄkprecision.

NÀr AlphaProof stöter pÄ ett problem genererar det potentiella lösningar och söker efter bevissteg i Lean för att verifiera eller motbevisa dem. Detta Àr i huvudsak ett neurosymboliskt tillvÀgagÄngssÀtt, dÀr det neurala nÀtverket, Gemini, översÀtter naturliga sprÄkinstruktioner till det symboliska formsprÄket Lean för att bevisa eller motbevisa pÄstÄendet. I likhet med AlphaZeros sjÀlvspelsmekanism, dÀr systemet lÀr sig genom att spela spel mot sig sjÀlvt, trÀnar AlphaProof sig sjÀlv genom att försöka bevisa matematiska pÄstÄenden. Varje provförsök förfinar AlphaProofs sprÄkmodell, med framgÄngsrika bevis som förstÀrker modellens förmÄga att hantera mer utmanande problem.

För International Mathematical Olympiad (IMO) trÀnades AlphaProof genom att bevisa eller motbevisa miljontals problem som tÀcker olika svÄrighetsnivÄer och matematiska Àmnen. Denna utbildning fortsatte under tÀvlingen, dÀr AlphaProof förfinade sina lösningar tills den hittade fullstÀndiga svar pÄ problemen.

AlphaGeometry 2: Integrering av LLM och symbolisk AI för att lösa geometriproblem

AlphaGeometry 2 Àr den senaste iterationen av Alfageometri serie, designad för att hantera geometriska problem med ökad precision och effektivitet. AlphaGeometry 2 bygger pÄ grunden för sin föregÄngare och anvÀnder ett neurosymboliskt tillvÀgagÄngssÀtt som kombinerar neurala stora sprÄkmodeller (LLM) med symbolisk AI. Denna integrering kombinerar regelbaserad logik med neurala nÀtverks prediktiva förmÄga att identifiera hjÀlppunkter, vÀsentliga för att lösa geometriproblem. LLM i AlphaGeometry förutsÀger nya geometriska konstruktioner, medan den symboliska AI anvÀnder formell logik för att generera bevis.

NÀr AlphaGeometry stÀlls inför ett geometriskt problem utvÀrderar kandidatexamen i juridik ett flertal möjligheter och förutsÀger konstruktioner som Àr avgörande för problemlösning. Dessa förutsÀgelser fungerar som vÀrdefulla ledtrÄdar och vÀgleder den symboliska motorn mot korrekta deduktioner och avancerar nÀrmare en lösning. Denna innovativa metod gör det möjligt för AlphaGeometry att ta itu med komplexa geometriska utmaningar som strÀcker sig bortom konventionella scenarier.

En viktig förbÀttring i AlphaGeometry 2 Àr integrationen av Gemini LLM. Denna modell Àr trÀnad frÄn grunden pÄ betydligt mer syntetisk data Àn sin föregÄngare. Denna omfattande utbildning utrustar den för att hantera svÄrare geometriproblem, inklusive de som involverar objektrörelser och ekvationer av vinklar, förhÄllanden eller avstÄnd. Dessutom har AlphaGeometry 2 en symbolisk motor som arbetar tvÄ storleksordningar snabbare, vilket gör att den kan utforska alternativa lösningar med oövertrÀffad hastighet. Dessa framsteg gör AlphaGeometry 2 till ett kraftfullt verktyg för att lösa intrikata geometriska problem, vilket sÀtter en ny standard pÄ omrÄdet.

AlphaProof och AlphaGeometry 2 pÄ IMO

I Är vid International Mathematical Olympiad (IMO) testades deltagarna med sex olika problem: tvÄ i algebra, ett i talteori, ett i geometri och tvÄ i kombinatorik. Google-forskare översatt dessa problem till formellt matematiskt sprÄk för AlphaProof och AlphaGeometry 2. AlphaProof tog itu med tvÄ algebraproblem och ett nummerteoretiskt problem, inklusive det svÄraste problemet i tÀvlingen, löst av endast fem mÀnskliga tÀvlande i Är. Under tiden löste AlphaGeometry 2 framgÄngsrikt geometriproblemet, Àven om det inte knÀckte de tvÄ kombinatoriska utmaningarna

Varje problem vid IMO Àr vÀrt sju poÀng, vilket ger maximalt 42 poÀng. AlphaProof och AlphaGeometry 2 fick 28 poÀng och fick perfekta poÀng pÄ de problem de löste. Detta placerade dem i den övre Ànden av silvermedaljkategorin. Tröskeln för guldmedalj i Är var 29 poÀng, nÄdd av 58 av de 609 tÀvlande.

NÀsta sprÄng: Naturligt sprÄk för matematikutmaningar

AlphaProof och AlphaGeometry 2 har visat imponerande framsteg inom AI:s matematiska problemlösningsförmÄga. Dessa system Àr dock fortfarande beroende av mÀnskliga experter för att översÀtta matematiska problem till formellt sprÄk för bearbetning. Dessutom Àr det oklart hur dessa specialiserade matematiska fÀrdigheter kan införlivas i andra AI-system, till exempel för att utforska hypoteser, testa innovativa lösningar pÄ lÄngvariga problem och effektivt hantera tidskrÀvande aspekter av bevis.

För att övervinna dessa begrÀnsningar utvecklar Googles forskare ett naturligt sprÄkresonemangssystem baserat pÄ Gemini och deras senaste forskning. Detta nya system syftar till att förbÀttra problemlösningsförmÄga utan att krÀva formell sprÄköversÀttning och Àr utformat för att smidigt integreras med andra AI-system.

The Bottom Line

Prestandan för AlphaProof och AlphaGeometry 2 vid den internationella matematikolympiaden Àr ett anmÀrkningsvÀrt steg framÄt i AI:s förmÄga att hantera komplext matematiskt resonemang. BÄda systemen visade silvermedaljprestanda genom att lösa fyra av sex utmanande problem, vilket visar betydande framsteg inom formellt bevis och geometrisk problemlösning. Trots sina framgÄngar Àr dessa AI-system fortfarande beroende av mÀnsklig input för att översÀtta problem till formellt sprÄk och stÄr inför utmaningar med integration med andra AI-system. Framtida forskning syftar till att förbÀttra dessa system ytterligare, potentiellt genom att integrera naturligt sprÄkresonemang för att utöka deras kapacitet över ett bredare spektrum av matematiska utmaningar.

Dr. Tehseen Zia Ă€r fast docent vid COMSATS University Islamabad och har en doktorsexamen i AI frĂ„n Wiens tekniska universitet, Österrike. Han Ă€r specialiserad pĂ„ artificiell intelligens, maskininlĂ€rning, datavetenskap och datorseende och har gjort betydande bidrag med publikationer i vĂ€lrenommerade vetenskapliga tidskrifter. Dr. Tehseen har ocksĂ„ lett olika industriella projekt som huvudutredare och fungerat som AI-konsult.