Artificiell intelligens

AlphaGeometry2: Den AI som övertrÀffar mÀnskliga olympiamÀstare i geometri

mm

Artificiell intelligens har länge försökt att efterlikna mänsklig logisk resonemang. Medan det har gjort enorma framsteg i mönsterigenkänning, har abstrakt resonemang och symbolisk deduktion förblivit svåra utmaningar för AI. Denna begränsning blir särskilt tydlig när AI används för matematiskt problemlösning, ett område som länge har varit en bekräftelse på mänskliga kognitiva förmågor som logiskt tänkande, kreativitet och djup förståelse. Till skillnad från andra grenar av matematiken som bygger på formler och algebraiska manipulationer, är geometri annorlunda. Den kräver inte bara strukturerat, stegvis resonemang, utan också förmågan att känna igen dolda relationer och färdigheten att konstruera extra element för att lösa problem.

För länge sedan troddes dessa förmågor vara unika för människor. Men Google DeepMind har arbetat med att utveckla AI som kan lösa dessa komplexa resonemangsuppgifter. Förra året introducerade de AlphaGeometry, ett AI-system som kombinerar den prediktiva kraften i neurala nätverk med den strukturerade logiken i symbolisk resonemang för att hantera komplexa geometriproblem. Detta system hade en betydande inverkan genom att lösa 54% av de internationella matematikolympiadens (IMO) geometriproblem, vilket motsvarar prestationen hos silvermedaljörer. Nyligen tog de det ännu längre med AlphaGeometry2, som uppnådde en otrolig 84% lösningstakt och överträffade en genomsnittlig IMO-guldmedaljör.

I den här artikeln kommer vi att undersöka de viktigaste innovationerna som hjälpte AlphaGeometry2 att uppnå denna nivå av prestanda och vad denna utveckling betyder för framtiden för AI i att lösa komplexa resonemangsproblem. Men innan vi dyker in i vad som gör AlphaGeometry2 speciellt, är det viktigt att först förstå vad AlphaGeometry är och hur det fungerar.

AlphaGeometry: Banbrytande AI i geometriproblemlösning

AlphaGeometry är ett AI-system utformat för att lösa komplexa geometriproblem på IMO-nivå. Det är i grund och botten ett neuro-symboliskt system som kombinerar ett neuralt språkmodell med en symbolisk deduktionsmotor. Det neurala språkmodellen hjälper systemet att förutsäga nya geometriska konstruktioner, medan den symboliska AI tillämpar formell logik för att generera bevis. Detta setup möjliggör för AlphaGeometry att tänka mer som en människa genom att kombinera mönsterigenkänningsförmågan hos neurala nätverk, som replikerar intuitivt mänskligt tänkande, med den strukturerade resonemangen i formell logik, som imiterar mänsklig deduktiv resonemangsförmåga. En av de viktigaste innovationerna i AlphaGeometry var hur det genererade träningsdata. Istället för att förlita sig på mänskliga demonstrationer, skapade det en miljard slumpmässiga geometriska diagram och härledde systematiskt relationer mellan punkter och linjer. Detta process skapade en enorm dataset med 100 miljoner unika exempel, vilket hjälpte det neurala modellen att förutsäga funktionsgeometriska konstruktioner och guida den symboliska motorn mot exakta lösningar. Denna hybridapproach möjliggjorde för AlphaGeometry att lösa 25 av 30 olympiadgeometriproblem inom standardtävlingstid, vilket nära motsvarade prestationen hos toppmänskliga konkurrenter.

Hur AlphaGeometry2 uppnår förbättrad prestanda

Medan AlphaGeometry var ett genombrott inom AI-drivet matematiskt resonemang, hade det vissa begränsningar. Det kämpade med att lösa komplexa problem, saknade effektivitet i att hantera en bred variation av geometriutmaningar och hade begränsningar i problemtäckning. För att övervinna dessa hinder introducerar AlphaGeometry2 en serie betydande förbättringar:

  1. Utökar AI:s förmåga att förstå mer komplexa geometriproblem

En av de mest betydande förbättringarna i AlphaGeometry2 är dess förmåga att arbeta med en bredare variation av geometriproblem. Det tidigare AlphaGeometry kämpade med problem som involverade linjära ekvationer av vinklar, förhållanden och avstånd, samt de som krävde resonemang om rörliga punkter, linjer och cirklar. AlphaGeometry2 övervinner dessa begränsningar genom att introducera ett mer avancerat språkmodell som tillåter det att beskriva och analysera dessa komplexa problem. Som ett resultat kan det nu hantera 88% av alla IMO-geometriproblem från de senaste två decennierna, en betydande ökning från den tidigare 66%.

  1. En snabbare och mer effektiv problemlösningsmotor

En annan viktig anledning till att AlphaGeometry2 presterar så bra är dess förbättrade symboliska motor. Denna motor, som utgör den logiska kärnan i detta system, har förbättrats på flera sätt. Först har den förbättrats för att arbeta med en mer raffinerad uppsättning problemlösningsregler, vilket gör den mer effektiv och snabb. För det andra kan den nu känna igen när olika geometriska konstruktioner representerar samma punkt i ett problem, vilket tillåter den att resonera mer flexibelt. Slutligen har motorn skrivits om i C++ istället för Python, vilket gör den över 300 gånger snabbare än tidigare. Denna hastighetsökning tillåter AlphaGeometry2 att generera lösningar snabbare och mer effektivt.

  1. Träning av AI med mer komplexa och varierade geometriproblem

Effektiviteten hos AlphaGeometry2:s neurala modell kommer från dess omfattande träning i syntetiska geometriproblem. AlphaGeometry genererade initialt en miljard slumpmässiga geometriska diagram för att skapa 100 miljoner unika träningsexempel. AlphaGeometry2 tar detta ett steg längre genom att generera mer omfattande och komplexa diagram som innehåller intrikata geometriska relationer. Dessutom inkorporerar det nu problem som kräver införandet av hjälpkonstruktioner – nya definierade punkter eller linjer som hjälper till att lösa ett problem, vilket tillåter det att förutsäga och generera mer sofistikerade lösningar

  1. Hitta den bästa vägen till en lösning med smartare sökstrategier

En viktig innovation i AlphaGeometry2 är dess nya sökapproach, kallad Shared Knowledge Ensemble of Search Trees (SKEST). Till skillnad från sin föregångare, som förlitade sig på en grundläggande sökmetod, kör AlphaGeometry2 flera sökningar parallellt, med varje sökning som lär av de andra. Denna teknik tillåter det att utforska en bredare variation av möjliga lösningar och förbättrar betydligt AI:s förmåga att lösa komplexa problem på en kortare tid.

  1. Lära av ett mer avancerat språkmodell

En annan viktig faktor bakom AlphaGeometry2:s framgång är dess antagande av Google’s Gemini-modell, en state-of-the-art AI-modell som har tränats på en ännu mer omfattande och varierad uppsättning matematiska problem. Denna nya språkmodell förbättrar AlphaGeometry2:s förmåga att generera steg-för-steg-lösningar på grund av dess förbättrade kedja-av-tankar-resonemang. Nu kan AlphaGeometry2 närma sig problemen på ett mer strukturerat sätt. Genom att finjustera sina förutsägelser och lära av olika typer av problem, kan systemet nu lösa en betydligt större andel av olympiadnivåns geometriproblem.

Uppnår resultat som överträffar mänskliga olympiamästare

Tack vare ovanstående framsteg löser AlphaGeometry2 42 av 50 IMO-geometriproblem från 2000-2024, med en 84% lösningstakt. Dessa resultat överträffar prestationen hos en genomsnittlig IMO-guldmedaljör och sätter en ny standard för AI-drivet matematiskt resonemang. Utöver sin imponerande prestanda är AlphaGeometry2 också på väg att automatisera bevisföring, vilket bringar oss närmare AI-system som inte bara kan lösa geometriproblem, utan också förklara sin resonemang på ett sätt som människor kan förstå

Framtiden för AI i matematiskt resonemang

Framstegen från AlphaGeometry till AlphaGeometry2 visar hur AI blir bättre på att hantera komplexa matematiska problem som kräver djupt tänkande, logik och strategi. Det visar också att AI inte längre bara handlar om att känna igen mönster – det kan resonera, göra kopplingar och lösa problem på sätt som känns mer som mänskligt logiskt resonemang.

AlphaGeometry2 visar oss också vad AI kan vara kapabel till i framtiden. Istället för att bara följa instruktioner, kan AI börja utforska nya matematiska idéer på egen hand och till och med hjälpa till med vetenskaplig forskning. Genom att kombinera neurala nätverk med logisk resonemang, kan AI inte bara vara ett verktyg som kan automatisera enkla uppgifter, utan också en kvalificerad partner som hjälper till att expandera mänsklig kunskap inom områden som bygger på kritiskt tänkande.

Kan vi vara på väg in i en era där AI bevisar satser och gör nya upptäckter inom fysik, teknik och biologi? När AI skiftar från brutalkraftsberäkningar till mer genomtänkt problemlösning, kan vi vara på väg mot en framtid där människor och AI arbetar tillsammans för att upptäcka idéer som vi aldrig trodde var möjliga.

Dr. Tehseen Zia Ă€r en fast anstĂ€lld bitrĂ€dande professor vid COMSATS University Islamabad, med en doktorsexamen i AI frĂ„n Vienna University of Technology, Österrike. Specialiserad pĂ„ artificiell intelligens, maskinlĂ€rning, datavetenskap och datorseende, har han gjort betydande bidrag med publikationer i ansedda vetenskapliga tidskrifter. Dr. Tehseen har ocksĂ„ lett olika industriprojekt som huvudutredare och tjĂ€nstgjort som AI-konsult.