Kunstig intelligens

AlphaGeometry2: Den AI som overgår menneskelige olympiademestere i geometri

mm

Kunstig intelligens har lenge forsøkt å etterligne menneskelig logisk resonnering. Mens det har gjort store fremgang i mønstergjenkjenning, har abstrakt resonnering og symbolsk deduksjon vært tøffe utfordringer for AI. Dette begrensningen blir særlig tydelig når AI brukes til matematisk problemløsning, en disiplin som lenge har vært et vitnesbyrd om menneskelige kognitive evner som logisk tenkning, kreativitet og dyp forståelse. I motsetning til andre grener av matematikk som bygger på formularer og algebraiske manipulasjoner, er geometri annerledes. Det krever ikke bare strukturert, steg-for-steg resonnering, men også evnen til å gjenkjenne skjulte relasjoner og ferdigheten til å konstruere ekstra elementer for å løse problemer.

I lang tid ble disse evnene antatt å være unike for mennesker. Men Google DeepMind har arbeidet med å utvikle AI som kan løse disse komplekse resonerteknikkene. Forrige år introduserte de AlphaGeometry, et AI-system som kombinerer den prediktive kraften til neurale nettverk med den strukturerte logikken til symbolsk resonnering for å takle komplekse geometriproblemer. Dette systemet hadde en betydelig innvirkning ved å løse 54% av Internasjonale Matematisk Olympiad (IMO) geometriproblemer og oppnå en ytelse på samme nivå som sølvmedaljører. Nylig tok de det enda lenger med AlphaGeometry2, som oppnådde en imponerende 84% løsningsrate og overgikk en gjennomsnittlig IMO-gullmedaljør.

I denne artikkelen vil vi utforske de viktigste innovasjonene som hjalp AlphaGeometry2 å oppnå dette nivået av ytelse og hva denne utviklingen betyr for fremtiden til AI i løsning av komplekse resonerteknikker. Men før vi dykker ned i hva som gjør AlphaGeometry2 spesiell, er det essensielt å forstå hva AlphaGeometry er og hvordan det fungerer.

AlphaGeometry: Pioner AI i geometriproblemløsning

AlphaGeometry er et AI-system designet for å løse komplekse geometriproblemer på samme nivå som IMO. Det er i hovedsak et neuro-symbolisk system som kombinerer et neuralt språkmodell med en symbolsk deduksjonsmotor. Det neurale språkmodellen hjelper systemet til å forutsi nye geometriske konstruksjoner, mens den symbolske AI anvender formell logikk til å generere bevis. Denne oppsettet gjør det mulig for AlphaGeometry å tenke mer som et menneske ved å kombinere mønstergjenkjenningsevnen til neurale nettverk, som replikerer intuitivt menneskelig tenkning, med den strukturerte resonneringen til formell logikk, som etterligner menneskelig deduktiv resonneringsevne. En av de viktigste innovasjonene i AlphaGeometry var hvordan det genererte treningdata. I stedet for å basere seg på menneskelig demonstrasjon, genererte det en milliard tilfeldige geometriske diagrammer og systematisk avledet relasjoner mellom punkter og linjer. Denne prosessen skapte en massiv datasett på 100 millioner unike eksempler, som hjalp det neurale modellen til å forutsi funksjonelle geometriske konstruksjoner og veilede den symbolske motoren mot nøyaktige løsninger. Denne hybride tilnærmingen gjorde det mulig for AlphaGeometry å løse 25 av 30 Olympiad-geometriproblemer innen standard konkurranse tid, og matchet nært ytelsen til topp menneskelige konkurrenter.

Hvordan AlphaGeometry2 oppnår forbedret ytelse

Mens AlphaGeometry var et gjennombrudd i AI-drevet matematisk resonnering, hadde det visse begrensninger. Det kjempet med å løse komplekse problemer, manglet effektivitet i å håndtere et bredt spekter av geometriutfordringer, og hadde begrensninger i problemdækning. For å overvinne disse hindrene, introduserer AlphaGeometry2 en rekke betydelige forbedringer:

  1. Utvider AI sin evne til å forstå mer komplekse geometriproblemer

En av de viktigste forbedringene i AlphaGeometry2 er dens evne til å arbeide med et bredere spekter av geometriproblemer. Den tidligere AlphaGeometry kjempet med problemer som involverte lineære ligninger om vinkler, forhold og avstander, samt de som krevde resonnering om flyttende punkter, linjer og sirkler. AlphaGeometry2 overvinner disse begrensningene ved å introdusere en mer avansert språkmodell som gjør det mulig for det å beskrive og analysere disse komplekse problemene. Som resultat kan det nå takle 88% av alle IMO-geometriproblemer fra de siste to tiårene, en betydelig økning fra den tidligere 66%.

  1. En raskere og mer effektiv problemløsingsmotor

En annen viktig årsak til at AlphaGeometry2 fungerer så godt er dens forbedrede symbolske motor. Denne motoren, som tjener som den logiske kernen i dette systemet, er blitt forbedret på flere måter. Først er den forbedret til å arbeide med en mer finmasket sett av problemløsningsregler, noe som gjør den mer effektiv og rask. Andre er den i stand til å gjenkjenne når forskjellige geometriske konstruksjoner representerer samme punkt i et problem, noe som gjør det mulig for det å resonere mer fleksibelt. Til slutt er motoren blitt omskrevet i C++ i stedet for Python, noe som gjør den over 300 ganger raskere enn før. Denne hastighetsøkningen gjør det mulig for AlphaGeometry2 å generere løsninger raskere og mer effektivt.

  1. Trening av AI med mer komplekse og varierte geometriproblemer

Effektiviteten til AlphaGeometry2 sitt neurale modell kommer fra dens omfattende trening i syntetiske geometriproblemer. AlphaGeometry genererte initialt en milliard tilfeldige geometriske diagrammer for å skape 100 millioner unike treningseksempler. AlphaGeometry2 tar dette et skritt videre ved å generere mer omfattende og mer komplekse diagrammer som inkluderer intrikate geometriske relasjoner. I tillegg inkorporerer det nå problemer som krever innføringen av hjelpekonstruksjoner – nye definerte punkter eller linjer som hjelper til å løse et problem, noe som gjør det mulig for det å forutsi og generere mer sofistikerte løsninger

  1. Finn den beste løsningen med smartere søkestrategier

En viktig innovasjon i AlphaGeometry2 er dens nye søkeapproach, kalt Shared Knowledge Ensemble of Search Trees (SKEST). I motsetning til dens forgjenger, som baserte seg på en grundig søkemetode, kjører AlphaGeometry2 flere søk i parallell, hvor hvert søk lærer av de andre. Denne teknikken gjør det mulig for det å utforske et bredere spekter av mulige løsninger og forbedrer betydelig AI sin evne til å løse komplekse problemer på en kortere tid.

  1. Læring fra en mer avansert språkmodell

En annen viktig faktor bak AlphaGeometry2 sitt suksess er dens adopsjon av Google sitt Gemini-modell, en state-of-the-art AI-modell som har blitt trent på en enda mer omfattende og mer diversifisert sett av matematiske problemer. Denne nye språkmodellen forbedrer AlphaGeometry2 sitt evne til å generere steg-for-steg løsninger på grunn av dens forbedrede chain-of-thought resonnering. Nå kan AlphaGeometry2 nærme seg problemene på en mer strukturert måte. Ved å finjustere sine forutsigelser og lære av forskjellige typer problemer, kan systemet nå løse en mye større prosent av Olympiad-nivå geometri-spørsmål.

Oppnå resultater som overgår menneskelige olympiademestere

Takk til ovennevnte fremgang, løser AlphaGeometry2 42 av 50 IMO-geometriproblemer fra 2000-2024, og oppnår en 84% løsningsrate. Disse resultater overgår ytelsen til en gjennomsnittlig IMO-gullmedaljør og setter en ny standard for AI-drevet matematisk resonnering. Forbi dens imponerende ytelse, er AlphaGeometry2 også på vei til å automatisere bevisføring, og bringer oss nærmere AI-systemer som ikke bare kan løse geometriproblemer, men også forklare sin resonnering på en måte som mennesker kan forstå

Fremtiden til AI i matematisk resonnering

Fremgangen fra AlphaGeometry til AlphaGeometry2 viser hvordan AI blir bedre til å håndtere komplekse matematiske problemer som krever dyp tenkning, logikk og strategi. Det viser også at AI ikke lenger bare er om å gjenkjenne mønster – det kan resonere, gjøre sammenhenger og løse problemer på måter som føles mer som menneskelig logisk resonnering.

AlphaGeometry2 viser oss også hva AI kan være i stand til i fremtiden. I stedet for bare å følge instruksjoner, kan AI begynne å utforske nye matematiske ideer på egen hånd og sogar hjelpe med vitenskapelig forskning. Ved å kombinere neurale nettverk med logisk resonnering, kan AI ikke bare være et verktøy som kan automatisere enkle oppgaver, men en kvalifisert partner som hjelper til å utvide menneskelig kunnskap i felt som avhenger av kritisk tenkning.

Kunne vi være på vei inn i en æra hvor AI beviser teorier og gjør nye oppdagelser i fysikk, ingeniørvitenskap og biologi? Mens AI skifter fra brute-force beregninger til mer tenksomme problemløsninger, kan vi være på randen av en fremtid hvor mennesker og AI arbeider sammen for å avdekke ideer vi aldri trodde var mulige.

Dr. Tehseen Zia er en fast ansatt associate professor ved COMSATS University Islamabad, med en PhD i AI fra Vienna University of Technology, Østerrike. Som spesialist i kunstig intelligens, maskinlæring, datavitenskap og datavisjon, har han gjort betydelige bidrag med publikasjoner i anerkjente vitenskapelige tidsskrifter. Dr. Tehseen har også ledet flere industriprosjekter som hovedundersøker og tjenestegjort som AI-konsulent.