Kontakt med oss

Kunstig intelligens

AlphaGeometry2: AI-en som overgår menneskelige Olympiade-mestere i geometri

mm

Kunstig intelligens har lenge forsøkt å etterligne menneskelignende logiske resonnementer. Selv om det har gjort store fremskritt innen mønstergjenkjenning, har abstrakt resonnement og symbolsk deduksjon fortsatt vært tøffe utfordringer for AI. Denne begrensningen blir spesielt tydelig når AI brukes til matematisk problemløsning, en disiplin som lenge har vært et bevis på menneskelige kognitive evner som logisk tenkning, kreativitet og dyp forståelse. I motsetning til andre grener av matematikk som er avhengige av formler og algebraiske manipulasjoner, er geometri annerledes. Det krever ikke bare strukturert, trinnvis resonnement, men også evnen til å gjenkjenne skjulte relasjoner og ferdigheten til å konstruere ekstra elementer for å løse problemer.

I lang tid ble disse evnene antatt å være unike for mennesker. Google DeepMind har imidlertid jobbet med å utvikle AI som kan løse disse komplekse resonneringsoppgavene. I fjor introduserte de Alfageometri, et AI-system som kombinerer prediksjonskraften til nevrale nettverk med den strukturerte logikken til symbolsk resonnement for å takle komplekse geometriproblemer. Dette systemet gjorde en betydelig innvirkning ved å løse 54 % av International Mathematical Olympiad (IMO) geometriproblemer for å oppnå ytelse på nivå med sølvmedaljevinnere. Nylig tok de det enda lenger med Alfageometri 2, som oppnådde en utrolig løsningsrate på 84 % for å overgå en gjennomsnittlig IMO-gullmedaljevinner.

I denne artikkelen vil vi utforske nøkkelinnovasjoner som hjalp AlphaGeometry2 med å oppnå dette ytelsesnivået og hva denne utviklingen betyr for fremtiden til AI når det gjelder å løse komplekse resonneringsproblemer. Men før du dykker inn i hva som gjør AlphaGeometry2 spesiell, er det viktig først å forstå hva AlphaGeometry er og hvordan det fungerer.

AlphaGeometry: Banebrytende AI innen problemløsning i geometri

Alfageometri er et AI-system designet for å løse komplekse geometriproblemer på nivå med IMO. Det er i utgangspunktet et nevro-symbolsk system som kombinerer en nevral språkmodell med en symbolsk deduksjonsmotor. Den nevrale språkmodellen hjelper systemet med å forutsi nye geometriske konstruksjoner, mens symbolsk AI bruker formell logikk for å generere bevis. Dette oppsettet lar AlphaGeometry tenke mer som et menneske ved å kombinere mønstergjenkjenningsevnene til nevrale nettverk, som replikerer intuitiv menneskelig tenkning, med den strukturerte resonnementet til formell logikk, som etterligner menneskelige deduktive resonneringsevner. En av de viktigste nyvinningene i AlphaGeometry var hvordan den genererte treningsdata. I stedet for å stole på menneskelige demonstrasjoner, skapte den én milliard tilfeldige geometriske diagrammer og systematisk utledede forhold mellom punkter og linjer. Denne prosessen skapte et massivt datasett med 100 millioner unike eksempler, og hjalp den nevrale modellen med å forutsi funksjonelle geometriske konstruksjoner og ledet den symbolske motoren mot nøyaktige løsninger. Denne hybride tilnærmingen gjorde det mulig for AlphaGeometry å løse 25 av 30 Olympiad-geometriproblemer innen standard konkurransetid, og matchet ytelsen til de beste menneskelige konkurrenter.

Hvordan AlphaGeometry2 oppnår forbedret ytelse

Mens AlphaGeometry var et gjennombrudd innen AI-drevet matematisk resonnement, hadde det visse begrensninger. Den slet med å løse komplekse problemer, manglet effektivitet i å håndtere et bredt spekter av geometriutfordringer, og hadde begrensninger i problemdekning. For å overvinne disse hindringene, Alfageometri 2 introduserer en rekke betydelige forbedringer:

  1. Utvide AIs evne til å forstå mer komplekse geometriproblemer

En av de viktigste forbedringene i AlphaGeometry2 er dens evne til å jobbe med et bredere spekter av geometriproblemer. Den tidligere AlphaGeometry slet med problemer som involverte lineære ligninger av vinkler, forhold og avstander, så vel som de som krevde resonnement om bevegelige punkter, linjer og sirkler. AlphaGeometry2 overvinner disse begrensningene ved å introdusere en mer avansert språkmodell som lar den beskrive og analysere disse komplekse problemene. Som et resultat kan den nå takle 88 % av alle IMO-geometriproblemer fra de siste to tiårene, en betydelig økning fra de forrige 66 %.

  1. En raskere og mer effektiv problemløsningsmotor

En annen viktig grunn til at AlphaGeometry2 presterer så bra, er dens forbedrede symbolske motor. Denne motoren, som fungerer som den logiske kjernen i dette systemet, har blitt forbedret på flere måter. For det første er det forbedret å jobbe med et mer raffinert sett med problemløsningsregler som gjør det mer effektivt og raskere. For det andre kan den nå gjenkjenne når forskjellige geometriske konstruksjoner representerer det samme punktet i et problem, slik at det kan resonnere mer fleksibelt. Endelig har motoren blitt skrevet om i C++ i stedet for Python, noe som gjør den over 300 ganger raskere enn før. Denne hastighetsøkningen lar AlphaGeometry2 generere løsninger raskere og mer effektivt.

  1. Trene AI med mer komplekse og varierte geometriproblemer

Effektiviteten til AlphaGeometry2s nevrale modell kommer fra dens omfattende opplæring i syntetiske geometriproblemer. AlphaGeometry genererte opprinnelig én milliard tilfeldige geometriske diagrammer for å lage 100 millioner unike treningseksempler. AlphaGeometry2 tar dette et skritt videre ved å generere mer omfattende og mer komplekse diagrammer som inkluderer intrikate geometriske relasjoner. I tillegg inneholder den nå problemer som krever innføring av hjelpekonstruksjoner – nydefinerte punkter eller linjer som hjelper til med å løse et problem, slik at det kan forutsi og generere mer sofistikerte løsninger

  1. Finne den beste veien til en løsning med smartere søkestrategier

En nøkkelinnovasjon av AlphaGeometry2 er den nye søkemetoden, kalt Shared Knowledge Ensemble of Search Trees (SKEST). I motsetning til forgjengeren, som var avhengig av en grunnleggende søkemetode, kjører AlphaGeometry2 flere søk parallelt, hvor hvert søk lærer av de andre. Denne teknikken lar den utforske et bredere spekter av mulige løsninger og forbedrer AIs evne til å løse komplekse problemer på kortere tid betydelig.

  1. Lær fra en mer avansert språkmodell

En annen nøkkelfaktor bak AlphaGeometry2s suksess er bruken av Googles Gemini-modell, en state-of-the-art AI-modell som har blitt trent på et enda mer omfattende og mer mangfoldig sett med matematiske problemer. Denne nye språkmodellen forbedrer AlphaGeometry2s evne til å generere trinn-for-trinn-løsninger på grunn av dens forbedrede tankekjede-resonnement. Nå kan AlphaGeometry2 nærme seg problemene på en mer strukturert måte. Ved å finjustere sine spådommer og lære av ulike typer problemer, kan systemet nå løse en mye mer betydelig prosentandel av geometrispørsmålene på Olympiade-nivå.

Oppnå resultater som overgår menneskelige Olympiade-mestere

Takket være fremskritt ovenfor løser AlphaGeometry2 42 av 50 IMO-geometriproblemer fra 2000-2024, og oppnår en suksessrate på 84 %. Disse resultatene overgår ytelsen til en gjennomsnittlig IMO gullmedaljevinner og satte en ny standard for AI-drevet matematisk resonnement. Utover sin imponerende ytelse, gjør AlphaGeometry2 også fremskritt i å automatisere teorembevis, og bringer oss nærmere AI-systemer som ikke bare kan løse geometriproblemer, men også forklare resonnementet deres på en måte som mennesker kan forstå

Fremtiden til AI i matematisk resonnement

Fremgangen fra AlphaGeometry til AlphaGeometry2 viser hvordan AI blir bedre til å håndtere komplekse matematiske problemer som krever dyp tenkning, logikk og strategi. Det betyr også at AI ikke lenger bare handler om å gjenkjenne mønstre – den kan resonnere, knytte forbindelser og løse problemer på måter som føles mer som menneskelignende logiske resonnementer.

AlphaGeometry2 viser oss også hva AI kan være i stand til i fremtiden. I stedet for bare å følge instruksjonene, kan AI begynne å utforske nye matematiske ideer på egen hånd og til og med hjelpe til med vitenskapelig forskning. Ved å kombinere nevrale nettverk med logisk resonnement, kan AI ikke bare være et verktøy som kan automatisere enkle oppgaver, men en kvalifisert partner som hjelper til med å utvide menneskelig kunnskap i felt som er avhengige av kritisk tenkning.

Kan vi gå inn i en æra hvor AI beviser teoremer og gjør nye oppdagelser innen fysikk, ingeniørvitenskap og biologi? Ettersom AI skifter fra brute-force-beregninger til mer gjennomtenkt problemløsning, kan vi være på randen av en fremtid der mennesker og AI jobber sammen for å avdekke ideer vi aldri trodde var mulig.

Dr. Tehseen Zia er en fast førsteamanuensis ved COMSATS University Islamabad, med en doktorgrad i AI fra Wiens teknologiske universitet, Østerrike. Med spesialisering i kunstig intelligens, maskinlæring, datavitenskap og datasyn, har han gitt betydelige bidrag med publikasjoner i anerkjente vitenskapelige tidsskrifter. Dr. Tehseen har også ledet ulike industrielle prosjekter som hovedetterforsker og fungert som AI-konsulent.