Kunstig intelligens
AlphaGeometry2: Den AI, der overgår menneskelige olympiademestre i geometri

Kunstig intelligens har længe forsøgt at efterligne menneskelignende logiske ræsonnementer. Selvom det har gjort massive fremskridt inden for mønstergenkendelse, er abstrakt ræsonnement og symbolsk deduktion forblevet hårde udfordringer for AI. Denne begrænsning bliver især tydelig, når AI bliver brugt til matematisk problemløsning, en disciplin, der længe har været et vidnesbyrd om menneskelige kognitive evner såsom logisk tænkning, kreativitet og dyb forståelse. I modsætning til andre grene af matematik, der er afhængige af formler og algebraiske manipulationer, er geometri anderledes. Det kræver ikke kun struktureret, trin-for-trin-ræsonnement, men også evnen til at genkende skjulte relationer og evnen til at konstruere ekstra elementer til at løse problemer.
I lang tid blev disse evner anset for at være unikke for mennesker. Google DeepMind har dog arbejdet på at udvikle AI, der kan løse disse komplekse ræsonnementopgaver. Sidste år introducerede de Alfageometri, et AI-system, der kombinerer neurale netværks forudsigelseskraft med den strukturerede logik af symbolsk ræsonnement for at tackle komplekse geometriproblemer. Dette system gjorde en betydelig indvirkning ved at løse 54 % af International Mathematical Olympiad (IMO) geometriproblemer for at opnå ydeevne på niveau med sølvmedaljevindere. For nylig tog de det endnu længere med Alfageometri 2, som opnåede en utrolig 84% løsningsrate for at overgå en gennemsnitlig IMO-guldvinder.
I denne artikel vil vi udforske nøgleinnovationer, der hjalp AlphaGeometry2 med at opnå dette præstationsniveau, og hvad denne udvikling betyder for fremtiden for AI til at løse komplekse ræsonnementproblemer. Men før du dykker ned i, hvad der gør AlphaGeometry2 til noget særligt, er det vigtigt først at forstå, hvad AlphaGeometry er, og hvordan det virker.
AlphaGeometry: Banebrydende kunstig intelligens inden for problemløsning af geometri
Alfageometri er et AI-system designet til at løse komplekse geometriproblemer på niveau med IMO. Det er dybest set et neuro-symbolsk system, der kombinerer en neural sprogmodel med en symbolsk deduktionsmotor. Den neurale sprogmodel hjælper systemet med at forudsige nye geometriske konstruktioner, mens symbolsk AI anvender formel logik til at generere beviser. Denne opsætning tillader AlphaGeometry at tænke mere som et menneske ved at kombinere neurale netværks mønstergenkendelsesevner, som replikerer intuitiv menneskelig tænkning, med den strukturerede ræsonnement af formel logik, som efterligner menneskets deduktive ræsonnementevner. En af de vigtigste nyskabelser i AlphaGeometry var, hvordan den genererede træningsdata. I stedet for at stole på menneskelige demonstrationer skabte den en milliard tilfældige geometriske diagrammer og systematisk afledte forhold mellem punkter og linjer. Denne proces skabte et massivt datasæt med 100 millioner unikke eksempler, der hjalp den neurale model med at forudsige funktionelle geometriske konstruktioner og lede den symbolske motor mod nøjagtige løsninger. Denne hybride tilgang gjorde det muligt for AlphaGeometry at løse 25 ud af 30 Olympiade-geometriproblemer inden for standardkonkurrencetid, hvilket nøje matchede præstationerne hos de bedste menneskelige konkurrenter.
Hvordan AlphaGeometry2 opnår forbedret ydeevne
Selvom AlphaGeometry var et gennembrud inden for AI-drevet matematisk ræsonnement, havde det visse begrænsninger. Det kæmpede med at løse komplekse problemer, manglede effektivitet i håndteringen af en bred vifte af geometriske udfordringer og havde begrænsninger i problemdækning. For at overvinde disse forhindringer, Alfageometri 2 introducerer en række væsentlige forbedringer:
- Udvidelse af AI's evne til at forstå mere komplekse geometriproblemer
En af de væsentligste forbedringer i AlphaGeometry2 er dens evne til at arbejde med en bredere vifte af geometriproblemer. Den tidligere AlphaGeometry kæmpede med problemer, der involverede lineære ligninger af vinkler, forhold og afstande, såvel som dem, der krævede ræsonnement om bevægelige punkter, linjer og cirkler. AlphaGeometry2 overvinder disse begrænsninger ved at introducere en mere avanceret sprogmodel, der gør det muligt at beskrive og analysere disse komplekse problemer. Som et resultat heraf kan den nu tackle 88 % af alle IMO-geometriproblemer fra de sidste to årtier, en betydelig stigning fra de tidligere 66 %.
- En hurtigere og mere effektiv problemløsningsmotor
En anden vigtig grund til, at AlphaGeometry2 klarer sig så godt, er dens forbedrede symbolske motor. Denne motor, der fungerer som den logiske kerne i dette system, er blevet forbedret på flere måder. For det første er det forbedret at arbejde med et mere raffineret sæt problemløsningsregler, som gør det mere effektivt og hurtigere. For det andet kan den nu genkende, når forskellige geometriske konstruktioner repræsenterer det samme punkt i et problem, hvilket giver det mulighed for at ræsonnere mere fleksibelt. Endelig er motoren blevet omskrevet i C++ frem for Python, hvilket gør den over 300 gange hurtigere end før. Dette hastighedsboost giver AlphaGeometry2 mulighed for at generere løsninger hurtigere og mere effektivt.
- Træning af kunstig intelligens med mere komplekse og varierede geometriproblemer
Effektiviteten af AlphaGeometry2s neurale model kommer fra dens omfattende træning i syntetiske geometriproblemer. AlphaGeometry genererede oprindeligt en milliard tilfældige geometriske diagrammer for at skabe 100 millioner unikke træningseksempler. AlphaGeometry2 tager dette et skridt videre ved at generere mere omfattende og mere komplekse diagrammer, der inkluderer indviklede geometriske relationer. Derudover inkorporerer den nu problemer, der kræver introduktion af hjælpekonstruktioner - nydefinerede punkter eller linjer, der hjælper med at løse et problem, så det kan forudsige og generere mere sofistikerede løsninger
- Find den bedste vej til en løsning med smartere søgestrategier
En nøgleinnovation af AlphaGeometry2 er dens nye søgetilgang, kaldet Shared Knowledge Ensemble of Search Trees (SKEST). I modsætning til sin forgænger, som var afhængig af en grundlæggende søgemetode, kører AlphaGeometry2 flere søgninger parallelt, hvor hver søgning lærer af de andre. Denne teknik giver den mulighed for at udforske en bredere række af mulige løsninger og forbedrer AI'ens evne til at løse komplekse problemer på kortere tid markant.
- Lær fra en mere avanceret sprogmodel
En anden nøglefaktor bag AlphaGeometry2's succes er dens vedtagelse af Googles Gemini-model, en state-of-the-art AI-model, der er blevet trænet i et endnu mere omfattende og mere forskelligartet sæt matematiske problemer. Denne nye sprogmodel forbedrer AlphaGeometry2's evne til at generere trin-for-trin-løsninger på grund af dens forbedrede tankekæde-ræsonnement. Nu kan AlphaGeometry2 gribe problemerne an på en mere struktureret måde. Ved at finjustere sine forudsigelser og lære af forskellige typer problemer, kan systemet nu løse en meget større procentdel af geometrispørgsmål på Olympiade-niveau.
At opnå resultater, der overgår menneskelige Olympiade-mestre
Takket være ovenstående fremskridt løser AlphaGeometry2 42 ud af 50 IMO-geometriproblemer fra 2000-2024 og opnår en succesrate på 84%. Disse resultater overgår ydeevnen af en gennemsnitlig IMO-guldvinder og satte en ny standard for AI-drevet matematisk ræsonnement. Ud over dens imponerende ydeevne gør AlphaGeometry2 også fremskridt med at automatisere teorembeviset, hvilket bringer os tættere på AI-systemer, der ikke kun kan løse geometriproblemer, men også forklare deres ræsonnement på en måde, som mennesker kan forstå
Fremtiden for AI i matematisk ræsonnement
Fremskridtet fra AlphaGeometry til AlphaGeometry2 viser, hvordan AI bliver bedre til at håndtere komplekse matematiske problemer, der kræver dyb tænkning, logik og strategi. Det betyder også, at AI ikke længere kun handler om at genkende mønstre – den kan ræsonnere, skabe forbindelser og løse problemer på måder, der føles mere som menneskelignende logiske ræsonnementer.
AlphaGeometry2 viser os også, hvad AI kan være i stand til i fremtiden. I stedet for bare at følge instruktionerne, kunne AI begynde at udforske nye matematiske ideer på egen hånd og endda hjælpe med videnskabelig forskning. Ved at kombinere neurale netværk med logisk ræsonnement er AI måske ikke bare et værktøj, der kan automatisere simple opgaver, men en kvalificeret partner, der hjælper med at udvide menneskelig viden inden for områder, der er afhængige af kritisk tænkning.
Kan vi gå ind i en æra, hvor AI beviser teoremer og gør nye opdagelser inden for fysik, teknik og biologi? Efterhånden som AI skifter fra brute-force-beregninger til mere gennemtænkt problemløsning, kan vi være på randen af en fremtid, hvor mennesker og AI arbejder sammen for at afdække ideer, vi aldrig troede var mulige.