Connect with us

Fra o1 til o3: Hvordan OpenAI redefinerer kompleks resonnering i AI

Kunstig intelligens

Fra o1 til o3: Hvordan OpenAI redefinerer kompleks resonnering i AI

mm

Generativ AI har redefinert hva vi tror AI kan gjøre. Det som startet som et verktøy for enkle, repetitive oppgaver løser nå noen av de mest utfordrende problemene vi står overfor. OpenAI har spilt en stor rolle i denne skiftningen, og leder veien med sin ChatGPT-system. Tidlige versjoner av ChatGPT viste hvordan AI kunne ha menneske-lignende samtaler. Denne evnen gir en glimt inn i hva som var mulig med generativ AI. Over tid har dette systemet utviklet seg fra enkle interaksjoner til å takle utfordringer som krever resonnering, kritisk tenkning og problemløsing. Denne artikkelen undersøker hvordan OpenAI har transformert ChatGPT fra et konversasjonsverktøy til et system som kan resonere og løse problemer.

o1: Det første spranget inn i ekte resonnering

OpenAI’s første skritt mot resonnering kom med lanseringen av o1 i september 2024. Før o1 var GPT-modellene gode på å forstå og generere tekst, men de kjempet med oppgaver som krevde strukturert resonnering. o1 endret dette. Det var designet for å fokusere på logiske oppgaver, og bryte ned komplekse problemer inn i mindre, håndterbare steg.

o1 oppnådde dette ved å bruke en teknikk kalt resonanskjeder. Denne metoden hjalp modellen med å takle kompliserte problemer, som matematikk, vitenskap og programmering, ved å dele dem inn i enkle deler. Denne tilnærmingen gjorde o1 langt mer nøyaktig enn tidligere versjoner som GPT-4o. For eksempel, når det ble testet på avanserte matematikkproblemer, løste o1 83% av spørsmålene, mens GPT-4o bare løste 13%.

Suksessen med o1 kom ikke bare fra resonanskjeder. OpenAI forbedret også hvordan modellen ble trent. De brukte egendefinerte datasett fokusert på matematikk og vitenskap, og anvendte storskala reinforcement learning. Dette hjalp o1 med å håndtere oppgaver som trengte flere steg for å løse. Den ekstra beregnings­tiden som ble brukt på resonnering viste seg å være en nøkelfaktor for å oppnå nøyaktighet som tidligere modeller ikke kunne matche.

o3: Tar resonnering til neste nivå

Bygget på suksessen med o1, har OpenAI nå lansert o3. Lansert under ”12 Days of OpenAI”-arrangementet, tar denne modellen AI-resonnering til neste nivå med mer innovative verktøy og nye evner.

En av de viktigste oppgraderingene i o3 er dens evne til å tilpasse seg. Den kan nå sjekke sine svar mot bestemte kriterier, og sikre at de er nøyaktige. Denne evnen gjør o3 mer pålitelig, spesielt for komplekse oppgaver hvor presisjon er avgjørende. Tenk på det som å ha en innebygd kvalitetskontroll som reduserer sjansen for feil. Ulempen er at det tar litt lengre tid å komme frem til svarene. Det kan ta noen ekstra sekunder eller til og med minutter å løse et problem sammenlignet med modeller som ikke bruker resonnering.

Liksom o1, ble o3 trent til å ”tenke” før den svarte. Denne treningen gjør det mulig for o3 å utføre chain-of-thought-resonnering ved hjelp av reinforcement learning. OpenAI kaller denne tilnærmingen en ”privat tankekedde”. Den lar o3 bryte ned problemer og tenke gjennom dem steg for steg. Når o3 får en prompt, skynder den seg ikke til å svare. Den tar tid til å vurdere relaterte ideer og forklare sin resonnering. Etter dette summerer den det beste svaret den kan komme opp med.

En annen nyttig funksjon i o3 er dens evne til å justere hvor mye tid den bruker på å resonere. Hvis oppgaven er enkel, kan o3 flytte raskt. Men den kan bruke mer beregningskraft for å forbedre nøyaktigheten for mer kompliserte utfordringer. Denne fleksibiliteten er avgjørende fordi den lar brukerne kontrollere modellens ytelse basert på oppgaven.

I tidlige tester viste o3 stor potensial. På ARC-AGI-benchmarket, som tester AI på nye og ukjente oppgaver, scoret o3 87,5%. Dette resultatet er et sterkt resultat, men det pekte også ut områder hvor modellen kunne forbedres. Mens den gjorde det bra med oppgaver som kodning og avansert matematikk, hadde den noen ganger problemer med mer rett frem oppgaver. 

Har o3 oppnådd kunstig generell intelligens (AGI)

Selv om o3 betydelig utvider AI-resonneringens evner ved å score høyt på ARC-utfordringen, en benchmark designet for å teste resonnering og tilpasning, mangler den fortsatt menneske-lignende intelligens. ARC-utfordringens arrangører har klargjort at selv om o3s prestasjon oppnådde et betydelig milepæl, er det bare et skritt mot AGI og ikke det endelige resultatet. Mens o3 kan tilpasse seg nye oppgaver på imponerende måter, har den fortsatt problemer med enkle oppgaver som kommer lett for mennesker. Dette viser gapet mellom nåværende AI og menneskelig tenkning. Mennesker kan bruke kunnskap på tvers av forskjellige situasjoner, mens AI fortsatt kjemper med det nivået av generalisering. Så, mens O3 er en bemerkelsesverdig utvikling, har den fortsatt ikke den universelle problemløsningsevnen som trengs for AGI. AGI forblir et mål for fremtiden.

Vegen fremover

o3s fremgang er et stort øyeblikk for AI. Den kan nå løse mer komplekse problemer, fra kodning til avansert resonnering. AI nærmer seg ideen om AGI, og potensialet er enormt. Men med denne fremgangen kommer ansvar. Vi må tenke nøye på hvordan vi går fremover. Det er en balanse mellom å pushe AI til å gjøre mer og å sikre at det er trygt og skalerbart.

o3 står fortsatt overfor utfordringer. En av de største utfordringene for o3 er dens behov for mye beregningskraft. Å kjøre modeller som o3 tar betydelige ressurser, noe som gjør skaleringen av denne teknologien vanskelig og begrenser dens vidtrekkende bruk. Å gjøre disse modellene mer effektive er nøkkel til å sikre at de kan nå sitt fulle potensial. Sikkerhet er en annen primær bekymring. Jo mer kapabel AI blir, jo større er risikoen for uforutsette konsekvenser eller misbruk. OpenAI har allerede implementert noen sikkerhetstiltak, som ”deliberative alignment”, som hjelper med å guide modellens beslutningstagning i å følge etiske prinsipper. Men når AI utvikler seg, må disse tiltakene også utvikles.
Andre selskaper, som Google og DeepSeek, arbeider også med AI-modeller som kan håndtere lignende resonneringsoppgaver. De står overfor lignende utfordringer: høye kostnader, skalerbarhet og sikkerhet.

AIens fremtid er full av løfter, men det finnes fortsatt hindringer. Teknologien står på et vendepunkt, og hvordan vi håndterer problemer som effektivitet, sikkerhet og tilgjengelighet, vil bestemme hvor den går. Det er en spennende tid, men nøye overveielser er nødvendig for å sikre at AI kan nå sitt fulle potensial.

Botunnsaken

OpenAIs skritt fra o1 til o3 viser hvor langt AI har kommet i resonnering og problemløsing. Disse modellene har utviklet seg fra å håndtere enkle oppgaver til å takle mer komplekse oppgaver som avansert matematikk og kodning. o3 står ut for sin evne til å tilpasse seg, men den er fortsatt ikke på kunstig generell intelligens (AGI)-nivå. Mens den kan håndtere mye, har den fortsatt problemer med noen grunnleggende oppgaver og trenger mye beregningskraft.

Fremtiden for AI er lys, men det finnes utfordringer. Effektivitet, skalerbarhet og sikkerhet trenger oppmerksomhet. AI har gjort imponerende fremgang, men det er fortsatt arbeid å gjøre. OpenAIs fremgang med o3 er et betydelig skritt fremover, men AGI er fortsatt på horisonten. Hvordan vi håndterer disse utfordringene, vil forme fremtiden for AI.

Dr. Tehseen Zia er en fast ansatt associate professor ved COMSATS University Islamabad, med en PhD i AI fra Vienna University of Technology, Østerrike. Som spesialist i kunstig intelligens, maskinlæring, datavitenskap og datavisjon, har han gjort betydelige bidrag med publikasjoner i anerkjente vitenskapelige tidsskrifter. Dr. Tehseen har også ledet flere industriprosjekter som hovedundersøker og tjenestegjort som AI-konsulent.