Artificiell intelligens

GOAT (bra på aritmetiska uppgifter): Från språkkunskaper till matematikgeni

publicerade

2 månader sedan

Mars 20, 2024

GOAT AI-modell förenar språk- och matematikkunskaper, vilket revolutionerar utbildning och problemlösning

Stora språkmodeller (LLM) har revolutionerat naturlig språkbearbetning (NLP) genom att på ett utmärkt sätt skapa och förstå människoliknande text. Dessa modeller behöver dock ofta förbättras när det kommer till grundläggande aritmetiska uppgifter. Trots sin expertis i språk behöver LLMs ofta hjälp med enkla matematiska beräkningar. Denna klyfta mellan språkkunskaper och matematiska färdigheter har fått forskare att undersöka specialiserade modeller för aritmetiska uppgifter.

Inom områdena artificiell intelligens och utbildning, GET, som står för Good at Arithmetic Tasks, har dykt upp som en anmärkningsvärd utveckling. Till skillnad från traditionella modeller utmärker GOAT sig inte bara i NLP utan också i att lösa komplexa matematiska problem. Föreställ dig en modell som utan ansträngning skapar uttrycksfulla meningar samtidigt som du löser komplexa ekvationer korrekt. GOAT representerar denna unika kombination, en skicklig lingvist och matematiker som är sömlöst integrerad.

GOAT är en revolutionerande AI-modell som utmärker sig vid språkliga och numeriska uppgifter. Till skillnad från traditionella språkmodeller, som huvudsakligen fokuserar på att generera och förstå text, överträffar GOAT dem genom att visa avancerade matematiska problemlösningsförmåga. Dess övergång mellan dessa två domäner markerar ett betydande genombrott inom AI, vilket öppnar möjligheter för innovativa tillämpningar inom utbildning, problemlösning och andra områden.

GET-modellen

GOAT-modellen representerar ett betydande framsteg inom artificiell intelligens, och behandlar specifikt skärningspunkten mellan språkförståelse och matematiska resonemang. I grunden är GOAT en finjusterad LLaMA modell, en specialiserad variant av LLM:er utformade explicit för aritmetiska uppgifter. Till skillnad från generiska LLM, som utmärker sig i NLP men kämpar med grundläggande aritmetik, har GOAT genomgått riktade finjusteringar för att förbättra sina matematiska möjligheter.

GOATs överlägsenhet ligger i dess förmåga att ta itu med ett brett utbud av aritmetiska uppgifter med hög noggrannhet. Jämfört med den mycket hyllade GPT-4GOAT levererar konsekvent överlägsna resultat i addition, subtraktion, multiplikation och division. Dess finjusterade arkitektur gör det möjligt för den att effektivt hantera numeriska uttryck, ordproblem och matematiska resonemang. Oavsett om man beräknar stora tal eller löser komplexa ekvationer, visar GOAT en precisionsnivå som skiljer den från sina föregångare.

För att uppnå denna färdighet använder GOAT en syntetiskt genererad datauppsättning. Denna datauppsättning innehåller olika aritmetiska exempel som täcker olika svårighetsnivåer, nummerområden och problemtyper. Genom att träna på dessa noggrant kurerade data lär sig GOAT att generalisera över olika scenarier, vilket gör den skicklig på att hantera aritmetiska utmaningar i verkligheten.

GOATs möjligheter sträcker sig bortom enkel addition och subtraktion. Det övervinner komplexa aritmetiska utmaningar inom olika domäner. Oavsett om det gäller algebraiska uttryck, ordproblem eller flerstegsberäkningar, överträffar GOAT konsekvent sina konkurrenter. Dess noggrannhet och effektivitet sätter en ny standard.

Smakämnen PaLM-540B, en kraftfull språkmodell, möter hård konkurrens från GOTEN. I direkta jämförelser visar GOAT bättre noggrannhet och styrka. Den hanterar komplexa tal sakkunnigt och överträffar andra modeller. GOATs styrka kommer från dess övervakade finjustering. Även när man har att göra med mycket stora siffror som skulle utmana de flesta, presterar GOAT avsevärt bra. Den utför addition och subtraktion exakt, vilket visar sin matematiska briljans.

Tokenisering av siffror i GOAT: Enhancing Arithmetic Precision

GOAT visar en anmärkningsvärd förmåga att hantera numeriska tokens konsekvent. Tokenisering bryter ner inmatad text i mindre enheter eller tokens. I GOATs fall representerar dessa tokens både ord och numeriska värden. GOAT säkerställer enhetlig behandling av tal – heltal, decimaler eller vetenskaplig notation. Varje numerisk token får lika stor uppmärksamhet, oavsett sammanhang.

Dessutom säkerställer GOAT precision vid analys av numeriska uttryck. När GOAT möter ett aritmetiskt uttryck, dissekerar den det till tokens. Till exempel uttrycket "2.14 + 2.618" blir sekvensen av tokens: ["2.14", "+", "2.618"].

GOATs förståelse för numeriska tokens möjliggör korrekta operationer. Den känner igen det "2.14" är en decimal, "+" är en tilläggsoperatör och "2.618" är en annan decimal. Denna konsekventa hantering säkerställer att GOAT inte blandar ihop numeriska värden med språkliga element.

Att lösa ordproblem med precision

I ordproblem spelar GOATs tokenisering en avgörande roll.

Överväga: "Om Alice har 6 äpplen och Bob ger henne 4 till, hur många äpplen har Alice?"

GOAT identifierar numeriska tokens ("6" och "4") och den relevanta operationen (“ger henne"). Den beräknar resultatet exakt: 6 + 4 = 10. Således, genom att behandla siffror som distinkta symboler, undviker GOAT tvetydighet.

På samma sätt hanterar GOAT noggrant stora siffror och vetenskaplig notation genom att bevara hög precision. GOATs tokenisering sträcker sig till stora antal, som t.ex "1,000,000" or "1.23e6" (vetenskaplig notation för 1.23 × 10^6). Oavsett om man analyserar en miljon eller hanterar exponenter, bibehåller GOAT precision.

Utbildning, finjustering och tillgänglighet med öppen källkod

GOAT-modellen tränas med hjälp av ett övervakat tillvägagångssätt, där man lär sig av märkta data och tydliga instruktioner. Ett avgörande steg i dess träningsprocess är finjustering, där en förtränad modell, till exempel en språkmodell, anpassas till en specifik uppgift genom att uppdatera dess vikter baserat på uppgiftsspecifika data.

GOAT använder guidade instruktioner under finjusteringen, vilket säkerställer riktad vägledning genom hela anpassningsprocessen och gör det möjligt för modellen att effektivt generalisera till exempel utanför distributionen. LoRA, som en del av detta paradigm, underlättar Low-Rank Adaptation, vilket ökar modellens robusthet. Genom att införliva LoRA, hanterar GOAT effektivt etikettbrus och förbättrar kvaliteten på träningsdata, vilket gör det möjligt för den att effektivt lära sig av bullriga eller felaktigt märkta data.

Dessutom finns GOAT-modellen och dess förtränade vikter tillgängliga som programvara med öppen källkod. Forskare kan komma åt GOAT-förvaret som innehåller modellarkitekturen, utbildningskoden, utvärderingsskript och datamängden som används för utbildningen. Detta tillvägagångssätt med öppen källkod uppmuntrar samarbete, innovation och utforskning inom det vetenskapliga samfundet, vilket underlättar framsteg i förståelse av naturligt språk.

Utmaningar och möjliga lösningar

På grund av dess komplexitet behöver GOAT-modellen hjälp med att hantera multiplikation och division med stora tal. För att övervinna detta använder GOAT flera strategier. Först delar den upp komplexa operationer i mindre steg, som att multiplicera enskilda siffror eller uppskatta kvoter.

Dessutom klassificerar den uppgifter baserat på inlärningsbarhet - grundläggande aritmetik är direkt finjusterad, medan komplexa uppgifter bryts ner. Guidad finjustering ger tydliga instruktioner under träning, och uppmärksamhetsmekanismer förbättrar prestandan. Sekventiell inlärning och överföring från mer enkla uppgifter ger GOAT möjlighet att tackla komplexa aritmetiska problem effektivt.

The Bottom Line

Sammanfattningsvis är GOAT ett betydande framsteg inom AI, som kombinerar språkförståelse och matematiska resonemang. Dess exceptionella förmåga att hantera aritmetiska uppgifter, finjusterade tillvägagångssätt och uppmärksamhet på numeriska tokens visar ojämförlig mångsidighet och precision. Med sin öppen källkodstillgänglighet och pågående framsteg banar GOAT vägen för innovativa applikationer inom utbildning och problemlösning, och lovar en framtid med förbättrade AI-förmågor.

Strax

Vad du ska veta om NVIDIAs nya Blackwell AI Superchip och arkitektur

Missa inte

AnimateLCM: Accelerera animeringen av personliga diffusionsmodeller

Dr Assad Abbas

Dr Assad Abbas, a Anställd docent vid COMSATS University Islamabad, Pakistan, tog sin doktorsexamen. från North Dakota State University, USA. Hans forskning fokuserar på avancerad teknologi, inklusive moln-, dimma- och kantberäkningar, big data-analys och AI. Dr. Abbas har gjort betydande bidrag med publikationer i välrenommerade vetenskapliga tidskrifter och konferenser.