Artificial Intelligence

GOAT (goed in rekentaken): van taalvaardigheid tot wiskundegenie

gepubliceerd

2 maanden geleden

20 maart 2024

Het GOAT AI-model combineert taal- en rekenvaardigheid en zorgt voor een revolutie in het onderwijs en het oplossen van problemen

Grote taalmodellen (LLM's) hebben gerevolutioneerd natuurlijke taalverwerking (NLP) door uitstekend mensachtige tekst te creëren en te begrijpen. Deze modellen moeten echter vaak worden verbeterd als het gaat om elementaire rekentaken. Ondanks hun taalexpertise hebben LLM's vaak hulp nodig bij eenvoudige wiskundige berekeningen. Deze kloof tussen taalvaardigheid en wiskundige vaardigheden heeft onderzoekers ertoe aangezet gespecialiseerde modellen voor rekentaken te onderzoeken.

Op het gebied van kunstmatige intelligentie en onderwijs, GEIT, wat staat voor Goed in Rekenkundige Taken, is een opmerkelijke ontwikkeling gebleken. In tegenstelling tot traditionele modellen blinkt GOAT niet alleen uit in NLP, maar ook in het oplossen van complexe wiskundige problemen. Stel je een model voor dat moeiteloos expressieve zinnen maakt en tegelijkertijd complexe vergelijkingen nauwkeurig oplost. GOAT vertegenwoordigt deze unieke combinatie, een vaardige taalkundige en wiskundige naadloos geïntegreerd.

GOAT is een revolutionair AI-model dat uitblinkt in taalkundige en numerieke taken. In tegenstelling tot traditionele taalmodellen, die zich voornamelijk richten op het genereren en begrijpen van tekst, presteert GOAT beter door geavanceerde wiskundige probleemoplossende vaardigheden te demonstreren. De overgang tussen deze twee domeinen markeert een belangrijke doorbraak op het gebied van AI, waardoor er mogelijkheden ontstaan voor innovatieve toepassingen op het gebied van onderwijs, probleemoplossing en andere terreinen.

Het GOAT-model

Het GOAT-model vertegenwoordigt een aanzienlijke vooruitgang op het gebied van kunstmatige intelligentie, waarbij specifiek het snijvlak van taalbegrip en wiskundig redeneren wordt aangepakt. In de kern is GOAT verfijnd LLaMA-model, een gespecialiseerde variant van LLM's die expliciet is ontworpen voor rekentaken. In tegenstelling tot generieke LLM's, die uitblinken in NLP maar worstelen met basisrekenkunde, heeft GOAT gerichte verfijning ondergaan om zijn wiskundige mogelijkheden te verbeteren.

De superioriteit van GOAT ligt in zijn vermogen om een breed scala aan rekentaken met hoge nauwkeurigheid aan te pakken. Vergeleken met de alom geprezen GPT-4GOAT levert consequent superieure resultaten bij optellen, aftrekken, vermenigvuldigen en delen. Dankzij de verfijnde architectuur kan het effectief omgaan met numerieke uitdrukkingen, woordproblemen en wiskundig redeneren. Of het nu gaat om het berekenen van grote getallen of het oplossen van complexe vergelijkingen, GOAT demonstreert een nauwkeurigheidsniveau dat hem onderscheidt van zijn voorgangers.

Om deze vaardigheid te bereiken, gebruikt GOAT een synthetisch gegenereerde dataset. Deze dataset bevat diverse rekenvoorbeelden die verschillende moeilijkheidsgraden, getalbereiken en probleemtypen bestrijken. Door te trainen met deze zorgvuldig samengestelde gegevens leert GOAT te generaliseren over verschillende scenario's, waardoor het bedreven wordt in het omgaan met rekenkundige uitdagingen in de echte wereld.

De mogelijkheden van GOAT gaan verder dan eenvoudig optellen en aftrekken. Het overwint complexe rekenkundige uitdagingen in verschillende domeinen. Of het nu gaat om algebraïsche uitdrukkingen, woordproblemen of berekeningen in meerdere stappen, GOAT presteert consequent beter dan zijn concurrenten. De nauwkeurigheid en efficiëntie zetten een nieuwe standaard.

De PaLM-540B, een krachtig taalmodel, ondervindt zware concurrentie van de GOAT. In directe vergelijkingen vertoont GOAT een betere nauwkeurigheid en sterkte. Het verwerkt complexe getallen vakkundig en overtreft andere modellen. De kracht van GOAT zit in de begeleide verfijning. Zelfs als het gaat om zeer grote aantallen die de meeste problemen opleveren, presteert GOAT aanzienlijk goed. Het voert het optellen en aftrekken nauwkeurig uit, wat zijn wiskundige genialiteit aantoont.

Tokenisatie van getallen in GOAT: verbetering van de rekenkundige precisie

GOAT demonstreert een opmerkelijk vermogen om numerieke tokens consistent te verwerken. Tokenisatie splitst invoertekst op in kleinere eenheden of tokens. In het geval van GOAT vertegenwoordigen deze tokens zowel woorden als numerieke waarden. GOAT zorgt voor een uniforme behandeling van getallen: gehele getallen, decimalen of wetenschappelijke notatie. Elk numeriek token krijgt evenveel aandacht, ongeacht de context.

Bovendien zorgt GOAT voor precisie bij het parseren van numerieke uitdrukkingen. Wanneer GOAT een rekenkundige uitdrukking tegenkomt, wordt deze in tokens ontleed. De uitdrukking bijvoorbeeld “2.14 + 2.618” wordt de reeks tokens: ["2.14", “+”, "2.618"].

GOAT's begrip van numerieke tokens maakt nauwkeurige operaties mogelijk. Het erkent dat "2.14" is een decimaal, "+" is een opteloperator, en "2.618" is nog een decimaal. Deze consistente afhandeling zorgt ervoor dat GOAT numerieke waarden niet verwart met taalkundige elementen.

Woordproblemen met precisie oplossen

Bij woordproblemen speelt de tokenisatie van GOAT een cruciale rol.

Overwegen: “Als Alice zes appels heeft en Bob haar er nog vier geeft, hoeveel appels heeft Alice dan?”

GOAT identificeert numerieke tokens (“6” en “4”) en de relevante operatie (“geeft haar"). Het berekent het resultaat nauwkeurig: 6 + 4 = 10. Door getallen als afzonderlijke tokens te behandelen, vermijdt GOAT dus dubbelzinnigheid.

Op dezelfde manier verwerkt GOAT nauwkeurig grote getallen en wetenschappelijke notaties door een hoge precisie te behouden. De tokenisatie van GOAT strekt zich uit tot grote aantallen, zoals "1,000,000" or “1.23e6” (wetenschappelijke notatie voor 1.23×10^6). Of het nu gaat om het ontleden van een miljoen of het omgaan met exponenten, GOAT behoudt de precisie.

Training, verfijning en beschikbaarheid van open source

Het GOAT-model wordt getraind met behulp van een begeleide aanpak, waarbij wordt geleerd van gelabelde gegevens en expliciete instructies. Een cruciale stap in het trainingsproces is de verfijning, waarbij een vooraf getraind model, zoals een taalmodel, wordt aangepast aan een specifieke taak door de gewichten ervan bij te werken op basis van taakspecifieke gegevens.

GOAT maakt gebruik van begeleide instructies tijdens het afstemmen, waardoor gerichte begeleiding tijdens het aanpassingsproces wordt gegarandeerd en het model in staat wordt gesteld effectief te generaliseren naar voorbeelden die niet in de distributie voorkomen. LoRA vergemakkelijkt, als onderdeel van dit paradigma, Low-Rank Adaptation, wat de robuustheid van het model vergroot. Door LoRA te integreren, gaat GOAT effectief om met labelruis en verbetert het de kwaliteit van trainingsgegevens, waardoor het effectief kan leren van luidruchtige of imperfect gelabelde gegevens.

Bovendien zijn het GOAT-model en de vooraf getrainde gewichten beschikbaar als open-sourcesoftware. Onderzoekers hebben toegang tot de GOAT-repository met de modelarchitectuur, trainingscode, evaluatiescripts en de dataset die voor de training wordt gebruikt. Deze open-sourcebenadering stimuleert samenwerking, innovatie en verkenning binnen de wetenschappelijke gemeenschap, waardoor vooruitgang in het begrip van natuurlijke taal wordt vergemakkelijkt.

Uitdagingen en mogelijke oplossingen

Vanwege de complexiteit heeft het GOAT-model hulp nodig bij het verwerken van vermenigvuldiging en deling van grote getallen. Om dit te ondervangen gebruikt GOAT verschillende strategieën. Ten eerste ontleedt het complexe bewerkingen in kleinere stappen, zoals het vermenigvuldigen van individuele cijfers of het schatten van quotiënten.

Bovendien classificeert het taken op basis van leerbaarheid: basisrekenkunde wordt direct verfijnd, terwijl complexe taken worden opgesplitst. Begeleide afstemming zorgt voor expliciete instructies tijdens de training, en aandachtsmechanismen verbeteren de prestaties. Sequentieel leren en overdracht van eenvoudigere taken stellen GOAT in staat om complexe rekenkundige problemen effectief aan te pakken.

The Bottom Line

Kortom, GOAT is een aanzienlijke vooruitgang op het gebied van AI, waarbij taalbegrip en wiskundig redeneren worden gecombineerd. Het uitzonderlijke vermogen om rekenkundige taken uit te voeren, de verfijnde aanpak en de aandacht voor numerieke tokens demonstreren een onvergelijkbare veelzijdigheid en precisie. Met zijn open source-beschikbaarheid en voortdurende vooruitgang maakt GOAT de weg vrij voor innovatieve toepassingen in het onderwijs en het oplossen van problemen, en belooft een toekomst van verbeterde AI-mogelijkheden.

Wat u moet weten over NVIDIA's nieuwe Blackwell AI-superchip en architectuur

Mis het niet

AnimateLCM: versnelling van de animatie van gepersonaliseerde diffusiemodellen

Dr. Assad Abbas

Dr. Assad Abbas, a Vaste universitair hoofddocent aan de COMSATS Universiteit Islamabad, Pakistan, behaalde zijn Ph.D. van de North Dakota State University, VS. Zijn onderzoek richt zich op geavanceerde technologieën, waaronder cloud-, fog- en edge-computing, big data-analyse en AI. Dr. Abbas heeft substantiële bijdragen geleverd met publicaties in gerenommeerde wetenschappelijke tijdschriften en conferenties.