Umelá inteligencia

KOZA (Dobrá v aritmetických úlohách): Od jazykových znalostí k matematickému géniu

uverejnené

2 mesiacmi

March 20, 2024

Model GOAT AI spája jazykové a matematické schopnosti, čo prináša revolúciu vo vzdelávaní a riešení problémov

Veľké jazykové modely (LLM) spôsobili revolúciu spracovanie prirodzeného jazyka (NLP) vynikajúcou tvorbou a pochopením ľudského textu. Tieto modely sa však často musia zlepšiť, pokiaľ ide o základné aritmetické úlohy. Napriek ich odborným znalostiam v oblasti jazyka LLM často vyžadujú pomoc s jednoduchými matematickými výpočtami. Táto priepasť medzi jazykovou zdatnosťou a matematickými zručnosťami podnietila výskumníkov, aby skúmali špecializované modely pre aritmetické úlohy.

Na poliach umelá inteligencia a vzdelanie, KOZY, čo znamená Good at Aritmetic Tasks, sa ukázal ako pozoruhodný vývoj. Na rozdiel od tradičných modelov GOAT vyniká nielen v NLP, ale aj v riešení zložitých matematických problémov. Predstavte si model, ktorý bez námahy vytvára expresívne vety a zároveň presne rieši zložité rovnice. GOAT predstavuje túto jedinečnú kombináciu, dokonale integrovanú skúseného lingvistu a matematika.

GOAT je revolučný model AI, ktorý vyniká v lingvistických a numerických úlohách. Na rozdiel od tradičných jazykových modelov, ktoré sa zameriavajú hlavne na generovanie a porozumenie textu, GOAT ich prekonáva tým, že demonštruje pokročilé matematické schopnosti riešiť problémy. Jeho prechod medzi týmito dvoma doménami znamená významný prelom v AI, otvára príležitosti pre inovatívne aplikácie vo vzdelávaní, riešení problémov a iných oblastiach.

Model KOZY

Model GOAT predstavuje významný pokrok v umelej inteligencii, konkrétne rieši prienik jazykového porozumenia a matematického uvažovania. Vo svojom jadre je GOAT jemne vyladený Model LLaMA, špecializovaný variant LLM navrhnutý výslovne pre aritmetické úlohy. Na rozdiel od generických LLM, ktoré vynikajú v NLP, ale zápasia so základnou aritmetikou, GOAT prešiel cieleným jemným doladením, aby zvýšil svoje matematické schopnosti.

Prednosť GOAT spočíva v jeho schopnosti riešiť širokú škálu aritmetických úloh s vysokou presnosťou. V porovnaní so všeobecne uznávanými GPT-4, GOAT dôsledne poskytuje vynikajúce výsledky pri pridávaní, odčítaní, násobení a delení. Jeho vyladená architektúra mu umožňuje efektívne zvládnuť numerické výrazy, slovné úlohy a matematické uvažovanie. Či už ide o výpočty veľkých čísel alebo riešenie zložitých rovníc, GOAT demonštruje úroveň presnosti, ktorá ho odlišuje od svojich predchodcov.

Na dosiahnutie tejto zručnosti používa GOAT synteticky generovaný súbor údajov. Tento súbor údajov obsahuje rôzne aritmetické príklady pokrývajúce rôzne úrovne obtiažnosti, rozsahy čísel a typy problémov. Školením na týchto starostlivo upravených údajoch sa GOAT učí zovšeobecňovať naprieč rôznymi scenármi, vďaka čomu je zručný na zvládanie aritmetických výziev v reálnom svete.

Schopnosti GOAT presahujú jednoduché sčítanie a odčítanie. Zdoláva zložité aritmetické výzvy v rôznych oblastiach. Či už ide o algebraické výrazy, slovné úlohy alebo viackrokové výpočty, GOAT neustále prekonáva svojich konkurentov. Jeho presnosť a účinnosť nastavuje nový štandard.

PaLM-540B, výkonný jazykový model, naráža na tvrdú konkurenciu KOZY. Pri priamych porovnaniach GOAT vykazuje lepšiu presnosť a silu. Odborne narába s komplexnými číslami, čím prekonáva ostatné modely. Sila KOZY pochádza z jej doladenia pod dohľadom. Dokonca aj pri práci s veľmi veľkými číslami, ktoré by mohli byť výzvou pre väčšinu, GOAT funguje výrazne dobre. Presne vykonáva sčítanie a odčítanie, čím demonštruje svoju matematickú brilantnosť.

Tokenizácia čísel v GOAT: Zlepšenie aritmetickej presnosti

GOAT demonštruje pozoruhodnú schopnosť konzistentne narábať s číselnými tokenmi. Tokenizácia rozdeľuje vstupný text na menšie jednotky alebo tokeny. V prípade KOZY tieto žetóny predstavujú slová aj číselné hodnoty. GOAT zabezpečuje jednotné zaobchádzanie s číslami – celými číslami, desatinnými miestami alebo vedeckým zápisom. Každému číselnému tokenu sa venuje rovnaká pozornosť bez ohľadu na kontext.

Okrem toho GOAT zaisťuje presnosť pri analýze číselných výrazov. Keď GOAT narazí na aritmetický výraz, rozloží ho na žetóny. Napríklad výraz "2.14 + 2.618" sa stáva sekvenciou žetónov: ["2.14", "+", "2.618"].

Pochopenie číselných znakov GOAT umožňuje presné operácie. Uznáva to "2.14" je desatinné číslo, "+" je operátor sčítania a "2.618" je ďalšie desatinné miesto. Toto konzistentné spracovanie zaisťuje, že GOAT si nezamieňa číselné hodnoty s lingvistickými prvkami.

Presné riešenie slovných úloh

V slovných úlohách zohráva kľúčovú úlohu tokenizácia KOZY.

brať do úvahy: "Ak má Alice 6 jabĺk a Bob jej dá ďalšie 4, koľko jabĺk má Alice?"

GOAT identifikuje číselné tokeny ("6" a "4") a príslušnú operáciu („dáva jej“). Presne vypočíta výsledok: 6 + 4 = 10. Tým, že GOAT zaobchádza s číslami ako so samostatnými tokenmi, sa vyhýba nejednoznačnosti.

Podobne GOAT presne spracováva veľké čísla a vedecké zápisy pri zachovaní vysokej presnosti. Tokenizácia GOAT sa rozširuje na veľké počty, ako napr "1,000,000" or "1.23e6" (vedecký zápis pre 1.23 × 10^6). Či už analyzujete milión alebo sa zaoberáte exponentmi, GOAT si zachováva presnosť.

Školenie, dolaďovanie a dostupnosť otvoreného zdroja

Model GOAT sa trénuje pomocou kontrolovaného prístupu, pričom sa učí z označených údajov a explicitných pokynov. Rozhodujúci krok v jeho tréningovom procese zahŕňa jemné ladenie, kde sa vopred vyškolený model, ako je jazykový model, prispôsobí konkrétnej úlohe aktualizáciou svojich váh na základe údajov špecifických pre danú úlohu.

GOAT využíva pri dolaďovaní riadené inštrukcie, ktoré zaisťujú cielené vedenie počas celého adaptačného procesu a umožňujú efektívne zovšeobecnenie modelu na príklady mimo distribúcie. LoRA, ako súčasť tejto paradigmy, uľahčuje prispôsobenie nízkej hodnote, čo zvyšuje robustnosť modelu. Začlenením LoRA GOAT efektívne zvláda štítkový šum a zlepšuje kvalitu tréningových údajov, čo mu umožňuje efektívne sa učiť zo zašumených alebo nedokonale označených údajov.

Model GOAT a jeho predtrénované závažia sú navyše dostupné ako softvér s otvoreným zdrojovým kódom. Výskumníci majú prístup k úložisku GOAT, ktoré obsahuje modelovú architektúru, tréningový kód, hodnotiace skripty a množinu údajov používanú na jeho školenie. Tento prístup s otvoreným zdrojovým kódom podporuje spoluprácu, inovácie a prieskum v rámci vedeckej komunity, čím uľahčuje pokrok v porozumení prirodzeného jazyka.

Výzvy a možné riešenia

Vzhľadom na svoju zložitosť potrebuje model GOAT pomoc pri zvládaní násobenia a delenia veľkých čísel. Na prekonanie tohto problému GOAT používa niekoľko stratégií. Najprv rozloží zložité operácie na menšie kroky, ako je násobenie jednotlivých číslic alebo odhad podielov.

Okrem toho klasifikuje úlohy na základe učenia sa – základná aritmetika je priamo doladená, zatiaľ čo zložité úlohy sú rozdelené. Riadené jemné ladenie poskytuje jasné pokyny počas tréningu a mechanizmy pozornosti zvyšujú výkon. Sekvenčné učenie a presun z jednoduchších úloh umožňuje GOAT efektívne riešiť zložité aritmetické problémy.

Bottom Line

Záverom možno povedať, že GOAT predstavuje významný pokrok v oblasti AI, ktorý spája porozumenie jazyka a matematické uvažovanie. Jeho výnimočná schopnosť zvládnuť aritmetické úlohy, vyladený prístup a pozornosť venovaná numerickým symbolom demonštruje neporovnateľnú všestrannosť a presnosť. Svojou dostupnosťou open source a neustálym pokrokom GOAT dláždi cestu pre inovatívne aplikácie vo vzdelávaní a riešení problémov a sľubuje budúcnosť vylepšených schopností AI.

Nasledujúci

Čo by ste mali vedieť o novom superčipe a architektúre AI Blackwell od NVIDIA

Nenechajte si ujsť

AnimateLCM: Urýchlenie animácie prispôsobených modelov difúzie

Dr. Assad Abbas

Doktor Assad Abbas, a Úradovaný docent na COMSATS University Islamabad, Pakistan, získal titul Ph.D. zo Štátnej univerzity v Severnej Dakote, USA. Jeho výskum sa zameriava na pokročilé technológie vrátane cloudu, fog a edge computingu, analýzy veľkých dát a AI. Dr. Abbas významne prispel publikáciami v renomovaných vedeckých časopisoch a na konferenciách.