인공 지능

GOAT(산술에 능숙함): 언어 능력부터 수학 천재까지

게재

2 개월 전

2024 년 3 월 20 일

GOAT AI 모델은 언어와 수학 능력을 결합하여 교육과 문제 해결에 혁신을 가져옵니다.

대규모 언어 모델(LLM) 혁명을 일으켰다 자연어 처리 (NLP) 인간과 유사한 텍스트를 탁월하게 생성하고 이해함으로써 그러나 이러한 모델은 기본적인 산술 작업의 경우 개선이 필요한 경우가 많습니다. 언어에 대한 전문 지식에도 불구하고 LLM은 간단한 수학 계산에 도움이 필요한 경우가 많습니다. 언어 능력과 수학 능력 사이의 이러한 격차로 인해 연구자들은 산술 작업을 위한 특수 모델을 조사하게 되었습니다.

의 분야에서 인공 지능 그리고 교육, 염소Good at Arithmetic Tasks의 약자인 가 눈부신 발전을 이루었습니다. 기존 모델과 달리 GOAT는 NLP뿐만 아니라 복잡한 수학적 문제 해결에도 뛰어납니다. 복잡한 방정식을 정확하게 풀면서 표현력 있는 문장을 쉽게 만드는 모델을 상상해 보세요. GOAT는 숙련된 언어학자와 수학자가 완벽하게 통합된 독특한 조합을 나타냅니다.

GOAT는 언어 및 수치 작업에 탁월한 혁신적인 AI 모델입니다. 주로 텍스트 생성 및 이해에 중점을 두는 기존 언어 모델과 달리 GOAT는 고급 수학적 문제 해결 능력을 보여줌으로써 이러한 모델을 능가합니다. 이 두 영역 사이의 전환은 AI의 획기적인 발전을 의미하며 교육, 문제 해결 및 기타 분야에서 혁신적인 응용 프로그램을 위한 기회를 열어줍니다.

염소 모델

GOAT 모델은 특히 언어 이해와 수학적 추론의 교차점을 다루는 인공 지능의 중요한 발전을 나타냅니다. GOAT의 핵심은 미세 조정된 것입니다. LLaMA 모델, 산술 작업을 위해 명시적으로 설계된 LLM의 특수 변형입니다. NLP에서는 뛰어나지만 기본 산술에는 어려움을 겪는 일반 LLM과 달리 GOAT는 수학적 능력을 향상시키기 위해 목표에 맞는 미세 조정을 거쳤습니다.

GOAT의 우수성은 광범위한 산술 작업을 높은 정확도로 처리하는 능력에 있습니다. 호평을 받은 작품에 비하면 GPT-4, GOAT는 덧셈, 뺄셈, 곱셈, 나눗셈에서 지속적으로 우수한 결과를 제공합니다. 미세 조정된 아키텍처를 통해 수치 표현, 단어 문제 및 수학적 추론을 효과적으로 처리할 수 있습니다. 큰 숫자를 계산하든 복잡한 방정식을 풀든 GOAT는 이전 제품과 차별화되는 정밀도 수준을 보여줍니다.

이 기술을 달성하기 위해 GOAT는 합성으로 생성된 데이터 세트를 사용합니다. 이 데이터 세트는 다양한 난이도, 숫자 범위 및 문제 유형을 다루는 다양한 산술 예제로 구성됩니다. GOAT는 신중하게 선별된 데이터를 학습함으로써 다양한 시나리오에 걸쳐 일반화하는 방법을 학습하여 실제 산술 문제를 능숙하게 처리합니다.

GOAT의 기능은 단순한 덧셈과 뺄셈 이상으로 확장됩니다. 다양한 영역에 걸쳐 복잡한 산술 문제를 해결합니다. 대수식, 단어 문제, 다단계 계산 등 GOAT는 지속적으로 경쟁사보다 뛰어난 성능을 발휘합니다. 정확성과 효율성은 새로운 표준을 제시합니다.

XNUMXD덴탈의 PaLM-540B강력한 언어 모델인 는 GOAT와의 치열한 경쟁에 직면합니다. 직접 비교에서 GOAT는 더 나은 정확성과 강도를 보여줍니다. 다른 모델을 능가하여 복소수를 전문적으로 처리합니다. GOAT의 강점은 감독된 미세 조정에서 비롯됩니다. 가장 어려운 매우 큰 숫자를 처리할 때에도 GOAT는 상당히 좋은 성능을 발휘합니다. 덧셈과 뺄셈을 정확하게 수행하여 수학적 탁월함을 보여줍니다.

GOAT의 숫자 토큰화: 산술 정밀도 향상

GOAT는 숫자 토큰을 일관되게 처리하는 놀라운 능력을 보여줍니다. 토큰화는 입력 텍스트를 더 작은 단위 또는 토큰으로 분해합니다. GOAT의 경우 이러한 토큰은 단어와 숫자 값을 모두 나타냅니다. GOAT는 정수, 소수 또는 과학적 표기법 등의 숫자를 균일하게 처리합니다. 각 숫자 토큰은 상황에 관계없이 동일한 관심을 받습니다.

또한 GOAT는 숫자 표현식 구문 분석의 정확성을 보장합니다. GOAT는 산술 표현식을 만나면 이를 토큰으로 분해합니다. 예를 들어, 다음 표현은 "2.14 + 2.618" 토큰의 시퀀스가 됩니다. ["2.14", “+”, "2.618"].

GOAT의 숫자 토큰에 대한 이해는 정확한 작업을 가능하게 합니다. 그것은 그것을 인식한다 "2.14" 는 십진수이고, "+" 덧셈 연산자이고, "2.618" 또 다른 소수입니다. 이러한 일관된 처리를 통해 GOAT는 숫자 값을 언어 요소와 혼동하지 않습니다.

단어 문제를 정확하게 해결하기

단어 문제에서는 GOAT의 토큰화가 중요한 역할을 합니다.

중히 여기다: “앨리스가 사과 6개를 가지고 있고 밥이 그녀에게 사과 4개를 더 준다면 앨리스는 몇 개의 사과를 가지고 있습니까?”

GOAT는 숫자 토큰을 식별합니다. (“6”와 “4”) 그리고 관련 작업(“그녀에게 준다”). 결과를 정확하게 계산합니다. 6 + 4 = 10. 따라서 GOAT는 숫자를 별개의 토큰으로 처리하여 모호성을 방지합니다.

마찬가지로 GOAT는 높은 정밀도를 유지하여 큰 숫자와 과학적 표기법을 정확하게 처리합니다. GOAT의 토큰화는 다음과 같은 많은 수로 확장됩니다. "1,000,000" or “1.23e6” (과학적 표기법 1.23×10^6). 백만 개를 구문 분석하든 지수를 처리하든 GOAT는 정확성을 유지합니다.

교육, 미세 조정 및 오픈 소스 가용성

GOAT 모델은 지도된 접근 방식을 사용하여 학습되고 레이블이 지정된 데이터와 명시적인 지침을 통해 학습됩니다. 학습 프로세스의 중요한 단계에는 언어 모델과 같은 사전 학습된 모델이 작업별 데이터를 기반으로 가중치를 업데이트하여 특정 작업에 맞게 조정되는 미세 조정이 포함됩니다.

GOAT는 미세 조정 중에 안내 지침을 사용하여 적응 프로세스 전반에 걸쳐 목표 지침을 보장하고 모델이 배포되지 않은 사례에 효과적으로 일반화할 수 있도록 합니다. 이 패러다임의 일부인 LoRA는 낮은 순위 적응을 촉진하여 모델의 견고성을 향상시킵니다. LoRA를 통합함으로써 GOAT는 라벨 노이즈를 효과적으로 처리하고 훈련 데이터의 품질을 향상시켜 노이즈가 있거나 불완전하게 라벨이 지정된 데이터로부터 효과적으로 학습할 수 있습니다.

또한 GOAT 모델과 사전 훈련된 가중치는 오픈 소스 소프트웨어로 제공됩니다. 연구원은 모델 아키텍처, 교육 코드, 평가 스크립트 및 교육에 사용되는 데이터 세트가 포함된 GOAT 저장소에 액세스할 수 있습니다. 이 오픈 소스 접근 방식은 과학 커뮤니티 내에서 협업, 혁신 및 탐구를 장려하여 자연어 이해의 발전을 촉진합니다.

과제와 가능한 솔루션

복잡성으로 인해 GOAT 모델은 큰 수의 곱셈과 나눗셈을 처리하는 데 도움이 필요합니다. 이를 극복하기 위해 GOAT는 몇 가지 전략을 사용합니다. 첫째, 개별 숫자를 곱하거나 몫을 추정하는 등 복잡한 연산을 더 작은 단계로 분해합니다.

또한 학습 가능성을 기준으로 작업을 분류합니다. 기본 산술은 직접 미세 조정되고 복잡한 작업은 세분화됩니다. 안내식 미세 조정은 훈련 중에 명시적인 지침을 제공하고 주의 메커니즘은 성능을 향상시킵니다. 보다 간단한 작업에서 순차적 학습 및 전송을 통해 GOAT는 복잡한 산술 문제를 효과적으로 해결할 수 있습니다.

히프 라인

결론적으로 GOAT는 언어 이해와 수학적 추론을 결합한 AI의 중요한 발전입니다. 산술 작업을 처리하는 탁월한 능력, 미세 조정된 접근 방식, 숫자 토큰에 대한 관심은 비교할 수 없는 다용성과 정확성을 보여줍니다. 오픈 소스 가용성과 지속적인 발전을 통해 GOAT는 교육 및 문제 해결 분야에서 혁신적인 애플리케이션을 위한 길을 열어 향상된 AI 기능의 미래를 약속합니다.

다음 위로

NVIDIA의 새로운 Blackwell AI 슈퍼칩 및 아키텍처에 대해 알아야 할 사항

놓치지 마세요.

AnimateLCM: 맞춤형 확산 모델의 애니메이션 가속화

아사드 압바스 박사

아사드 압바스 박사 종신 부교수 파키스탄 COMSATS University Islamabad에서 박사학위를 취득했습니다. 미국 노스다코타 주립대학교 출신. 그의 연구는 클라우드, 포그, 엣지 컴퓨팅, 빅데이터 분석, AI를 포함한 고급 기술에 중점을 두고 있습니다. Abbas 박사는 평판이 좋은 과학 저널과 컨퍼런스에 출판물을 발표하는 데 상당한 공헌을 했습니다.