부본 GPT-4는 AGI에 도달하기 위한 도약인가? - Unite.AI
Rescale 미팅 예약

인공 지능

GPT-4는 AGI에 도달하기 위한 도약인가?

mm
업데이트 on

Microsoft는 최근 다음과 같은 제목의 연구 논문을 발표했습니다. 인공 일반 지능의 불꽃: GPT-4를 사용한 초기 실험. Microsoft에서 설명한 대로:

이 종이 OpenAI에서 아직 활발하게 개발 중이던 초기 버전의 GPT-4에 대한 조사에 대해 보고합니다. 우리는 (이 초기 버전의) GPT-4가 이전 AI 모델보다 더 일반적인 지능을 나타내는 새로운 LLM 코호트(예: ChatGPT 및 Google의 PaLM과 함께)의 일부라고 주장합니다.

이 논문에는 GPT-4가 암기 그 이상이며 개념, 기술 및 영역에 대한 깊고 유연한 이해를 가지고 있음을 보여주는 결정적인 증거가 있습니다. 사실 그것은 일반화하는 능력이 오늘날 살아있는 어떤 인간의 능력을 훨씬 능가합니다.

이전에 논의한 반면 AGI의 이점, 우리는 AGI 시스템이 무엇인지에 대한 일반적인 합의를 빠르게 요약해야 합니다. 본질적으로 AGI는 여러 도메인에 걸쳐 일반화할 수 있고 범위가 좁지 않은 일종의 고급 AI입니다. 좁은 AI의 예로는 자율 주행 차량, 챗봇, 체스 봇 또는 단일 목적을 위해 설계된 기타 AI가 있습니다.

이에 비해 AGI는 위 또는 다른 전문 분야 간에 유연하게 전환할 수 있습니다. 다음과 같은 초기 알고리즘을 활용하는 AI입니다. 전학 학습, 진화 학습과 같은 레거시 알고리즘도 활용합니다. 심층 강화 학습.

AGI에 대한 위의 설명은 GPT-4 사용에 대한 나의 개인적인 경험과 Microsoft에서 발표한 연구 논문에서 공유된 증거와 일치합니다.

논문에 요약된 프롬프트 중 하나는 GPT-4가 시의 형태로 소수의 무한성에 대한 증명을 작성하는 것입니다.

그러한 시를 창작하기 위한 요구 사항을 분석하면 수학적 추론, 시적 표현 및 자연어 생성이 필요함을 알 수 있습니다. 이것은 대부분의 인간의 평균 능력을 초과하는 도전입니다.

논문에서는 GPT-4가 단순히 일반적인 암기 기반으로 콘텐츠를 제작하는 것이 아니라 맥락을 이해하고 추론할 수 있는 능력을 갖춘 것인지 이해하고 싶었습니다. 셰익스피어 스타일로 시를 재현해 달라는 요청을 받았을 때 그렇게 할 수 있었습니다. 이를 위해서는 일반 대중의 능력을 훨씬 뛰어 넘는 정신 이론과 수학적 천재성을 포함하는 다각적인 수준의 이해가 필요합니다.

GPT-4 지능을 계산하는 방법?

그런 다음 문제는 LLM의 지능을 어떻게 측정할 수 있습니까? 그리고 GPT-4는 진정한 학습 또는 단순한 암기의 행동을 보여주고 있습니까?

현재 AI 시스템을 테스트하는 방법은 일련의 표준 벤치마크 데이터 세트에서 시스템을 평가하고, 훈련 데이터와 독립적이며 다양한 작업과 도메인을 포괄하는지 확인하는 것입니다. 이러한 유형의 테스트는 GPT-4가 학습한 거의 무제한의 데이터로 인해 거의 불가능합니다.

이 논문에서는 GPT-4가 암기 이상의 기능을 수행하며 개념, 기술 및 영역에 대한 깊고 유연한 이해를 갖추고 있음을 설득력 있게 보여주는 새롭고 어려운 작업/질문 생성에 대해 논의합니다.

지능에 관한 한 GPT-4는 단편 소설과 각본을 생성할 수 있으며 가장 복잡한 공식을 계산할 수 있습니다.

GPT-4는 또한 명령에서 코드를 작성하고 기존 코드를 이해하는 측면에서 모두 매우 높은 수준에서 코딩할 수 있습니다. GPT-4는 다음과 같은 광범위한 코딩 작업을 처리할 수 있습니다.
낮은 수준의 어셈블리에서 높은 수준의 프레임워크까지, 간단한 데이터 구조에서 게임과 같은 복잡한 프로그램에 이르기까지 실제 응용 프로그램에 대한 코딩 문제. GPT-4는 또한 코드 실행에 대해 추론하고 명령의 효과를 시뮬레이션하며 결과를 자연어로 설명할 수 있습니다. GPT-4는 의사 코드도 실행할 수 있습니다.

GPT-4는 주어진 거의 모든 프롬프트에 합리적인 응답을 제공할 수 있습니다. 사실, 그것의 지능은 그 복잡성에서 거의 천하무적입니다.

GPT-4 제한 사항

그런 다음 논문은 계속해서 GPT-4의 반응과 행동을 조사하고 일관성, 일관성 및 정확성을 확인하고 한계와 편견을 밝히는 방법을 설명합니다.

가장 분명한 한계는 환각 경향. 다음은 GPT-4가 자신의 대답이 완전히 거짓이라고 확신했던 논문에 나온 환각의 예입니다.

내가 GPT 환각이 무엇인지 물었을 때 GPT-4가 제공한 응답이었기 때문에 GPT-XNUMX조차도 환각에 대한 현재의 제한 사항을 이해하는 것으로 보입니다.

GPT 환각은 현재 상호 작용하고 있는 것과 같은 GPT(Generative Pre-trained Transformer) 모델이 사실 정보를 기반으로 하지 않거나 제공된 컨텍스트와 일관되지 않은 응답을 생성하는 현상을 말합니다. 이러한 환각은 모델이 그럴듯해 보이지만 실제로는 부정확하거나 오해의 소지가 있거나 무의미한 텍스트를 생성할 때 발생합니다.

다시 말해 전 세계 데이터에 대해 LLM AI를 교육할 때 시스템이 잘못된 데이터를 학습하는 것을 어떻게 방지할 수 있습니까? 잘못된 정보를 학습하고 역류시키는 대규모 언어 모델과 음모론은 실제로 LLM의 대규모 채택으로 인류가 직면하는 가장 큰 함정과 위협 중 하나일 수 있습니다. 이것은 실제로 AGI의 더 큰 위협 중 하나일 수 있으며, AGI의 위험성을 논의할 때 놀랍게도 놓치는 것입니다.

GPT-4 지능 증명

이 논문은 GPT-4가 어떤 유형의 복잡한 프롬프트가 지시되었는지는 중요하지 않으며 GPT-XNUMX가 기대치를 초과할 것이라고 설명합니다. 논문에 명시된 바와 같이:

타의 추종을 불허하는 자연어 숙달. 유창하고 일관된 텍스트를 생성할 수 있을 뿐만 아니라 요약, 번역 또는 매우 광범위한 질문 세트에 대한 답변과 같은 다양한 방식으로 텍스트를 이해하고 조작할 수 있습니다. 또한 번역이란 서로 다른 자연어 간의 번역뿐만 아니라 어조와 스타일의 번역은 물론 의학, 법률, 회계, 컴퓨터 프로그래밍, 음악 등과 같은 영역 전반을 의미합니다.

모의 기술 검토가 GPT-4에 제공되었으며, 이 맥락에서 이 사람이 다른 쪽 끝에 있는 사람이라면 즉시 소프트웨어 엔지니어로 고용될 것이라는 의미를 쉽게 전달했습니다. Multistate Bar Exam에서 GPT-4의 역량에 대한 유사한 예비 테스트에서 70% 이상의 정확도가 나타났습니다. 이것은 미래에 현재 변호사에게 주어지는 많은 작업을 자동화할 수 있음을 의미합니다. 사실 몇 가지가 있습니다. 현재 로봇 변호사를 만들기 위해 노력하고 있는 스타트업 GPT-4를 사용합니다.

새로운 지식 생산

이 논문의 주장 중 하나는 GPT-4가 진정한 이해 수준을 증명하기 위해 남은 유일한 것은 새로운 수학 정리를 증명하는 것과 같은 새로운 지식을 생산하는 것뿐이라는 것입니다.

그렇다면 이것은 AGI의 성배입니다. 잘못된 손에서 AGI를 제어하는 ​​위험이 있지만 AGI가 모든 과거 데이터를 신속하게 분석하여 새로운 정리, 치료법 및 치료법을 발견할 수 있는 이점은 거의 무한합니다.

AGI는 현재 민간 산업 자금이 부족한 희귀 유전병에 대한 치료법을 찾고, 암을 완전히 치료하고, 지속 불가능한 에너지에 대한 의존도를 제거하기 위해 재생 가능 에너지의 효율성을 최대화하는 데 잃어버린 고리가 될 수 있습니다. 실제로 AGI 시스템에 입력되는 모든 결과적 문제를 해결할 수 있습니다. 이것이 Sam Altman과 OpenAI 팀이 이해하는 것입니다. AGI는 진정한 최후의 발명품 그것은 대부분의 문제를 해결하고 인류에게 혜택을 주기 위해 필요합니다.

물론 그것은 누가 AGI를 제어하고 그들의 의도가 무엇인지에 대한 핵 버튼 문제를 해결하지 못합니다. 이것에 상관없이 종이 GPT-4가 AI 연구원들이 꿈꿔왔던 꿈을 이루기 위한 도약이라고 주장하는 경이로운 일을 합니다. 1956 이후, 인공 지능 여름 워크샵에 대한 초기 Dartmouth 여름 연구 프로젝트가 처음 시작되었을 때.

GPT-4가 AGI인지는 논란의 여지가 있지만 인류 역사상 처음으로 튜링 테스트.

unite.AI의 창립 파트너이자 포브스 기술 위원회, 앙투안은 미래파 예술가 AI와 로봇공학의 미래에 열정을 갖고 있는 사람입니다.

그는 또한 증권.io, 파괴적인 기술에 대한 투자에 초점을 맞춘 웹사이트입니다.