์ฌ์ ๋ฆฌ๋
์งํ์ ๋ฐ๊พธ๋ ์ธ๊ณต์ง๋ฅ์ โ์์๋ฃจ์ โ

오늘날, 기술적 단층선의 가장자리에 서서, 우리는 LLMs에서 에이전트로, 그리고 궁극적으로 에이전틱 AI와 AGI로의 여정을 관찰하고 있으며, 이는 단순히 더 큰 모델이나 더 빠른 응답에 관한 것이 아닙니다. 이는 또한 기계가 수동적인 보조자에서 능동적인 협력자로, 그리고 아마도 언젠가 독립적인 사고자로 이동하는 것에 관한 것입니다.
이 경로를 추적하고 이를 작업, 전문 지식, 그리고 내일의 지능을 형성하는 인간의 역할에 대해 어떤 것을 의미하는지 탐구해 보겠습니다.
LLMs, 에이전트 기반 시스템, 및 에이전틱 AI의 차이
이를 더 잘 이해하기 위해, 예를 들어, 다음과 같은 예가 있습니다. 만약 내가 LLM에게 다음과 같은 질문을 한다면: “나는 시카고에서 오스틴까지 여행하고 싶으며, 하루에 4시간 이상 운전하지 않고,风景이 좋은 곳에서 정차하고 싶습니다.” 일반적인 LLM은 언어 생성에 기반한 정적 응답을 텍스트 형식으로 반환할 것입니다. 이는 요청에 대한 철저한 분석 없이 요청에만 응답할 것입니다.
에이전트는 먼저 요청을 여행과 관련된 것으로 분류합니다. 그런 다음, 필요한 데이터를 결정합니다: 지도 서비스를 사용한 경로, 날씨 정보, 연료 비용, 호텔, 레스토랑 등. 이후 에이전트는 요청을 하위 작업으로 나누고 이를 전문적인 모듈이나 관련된 소스에 훈련된 LLM으로 라우팅합니다. 이것은 오케스트레이션과 여러 모델 및 도구를 통일된 논리 아래에서 조정하는 것입니다.
오늘날, 대부분의 주요 시스템은 ChatGPT나 Anthropic의 Claude와 같이 본질적으로 이미 에이전트입니다. 사용자가 단일 모델과 상호 작용하는 것으로 보일 수 있지만, 실제로는 여러 모델과 시스템이 포함된 복잡한 아키텍처가 있습니다.它们는 이미 복잡한 쿼리를 처리할 수 있지만, 그들의 능력은 대부분 정보 제공에 제한됩니다. 아직 행동을 취하지는 않습니다.
완전한 자율 에이전트는 정보를 수집하고, 예를 들어, 호텔을 예약하거나, 티켓을 구매하거나, 결제를 시작할 수 있는 시스템입니다. 이는 관련된 API 또는 사용자 데이터에 접근할 수 있는 경우에 해당합니다. 이러한 에이전트는 현재 초기 개발 단계에 있습니다. 이 시점에서,它们는 정보를 처리할 수 있지만, 아직 자율적인 행동을 수행하지는 못합니다.
연구 커뮤니티에서 흥미로운 토론 영역은 에이전틱 AI입니다. 일반적인 에이전트와 달리, 개발자에 의해 스크립팅된 행동을 가지는 에이전트와 달리, 에이전틱 AI는 시스템이 독립적으로 작업을 수행할지, 필요한 데이터가 무엇인지, 그리고甚至 자신의 훈련을 계속할지 결정하는 시스템입니다. 이는 지시를 실행하는 것을 넘어서, 자율적인 결정에 관한 것입니다. 그러나, 에이전틱 AI는 아직 이론적 단계에 있으며, 실제로 존재하는 시스템은 아직 없습니다.
AGI – 새로운 지평. 그러나, 그것은 달성 가능합니까?
메타는 3개월 전 Scale AI에 투자했습니다. 목표는 AGI, 즉 인간 수준 또는 그 이상의 任意 작업을 수행할 수 있는 인공 일반 지능을 구축하기 위한 협력을 강화하는 것이었습니다. 오늘날의 AI는 기술 혁명이라면, AGI는 진정한 메가 혁명일 것입니다. 때때로私は이를 “엑소루션”이라고 부르며, 이는 AI가 그늘에서 벗어나서 나타나는 것을 의미합니다.誰ever이 먼저 이를 달성하면 글로벌 전략적 우위를 얻을 것입니다.
AGI에 얼마나 가까이 있는지에 대해서는, 그것을 정의하는 방법에 따라 달라집니다.私はIlya Sutskever의 견해와 일치합니다: AGI는 인간이 수행할 수 있는 任意 지적 작업을 수행할 수 있는 시스템입니다. 단순히 질문에 대답하는 것이 아니라, 추론, 의사 결정, 일반화, 및 여러 영역에서 해석을 포함합니다. 진정한 AGI는 普遍적이며 狭い 작업 경계에 제한되지 않습니다.
현재 모델 중 어느 것도 이러한 수준에 도달하지 못했습니다. 우리는 그 방향으로 이동하고 있지만, 이론적인 의미에서 진정한 AGI는 아직 존재하지 않습니다. 그리고 아마도, 그것이 가장 좋습니다. 우리는 아직 근사 단계에 있으며, 아마도 오랜 시간 동안 그 상태로 남아 있을 것입니다.
AGI의 基礎는 아마도 에이전트 기반 시스템일 것입니다. 이는 반드시 단일 LLM에 의존하지는 않을 것입니다. 왜냐하면, 아무리 영리한 인간도 모든 지식 및 기술의 영역을 마스터할 수 없듯이, 단일 LLM도 AGI 작업의 전체 스펙트럼을 혼자 다룰 수 없습니다. 우리가 필요한 것은 “집단 지능”입니다: 여러 모델 및 구성 요소를 조정할 수 있는 아키텍처입니다.
AGI는 단순히 인간이 설계한 에이전트로 나타나지 않을 것입니다. 그것은 부분적으로 개발되고 AI 자체의 도움으로 진화하는 시스템일 것입니다. 이는 중요합니다. 왜냐하면, 인간에 의해 완전히 설계된 시스템은 내재된 제한을 가질 수 있기 때문입니다. 설계 과정에 AI를 참여시키면 이러한 제한을 극복하고 시스템을 더 적응性 있게 만들 수 있습니다.
AGI는 아마도 특정한 돌파구에서 오지 않을 것입니다. 더 큰 LLM, 더 지능적인 에이전트, 또는 완전히 새로운 아키텍처가 아니라, 세 가지 모두의 종합에서 나타날 것입니다. 아마도, 현재 사용하는 범주를 초월하는 근본적으로 새로운 무언가에서 나타날 것입니다.
“인간의 마지막 시험” 및 기타 AGI 벤치마크
“인간의 마지막 시험”(HLE)은 현재 LLMs, 에이전트, 및 AGI의 contexto에서 논의되는 더 야심적인 벤치마크 중 하나입니다. 본질적으로, 이것은 수학, 물리학, 생물학, 화학, 공학, 컴퓨터 과학, 및 심지어 체스와 같은 광범위한 학문 분야를 포함하는 약 2,500개의 질문으로 구성된 시험입니다. 아이디어는 AI 시스템이 진정한 인간의 이해를 반영하는 수준에서 문제를 해결할 수 있는지 평가하는 것입니다.
현재 언어 모델은 HLE에서 매우 나쁜 성능을 보입니다. 종종 5% 미만의 정확도를 달성합니다. 이는 MMLU 또는 GPQA와 같은 다른 벤치마크와 대조적입니다. 여기서 모델은 훨씬 더 높은 점수를 달성합니다. HLE에서 모델이 어려움을 겪는 것은真正한 일반 지능에서 아직 얼마나 멀리 떨어져 있는지 보여줍니다.
중요한 것은, 알려진 또는 狭い 데이터 세트가 있는 벤치마크에서 높은 성능은 반드시真正한 일반 지능의 존재를 나타내지 않는다는 것입니다. 모델은 “테스트에 훈련”될 수 있으며, 이는 실제 능력보다 더 높은 점수를 나타낼 수 있습니다. 따라서, HLE에서 완벽한 점수를 얻는 것은 AGI에 도달했다는 것을 의미하지 않습니다. 그것은 단순히 특정한 시험을 통과했음을 의미할 뿐입니다.
AGI를 움직이는 것
私は完全に 동의합니다. AGI의 핵심 기둥은 데이터, 컴퓨팅, 및人才입니다. 컴퓨팅 상황은 명확합니다. 주요 플레이어들은 자체 칩을 생산하려고 시도했으며, 이를 위해 수십억을 투자했습니다. 그러나, 회사는 여전히 다른 칩과 다른 플레이어들의 컴퓨팅 파워에 크게 의존합니다. 예를 들어, Nvidia는 필요한 하드웨어를 공급할 뿐만 아니라 생산을 확대하는 중요성을 이해합니다.
더 많은 질문은 데이터와人才에 관한 것입니다. 인터넷은 이미 다 사용되었습니다. 현재 훈련에 사용되지 않은 인간이 생성한 텍스트는 없습니다. 인간이 지금까지 생성한 정보의 총 볼륨은 놀라울 정도로 작습니다. 그것이 왜 회사들이 높은 품질의 인간 데이터를 생성할 수 있는 사람들과 적극적으로 협력하고 있는지입니다.
완전 자동화 또는 인간-루프?
또 다른 점은 수동 데이터 주석의 수요 감소입니다. 몇 년 전, 산업은 전속력으로 확장하고 있었습니다. 수천명의 주석자가 AI 파이프라인의饥渴을 충족시키기 위해 탑재되었습니다. 그러나, 오늘날 많은 이러한 모멘텀은 자동화로 이동했습니다. 모델은 성숙했으며, 이를 둘러싼 툴링도 성숙했습니다.
얼굴 인식의 경우를 생각해 보십시오. 그것은 이미지를 주석하는 볼륨의 주요 동인之一이었습니다. 그러나, 이 카테고리는 대부분 해결되었습니다. YOLO, SAM, 및 Samurai와 같은 모델은 빠르게 루틴 작업을 흡수하고 있으며, 종종驚人的 정확도로 수행합니다. 우리는 또한 우리의 독점 플랫폼 Keylabs에서 많은 ML 지원 도구를 구현했습니다. 이는 실제로 루틴 워크플로우를 절단하는 데 도움이 됩니다.
그러나, 이러한 모델은 모두 일반화에 제한되며, 표준 및 균일한 작업만 자동화에 적합합니다. 복잡하거나 고유한 경우에는 여전히 인간의 주목이 필요합니다.
우리는 이미 옛 패러다임에서 벗어나고 있습니다. 주석자는 단순히 세부 사항에 주의를 기울이는 사람으로, 객체나 감정을 인식할 수 있는 사람입니다. 새로운 현실에서, 전문가들이 필요합니다: 의사들이 의료 이미지를 주석하고, 프로그래머가 코드를 작성하며, 건축가가 청사진을 만들고, 마케터가 고객 인사이트를 제공하며, 군사 전문가가 방어 시나리오를 제공합니다.
우리는 이미 실제 사례를 보이고 있습니다. 예를 들어, 전투 조종사들이 AI를 위한 데이터를 주석하고, 그들의 전문 지식에 대해 1시간에 1,000달러를 받는 경우입니다. 이러한 전문가들은 희귀하며, 그들의 지식은 높은 성능의 AI를 훈련시키는 데 중요합니다.
세계는 변화하고 있습니다: 점점 더 많은 사람들이 인공지능의 운영자 및 “트레이너”가 됩니다. 앞으로, 우리 중 누구든지 AI 앱을 위한 데이터 세트를 확인하도록 요청받을 수 있습니다. 미래에는, 단순히 버튼을 클릭하는 사람이 아니라, 지식이 내일의 지능을 형성하는 전문가로 일할 수 있습니다.
우리는 이미 이러한 새로운 현실에 살고 있습니다. 데이터 라벨링과 AI 훈련의 세계입니다. 이를 인식하고 적응하는 사람들은 중요한 우위를 얻을 것입니다.












