사상가

생성 AI에서 LLM 에이전트의 디코딩 기회와 과제

게재

8 개월 전

2023 년 9 월 7 일

우리는 프롬프트에서 검색 증강 생성(RAG), 에이전트에 이르기까지 대규모 언어 모델(LLM)을 기반으로 하는 생성적 AI 애플리케이션의 발전을 보고 있습니다. 에이전트는 업계 및 연구계에서 주로 이 기술이 엔터프라이즈 애플리케이션을 변화시키고 우수한 고객 경험을 제공하는 데 제공하는 힘에 대해 많이 논의되고 있습니다. 일반 인공 지능(AGI)을 향한 첫 번째 단계를 가능하게 하는 에이전트를 구축하는 데에는 공통 패턴이 있습니다.

내 이전에는 기사, 우리는 LLM 기반 애플리케이션을 구축하기 위한 패턴 지능의 사다리를 보았습니다. 문제 도메인을 캡처하고 LLM 내부 메모리를 사용하여 출력을 생성하는 프롬프트로 시작합니다. RAG를 사용하면 벡터 데이터베이스에서 검색된 외부 지식으로 프롬프트를 강화하여 출력을 제어할 수 있습니다. 다음으로 LLM 호출을 연결하여 복잡한 애플리케이션을 실현하는 워크플로를 구축할 수 있습니다. 에이전트는 LLM 체인이 어떻게 형성되는지 자동으로 결정하여 이를 한 단계 더 발전시킵니다. 자세히 살펴보겠습니다.

상담원 – 내부적으로

에이전트의 주요 패턴은 LLM의 언어 이해력을 사용하여 주어진 문제를 해결하는 방법에 대한 계획을 세우는 것입니다. LLM은 문제를 이해하고 문제 해결을 위한 일련의 단계를 제공합니다. 그러나 여기서 끝나지 않습니다. 상담원은 문제 해결에 대한 권장 사항을 제공한 다음 권장 단계를 수행하도록 지휘봉을 전달하는 순수한 지원 시스템이 아닙니다. 상담원은 작업을 진행하고 수행할 수 있는 도구를 사용할 수 있습니다. 무섭죠!?

상담원에게 다음과 같은 기본적인 질문을 하면:

휴먼: 전화를 발명한 사람은 어느 회사를 시작했나요?

다음은 상담원이 취할 수 있는 사고 단계의 샘플입니다.

상담원(생각 중):

생각: 전화기를 발명한 사람을 찾아야 해요.
동작: [전화의 발명가]를 검색하세요
관찰: 알렉산더 그레이엄 벨
생각: Alexander Graham Bell이 설립한 회사를 검색해야 합니다.
동작: 검색 [알렉산더 그레이엄 벨이 설립한 회사]
관찰: 알렉산더 그레이엄 벨(Alexander Graham Bell)은 1885년 미국 전화 전신 회사(AT&T)를 공동 창립했습니다.
생각: 나는 답을 찾았습니다. 내가 돌아갑니다.

상담원(응답): 알렉산더 그레이엄 벨(Alexander Graham Bell)은 1885년 AT&T를 공동 창립했습니다.

에이전트가 특정 작업을 수행하여 해결할 수 있는 하위 문제로 문제를 분류하는 체계적인 방법을 따르는 것을 볼 수 있습니다. 여기에 있는 작업은 LLM에서 권장하며 이러한 작업을 구현하기 위해 이를 특정 도구에 매핑할 수 있습니다. LLM이 검색을 작업으로 제공했음을 인식하면 LLM에서 제공한 매개변수를 사용하여 이 도구를 호출하도록 에이전트에 대한 검색 도구를 활성화할 수 있습니다. 여기서 검색은 인터넷에서 이루어지지만 벡터 데이터베이스와 같은 내부 지식 기반을 검색하도록 리디렉션될 수도 있습니다. 이제 시스템은 자급자족할 수 있게 되었으며 일련의 단계에 따라 복잡한 문제를 해결하는 방법을 알아낼 수 있습니다. 다음과 같은 프레임워크 랭체인 LLaMAIndex는 이러한 에이전트를 구축하고 도구 및 API에 연결하는 쉬운 방법을 제공합니다. Amazon은 최근 에이전트 설계를 위한 시각적 인터페이스를 제공하는 Bedrock Agents 프레임워크를 출시했습니다.

내부적으로 상담원은 LLM에 프롬프트를 보내 작업 계획을 생성하는 특별한 스타일을 따릅니다. 위의 Thought-Action-Observation 패턴은 ReAct(Reasoning and Acting)라는 에이전트 유형에서 널리 사용됩니다. 다른 유형의 에이전트에는 주로 프롬프트 스타일이 다른 MRKL과 계획 및 실행이 있습니다.

보다 복잡한 에이전트의 경우 소스 시스템을 변경하는 도구에 작업이 연결될 수 있습니다. 예를 들어 휴가 잔액을 확인하고 직원의 ERP 시스템에서 휴가를 신청하는 도구에 에이전트를 연결할 수 있습니다. 이제 우리는 사용자와 상호 작용하고 채팅 명령을 통해 시스템에서 휴가를 신청할 수 있는 멋진 챗봇을 구축할 수 있습니다. 복잡한 휴가 신청 화면은 이제 그만, 간편한 통합 채팅 인터페이스로 만나보세요. 재미있을 것 같은데요!?

책임 있는 AI에 대한 주의 사항 및 필요성

이제 사전 승인된 API를 사용하여 주식 거래에 대한 트랜잭션을 호출하는 도구가 있다면 어떨까요? 에이전트가 도구를 사용하여 주식 변동을 연구하고 주식 구매 및 판매에 대한 결정을 내리는 애플리케이션을 구축합니다. 만약 대리인이 환각에 빠져 잘못된 결정을 했기 때문에 잘못된 주식을 팔았다면 어떻게 될까요? LLM은 거대한 모델이기 때문에 그들이 어떤 결정을 내리는 이유를 정확히 찾아내기 어렵기 때문에 적절한 가드레일이 없으면 환각이 흔합니다.

요원은 모두 매력적이지만 그들이 얼마나 위험할 수 있는지 짐작했을 것입니다. 환각을 느끼고 잘못된 행동을 취하면 막대한 금전적 손실이 발생하거나 엔터프라이즈 시스템에 중대한 문제가 발생할 수 있습니다. 따라서 책임 있는 AI는 LLM 기반 애플리케이션 시대에 가장 중요해지고 있습니다. 재현성, 투명성 및 책임에 관한 Responsible AI의 원칙은 에이전트가 내리는 결정에 가드레일을 설정하고 인간 참여가 필요한 조치를 결정하기 위한 위험 분석을 제안합니다. 더욱 복잡한 에이전트가 설계됨에 따라 그들이 무엇을 하고 있는지 확인하기 위해 더 많은 조사, 투명성 및 책임이 필요합니다.

닫는 생각

행동을 통해 논리적 단계의 경로를 생성하는 에이전트의 능력은 에이전트를 인간의 추론에 매우 가깝게 만듭니다. 더 강력한 도구로 권한을 부여하면 초능력을 얻을 수 있습니다. ReAct와 같은 패턴은 인간이 문제를 해결하는 방법을 모방하려고 시도하며 특정 컨텍스트 및 영역(은행, 보험, 의료, 산업 등)과 관련된 더 나은 에이전트 패턴을 볼 수 있습니다. 미래는 여기에 있으며 에이전트 기반의 기술은 우리가 사용할 준비가 되어 있습니다. 동시에 우리는 스카이넷을 구축하지 않도록 책임 있는 AI 가드레일에 세심한 주의를 기울여야 합니다!

다음 위로

교실 혁명: AI 강화 학습의 새로운 시대

놓치지 마세요.

AI 골드러시 탐색: 엔터프라이즈 벤처의 기술 부채에 숨겨진 비용 공개

다타라지 라오

Dattaraj Rao, 수석 데이터 과학자 영구 시스템, "Keras to Kubernetes: The Journey of a Machine Learning Model to Production"이라는 책의 저자입니다. Persistent Systems에서 Dattaraj는 컴퓨터 비전, 자연어 이해, 확률적 프로그래밍, 강화 학습, Explainable AI 등의 최신 알고리즘을 탐색하고 의료, 은행 및 산업 영역에서의 적용 가능성을 입증하는 AI 연구실을 이끌고 있습니다. Dattaraj는 기계 학습 및 컴퓨터 비전 분야에서 11개의 특허를 보유하고 있습니다.

Unite.AI

생성 AI에서 LLM 에이전트의 디코딩 기회와 과제

사상가