์ธ๊ณต์ง๋ฅ
๋ค์ค ์์ด์ ํธ ์ญ์ค: ๋ ๋ง์ ์์ด์ ํธ๊ฐ ๋ ๋์ ๊ฒฐ๊ณผ๋ฅผ ์ด๋ํ๋ ์ด์

지난 2년 동안 다중 에이전트 시스템은 인공 지능의 자연스러운 다음 단계로 여겨져 왔다. 하나의 큰 언어 모델이 추론, 계획, 및 행동할 수 있다면, 여러 개의 에이전트가 함께 일하면 더 나은 결과를 얻을 수 있을 것이다. 이러한 믿음은 코딩, 연구, 금융, 및 워크플로 자동화에 대한 에이전트 팀의 부상을 주도했다. 그러나 新的 연구는 역설적인 결과를 보여준다. 에이전트를 시스템에 추가하는 것이 항상 더好的 성능을 의미하지 않는다는 것이다. 오히려, 시스템이 더 느려지고, 더 비싸고, 더 부정확해진다. 이러한 현상, 즉 다중 에이전트 역설, 더 많은 에이전트가 항상 더好的 지능을 의미하지 않는다는 것을 보여준다. 대신, 더 많은 에이전트가 새로운 실패 모드를 도입한다.
다중 에이전트 시스템이 इतन 인기 있는 이유
다중 에이전트 시스템의 개념은 인간이 팀으로 일하는 방식에서 영감을 얻었다. 복잡한 문제에 직면하여, 작업을 부분으로 나누고, 전문가가 개별 작업을 처리하며, 그 결과를 결합한다. 초기 실험은 이러한 접근 방식을 지지한다. 정적 작업인 수학 문제나 코드 생성과 같은 경우, 토론이나 투표를 통해 여러 에이전트가 단일 모델보다 더好的 성능을 발휘한다.
그러나 이러한 초기 성공은 실제 배포 조건을 반영하지 않는 작업에서 나왔다. 그들은 일반적으로 짧은 추론 체인, 외부 시스템과의 제한된 상호 작용, 및 정적인 환경을 포함한다. 그러나 에이전트가 연속적인 상호 작용, 적응, 및 장기 계획을 요구하는 환경에서 작동할 때, 상황은 극적으로 변경된다. 또한, 도구가 발전함에 따라 에이전트는 웹을 탐색하고, API를 호출하고, 코드를 작성하고, 실행하고, 계획을 시간이 지남에 따라 업데이트할 수 있다. 이것은 시스템에 더 많은 에이전트를 추가하는 것을 더 유혹한다.
에이전트 작업은 정적 작업과 다르다
에이전트 작업이 정적 추론 작업과 근본적으로 다르다는 것을 인식하는 것이 중요하다. 정적 작업은 단일 패스에서 해결할 수 있다. 모델은 문제를 제시받고, 답을 생성하고, 중지한다. 이러한 환경에서 여러 에이전트는 앙상블처럼 작동하며, 단순한 전략인 다수결 투표가 종종 더好的 결과를 생성한다.
에이전트 시스템은 매우 다른 환경에서 작동한다. 그들은 환경과 반복적인 상호 작용을 필요로하며, 에이전트는 탐색하고, 결과를 관찰하고, 계획을 업데이트하고, 다시 행동해야 한다. 예를 들어, 웹 탐색, 금융 분석, 소프트웨어 디버깅, 및 시뮬레이션 세계에서 전략적 계획이 포함된다. 이러한 작업에서 각 단계는 이전 단계에 의존하며, 이 과정은 본질적으로 순차적이며 초기 오류에 매우 민감하다.
이러한 환경에서 여러 에이전트의 오류는 앙상블에서처럼 상쇄되지 않는다. 대신, 그들은 축적된다. 초기에 발생한 단일 잘못된 가정은 모든 것을 파괴할 수 있으며, 여러 에이전트가涉及된 경우, 이러한 오류는 시스템 전체에 빠르게 распростран될 수 있다.
조정에는 비용이 있다
모든 다중 에이전트 시스템은 조정 비용을 지불한다. 에이전트는 그들의 발견을 공유하고, 목표를 일치시키고, 부분 결과를 통합해야 한다. 이 과정은 결코 비용이 없다. 토큰, 시간, 및 인지 대역폭을 소비하며, 에이전트의 수가 증가함에 따라 병목 현상이 될 수 있다.
고정된 계산 예산에서, 이 조정 비용은 특히 중요하다. 네 개의 에이전트가 단일 에이전트와 동일한 총 예산을 공유한다면, 각 에이전트는 더 깊은 추론에 대한 용량이 줄어든다. 시스템은 또한 복잡한 생각을 요약하여 통신할 수 있으며, 이 과정에서 중요한 세부 사항을 잃을 수 있으며, 시스템의 전체 성능을 약화시킬 수 있다.
이것은 트레이드 오프를 만든다. 단일 에이전트 시스템은 모든 추론을 하나의 장소에 유지한다. 그것은 작업 내내 일관된 내부 상태를 유지한다. 다중 에이전트 시스템은 다양한 관점을 제공하지만, 문맥을 단편화하는 비용으로 한다. 작업이 더 순차적이고 상태 의존적인 경우, 단편화는 치명적인 취약점이 되며, 종종 여러 에이전트의 이점을 초과한다.
더 많은 에이전트가 성능을 악화시키는 경우
최근의 제어 연구는 순차적 계획 작업에서 다중 에이전트 시스템이 종종 단일 에이전트 기반 시스템보다 성능이 낮다는 것을 보여준다. 각 동작이 상태를 변경하고 미래의 선택을 影響하는 환경에서, 에이전트 간의 조정은 추론을 중단하고, 진행을 늦추고, 오류를 축적하는リス크를 증가시킨다. 이러한 경우, 에이전트는 통신 없이 병렬로 작동하며, 그 결과는 오류가 누적되며, 수정되지 않는다.
중앙 조정을 가진 시스템조차도 실패에 면역이 아니다. 중앙 조정기는 오류를 포함할 수 있지만, 또한 지연과 병목 현상을 도입한다. 중앙 조정기는 확장된 추론을 요약하여 결정에 영향을 미칠 수 있으며, 이러한 결정은 단일 에이전트의 집중된 추론 루프에서 나온 결정보다 더 나쁠 수 있다. 이것이 다중 에이전트 역설의 핵심이다. 협력은 단일 에이전트 시스템에서 존재하지 않는 새로운 실패 모드를 도입한다.
일부 작업은 여전히 여러 에이전트에서 이점을 얻을 수 있다
역설은 다중 에이전트 시스템이 무용하다는 것을 의미하지 않는다. 다중 에이전트 시스템은 작업을 명확하게 독립적인 하위 작업으로 나눌 수 있을 때 가장 효과적이다. 예를 들어, 금융 분석은 이러한 작업 중 하나이다. 이 작업에서, 하나의 에이전트는 수익 추세를 분석하고, 다른 에이전트는 비용을 조사하며, 세 번째 에이전트는 경쟁사를 비교할 수 있다. 이러한 하위 작업은 대부분 독립적이며, 그 결과를 조율 없이 결합할 수 있다. 이러한 경우, 중앙 조정은 더好的 결과를 제공한다. 동적 웹 브라우징도 여러 에이전트가 독립적으로 작동할 수 있는 경우이다. 정보 경로를同时적으로 탐색하는 작업에서, 병렬 탐색은 도움이 될 수 있다.
중요한 결론은 다중 에이전트 시스템이 작업을 독립적인 조각으로 나눌 수 있을 때 가장 효과적이라는 것이다. 이러한 작업은 협력을 필요로 하지 않는다. 그러나 단계별 추론이나 상태의 변경을 주의 깊게 추적하는 작업은 일반적으로 단일 에이전트가 더好的 성능을 발휘한다.
능력 상한 효과
또한 중요한 발견은 더 강력한 기본 모델이 조정을 필요로 하는 것을 줄인다는 것이다. 단일 에이전트가 더 강력해질수록, 추가 에이전트의 잠재적인 이점이 줄어든다. 특정 성능 수준을 넘어서면, 에이전트를 추가하는 것은 감소하는 반환 또는 thậm chí 더 나쁨의 결과를 초래한다.
이것은 조정 비용이 거의 동일하게 유지되는 반면, 이점이 감소한다는 것을 의미한다. 단일 에이전트가 이미 작업의 대부분을 처리할 수 있다면, 추가 에이전트는 가치 대신 노イズ를 추가하는 경향이 있다. 실제로, 이것은 다중 에이전트 시스템이 약한 모델에 더 유용하고, 최전선 모델에는 덜 효과적이라는 것을 의미한다.
이것은 모델 지능이 자연스럽게 더 많은 에이전트와 함께 확장한다는 가정에 도전한다. 많은 경우에, 핵심 모델을 개선하는 것이 추가 에이전트를 둘러싸는 것보다 더好的 결과를 제공한다.
오류 증폭은 숨겨진 위험이다
최근 연구에서 가장 중요한 통찰 중 하나는 다중 에이전트 시스템에서 오류가 어떻게 증폭될 수 있는지이다. 다단계 작업에서, 초기 단일 오류는 전체 과정에 걸쳐 전파될 수 있다. 여러 에이전트가 공유된 가정에 의존할 때, 이러한 오류는 더 빠르게 퍼지고, 더難하게 제어된다.
독립적인 에이전트는 특히 이러한 문제에 취약하다. 내장된 검증 없이, 잘못된 결론이 반복적으로 나타날 수 있으며, 서로를 강화하며, 잘못된 자신감을 생성한다. 중앙 조정 시스템은 검증 단계를 추가하여 이 위험을 줄일 수 있지만, 완전히 제거할 수는 없다.
단일 에이전트는 종종 내장된 이점을 가지고 있다. 모든 추론이 단일 컨텍스트 내에서 발생하기 때문에, 모순은 더 쉽게 발견되고 수정될 수 있다. 이것은 다중 에이전트 시스템을 평가할 때 종종 간과되는 미묘한 능력이다.
결론
다중 에이전트 역설의 핵심 교훈은 협력을 피하는 것이 아니라, 더 선택적으로 하는 것이다. 질문은 에이전트의 수를 얼마나 사용할 것인가가 아니라, 작업에 대한 조정이 정당화되는지 여부이다.
강한 순차적 의존성을 가진 작업은 일반적으로 단일 에이전트를 선호한다. 반면, 병렬 구조를 가진 작업은 작은, 잘 조정된 팀에서 이점을 얻을 수 있다. 도구를 많이 사용하는 작업은 조정이 자원을 소비한다는 것을 고려하여 주의 깊게 계획해야 한다. 가장 중요한 것은 에이전트 아키텍처의 선택이 직관에 의해_guided되지 않고, 작업 속성에 의해_guided되어야 한다. 분해 가능성, 오류 허용, 및 상호 작용의 깊이가 팀 크기보다 더 중요하다.
elf가 사용할 수 있는 자원은 행동에 사용될 수 있다. 가장 중요한 것은 에이전트 아키텍처의 선택이 측정 가능한 작업 속성에 의해_guided되어야 한다는 것이다. 분해 가능성, 오류 허용, 및 상호 작용의 깊이가 팀 크기보다 더 중요하다.












