Connect with us

사상 리더

귀사의 AI의 성격은 지능 지수만큼 중요하며, 기업 배포에 성공 또는 실패를 결정짓는다

mm
A woman and a man standing on a high-rise balcony looking at a glowing data visualization that blends sharp blue geometric lines with soft amber waves, symbolizing the balance between AI benchmarks and personality.

대부분의 회사들은 아직도 벤치마크에 근거하여 AI 모델을 선택한다. 실제로, 이러한 시스템이 실제로 작동하는지 여부를 결정하는 것은 드물다.

지금까지, 기업 환경에서 대규모 언어 모델에 대한 대부분의 대화는 벤치마크에 의해 지배되어 왔다. 팀들은 측정 가능한 성능에 끌リ며, 어느 모델이 가장 지능적이고, 코딩에 강하며, 요약에 정확하며, 수리적推論에 뛰어나고 있는지에 관심을 둔다.

그러나 팀들이 실험 단계를 넘어서 실제 배포에 들어가면, 대부분의 최고경영자가 크게 간과하는 다른 중요한 요소들이 빠르게 비즈니스 성공에 중요하다는 것을 증명할 것이다.

AI의 고용 가능성

원시적인 지능과 분석 능력은 분명히 중요하지만, 기업 AI 배포에서 가장 과소평가되는 변수는 성격이다. 성격은 대규모 언어 모델의 contexto에서 일관된 목소리, 톤, 그리고 행동을 의미한다. 이는 AI가 일관적이고 신뢰할 수 있게 만드는 것이다.

AI를 구현할 때, 비즈니스는 인간 직원을 고용할 때와 같은 접근 방식을 취해야 한다. 모델이 작업을 완수하는 능력만이 아니라, 작업에 대한 태도, 의사소통 방식, 그리고 더 큰 워크플로에 대한 적합성을 평가해야 한다.

모델의 일관성을 유지하고, 적절하게 응답하며, 다양한 contexto에서 세부 사항을 처리하는 능력은 비즈니스 결과에 상당한 영향을 미칠 수 있다. 기술적으로 탁월한 AI지만 응답이 느리거나, 톤이 변경되거나, 세부 사항을 처리하지 못하는 경우, 비즈니스는 사용자에게 불편을 겪게 하고, 참여도를 낮추며, 궁극적으로 AI와 비즈니스의 성공을 낮출 수 있다.

이는 고객 지원, 정치적 아웃리치, 또는 내부 커뮤니케이션과 같은 산업에서 특히 중요하다. 응답 사이의 тон이나 문구의 미묘한 변화는 혼란을 일으키고, 신뢰를 약화시키고, 전체 참여도를 낮출 수 있다. 인간과 마찬가지로, 모든 범주에서 경쟁을 압도하는 단일 모델은 없다. 일부 모델은 코딩이나 수학과 같은 분석 작업에 더 적합한 반면, 다른 모델은 대화형 글쓰기와 회의 요약에 더 잘 수행된다.

그러나 이러한 특성이 固定되지 않기 때문에, 이러한 시스템을 구축하는 팀들에게 이는 도전이 된다.

이동하는 목표

AI 랜드스케이프는 대부분의 조직이 따라가기 어려울 정도로 빠르게 발전하고 있다. 새로운 버전이 빈번하게 출시되고, 성능 특성은 업데이트마다 변경될 수 있다. Google의 Gemini 모델 시리즈는 최근의 예이다.

Gemini 2.0 Pro는 2025년 2월에 출시되어 즉시 개발자와 기업을 위한 플래그십 모델로 거론되었다. 이는 코딩과 복잡한 프롬프트에 대한 세계적인 사용을 위한 것이었다.

그것은당시 Google가 제공한 가장 큰 컨텍스트 창을 가지고 있었으며, 이는 200만 토큰으로, 방대한 양의 정보를 한 번에 분석하고 이해하는 능력을 가지며,同時적으로 Google Search와 같은 도구를 사용하거나 코드를 작성할 수 있었다.

대량의 데이터를 빠르고 정확하게 처리해야 하는 시스템을 구축하는 팀들에게 이는 명백한 선택이었다. 그러나 몇 주 내에, Google는 Gemini 2.5 Pro를 출시하여 즉시 리더보드를 차지하고 코딩, 수학, 과학에서 이전 모델을 능가했다.

오버나이트, 시장에서 가장 좋은 옵션이었던 모델은 출시 후 2개월도 되지 않아 이미 뒤쳐지기 시작했다. 그러나 초기 채택자는 즉시 변경이 단순히 증분적이나 분석적인 것이 아니라, Gemini의 전체 성격이 밤새 변경되었다는 것을 알아차렸다. 여러 개발자들은 AI가 업데이트 후 “로보토마이즈”된 것처럼 행동한다고 말했다.

그들은 AI가 실제로 “더욱愚笨해”지는 것처럼 보인다고 불평했다. 이는 일관된 출력을 생산하지 못하고, 이전에 문제가 없던 프롬프트와 작업을 처리하는 데 일관성이 없으며, 유연하게 느껴졌던 작업이僵硬해지는 것을 의미했다.

이것이 公司의 AI 배포 전략이 근본적으로 변하는 시작이다.

벤치마크를 넘어서

紙上으로 Gemini 2.5 Pro는 능력과 안전성에서 크게 개선된 모델로 보였다.

그러나 실제로, 이러한 변경은 모델이 얼마나 신뢰할 수 있는지, 어떻게 행동하고, 프롬프트에 응답하며, 궁극적으로 비즈니스 결과에 영향을 미치는지 완전히 변경했다. 이러한 시스템을 구축하기 위해 많은 시간과 돈을 투자한 팀들은 모델의 새로운 능력이 기존 파이프라인과 일치하지 않는다면 다시 시작해야 했다.

작은 행동의 변화도 일관성과 예측 가능성을 기반으로 구축된 시스템을 혼란에 빠지게 할 수 있다. 이는 비즈니스에 실제적인 운영 위험을 초래한다. 왜냐하면 모델의 업데이트는 의존하는 시스템에 즉시 불안정을 가져올 수 있기 때문이다.

이를 극복하기 위해, 많은 전향적인 회사들은 이미 다중 모델 전략을 구현하기 시작했다. 여기서 다른 작업을 각 작업에 가장 적합한 모델로 라우팅하는 대신, 하나의 모델에 모든 것을 의존하지 않는다.

이 접근 방식은 각 작업에 맞게 성능을 개선하는 것뿐만 아니라, AI 구현과 관련된 위험을 줄여준다. 왜냐하면 하나의 모델이 업데이트 후恶化하더라도, 전체 시스템이 함께 붕괴되지 않기 때문이다. 대체 모델이 준비되어 있기 때문이다.

간단히 말해, AI의 성격과 신뢰성은 실제 작업 환경에서 다양한 작업을 완수하는 데 있어 원시적인 지능만큼 중요하다. 이러한 사고의 변화는 비즈니스들이 단순히 “더욱 inteligent한 도구”를 구매하는 것이 아니라, 전체 디지털 인프라 시스템을 구축하고 관리하는 것에 대한 근본적인 변화를 대표한다.

회사들이 오늘날의 비즈니스 환경에서 не仅 생존할 뿐만 아니라 번창하기 위해서는, 작업에 따라 다른 모델을 교체할 수 있는 파이프라인을 구축하고, 업데이트가 성능과 상호작용의 품질에 미치는 영향을 끊임없이 모니터링해야 한다.

궁극적으로, 모델 자체는 따라가기 어려울 정도의 속도로 계속 발전할 것이다. 그러나 변화에 대비하고, 중복성을 구축하며, AI를 도구와 팀원으로 다루는 비즈니스가 이러한 빠른 변화를 경쟁력으로 바꾸는 것이 될 것이다.

앤드류 미시(Andrew Missey)는 Convos의 공동 설립자로,以前 PubSent라고 불리었던 양방향 AI를 활용한 텍스트 플랫폼으로 정치 전략가, 캠페인, 비영리 단체, 옹호 단체들이 국가적 규모에서 개인화된 사실 기반의 유권자 대화를 제공하는 곳에서 제품과 엔지니어링을 이끌고 있습니다. Convos 이전에는 앤드류는 스타벅스, 크럼블, 모드 피자와 같은 국가적 음식 및 소매 브랜드를 서비스하는 시애틀 기반의 벤처 지원 AI 스타트업을 포함한 여러 회사에서 소프트웨어 엔지니어로 일했습니다. 또한, 앤드류는 자바스크립트, 파이썬, 타입스크립트에 능숙합니다.