사상 리더

기업 AI가 배포 후 깨지는 이유 – 그리고 무엇을 해야 하는가

Published May 13, 2026

Zuzana Drotárová, Head of Regional Competency, Avenga

경고: 문제는 모델이 아니다

2023년, 뉴욕시는 기업들이 복잡한 규정을 쉽게 이해할 수 있도록 MyCity 채팅봇을 출시했다. 아이디어는 간단했다: 법적 정보를 더 쉽게 접근할 수 있도록 하자.

실제로는 시스템이 정확하지 않은 답변을 생성했으며, 법적 조언이 아닌 법적 오해를 불러일으켰다. 팁 규칙, 주택 차별, 지불 법규 등에서 그러했다.

후속 감사에서 71.4%의 사용자 피드백이 부정적인 것으로 나타났다. 기본적인 문제를 해결하지 못하고, 시스템은 “베타” 버전으로 2년 이상 유지되었으며, 결국 폐쇄되었다.

실패의 원인은 기술적인 문제가 아니었다. 시스템은 생산에서 깨졌는데, 그 이유는 정확성을 보장할 수 있는 메커니즘이 없었기 때문이다. 또한 책임이 명확하지 않았고, 문제가 발생했을 때 개입할 수 있는 방법이 없었다.

이것이 현재 기업 AI의 패턴이다: 기술은 작동하지만, 조직은 신뢰할 수 있는 방식으로 작동시키지 못한다.

파일럿에서 생산까지: 모든 것이 무너지는 곳

파일럿을 구축하는 것은 khá 간단하다 – 사용 사례를 선택하고, 모델을 선택하고, 데이터를 준비하고, 후원자를 찾는다. 하지만 생산에서 시스템을 실행하는 것은 완전히 다른 리그이다.

간격은 2012년 펠릭스 바움가르트너가 점프한 것과 같은 차이이다. 기본 물리는 같지만, 조건은 완전히 다르며, 실패의 결과는 매우 다르다.

생산에서 AI는 실제 의사 결정 흐름에 참여하며, 고객과 상호 작용하며, 법적 및 운영상의 결과를 생성한다. 그것이 거기서 갭이 나타나는 곳이다 – 모델이 아니라, 그것이 어떻게 관리되는지에 있다.

유럽은 다른 지역보다 더 일찍 이를 명확히 한다. EU AI법, GDPR, NIS2와 같은 규정은 채택을 늦추지 않는다. 그러나 조직이 실제 제약 하에서 AI 시스템을 운영할 수 있는지 여부를暴露한다.

2025년에 이미 55%의 대규모 EU 기업이 AI를 사용하고 있었다. 채택은 이미 대규모로 진행되고 있다. 그러나 문제는 배포 후에 발생한다.

그때, 기본적인 운영 질문이浮上한다. 그러나 종종,誰도 그것에 대한 답을 할 수 없다: AI 출력과 자율적인 결정에 책임이 누구인지? 시스템이 예상치 못한 방식으로 작동할 때 어떻게 되는지? 그리고誰가 그것을_media 전에 잡을 수 있는지?

책임은 기술이 아니라 회사에 있다. 에어 캐나다의 채팅봇이 고객에게 부정확한 정보를 제공했다. 고객은 그것을 믿었고, 이후 환불을 거부당했다. 재판소는 항공사가 책임이 있다고 판결했다 – 채팅봇은 별개의實體가 아니었다.

同じ 문제, 다른 角度: 맥도날드의 McHire 시스템이 거의 64,000명의 지원자로부터 민감한 데이터를 노출했다. 원인은 복잡한 공격이 아니었다 – 관리자 로그인에 “admin”과 “123456”을 사용했다. 시스템은 발전된 것으로 보였지만, 실패는 기본적인 것이었다.

시스템에 거버넌스를 부착하는 것은 이미 늦었다. 시스템을 배포하는 것은 기술적인 결정이다. 그러나 신뢰할 수 있는 방식으로 작동시키는 것은 조직적인 결정이다. 그리고 그것이 대부분의 회사에서 간과하는 부분이다.

誰が 실제로 AI 위험을 소유하는가? 누구도 없다.

이것이 핵심 문제이며, 또한 가장少하게 논의되는 문제이다. IT는 인프라를 관리한다. 법률은 규정을 다룬다. 비즈니스 팀은 사용 사례를 推進한다. 그러나誰도 종단간 AI 위험을 소유하지 않는다.

그것은 두 가지 즉각적인 문제를 생성한다. “가동” 결정이 느려진다 -誰도 책임을 지고 싶어하지 않기 때문이다. 그리고 “중지” 결정도 느려진다 -誰도 그것을 할 수 있는지 모르는 때문이다.

데이터는 그것을 반영한다. 10% 미만의 AI 사용 사례가 파일럿에서 생산까지 도달한다. 대부분의 조직은 측정 가능한 비즈니스 영향을 생성하는 데 어려움을 겪고 있다.同時에, 많은 조직이 이미 AI를 배포하고 있지만, 거버넌스 성숙도 조사에 따르면, hanya 7%의 조직이 잘 구조화된 거버넌스를 가지고 있었다.

왜 이것이 그렇게 일관되게 발생하는가? 대부분의 프레임워크와 기업 정책이 무엇이 발생해야 하는지 정의하지만,誰가 책임이 있는지 정의하지 않기 때문이다. 시스템이 오류를 발생시키기 시작했을 때,誰가 행동할 수 있는지,誰가 결정할 수 있는지에 대한 질문은 이론적인 것이 아니다.

それは規模で 더 나쁘게 된다. 한 시스템은 비공식적으로 관리할 수 있다. 그러나 30개의 시스템이 있을 때, 책임은 팀에 걸쳐 분산되고, 누구도 전체 그림을 가지고 있지 않다.

코먼웰스 뱅크 오브 오스트레일리아는 명확한 예이다. 은행은 45명의 고객 서비스 직원을 AI 음성 봇으로 대체했다. 그러나 수요는 감소하지 않았고, 관리자가 오버플로를 처리하기 위해 개입해야 했다. 은행은 모든 45명의 직원을 다시 고용해야 했다. 그리고誰도 자동화가 작업량을 줄였다는 것을 증명할 수 없었다.

誰도 가정을 검증하지 않았다. 그리고誰도 그 가정이 실패했을 때 결과를 소유하지 않았다. 그것이 실제로 책임이 없는 공백이다.

규칙이 충분하지 않다. 메커니즘이 필요하다

대부분의 조직은 정책이 없다. 그러나 작동하는 시스템이 없다.

정책은 무엇이 발생해야 하는지 정의한다. 메커니즘은 실제로 무엇이 발생하는지 결정한다 – 모델이 오류를 발생시키거나, 벤더가 백그라운드에서 무언가를 변경하거나, 시스템이 예상치 못한 방식으로 작동할 때.

그 차이는 생산에서 보인다 – 실제 조건에서 결정이 내려져야 할 때.

이러한 실패는 일관된 역학을 따른다. 각 경우에 동일한 운영 갭이 나타난다 – 다만 다른 형태로.

소유권이 먼저다

모든 배포된 AI 시스템에는 명확한 책임이 있는 소유자가 필요하다 – 한 사람, 팀이나 부서가 아니다. 승인, 일시 중지, 종료할 수 있는 권한을 가진 사람.

그렇지 않으면, 빠른 배포나 안전한 개입이 불가능하다. 코먼웰스 뱅크의 예와 같이, 명확한 소유권의 부재는 직접적으로 운영 실패로 이어진다.

데이터와 법적 명확성이 종종 부족하다

많은 시스템이 문서화된 데이터 흐름, 검증된 법적 근거, 또는 생산에서 시스템에 적용되는 의무에 대한 명확성 없이 가동된다.

이탈리아 규제기관의 DeepSeek에 대한 조치는 이를 명확히 보여준다. 문제는 모델 품질이 아니었다 – 개인 데이터가 어떻게 처리되는지 설명할 수 없었다는 것이었다. 결과는 유럽 사용자를 위한 서비스 중단이었다.

테스트는 실제 사용을 반영하지 않는다

시스템은 잘 작동하는 시나리오에서 평가되지만, 실패가 가장 중요한 경우에는 평가되지 않는다.

MyCity 채팅봇은 명확한 예이다. 기본적인 에지 케이스 – 노동법, 주택 차별, 지불 규칙 등 – 는 배포 전에 捕获되지 않았다. 실제 사용자에게 노출되자마자, 그 실패는 즉시 공개되었다.

테스트는 성능에 대한 것이 아니다 – 시스템이 실패할 수 있는 곳을 사용자, 규제기관, 또는 언론보다 먼저 식별하는 것이다.

개입은 불분명하거나 너무 느리다

문제가 보이더라도, 시스템을 일시 중지하거나 종료할 수 있는 명확한 트리거나 권한이 없다.

Zillow Offers는 이를 대규모로 보여준다. 시스템은 알고리즘을 사용하여 주택을 가격하고 구입했다. 그러나 2021년 시장의 냉각으로, 시스템은 여전히 고가로 주택을 구입했다. 문제를 감지할 수 있는 메커니즘이 없었고, 시스템을 중지할 수 있는 명확한 결정 지점이 없었다. 결과는 8.8억 달러 이상의 손실과 전체 부서의 폐쇄였다.

모니터링은 소유권이 아니다

모니터링은 종종 대시보드로 축소된다. 그러나 그것이 실패를 방지하는 것이 아니다.

정의된 책임이 중요하다 – 신호를 추적하는 사람, 무엇이 에스컬레이션을 트리거하는지,誰가 행동할 것으로 기대되는지.

Deloitte Australia의 경우는 무엇이 발생하는지 보여준다. 정부 보고서에는 잘못된 인용과 법적 참조가 포함되어 있었다.誰도 출력을 배달하기 전에 검증할 책임이 없었다. 결과는 부분 환불과 평판 손상이었다.

에이전틱 AI: 무엇이 더 어려워질 것인가

제너레이티브 AI는 출력을 생성한다. 에이전틱 AI는 행동한다. 그것은 위험을 완전히 바꾼다.

한 번의 응답을 평가하는 것이 아니라, 한 명령이 여러 시스템에 걸친 결정의 연쇄를 트리거할 수 있다 – API 호출, 데이터 액세스, 트랜잭션, 업데이트 등 – 종종 각 단계에서 인간의 개입 없이.

문제가 발생하면, 문제는 정확성이 아니다. 추적 가능성이다. 어느 단계에서 문제가 발생했는지, 어떤 데이터가 사용되었는지,誰가 행동을 승인했는지. 많은 경우에, 이러한 질문은事後에 대답하기 어렵다.

기존의 갭이 치명적이 된다. 불분명한 소유권, 약한 모니터링, 개입의 부재는 지속되지 않는다 – 그것은 합성된다. 잘못된 답변은 수정될 수 있다. 잘못된 행동은誰도 알지 못하는 사이에 결과를 생성할 수 있다.

초기 신호는 이미 이러한 방향으로 지적한다. Gartner는 2027년까지 에이전틱 AI 프로젝트의 40% 이상이 취소될 것이라고 예측한다 – 모델의 한계로 인해 아니다. 조직이 비용, 위험, 결과를 제어하는 데 어려움을 겪기 때문이다. 그것은 배포 후에 보이는 제너레이티브 AI와 같은 패턴이다. 단, 더 높은 ставكة로.

규제기관은 이미 단순한 원칙으로 대응하고 있다: 자동화는 책임을 제거하지 않는다. 조직으로서는 명확한 의미가 있다: 오늘날 소유권과 제어가 불분명하다면, 에이전틱 시스템으로의 확장을 통해 문제가 해결되지 않을 것이다. 그것은 증폭될 것이다.

운영하거나 잃어라

AI는 더 이상 제약이 아니다. 모델은 널리 उपलब하며, 능력은 뛰어나고, 점점 더 공통화되고 있다. 실제 차별점은 조직이 AI를 구축할 수 있는지 여부가 아니다 – 그것은 조직이 신뢰할 수 있는 방식으로 작동시킬 수 있는지 여부이다.

그것이 대부분의 실패가 발생하는 곳이다 – 시스템을 구축하는 것이 아니라, 시스템을 운영하는 곳이다. 성공하는 조직은 가장 발전된 모델을 가진 것이 아니다. 가장 명확한 운영 구조를 가진 것이다.

이것을 직접 테스트할 수 있다. 가장 중요한 AI 시스템을 가져와서 세 가지 질문에 답해보라:

誰가 그것을 종료할 수 있는가?
그것이 실패할 때 어떻게 알 수 있는가?
그것이 실패했을 때 어떻게 되는가?

그 Antworten이 불분명하다면, 시스템은 생산에 준비가 되지 않았다.

모델은 준비가 될 수 있다. 그러나 조직은 아니다.

Zuzana Drotárová, Head of Regional Competency, Avenga

주자나 드로타로바는 아벤가의 비즈니스 분석을 이끌고 있으며, 체코와 슬로바키아의 기업 프로그램에서 약 100명의 분석가를 감독합니다. 그녀는 기업의 이니셔티브, 특히 AI를 포함한 이니셔티브가 생산에 성공적으로 작동하는지 결정하는 운영 및 의사 결정 구조에 초점을 맞추고 있습니다.