์‚ฌ์ƒ ๋ฆฌ๋”

์ง€์ถœ ๋ถ„๋ฅ˜ ์ฒด๊ณ„๊ฐ€ ๋‘ ๊ฐ€์ง€ ๊ณ ๊ฐ์„ ๊ฐ–๋Š” ๊ฒฝ์šฐ

mm

좋은 지출 분류 체계는 두 가지 고객을 갖는다: 그것을 사용해야 하는 사람들과 분류해야 하는 모델이다.

대부분의 리더들은 분류 체계를 의미 있는 범주로 지출을 조직하는 방식으로 이해한다. 그러나 실제로는 보고 프레임워크 이상의 것이며, 사람들이 지출을 어떻게 해석하는지, 데이터로 어떻게 변환하는지, 그리고 점점 더 AI 시스템이 데이터를 분류, 분석, 통찰력을 생성하는 방식에 영향을 미친다.

이것이 지출 가시성 구현에서 종종 과소평가되는 부분이다. 분류 체계는 일반적으로 설정 단계로 취급된다. 계층 구조를 정의하고 플랫폼에 로드하고 지출을 매핑한 다음 진행한다. 그러나 조달에서 AI採用이 가속화되고 있다; 2025년에 80%의 CPO는 3년 내에 생성적 AI를 배포할 계획이었다. 그러나 36%만이 의미 있는 구현을 갖고 있었다.

현실적으로 분류 체계는 일반적으로 그 간격이 시작되는 곳이다. 그것은 비즈니스에서 지출을 이해하는 언어가 되며 AI 주도 분류의 가장 중요한 입력 중 하나가 된다. 만약 그것이 두 고객 중 하나에게 실패한다면, 하류 영향은 빠르게 나타난다: 채택이 부족하고, 신뢰가 낮으며, 모델을 조정하기가 더 어려워진다.

채택 문제

사용자에게 있어서 분류 체계 설계는 변경 관리 문제이다. 범주 관리자, 소싱 팀, 재무 사용자, 그리고 경영진은 번역 계층 없이 지출 범주를 보고 무슨 의미인지 이해해야 한다.

어지러운 레이블이 그것을 더 어렵게 만든다. 내부 약어, 모호한 범주 이름, 중복 범주, 계층 구조 전체에 걸쳐 일관되지 않은 세부 수준도 마찬가지이다. 지출 큐브는 거래를 올바르게 분류할 수 있지만 사용자가 범주를 해석할 수 없으면 사용자 경험이 나빠질 수 있다. Gartner는 63%의 조직이 AI를 위한 적절한 데이터 관리 관행을 갖고 있지 않거나 그렇지 않을 수 있다고 발견했으며, 2026년까지 AI 데이터에 의해 지원되지 않는 60%의 AI 프로젝트가 중단될 것이라고 예측한다.

이것이 범주 팀의 입력이 필요한 곳이다. 범주를 관리하는 사람들은 지출이 어떻게 소싱, 협상, 그리고 처리되는지 이해한다. 그들은 어떤 버킷이 유용한지, 어떤 구별이 중요한지, 레이블이 비즈니스에서 실제로 지출에 대해 어떻게 말하는지 알 수 있다.

그러나 그 입력에는 가드레일이 필요하다. 모든 범주 팀이 독립적으로 설계할 수 없다.

시설 팀은 서비스 유형에 대한 자세한 세부 정보를 원할 수 있다: 노동, 재료, 자산 유형, 수리 유형, 서비스 빈도. IT 팀은 하드웨어, 소프트웨어, 서비스와 같은 광범위한 범주를 선호할 수 있다. 두 가지 관점 모두 자신의 기능 내에서 의미 있을 수 있다. 그러나 둘 다 전체 엔터프라이즈 분류 체계의 기본 설계 원칙이 되어서는 안 된다.

중앙 집중 팀이 프레임워크를 생성해야 한다. 분류 체계는 몇 단계를 가져야 하는가? 더 많은 세부 정보가 어디에서 더 나은 소싱 통찰력을 제공하는가? 어디에서 더 많은 세부 정보가 노イズ를 생성하는가? 어떤 레이블이 비전문가에게 명확할 것인가? 어떤 범주는 분리되어야 하며, 어떤 범주는 통합되어야 하는가?

좋은 분류 체계는 각 범주 팀의 선호도 중 가장 자세한 버전이 아니다. 그것은 엔터프라이즈가 지출을 일관되게 이해하는 공유 언어이다.

AI 문제

同じ 분류 체계는 또한 AI에서 작동해야 한다.

AI 주도 분류에서 레이블과 정의는 문서화가 아니다. 그것은 거래를 분류하는 데 사용되는 신호의 일부가 된다. 두 범주가 모호하거나 중복된 레이블을 갖고 있다면, 모델은 하나를 다른 하나보다 선호하는 근거가 줄어든다. 정의가 너무 일반적이면 과매칭이 발생할 수 있다. 정의가 데이터에 나타나지 않는 언어를 사용한다면 전혀 매칭되지 않을 수 있다.

이것은 단순히 모델 성숙도 문제가 아니다. 이것은 분류 체계 설계 문제이다.

좋은 분류 체계 설계는 모델에 깨끗한 타겟을 제공한다. 범주는 명확해야 하며, 설명 가능해야 하며, 기본 데이터에서 인식 가능해야 하며, 포함되는 것과 포함되지 않는 것에 대해 명확해야 한다. 마지막 점은 중요하다. 포함 언어는 모델이 무엇을 찾을지 알려준다. 제외 언어는 유사한 어휘를 공유하는 인접한 범주를 분리하는 데 도움이 된다.

시설 유지 보수, MRO, 건물 서비스, 장비 수리, 일반 산업 공급과 같은 영역을 고려해 보자. 이러한 범주는 쉽게 중복될 수 있다. 인간 검토자는 컨텍스트에서 의도된 구별을 이해할 수 있다. 그러나 모델은 더 명확한 신호가 필요하다. 여러 범주가 유사한 유지 보수 활동을 설명하는 경우에 명확한 경계가 없으면 분류화 신뢰도가 낮아질 수 있다.

보다 나은 분류 체계 설계는 무엇인가?

최선의 분류 체계 작업은 순수하게 수동적이 아니며, 완전히 자동화된 것도 아니다. 그것은 하이브리드 접근 방식이다.

중앙 집중 프레임워크에서 시작한다. 명명 규칙, 계층 구조 깊이, 폴백 범주, 의사 결정에 필요한 세부 수준을 정의한다. 그런 다음 범주 팀을 참여시켜 실제로 관리되는 지출에 대한 구조를 테스트한다.

그런 다음 실제 범주 정의를 작성한다. 유용한 범주 정의는 포함되는 것, 포함되지 않는 것, 데이터에 나타날 가능성이 있는 언어를 설명해야 한다. 벤더 이름, 제품 용어, 서비스 설명, 일반적인 약어 등이 신중하게 사용되면 중요하다.

그런 다음 실제 거래에 대한 분류 체계를 테스트한다. 높은 지출 예를 검토한다. 낮은 신뢰도 매칭을 검토한다. 정의가 너무 광범위하여 지출을 과도하게 분류하는 범주를 찾는다. 정의가 데이터에서 발견되는 어휘를 사용하지 않아 매칭하지 않는 범주를 찾는다.

이것이 AI가 유용한 곳이다. 패턴을 표면화하고, 신뢰도를 측정하고, 모호한 매칭을 식별하고, 개선이 필요한 영역을 우선순위로 정렬하는 데 도움이 될 수 있다. 그러나 인간이 참여하는 단계가 여전히 중요하다. 모델은 비즈니스 의미를 스스로 결정할 수 없기 때문이다.

분류 체계 설계는 구현 작업과 모델 품질 입력으로 처리되어야 한다. 레이블과 정의는 분류화에 영향을 미친다. 조달에서 AI 네이티브로의 더广泛한 전환은 그 기초를 무시하기 더 어렵게 만들고 있다 — 데이터 준비는 기술적인 요구 사항이 아니라 경쟁 차별화 요소로 처리된다. TF-IDF 매칭, 의미적 유사성, 신뢰도 임계값, 점수 마진, 약어 확장, 피드백 루프와 같은 기술적 접근 방식은 분류 체계 자체가 명확하고 분리 가능할 때 더 잘 작동한다.

목표는 조달 팀을 모델 용어로 압도하는 것이 아니다. 분류 체계 품질이 모델 품질이 된다는 것이다. 더 나은 레이블과 정의는 더 나은 신호를 생성한다. 더 나은 신호는 더 강한 분류화를 생성한다. 더 강한 분류화는 지출 큐브에 대한 더 많은 신뢰를 생성한다.

구현 교훈

분류 체계 구축에는 일반적으로 프로젝트 계획에서 할당된 시간보다 더 많은 시간이 필요하다.

이 단계를 서두르면 두 가지 예측 가능한 문제가 발생한다. 첫 번째는 채택이 부족하다. 사용자가 지출에 대해 생각하는 방식과 일관성이 없는 계층 구조로 인해 사용자는 지출 큐브를 신뢰하지 않는다.

두 번째는 모델 성능이 나쁘다. 분류화가 더 어려워진다. 대상 범주가 모호하거나, 중복되거나, 데이터의 언어와 분리된 경우에 발생한다.

두 가지 문제도 모델에 더 많은 AI를 적용함으로써 해결되지 않는다. 기초가 올바른지 확인해야 한다. 이것은 엔터프라이즈 전반에 걸쳐 나타나는 동일한 패턴이다: 대부분의 AI 프로젝트 실패는 모델 자체가 아니라 데이터 기반이 준비되지 않았기 때문에 있다.

강력한 분류 체계는 중앙에서 관리되고, 범주 전문가의 정보를 바탕으로 하며, 실제 데이터에 대해 테스트되고, 모델 피드백을 통해 개선되고, 시간이 지남에 따라 유지된다. 그것은 한 번 설정 파일이 아니다. 그것은 지출 가시성 운영 모델의 핵심 부분이다.

분류 체계는 행정적인 정리 작업이 아니다. 그것은 지출 큐브에 대한 신뢰의 기초이다. 그리고 점점 더 중요한 것은 AI가 지출 데이터를 분류, 설명, 개선하는 데 얼마나 잘할 수 있는지의 기초이다.

๋ฏธ์น˜ ์ฟ ํผ๋Š” SpendHQ์˜ ๋ฐ์ดํ„ฐ ๋ฐ ๋ถ„์„ ๋ถ€๋ฌธ ๋ถ€์‚ฌ์žฅ์œผ๋กœ, ๋ณต์žกํ•œ ์กฐ๋‹ฌ ๋ฐ์ดํ„ฐ๋ฅผ ์‹ ๋ขฐํ•  ์ˆ˜ ์žˆ๋Š” ์กฐ์น˜ ๊ฐ€๋Šฅํ•œ ๋น„์ฆˆ๋‹ˆ์Šค ์ธํ…”๋ฆฌ์ „์Šค๋กœ ๋ณ€ํ™˜ํ•˜๋Š” ํŒ€์„ ์ด๋Œ๊ณ  ์žˆ์Šต๋‹ˆ๋‹ค. SpendHQ์—์„œ 10๋…„ ๋™์•ˆ ๊ทผ๋ฌดํ•˜๊ณ  ์กฐ๋‹ฌ ์ปจ์„คํŒ… ๋ฐฐ๊ฒฝ์„ ๊ฐ€์ง€๊ณ  ์žˆ๋Š” ๊ทธ๋Š” ๊ธฐ์—… ์กฐ์ง์ด ์ง€์ถœ ๋ฐ์ดํ„ฐ๋ฅผ ๊ตฌ์กฐํ™”ํ•˜๊ณ  ์‚ฌ์šฉํ•˜๋Š” ๋ฐฉ๋ฒ•์— ๋Œ€ํ•œ ์‹ฌ์˜คํ•œ ์ „๋ฌธ ์ง€์‹์„ ๊ฐ€์ง€๊ณ  ์žˆ์Šต๋‹ˆ๋‹ค.