Líderes de opinión

Una buena taxonomía de gastos tiene dos clientes

mm

Una buena taxonomía de gastos tiene dos clientes: las personas que necesitan utilizarla y los modelos que necesitan clasificar contra ella.

La mayoría de los líderes entienden la taxonomía como una estructura de categorías, una forma de organizar lo que están gastando en cubos significativos. En realidad, es mucho más que un marco de informes. Da forma a cómo las personas interpretan ese gasto, cómo se convierte en datos y, cada vez más, influye en cómo los sistemas de inteligencia artificial categorizan, analizan y generan información a partir de esos datos.

Esa es la parte de las implementaciones de visibilidad de gastos que a menudo se subestima. La taxonomía suele tratarse como un paso de configuración. Definir la jerarquía, cargarla en la plataforma, asignar el gasto y seguir adelante. Pero la adopción de inteligencia artificial en la compra es cada vez más rápida; en 2025, el 80% de los directores de compras planeaban implementar inteligencia artificial generativa en tres años. Solo el 36% tenía implementaciones significativas.

En realidad, la taxonomía es donde comienza esa brecha. Se convierte en el lenguaje que la empresa utiliza para entender el gasto y una de las entradas más importantes para la categorización impulsada por inteligencia artificial. Si falla en cualquiera de las audiencias, el impacto en la parte inferior se muestra rápidamente: una adopción deficiente, una confianza más baja y modelos que son más difíciles de ajustar de lo que necesitan ser.

El problema de adopción

Para los usuarios, el diseño de la taxonomía es un problema de gestión del cambio. Los gerentes de categorías, los equipos de aprovisionamiento, los usuarios de finanzas y los directivos necesitan ver los cubos de gastos y entender lo que significan sin una capa de traducción.

Las etiquetas desordenadas hacen que eso sea más difícil. Lo mismo ocurre con los acrónimos internos, los nombres de categorías ambiguos, las categorías redundantes y los niveles de detalle inconsistentes en toda la jerarquía. Un cubo de gastos puede clasificar transacciones correctamente y aún crear una mala experiencia de usuario si los usuarios no pueden interpretar las categorías. Gartner encontró que el 63% de las organizaciones no tienen o no están seguras de tener las prácticas de gestión de datos adecuadas para la inteligencia artificial, y predice que hasta 2026, el 60% de los proyectos de inteligencia artificial no respaldados por datos listos para la inteligencia artificial serán abandonados.

Este es donde las implementaciones necesitan la entrada del equipo de categorías. Las personas que gestionan las categorías entienden cómo se origina el gasto, se negocia y se actúa sobre él. Saben si un cubo es útil, si una distinción es importante y si una etiqueta refleja cómo la empresa habla realmente sobre el gasto.

Pero esa entrada necesita guardias. Cada equipo de categorías no puede diseñar en aislamiento.

Un equipo de instalaciones puede querer un detalle profundo para cada tipo de servicio: mano de obra, materiales, tipo de activo, tipo de reparación y frecuencia de servicio. Un equipo de TI puede preferir categorías amplias como Hardware, Software y Servicios. Ambas vistas pueden tener sentido dentro de su propia función. Ninguna debería convertirse en el principio de diseño predeterminado para la taxonomía empresarial completa.

Un equipo centralizado tiene que crear el marco. ¿Cuántos niveles debe tener la taxonomía? ¿Dónde se crea una mejor comprensión de la fuente con más granularidad? ¿Dónde se crea ruido? ¿Qué etiquetas serán claras para los no especialistas? ¿Qué categorías necesitan separarse y cuáles deben permanecer consolidadas?

Una buena taxonomía no es la versión más detallada de las preferencias de cada equipo de categorías. Es el lenguaje compartido que la empresa utiliza para entender el gasto de manera consistente.

El problema de la inteligencia artificial

La misma taxonomía también tiene que funcionar para la inteligencia artificial.

En la categorización impulsada por inteligencia artificial, las etiquetas y definiciones no son solo documentación. Se convierten en parte de la señal que se utiliza para clasificar transacciones. Si dos categorías tienen etiquetas o definiciones vagas o superpuestas, el modelo tiene menos base para elegir una sobre la otra. Si una definición es demasiado genérica, puede coincidir en exceso. Si utiliza un lenguaje que nunca aparece en los datos, puede no coincidir en absoluto.

Esto no es simplemente un problema de madurez del modelo. Es un problema de diseño de taxonomía.

Un buen diseño de taxonomía da al modelo objetivos más limpios. Las categorías deben ser distintas, describibles, reconocibles en los datos subyacentes y claras sobre lo que pertenece y lo que no pertenece. Ese último punto es importante. El lenguaje de inclusión dice al modelo qué buscar. El lenguaje de exclusión ayuda a separar categorías adyacentes que pueden compartir un vocabulario similar.

Considera áreas como el mantenimiento de instalaciones, MRO, servicios de edificios, reparación de equipos y suministros industriales generales. Estas categorías pueden superponerse fácilmente. Un revisor humano puede entender la distinción intencionada del contexto. Un modelo necesita una señal más clara. Si varias categorías describen actividad de mantenimiento similar sin límites específicos, la confianza en la categorización se verá afectada.

El mismo problema aparece con las categorías de respaldo. Un cubo amplio, como MRO / Suministros industriales generales, puede ser útil cuando los datos son verdaderamente vagos. Pero no debe convertirse en un receptáculo para gastos que podrían clasificarse más precisamente. Si los datos indican claramente gafas de seguridad, guantes, equipo de protección personal o suministros de primeros auxilios, la taxonomía debe proporcionar una señal de gasto suficiente para clasificarlo como Suministros de seguridad en lugar de dejarlo en un cubo genérico.

Qué aspecto tiene un mejor diseño de taxonomía

El mejor trabajo de taxonomía no es puramente manual, y no es completamente automatizado. Es un enfoque híbrido.

Comienza con un marco centralizado. Define convenciones de nomenclatura, profundidad de la jerarquía, categorías de respaldo y el nivel de granularidad requerido para la toma de decisiones. Luego, trae a los equipos de categorías para probar la estructura contra cómo se gestiona realmente el gasto.

Desde allí, escribe definiciones prácticas, no académicas. Una definición de categoría útil debe decir qué pertenece, qué no pertenece y qué lenguaje es probable que aparezca en los datos. Los nombres de los vendedores, los términos de los productos, las descripciones de los servicios y las abreviaturas comunes pueden ser importantes cuando se utilizan con cuidado.

Luego, prueba la taxonomía contra transacciones reales. Revisa ejemplos de gastos altos. Revisa coincidencias de baja confianza. Busca categorías que estén capturando gastos en exceso porque sus definiciones son demasiado amplias. Busca categorías que estén subcoincidiendo porque sus definiciones no utilizan el vocabulario encontrado en los datos de origen.

Este es donde la inteligencia artificial es valiosa. Puede detectar patrones, medir la confianza, identificar coincidencias ambiguas y ayudar a los equipos a priorizar dónde se necesita refinamiento. Pero el paso de humano en el bucle todavía es importante porque el modelo no puede decidir el significado empresarial de una categoría por sí solo.

El diseño de la taxonomía debe tratarse como una corriente de trabajo de implementación y una entrada de calidad del modelo. Las etiquetas y definiciones influyen en la categorización. El cambio más amplio hacia la compra nativa de inteligencia artificial está haciendo que esa base sea más difícil de ignorar —la preparación de los datos se trata como un diferenciador competitivo en lugar de un requisito técnico. Los enfoques técnicos como la coincidencia TF-IDF, la similitud semántica, los umbrales de confianza, los márgenes de puntuación, la expansión de abreviaturas y los bucles de retroalimentación funcionan mejor cuando la taxonomía en sí es clara y separable.

El punto no es abrumar a los equipos de compras con terminología de modelo. El punto es que la calidad de la taxonomía se convierte en la calidad del modelo. Mejores etiquetas y definiciones crean mejores señales. Mejores señales crean una categorización más fuerte. Una categorización más fuerte crea más confianza en el cubo de gastos.

La lección de implementación

La creación de la taxonomía merece más tiempo del que suele recibir en el plan del proyecto.

Acelerar este paso crea dos problemas predecibles. El primero es una adopción deficiente. Los usuarios no confían en un cubo de gastos cuando las categorías no coinciden con cómo piensan sobre el gasto o cuando la jerarquía se siente inconsistente en todos los equipos.

El segundo es un rendimiento deficiente del modelo. La categorización se vuelve más difícil cuando las categorías objetivo son vagas, redundantes o desconectadas del lenguaje en los datos.

Ninguno de estos problemas se resuelve simplemente aplicando más inteligencia artificial. La base tiene que estar bien. Ese es el mismo patrón que se muestra en la inteligencia artificial empresarial en general: la mayoría de los fracasos de los proyectos de inteligencia artificial se remontan a una base de datos que no estaba lista, no a los modelos en sí.

Una taxonomía sólida está gobernada centralmente, informada por expertos en categorías, probada contra datos reales, refinada a través de la retroalimentación del modelo y mantenida con el tiempo. No es un archivo de configuración de una sola vez. Es una parte central del modelo operativo de visibilidad de gastos.

La taxonomía no es una limpieza administrativa. Es la base de la confianza en el cubo de gastos. Cada vez más, también es la base de cómo bien la inteligencia artificial puede clasificar, explicar y mejorar los datos de compras con el tiempo.

Mitch Couper es Vicepresidente de Datos y Análisis en SpendHQ, donde lidera el equipo responsable de transformar datos de compras complejos en inteligencia empresarial confiable y acciónnable. Con una década en SpendHQ y un trasfondo en consultoría de compras, aporta una profunda experiencia en cómo las organizaciones empresariales estructuran y utilizan sus datos de gastos.