Líderes de opinión
Cuando el ‘conocimiento’ de la IA tiene 50 años: El riesgo de cumplimiento que no puedes ignorar

El problema de las perspectivas falsas de la IA es un desafío urgente a medida que las empresas aumentan su uso de herramientas generativas. A pesar del entusiasmo generalizado sobre la adopción de la IA, también hay una corriente fuerte de críticas. Los comentaristas críticos a menudo señalan las inexactitudes aparentemente aleatorias y impredecibles en la salida de la IA, que socavan su valor y pueden incluso poner en peligro a los humanos, particularmente en sectores como la atención médica y el transporte, donde las salidas falsas podrían teóricamente llevar a todo, desde la prescripción incorrecta hasta trenes en curso de colisión.
A menudo, estas inexactitudes se han atribuido a las “alucinaciones” de la IA – instancias en las que la IA genera una respuesta de “mejor suposición”, transmitida con la misma confianza que una respuesta “auténtica”, en lugar de informar al usuario de una brecha en su conocimiento o capacidad. Las alucinaciones pueden ser difíciles de detectar a primera vista, pero hay un problema más silencioso y igualmente grave que es aún más difícil de detectar.
Deuda de calidad de datos: el talón de Aquiles de la IA
Cuando los sistemas de IA extraen datos obsoletos, incompletos o inexactos, se producen salidas falsas, pero son menos inmediatamente discernibles. Por ejemplo, podrías pedirle a una IA que identifique los síntomas de una afección médica y recibir una respuesta basada en un artículo de hace 50 años en lugar de investigaciones actuales. El resultado es poco probable que aparezca obviamente, ridículamente incorrecto, pero esa apariencia inicial de plausibilidad plantea un riesgo real para el paciente en cuestión y el proveedor de atención médica.
Lo mismo es cierto en todas las industrias – si los datos que se alimentan al modelo de IA incluyen información antigua, obsoleta o parcial, existe un alto riesgo de salidas falsas. Y a medida que más empresas integran la IA en procesos comerciales críticos, el riesgo de sacar conclusiones falsas de datos mal gobernados crece.
Precisión para el regulador
Este no es solo un problema para las operaciones diarias, sino que también es un desafío de cumplimiento significativo. Los requisitos regulatorios están evolucionando rápidamente para abordar las preocupaciones sobre la IA inexacta. Por ejemplo, se han producido varias acciones regulatorias iniciales sobre la IA; notablemente, cuando Italia prohibió temporalmente ChatGPT por preocupaciones de privacidad, y el Consejo de Protección de Datos de la UE lanzó una fuerza especial dedicada para coordinar posibles acciones de aplicación contra ChatGPT.
Uno de los cambios regulatorios más reveladores ha sido la aprobación del Acta de IA de la UE, el primer marco legal integral para la IA en el mundo. La Acta establece obligaciones basadas en el nivel de riesgo de los sistemas de IA, desde sistemas de “riesgo inaceptable”, que están prohibidos, hasta sistemas de “alto riesgo”, que enfrentan requisitos estrictos en torno a la transparencia, la calidad de los datos, la gobernanza y la supervisión humana.
La importancia de la Acta de IA de la UE no radica en su alcance ambicioso, sino en el precedente que establece. Los reguladores están dejando claro que la IA estará sujeta a reglas vinculantes y que las organizaciones deben tratar el cumplimiento y la transparencia sobre dónde y cómo se utiliza la IA como integral a la adopción de la IA, en lugar de un después pensamiento.
La Acta tiene un alcance amplio, con el potencial de afectar una gran proporción de desarrollos de IA. En su corazón está hacer que la IA sea segura, al mismo tiempo que se respetan los derechos y valores fundamentales. Dentro de este nuevo ecosistema principled viene el diagnóstico de posibles fuentes de inexactitudes de la IA, incluidos los datos y los conjuntos de datos que alimentan los modelos, la opacidad del modelo y el acceso, y el diseño y el uso del sistema. Las soluciones de IA son un constructo de los tres – los problemas con cualquiera de estos pueden tener un resultado negativo. No solo eso, sino que los datos que se utilizan en el diseño, el desarrollo del modelo, la implementación y la operación de la IA probablemente estén compuestos principalmente por registros comerciales que están sujetos a varios requisitos de cumplimiento.
En otras palabras, el entorno regulatorio que rodea a la IA se está volviendo cada vez más estricto – y eso es cierto tanto para la entrada de datos como para la salida de datos, aunque esta última recibe más titulares.
Cinco pasos para alimentar a la IA con datos conformes, actuales y relevantes
Para resolver este desafío dual – garantizar tanto el manejo de datos conforme como la entrada de alta calidad que permite la salida de alta calidad – las empresas necesitan control sobre los datos de entrenamiento y inferencia. Desafortunadamente, esto es algo que muchas empresas aún carecen.
Al menos, las organizaciones deberían aplicar sus programas de cumplimiento y gobernanza más amplios a las iniciativas de IA. Necesitan comenzar a capturar y mantener registros adecuados sobre los datos que alimentan los modelos de IA, cómo se diseñan los modelos y los sistemas, así como las decisiones y el contenido generado a través de la IA.
Sin embargo, también se está volviendo críticamente importante para las organizaciones ir un paso más allá y asegurarse de que tengan el control total sobre todos los datos que podrían utilizarse en despliegues de IA, ya sea para el entrenamiento inicial o el “trabajo en vivo”. Esto requiere una estrategia de gestión y almacenamiento de datos de alta calidad, asegurando que todos los datos relevantes se recopilen, limpien, almacenen, clasifiquen y titulen de manera inteligente. Para lograr esto, las organizaciones necesitan considerar cuatro pasos clave:
1. Linaje y procedencia de los datos
Esto incluye mantener un registro de la fuente de los datos, su origen, propiedad y cualquier cambio en los metadatos (si está permitido) a lo largo de su ciclo de vida. También significa mantener metadatos ricos y todos los documentos o artefactos subyacentes de los que se deriva.
2. Autenticidad de los datos
Esto requiere mantener una cadena clara de custodia para todos los datos, almacenar objetos en sus formas nativas y hash objetos recibidos para demostrar que los datos permanecen sin cambios. Además, las organizaciones deben mantener un historial de auditoría completo para cada objeto y para todas las acciones y eventos con respecto a cualquier cambio.
3. Clasificación de los datos
Establecer la naturaleza de un conjunto o tipo de datos es importante. Las organizaciones necesitan poder gobernar datos estructurados, datos semiestructurados y conjuntos estructurados de datos. Dar a cada clase un esquema único puede permitir que las organizaciones gestionen conjuntos de datos diversos sin una ontología fija de un tamaño único – evitando que los datos sean manipulados innecesariamente para forzarlos en una estructura de datos inflexible.
4. Normalización de los datos
Establecer definiciones y formatos comunes de metadatos es importante para su uso en análisis y soluciones de IA. Los esquemas claramente definidos son un elemento importante, junto con herramientas que pueden transformar o asignar datos para mantener vistas normalizadas y consistentes de datos relacionados.
5. Titulaciones de los datos
Las empresas necesitan controles de titulación granulares, incluidos a nivel de objeto o campo, basados en perfiles de usuario o sistema. Esto significa que los datos adecuados están disponibles para los usuarios y los sistemas que están autorizados a acceder a ellos, mientras que se restringe o limita el acceso a aquellos que no lo están.
Con estos elementos cruciales en su lugar, las empresas estarán mejor equipadas para garantizar que los datos proporcionados a los modelos de IA sean tanto de alta calidad como conformes. La IA impulsará mejoras y eficiencias en todas las industrias – pero para que eso suceda, una base de datos sólida es esencial.












