Ética

5 Pilares Fundamentales para Garantizar la Responsabilidad de la IA

mm

Estamos viendo un crecimiento abrumador en los sistemas de IA/ML para procesar océanos de datos que se generan en la nueva economía digital. Sin embargo, con este crecimiento, es necesario considerar seriamente las implicaciones éticas y legales de la IA.

Al confiar tareas cada vez más sofisticadas y importantes a los sistemas de IA, como la aprobación automática de préstamos, por ejemplo, debemos estar absolutamente seguros de que estos sistemas son responsables y confiables. Reducir los sesgos en la IA se ha convertido en un área de enfoque masivo para muchos investigadores y tiene enormes implicaciones éticas, al igual que la cantidad de autonomía que otorgamos a estos sistemas.

El concepto de IA Responsable es un marco importante que puede ayudar a generar confianza en tus despliegues de IA. Hay cinco pilares fundamentales para la IA Responsable. Este artículo explorará estos para ayudarte a construir mejores sistemas.

1. Reproducibilidad

Hay un viejo dicho en el mundo del desarrollo de software que dice: “hey, funciona en mi máquina”. En ML y IA, la frase podría ser: “hey, funciona en mi conjunto de datos”. Esto es para decir que los modelos de aprendizaje automático pueden tender a ser una caja negra. Muchos conjuntos de datos de entrenamiento pueden tener sesgos inherentes, como el sesgo de muestreo o el sesgo de confirmación, que reducen la precisión del producto final.

Para ayudar a hacer que los sistemas de IA/ML sean más reproducibles y, por lo tanto, precisos y confiables, el primer paso es estandarizar la tubería de MLOps. Incluso los científicos de datos más inteligentes tienen sus tecnologías y bibliotecas favoritas, lo que significa que la ingeniería de características y los modelos resultantes no son uniformes de persona a persona. Al utilizar herramientas como MLflow, puedes estandarizar la tubería de MLOps y reducir estas diferencias.

Otra forma de ayudar a hacer que los sistemas de IA/ML sean más reproducibles es a través del uso de lo que se llaman “conjuntos de datos de oro”. Estos son conjuntos de datos representativos que actúan esencialmente como pruebas y validación de nuevos modelos antes de que se lancen para producción.

2. Transparencia

Como se mencionó anteriormente, muchos modelos de ML, particularmente las redes neuronales, son cajas negras. Para hacerlos más responsables, debemos hacerlos más interpretables. Para sistemas simples como los árboles de decisión, es bastante fácil entender cómo y por qué el sistema tomó una determinada decisión, pero a medida que la precisión y la complejidad de un sistema de IA aumentan, su interpretabilidad a menudo disminuye.

Hay un nuevo área de investigación llamada “explicabilidad” que está tratando de traer transparencia incluso a los sistemas de IA complejos como las redes neuronales y el aprendizaje profundo. Estos utilizan modelos proxy para copiar el rendimiento de una red neuronal, pero también tratan de dar explicaciones válidas de qué características son importantes.

Todo esto conduce a la equidad; deseas saber por qué se tomó una determinada decisión y asegurarte de que esta decisión sea justa. También deseas asegurarte de que no se consideren características inapropiadas para que no se filtre el sesgo en tu modelo.

3. Responsabilidad

Quizás el aspecto más importante de la IA Responsable es la responsabilidad. Hay mucha conversación sobre este tema, incluso en el sector gubernamental, ya que se ocupa de qué políticas impulsarán los resultados de la IA. Este enfoque de política determina en qué etapa los humanos deben estar en el bucle.

La responsabilidad requiere monitores y métricas robustos para ayudar a los formuladores de políticas y controlar los sistemas de IA/ML. La responsabilidad realmente une la reproducibilidad y la transparencia, pero necesita una supervisión efectiva en forma de comités de ética de IA. Estos comités pueden manejar decisiones de política, decidir qué es importante medir y realizar revisiones de equidad.

4. Seguridad

La seguridad de la IA se centra en la confidencialidad y la integridad de los datos. Cuando los sistemas procesan datos, deseas que estén en un entorno seguro. Deseas que los datos estén cifrados mientras están en reposo en tu base de datos y también mientras se llaman a través de la tubería, pero las vulnerabilidades aún existen mientras se alimentan a un modelo de aprendizaje automático como texto plano. Tecnologías como el cifrado homomórfico solucionan este problema al permitir que el entrenamiento de aprendizaje automático ocurra en un entorno cifrado.

Otro aspecto es la seguridad del modelo en sí. Por ejemplo, los ataques de inversión de modelo permiten que los hackers aprendan los datos de entrenamiento que se utilizaron para construir el modelo. También hay ataques de envenenamiento de modelo, que insertan datos malos en el modelo mientras se entrena y dañan completamente su rendimiento. Probar tu modelo para ataques adversarios como estos puede mantenerlo seguro.

5. Privacidad

Google y OpenMined son dos organizaciones que han estado priorizando la privacidad de la IA, y OpenMined organizó una conferencia reciente sobre este tema. Con nuevas regulaciones como el GDPR y el CCPA, y posiblemente más por venir, la privacidad desempeñará un papel central en cómo entrenamos los modelos de aprendizaje automático.

Una forma de asegurarte de que estás manejando los datos de tus clientes de una manera consciente de la privacidad es utilizar el aprendizaje federado. Este método descentralizado de aprendizaje automático entrena diferentes modelos localmente y luego los agrega en un centro central mientras mantiene los datos seguros, seguros y privados. Otro método es introducir ruido estadístico para que los valores individuales de los clientes no se filtren. Esto te mantiene trabajando con el agregado para que los datos individuales de un cliente estén intactos y no estén disponibles para el algoritmo.

Manteniendo la IA Responsable

 En última instancia, mantener la IA responsable es responsabilidad de cada organización que diseña sistemas de IA/ML. Al perseguir intencionalmente tecnologías dentro de cada uno de estos cinco aspectos de la IA Responsable, no solo puedes beneficiarte del poder de la inteligencia artificial, sino que también puedes hacerlo de una manera confiable y directa que tranquilizará a tu organización, clientes y reguladores.

Dattaraj Rao, Chief Data Scientist en Persistent Systems, es el autor del libro “Keras to Kubernetes: The Journey of a Machine Learning Model to Production.” En Persistent Systems, Dattaraj lidera el AI Research Lab que explora algoritmos de última generación en Computer Vision, Natural Language Understanding, programación probabilística, Reinforcement Learning, Explainable AI, etc. y demuestra la aplicabilidad en los sectores de Salud, Banca y Industria. Dattaraj tiene 11 patentes en Machine Learning y Computer Vision.