Entrevistas

Dra. Judith Bishop, Directora Senior de Especialistas en IA en Appen – Serie de Entrevistas

mm

La Dra. Judith Bishop es Directora Senior de Especialistas en IA para la región de APAC/EE. UU. en Appen. Está liderando y haciendo crecer un equipo de primer nivel de lingüistas altamente calificados y experimentados, lingüistas computacionales y expertos en todos los modos de comunicación humana (habla, escritura y gesto), para entregar datos de entrenamiento de IA con una combinación sin igual de calidad y velocidad.

¿Qué te atrajo inicialmente a la lingüística?

Escuché sobre la lingüística por primera vez por un profesor de inglés favorito en la escuela secundaria. Era uno de esos niños que se sienten igualmente atraídos por las lenguas extranjeras y las humanidades, y las materias de matemáticas y ciencias. La lingüística es la ciencia de cómo funciona el lenguaje, así que unió esos intereses para mí. Como muchas personas, una vez que supe sobre ella, me enganché por completo. ¿Qué podría ser más fascinante que cómo nos comunicamos nuestros pensamientos y sentimientos entre nosotros? La lingüística explora las estructuras del lenguaje que, a pesar de las diferencias en sonidos y sistemas de escritura, a menudo son similares en la superficie, ya que todos son un producto, en última instancia, de nuestra existencia humana común.

¿Podrías compartir la historia de cómo te encontraste trabajando en IA?

He trabajado en Appen desde 2004 apoyando el desarrollo de productos y servicios de tecnología del lenguaje. Con el tiempo, la IA ha surgido como un marco integral, misión y visión para que la tecnología imite y amplíe las capacidades humanas de comunicación, razonamiento y percepción. En 2019, mi equipo se rebautizó como Especialistas en IA, reconociendo que nuestro conocimiento lingüístico y de lenguaje es fundamental para la empresa de IA. Nuestros datos anotados brindan un apoyo esencial para el éxito de las interacciones humanas con productos y servicios de IA.

Has estado trabajando en IA durante más de 16 años, ¿cuáles son algunos de los cambios más grandes que has visto?

El cambio principal ha sido una diversificación del enfoque desde el desarrollo de tecnología central a la cola larga de casos de uso y aplicaciones. Durante la mayor parte de mi carrera, el enfoque de la IA basada en el lenguaje ha sido desarrollar y perfeccionar un conjunto central de modelos que imitan la percepción y la producción del habla humana, a saber, el reconocimiento del habla, la síntesis del habla y el procesamiento del lenguaje natural. Los conjuntos de datos generalmente se ajustaban a los estándares y convenciones de etiquetado y muestreo de datos comunes, como los desarrollados por el consorcio Speecon (Interfaz de voz para dispositivos de consumo). Estos estándares han permitido a los desarrolladores de tecnología central comparar su rendimiento en estructuras de datos comunes y han apoyado la evolución rápida de la IA.

La expansión generalizada de los casos de uso de la IA en los últimos años, sin embargo, ha traído consigo el reconocimiento de que los modelos de IA genéricos centrales construidos con estos datos no funcionan adecuadamente en tipos de datos más especializados sin un ajuste adicional. Además, habiendo sido desarrollados con datos que fueron deliberadamente limpios y “estándar”, estos modelos ahora deben ser entrenados o actualizados para entender y responder a toda la diversidad de entradas humanas: todos los dialectos, todos los acentos, todos los géneros y todas las demás dimensiones de la diferencia humana.

¿Podrías discutir la importancia de los datos no sesgados en el aprendizaje automático?

Los modelos de aprendizaje automático, ya sean supervisados, no supervisados o de aprendizaje por refuerzo, reflejarán los sesgos presentes en los datos en los que se entrenan. Alyssa Simpson Rochwerger y Wilson Pang proporcionan varios ejemplos excelentes de este problema en su libro reciente, IA en el mundo real. Si no hay suficientes datos de entrenamiento para un segmento de la población, el modelo de IA será menos preciso para ese segmento.

En otro caso común, la representación de la población puede ser suficiente, pero si los datos de entrenamiento contienen correlaciones entre puntos de datos que reflejan condiciones reales, pero indeseables, en el mundo (como una tasa de empleo completo más baja para las mujeres, o una tasa de encarcelamiento más alta para los afroamericanos), las aplicaciones de IA resultantes pueden reforzar y perpetuar esas condiciones.

Las asociaciones presentes en el lenguaje en general pueden crear sesgos en las aplicaciones de PNL, que dependen de relaciones estadísticas conocidas como incrustaciones de palabras. Si “ella” y “enfermera” están más frecuentemente asociados en los datos de entrenamiento elegidos que “ellos” o “él” y “enfermera”, entonces la aplicación resultante utilizará “ella” cuando se le obligue a elegir un pronombre singular para referirse a una enfermera. Para abordar este problema específico, los investigadores han desarrollado recientemente una variante de género neutral de un algoritmo de incrustación de palabras comúnmente utilizado, GN-GloVe.

En aplicaciones sensibles, problemas de sesgo como estos pueden tener un impacto devastador en los usuarios y pueden anular la inversión comercial. La buena noticia es que, además del desarrollo de nuevos conjuntos de datos más transparentes y más inclusivos, un número creciente de aplicaciones de ciencia de datos se están desarrollando para verificar la presencia de sesgo en los conjuntos de datos de entrenamiento y las aplicaciones de IA existentes.

Appen lanzó recientemente nuevos conjuntos de datos de entrenamiento diversos para iniciativas de PNL. ¿Podrías compartir algunos detalles sobre cómo estos conjuntos de datos permitirán a los usuarios finales recibir la misma experiencia independientemente de la variedad de lenguaje, dialecto, etnolecto, acento, raza o género?

Por las razones mencionadas anteriormente, se necesitan conjuntos de datos para corregir los sesgos existentes en los sistemas de producción de IA, además de conjuntos de datos más inclusivos para entrenar sistemas futuros. Los conjuntos de datos de Appen que mencionas brindarán apoyo para la corrección de sesgos relacionados con la etnia y los etnolectos asociados, como el inglés vernáculo afroamericano. Proporcionarán datos de entrenamiento suplementarios para aumentar la representación de esta población en los modelos de lenguaje de IA.

La etnia está surgiendo como una dimensión demográfica crítica para la etiquetado explícito en los datos de IA. Los lingüistas se refieren a las variedades de lenguaje asociadas con etnias específicas como “etnolectos”. Los proveedores de datos de IA como Appen ahora reconocen que, a menos que las poblaciones clave y diversas estén representadas explícitamente en los conjuntos de datos de entrenamiento de IA, no podemos garantizar que los sistemas resultantes funcionen igual de bien para estas poblaciones.

El rendimiento igual significa que el sistema reconoce con igual precisión las palabras y las intenciones del usuario (sus significados o las acciones que desean realizar) y, en algunos casos, el sentimiento; y que responde de maneras que satisfacen igualmente las necesidades del usuario y no producen un impacto más negativo en una población específica de usuarios, ya sea práctico o psicológico.

Un enfoque de recolección de datos de larga data ha sido centrarse en la muestra geográfica y dialectalmente representativa en bases de datos, asumiendo que esto garantizaría que la tecnología se generalizaría a toda la población de hablantes de lenguaje. Sin embargo, el rendimiento relativamente pobre de las tecnologías del lenguaje documentadas recientemente para los hablantes del inglés vernáculo afroamericano ha demostrado que no es así. Las poblaciones que son diversas en etnia, raza, género y acento, entre otras dimensiones, necesitan ser incluidas proactivamente en los conjuntos de datos de entrenamiento para garantizar que sus voces sean escuchadas y entendidas por los productos y servicios de IA. Los conjuntos de datos de entrenamiento de IA diversificados de Appen abordan esta necesidad.

Fuera de la IA, también eres poeta con varios de tus poemas que han ganado diferentes premios de la industria. ¿Cuáles son tus puntos de vista sobre la IA futura que exhibe este tipo de creatividad, incluyendo la escritura de poesía?

Esa es una pregunta fascinante. La poesía y otras formas de creatividad humana se basan en todos nuestros recursos humanos de memoria, percepción, sensación y emoción, así como en las estructuras y matices del lenguaje y la imagen, para producir ideas que resuenan con las preocupaciones contemporáneas. Emily Dickinson escribió: “Si leo un libro y me hace que todo mi cuerpo se sienta tan frío que ningún fuego puede calentarme, sé que es poesía. Si siento físicamente que la parte superior de mi cabeza ha sido quitada, sé que es poesía”. Debe haber un elemento de reconocimiento perceptual, sensorial o emocional, pero también una sorpresa genuina.

Los modelos de IA avanzados, como GPT-3, modelan estadísticamente la probabilidad de que las palabras aparezcan juntas en diferentes géneros, incluyendo la poesía. Esto significa que pueden producir algo que reconocemos como “lenguaje poético”, como el uso de un lenguaje elevado, la rima y combinaciones inesperadas o surreales de palabras. Pero estos modelos de lenguaje generativos carecen de la mayoría de los recursos mencionados anteriormente, que se necesitan para producir una obra de arte que ilumine lo que significa ser humano en el presente.

Lo que encuentro convincente sobre la IA en un contexto creativo es su potencial para producir ideas completamente nuevas, ideas que son diferentes en tipo y más allá del alcance de la mente humana, incluso la más polifacética o profundamente leída y experimentada. Una vez que la IA tenga acceso consistente a datos sensoriales y perceptuales para análisis en una amplia gama de dominios humanos (visual, táctil, auditivo, fisiológico, emocional), no hay forma de saber qué aprenderemos sobre nosotros mismos y el mundo. Las capacidades analíticas de la IA pueden producir nuevos terrenos fértiles para la exploración creativa humana.

Has tenido una carrera fenomenal hasta ahora, en tu opinión, ¿qué es lo que impide que más mujeres se unan a STEM y específicamente a la IA?

La falta de modelos a seguir puede ser un factor poderoso (y un círculo vicioso). Hay una dificultad genuina, cultural, social y práctica, para romper áreas donde las mujeres, y las personas de otros géneros diversos, no tienen una presencia profundamente establecida, y donde el respeto por lo que podemos contribuir a menudo es demasiado escaso. Mi propia experiencia como líder me ha demostrado una y otra vez cómo pueden ser resilientes, creativas y exitosas los equipos cuando son inclusivos de experiencias y orientaciones diversas. Los líderes necesitan ser aventureros en su contratación y valientes en su confianza de que pueden manejar los desafíos a su forma de pensar que las perspectivas diversas traen, sabiendo que esta valentía también se ha demostrado que está fuertemente correlacionada con el éxito financiero y corporativo.

¿Hay algo más que te gustaría compartir sobre Appen o la IA en general?

Los proveedores de datos como Appen tienen un potencial poderoso para influir en los resultados de la IA para mejor, proporcionando datos de entrenamiento inclusivos.

Sin embargo, alcanzar el objetivo de la IA inclusiva requerirá que todos participen. Los compradores de datos también deben reconocer su responsabilidad de pedir explícitamente (y pagar) los datos inclusivos que garantizarán el rendimiento óptimo de sus sistemas para todos los usuarios en el mundo real. Y aquellos de comunidades diversas que suministran sus datos para el desarrollo de la IA deben poder confiar en los usos que se les dará. Construir esa confianza requerirá prácticas éticas y transparentes sólidas por parte de todos los que manejan datos sensibles.

Gracias por la gran entrevista, disfruté aprendiendo más sobre tus puntos de vista sobre la IA y la lingüística. Los lectores que deseen aprender más deben visitar Appen.

Antoine es un líder visionario y socio fundador de Unite.AI, impulsado por una pasión inquebrantable por dar forma y promover el futuro de la IA y la robótica. Un empresario serial, cree que la IA será tan disruptiva para la sociedad como la electricidad, y a menudo se le escucha hablando con entusiasmo sobre el potencial de las tecnologías disruptivas y la AGI. Como un futurista, está dedicado a explorar cómo estas innovaciones darán forma a nuestro mundo. Además, es el fundador de Securities.io, una plataforma enfocada en invertir en tecnologías de vanguardia que están redefiniendo el futuro y remodelando sectores enteros.