Inteligencia artificial

¿Qué son los Deepfakes?

mm

A medida que los deepfakes se vuelven más fáciles de crear y más prolíficos, se les presta más atención. Los deepfakes se han convertido en el centro de las discusiones que involucran la ética de la IA, la desinformación, la apertura de la información y la regulación de Internet. Es importante estar informado sobre los deepfakes y tener una comprensión intuitiva de lo que son. Este artículo aclarará la definición de un deepfake, examinará sus casos de uso, discutirá cómo se pueden detectar los deepfakes y examinará las implicaciones de los deepfakes para la sociedad.

¿Qué son los Deepfakes?

Antes de continuar con la discusión sobre los deepfakes, sería útil tomar algún tiempo para aclarar qué son en realidad los “deepfakes”. Hay una gran cantidad de confusión sobre el término Deepfake, y a menudo el término se aplica incorrectamente a cualquier medio falsificado, independientemente de si es un deepfake genuino o no. Para calificar como un Deepfake, el medio falsificado en cuestión debe ser generado con un sistema de aprendizaje automático, específicamente una red neuronal profunda.

El ingrediente clave de los deepfakes es el aprendizaje automático. El aprendizaje automático ha hecho posible que las computadoras generen video y audio de manera rápida y fácil. Las redes neuronales profundas se entrenan con imágenes de una persona real para que la red aprenda cómo lucen y se mueven las personas en condiciones ambientales objetivo. La red entrenada se utiliza luego con imágenes de otra persona y se combina con técnicas de gráficos computacionales adicionales para combinar a la nueva persona con las imágenes originales. Un algoritmo de codificador se utiliza para determinar las similitudes entre el rostro original y el rostro objetivo. Una vez que se han aislado las características comunes de los rostros, se utiliza un segundo algoritmo de IA llamado decodificador. El decodificador examina las imágenes codificadas (comprimidas) y las reconstruye en función de las características de las imágenes originales. Se utilizan dos decodificadores, uno en el rostro del sujeto original y el segundo en el rostro de la persona objetivo. Para realizar el intercambio, el decodificador entrenado con imágenes de la persona X se alimenta con imágenes de la persona Y. El resultado es que el rostro de la persona Y se reconstruye sobre las expresiones faciales y la orientación de la persona X.

Actualmente, todavía se necesita un tiempo razonable para crear un deepfake. El creador del falso tiene que pasar mucho tiempo ajustando manualmente los parámetros del modelo, ya que los parámetros subóptimos conducirán a imperfecciones y glitches de imagen que revelan la verdadera naturaleza del falso.

Aunque a menudo se asume que la mayoría de los deepfakes se crean con un tipo de red neuronal llamada red generativa adversaria (GAN), muchos (quizás la mayoría) de los deepfakes creados en la actualidad no dependen de las GAN. Si bien las GAN desempeñaron un papel destacado en la creación de los primeros deepfakes, la mayoría de los videos de deepfakes se crean a través de métodos alternativos, según Siwei Lyu de la Universidad de SUNY Buffalo.

Se necesita una cantidad desproporcionadamente grande de datos de entrenamiento para entrenar una GAN, y las GAN a menudo tardan mucho más en renderizar una imagen en comparación con otras técnicas de generación de imágenes. Las GAN también son mejores para generar imágenes estáticas que video, ya que las GAN tienen dificultades para mantener la coherencia de un marco a otro. Es mucho más común utilizar un codificador y varios decodificadores para crear deepfakes.

¿Para qué se utilizan los Deepfakes?

Muchos de los deepfakes que se encuentran en línea son de naturaleza pornográfica. Según una investigación realizada por Deeptrace, una empresa de IA, de una muestra de aproximadamente 15,000 videos de deepfakes tomados en septiembre de 2019, aproximadamente el 95% de ellos eran de naturaleza pornográfica. Una implicación inquietante de este hecho es que, a medida que la tecnología se vuelve más fácil de usar, es posible que aumenten los incidentes de venganza pornográfica falsa.

Sin embargo, no todos los deepfakes son de naturaleza pornográfica. Hay usos más legítimos para la tecnología de deepfakes. La tecnología de deepfakes de audio podría ayudar a las personas a transmitir sus voces regulares después de que hayan sido dañadas o perdidas debido a una enfermedad o lesión. Los deepfakes también se pueden utilizar para ocultar los rostros de las personas que se encuentran en situaciones sensibles y potencialmente peligrosas, mientras aún permiten que se lean sus labios y expresiones. La tecnología de deepfakes se puede utilizar potencialmente para mejorar el doblaje de películas en idiomas extranjeros, ayudar en la reparación de medios antiguos y dañados, e incluso crear nuevos estilos de arte.

Deepfakes no de video

Aunque la mayoría de las personas piensan en videos falsos cuando escuchan el término “deepfake”, los videos falsos no son de ninguna manera el único tipo de medio falso producido con tecnología de deepfakes. La tecnología de deepfakes se utiliza para crear fotos y audio falsos. Como se mencionó anteriormente, las GAN se utilizan con frecuencia para generar imágenes falsas. Se cree que ha habido muchos casos de perfiles falsos de LinkedIn y Facebook que tienen imágenes de perfil generadas con algoritmos de deepfakes.

También es posible crear deepfakes de audio. Las redes neuronales profundas se entrenan para producir clones de voz/piel de voz de diferentes personas, incluidos celebridades y políticos. Un ejemplo famoso de un deepfake de audio es cuando la empresa de IA Dessa utilizó un modelo de IA, respaldado por algoritmos no de IA, para recrear la voz del presentador de podcasts Joe Rogan.

¿Cómo detectar los Deepfakes?

A medida que los deepfakes se vuelven más y más sofisticados, distinguirlos de los medios genuinos se volverá cada vez más difícil. Actualmente, hay algunos signos reveladores que las personas pueden buscar para determinar si un video es potencialmente un deepfake, como una mala sincronización de labios, movimientos no naturales, parpadeo alrededor del borde del rostro y deformación de detalles finos como el cabello, los dientes o los reflejos. Otros signos potenciales de un deepfake incluyen partes de menor calidad del mismo video y parpadeo irregular de los ojos.

Aunque estos signos pueden ayudar a detectar un deepfake en este momento, a medida que la tecnología de deepfakes mejora, la única opción para detectar deepfakes de manera fiable puede ser otros tipos de IA entrenados para distinguir entre medios falsos y reales.

Las empresas de inteligencia artificial, incluidas muchas de las grandes empresas de tecnología, están investigando métodos para detectar deepfakes. El pasado diciembre, se inició un desafío de detección de deepfakes, respaldado por tres gigantes de la tecnología: Amazon, Facebook y Microsoft. Equipos de investigación de todo el mundo trabajaron en métodos para detectar deepfakes, compitiendo para desarrollar los mejores métodos de detección. Otros grupos de investigadores, como un grupo de investigadores combinados de Google y Jigsaw, están trabajando en un tipo de “forensia facial” que puede detectar videos que han sido alterados, haciendo que sus conjuntos de datos sean de código abierto y animando a otros a desarrollar métodos de detección de deepfakes. La mencionada Dessa ha trabajado en la mejora de las técnicas de detección de deepfakes, tratando de asegurarse de que los modelos de detección funcionen en videos de deepfakes que se encuentran en la red (en Internet) en lugar de solo en conjuntos de datos de entrenamiento y prueba precompuestos, como el conjunto de datos de código abierto que proporcionó Google.

También se están investigando otras estrategias para hacer frente a la proliferación de deepfakes. Por ejemplo, se pueden buscar videos para verificar su concordancia con otras fuentes de información. Se pueden realizar búsquedas de videos de eventos potencialmente tomados desde otros ángulos, o se pueden verificar los detalles de fondo del video (como patrones climáticos y ubicaciones) para detectar incongruencias. Más allá de esto, un sistema de registro en línea de Blockchain podría registrar los videos cuando se crean inicialmente, manteniendo su audio y imágenes originales para que los videos derivados siempre se puedan verificar para detectar manipulaciones.

En última instancia, es importante que se creen métodos confiables para detectar los deepfakes y que estos métodos de detección sigan el ritmo de los últimos avances en tecnología de deepfakes. Aunque es difícil saber exactamente qué efectos tendrán los deepfakes, si no hay métodos confiables para detectar los deepfakes (y otros tipos de medios falsos), la desinformación podría potencialmente propagarse y erosionar la confianza de las personas en la sociedad y las instituciones.

Implicaciones de los Deepfakes

¿Cuáles son los peligros de permitir que los deepfakes se propaguen sin control?

Uno de los problemas más grandes que los deepfakes crean actualmente es la pornografía no consensuada, creada combinando los rostros de las personas con videos y imágenes pornográficos. Los éticos de la IA están preocupados por el uso de los deepfakes en la creación de venganza pornográfica falsa. Más allá de esto, los deepfakes podrían usarse para acosar y dañar la reputación de casi cualquier persona, ya que podrían usarse para colocar a las personas en situaciones controvertidas y comprometedoras.

Las empresas y los especialistas en ciberseguridad han expresado su preocupación por el uso de los deepfakes para facilitar estafas, fraude y extorsión. Presuntamente, el audio de deepfake se ha utilizado para convencer a los empleados de una empresa para que transfieran dinero a estafadores.

Es posible que los deepfakes tengan efectos perjudiciales incluso más allá de los mencionados anteriormente. Los deepfakes podrían potencialmente erosionar la confianza de las personas en los medios en general y hacer que sea difícil para las personas distinguir entre noticias reales y falsas. Si muchos videos en la web son falsos, se vuelve más fácil para los gobiernos, las empresas y otras entidades cuestionar la legitimidad de controversias y prácticas poco éticas.

Cuando se trata de los gobiernos, los deepfakes pueden incluso plantear amenazas al funcionamiento de la democracia. La democracia requiere que los ciudadanos puedan tomar decisiones informadas sobre los políticos basadas en información confiable. La desinformación socava los procesos democráticos. Por ejemplo, el presidente de Gabón, Ali Bongo, apareció en un video intentando tranquilizar a la ciudadanía de Gabón. Se asumió que el presidente había estado enfermo durante un largo período de tiempo, y su repentina aparición en un video probablemente falso desencadenó un intento de golpe de estado. El presidente Donald Trump afirmó que una grabación de audio de él jactándose de agarrar a las mujeres por los genitales era falsa, a pesar de también describirla como “charla de vestuario”. El príncipe Andrew también afirmó que una imagen proporcionada por el abogado de Emily Maitilis era falsa, aunque el abogado insistió en su autenticidad.

En última instancia, aunque hay usos legítimos para la tecnología de deepfakes, hay muchos daños potenciales que pueden surgir del mal uso de esa tecnología. Por esa razón, es extremadamente importante que se creen métodos para determinar la autenticidad de los medios y que estos métodos se mantengan.

Bloguero y programador con especialidades en Machine Learning y Deep Learning temas. Daniel espera ayudar a otros a utilizar el poder de la IA para el bien social.