talón Un sistema de recomendación de almas gemelas basado solo en imágenes - Unite.AI
Contáctanos

Inteligencia artificial

Un sistema de recomendación AI Soulmate basado solo en imágenes

mm
Actualizado on

Investigadores del Reino Unido han utilizado redes neuronales para desarrollar un sistema de recomendación completamente basado en imágenes para coincidencias de citas en línea que solo tiene en cuenta si dos usuarios se sienten atraídos por las fotos del otro (en lugar de información de perfil como trabajo, edad, etc.). ), y han descubierto que supera a los sistemas menos 'superficiales' en términos de obtener una coincidencia precisa.

El sistema resultante se llama recomendador recíproco basado en imágenes temporales (TIRR) y utiliza redes neuronales recurrentes (RNN) para interpretar la predilección histórica de un usuario por las caras que encuentra mientras busca posibles coincidencias.

El tiene derecho -quizás desalentadoramente- Las fotos son todo lo que necesita para la recomendación recíproca en las citas en línea, y proviene de dos investigadores de la Universidad de Bristol, mejorando notablemente un sistema similar (llamado ImRec) lanzado por el mismo equipo en 2020.

En las pruebas, el sistema obtuvo una precisión de última generación en su capacidad para predecir recíproco coincidencias entre usuarios, mejorando no solo el trabajo de los investigadores de 2020, sino también otros sistemas de recomendaciones recíprocas de citas basadas en contenido que tienen en cuenta información más detallada basada en texto en los perfiles de citas.

Conjunto de datos de citas del mundo real

TIRR recibió capacitación sobre la información del usuario proporcionada por un servicio de citas en línea 'popular' sin nombre con 'varios millones de usuarios registrados', que solo permite a los usuarios comunicarse entre sí una vez que a cada uno le ha gustado el perfil del otro. El subconjunto de datos utilizado incluía 200,000 800,000 sujetos, divididos equitativamente entre hombres y mujeres, y aproximadamente XNUMX XNUMX preferencias expresadas por los usuarios en todos los perfiles de citas.

Dado que el servicio de citas anónimo que proporciona los datos solo admite coincidencias heterosexuales, en la investigación solo se cubrieron las coincidencias entre hombres y mujeres.

TIRR mejora los diseños anteriores de sistemas de recomendación recíproca (RRS) en este campo al calcular directamente la probabilidad de una coincidencia entre dos perfiles, basándose únicamente en las imágenes de perfil. En cambio, los sistemas anteriores predijeron dos preferencias unidireccionales y luego las agregaron para obtener una predicción.

Los investigadores excluyeron a los usuarios que habían sido eliminados del servicio de citas (por cualquier motivo, incluido el abandono voluntario) y excluyeron los perfiles que no incluían fotos basadas en rostros.

Los historiales de los usuarios se limitaron a un año atrás, para evitar posibles anomalías que podrían ocurrir a medida que el sitio de citas modificaba sus algoritmos con el tiempo. También se limitaron a un máximo de 15 preferencias de usuario, ya que se demostró que eran suficientes para probar el diseño del modelo, mientras que un uso más extenso de las preferencias degradaba el rendimiento y aumentaba los tiempos de entrenamiento.

Además, algunos de los usuarios más ávidos o a largo plazo tenían antecedentes con miles de preferencias, lo que podría haber corrido el riesgo de sesgar el peso de las características obtenidas y prolongar aún más los tiempos de entrenamiento.

Red siamesa

TIRR se formula usando un Red siamesa, típicamente usado para aprendizaje 'de una sola vez'.

Una plantilla de red siamesa, donde las redes neuronales convolucionales (CNN) paralelas comparten pesos pero no datos. También comparten una función de pérdida derivada de las salidas de cada CNN y una etiqueta de verdad del terreno. Fuente: https://arxiv.org/pdf/2108.11714.pdf

Una plantilla de red siamesa, donde las redes neuronales convolucionales (CNN) paralelas comparten pesos pero no datos. También comparten una función de pérdida derivada de las salidas de cada CNN y una etiqueta de verdad del terreno.  Fuente: https://arxiv.org/pdf/2108.11714.pdf

La red se entrenó utilizando entropía cruzada binaria, una función de pérdida común en las redes neuronales, y que los investigadores encontraron que daba resultados superiores en comparación con pérdida contrastiva. Este último es más efectivo en sistemas que evalúan la paridad entre dos caras, pero dado que este no es el objetivo de TIRR, es un enfoque que funciona mal en este contexto.

Es necesario que el sistema retenga y se base en la información que desarrolla a medida que el entrenamiento itera muchas veces sobre los mismos datos, y la red siamesa en TIRR usa un LSTM (Memoria a corto plazo a largo plazo) para tomar estas decisiones y garantizar que las características que se consideren relevantes no se descarten ad hoc a medida que el marco construye sus conocimientos.

La arquitectura de red siamesa específica para TIRR.

La arquitectura de red siamesa específica para TIRR.

Los investigadores descubrieron que la red se entrenó muy lentamente cuando se ingresaron todos los datos y, posteriormente, dividió el entrenamiento en tres etapas utilizando tres subconjuntos diferentes de datos. Hay una ventaja adicional en esto, ya que los experimentos de los investigadores de 2020 ya habían demostrado que entrenar los conjuntos de datos masculinos y femeninos por separado mejora el rendimiento de un sistema de recomendación recíproco.

El desglose de sesiones de capacitación separadas para la red siamesa de TIRR.

El desglose de sesiones de capacitación separadas para la red siamesa de TIRR.

Pruebas

Para evaluar el rendimiento de TIRR, los investigadores mantuvieron una parte de los datos obtenidos a un lado y la pasaron por el sistema totalmente convergente. Sin embargo, dado que el sistema es bastante novedoso, no existen sistemas anteriores directamente análogos con los que pueda compararse.

Por lo tanto, los investigadores primero establecieron una curva característica operativa del receptor (ROC) línea de base para la red siamesa, antes de usar la aproximación de variedad uniforme y la proyección para la reducción de la dimensionalidad (UMAP) para reducir los vectores de 128 dimensiones para una fácil visualización, con el fin de establecer un flujo coherente de gustos y disgustos.

A la izquierda, el ROC de la red siamesa como indicador de referencia del desempeño; a la derecha, la visualización de UMAP muestra "me gusta" en rojo, "no me gusta" en negro.

A la izquierda, el ROC de la red siamesa como indicador de referencia del desempeño; a la derecha, la visualización de UMAP muestra "me gusta" en rojo, "no me gusta" en negro.

TIRR se probó contra el filtrado colaborativo y los sistemas basados ​​​​en contenido con un ámbito similar, incluido el trabajo anterior de los investigadores ImRec (ver arriba), y Recon, un RRS de 2010, así como los algoritmos de filtrado colaborativo RCF (un RRS de citas de 2015 basado en el contenido de texto de los perfiles de citas) y LFRR (un proyecto similar de 2019).

En todos los casos, TIRR pudo ofrecer una precisión superior, aunque solo marginalmente en comparación con LFRR, lo que posiblemente indique factores de correlación entre el contenido del texto del perfil y el nivel percibido de atractivo de las fotos de perfil de los sujetos.

La casi paridad entre el TIRR basado en imágenes y el LFRR más basado en texto permite al menos dos posibilidades: que la percepción del atractivo visual de los usuarios esté influenciada por el contenido de texto de los perfiles; o que el contenido del texto recibe mayor atención y aprobación de lo que podría haber ocurrido si la imagen asociada no se percibiera como atractiva.

Por razones obvias, el equipo de investigación no puede publicar el conjunto de datos o el código fuente de TIRR, pero alienta a otros equipos a duplicar y confirmar su enfoque.

 

Nota: las imágenes utilizadas en la ilustración principal son de thispersondoesnotexist.com.