Connect with us

Ciberseguridad

Reidentificando a personas a través de datos de salud portátiles y aprendizaje automático

mm

Un nuevo tipo de ataque de privacidad basado en datos de salud portátiles ha sido identificado por investigadores de la Universidad de Massachusetts Lowell. Ataque de reidentificación de persona (PRI-Attack) utiliza datos públicos y cumplientes con HIPAA de dispositivos de salud portátiles para establecer la identidad de las personas a partir de datos de frecuencia cardíaca, respiración y gesticulación manual, entre otros.

La vulnerabilidad es posible en los EE. UU. debido a que la Ley de Portabilidad y Responsabilidad de Seguro de Salud (HIPAA), aunque requiere que los datos médicos permanezcan anónimos, no considera los datos de sensores sin procesar (como la temperatura de la piel y los datos del acelerómetro (ACC)) como sensibles a la privacidad, y por lo tanto no requiere que los datos públicos de este tipo estén cifrados o estén sujetos a las mismas protecciones generales que se otorgan a las formas tradicionales de datos de pacientes, como los registros de salud.

De vector a visual

Un ataque PRI utiliza datos de imagen interpretados para discernir patrones comunes que se correlacionan con otros tipos de datos de salud. La respuesta de la piel de una persona, por ejemplo, se puede evaluar desde un video (fotopletismografía), y correlacionar con lo que debería ser información de vector completamente anónima de dispositivos de monitoreo de salud, como relojes portátiles, y otros tipos de aparatos de monitoreo. La fotopletismografía produce datos de frecuencia cardíaca, que se pueden emparejar con datos cardíacos no identificados de dispositivos de salud portátiles.

El reconocimiento de gestos es otra “clave” que se puede traducir trivialmente de datos de vector a una matriz visual que, nuevamente, permite correlacionar datos de imagen/vidéo interpretados con información aparentemente anónima de acelerómetro en datos de salud.

Información de gestos manuales de datos portátiles.

Información de gestos manuales de datos portátiles. Fuente: https://arxiv.org/pdf/2106.11900.pdf

Datos de sensores como PII

La investigación, del profesor asistente de la Universidad de Massachusetts Lowell, Mohammad Arif Ul Alam, sostiene que los datos de sensores fisiológicos pueden constituir PII, y es en efecto un análogo biológico de las técnicas de huella digital del navegador que actualmente se creen que socavan las nuevas iniciativas para proteger la privacidad del usuario en la web.

Para probar la hipótesis, el investigador desarrolló un marco de reconocimiento y localización de gestos manuales que interpreta datos de gestos (movimientos vectoriales grabados) de un acelerómetro portátil, y traduce los movimientos en un registro visual que se puede correlacionar con movimientos grabados por dispositivos de salud portátiles.

Se construyó una Red Neural Siamesa Multi-Modal (mm-SNN) para interpretar la información de gestos clasificados a través de una Máquina de Vector de Soporte (SVM). Una red trata la información de vector (interpretada como información de imagen en un espacio 3D) y la segunda red trata los datos fisiológicos grabados a partir de datos de sensores.

Pruebas

El sistema se probó en varios conjuntos de datos, incluyendo un conjunto de datos de “fatiga de jugadores” obtenido al recopilar datos de cinco estudiantes voluntarios, de 19 a 25 años, que jugaron videojuegos durante siete días mientras llevaban un brazalete Empatica E4 wristband. El reloj cuenta con sensores ACC, contexto electrodérmico (EDA), temperatura de la piel y fotopletismografía (PPG).

El E4 también se utilizó en un conjunto de datos de “restaurante” novedoso, en el que ocho voluntarios prepararon y comieron sandwiches durante veinte minutos, y en un conjunto de datos de “adultos mayores”, donde 22 sujetos mayores, de 75 a 95 años, realizaron 13 actividades grabadas mientras llevaban el reloj.

Finalmente, los investigadores utilizaron el conjunto de datos públicamente disponible “Healthy Adults Fatigue Dataset”, que monitoreó a 28 hombres y mujeres sanos con una edad promedio de 42 durante 1-219 días consecutivos mientras llevaban un dispositivo portátil de múltiples sensores similar a las capacidades de recopilación de datos del E4, incluyendo un acelerómetro de 3 ejes, un electrodo de respuesta galvánica de la piel, temperatura y foto sensores, y un barómetro.

Los resultados indican que la frecuencia cardíaca y la frecuencia respiratoria son los medios más seguros para la reidentificación, con una tasa de precisión promedio >66%.

Resultados de la prueba del método de ataque PRI.

Resultados de la prueba del método de ataque PRI. Crib: PPG: fotopletismografía; HR: frecuencia cardíaca; BR: frecuencia respiratoria; PVP: Pulso de Volumen Sanguíneo (obtenido de PPG); IBI: Intervalo entre latidos (obtenido de PPG); TC: Componente tónico de la señal de EDA; Componente fásico de los datos de EDA (Ibid); Temp: Temperatura.

La investigación concluye:

‘Mientras que la tecnología de visión por computadora moderna se puede utilizar fácilmente para aprender gestos manuales y señales fisiológicas correspondientes (frecuencia cardíaca, frecuencia respiratoria) de cámaras de vigilancia pública, estas grandes cantidades de videos grabados se pueden utilizar fácilmente por los atacantes para aprender biometrías específicas de usuario para revelar la identidad de los datos de sensores de salud almacenados en servidores que cumplen con HIPAA.’

HIPAA considera los datos de PHR como ‘anónimos por defecto’

El gobierno de los EE. UU. ha reconocido el crecimiento de los registros de salud personales (PHR), y clasifica dicho registro (incluyendo datos de dispositivos de salud portátiles) como ‘un registro electrónico de la información de salud de un individuo por el cual el individuo controla el acceso a la información y puede tener la capacidad de gestionar, realizar un seguimiento y participar en su propio cuidado de la salud’.

Sin embargo, como este es un fenómeno del sector privado, el gobierno concede que no tiene supervisión oficial de dichos datos, habiendo establecido que no contienen información de identificación personal (PII). Un informe de junio de 2016 sobre entidades no cubiertas por HIPAA del Departamento de Salud y Servicios Humanos de los EE. UU. establece:

‘[Grandes] brechas en las políticas de acceso, seguridad y privacidad continúan, y la confusión persiste entre consumidores e innovadores. Los dispositivos de seguimiento de la forma física portátiles, las redes sociales de salud y las aplicaciones de salud móviles se basan en la idea de la participación del consumidor. Sin embargo, nuestras leyes y regulaciones no han mantenido el ritmo con estas nuevas tecnologías.’

Escritor sobre aprendizaje automático, especialista en síntesis de imágenes humanas. Anterior jefe de contenido de investigación en Metaphysic.ai.