Connect with us

Re-identificarea persoanelor prin intermediul datelor de sănătate purtabile și a învățării automate

Securitate cibernetică

Re-identificarea persoanelor prin intermediul datelor de sănătate purtabile și a învățării automate

mm

Un nou tip de atac de confidențialitate bazat pe datele de sănătate purtabile a fost identificat de către cercetători de la Universitatea Massachusetts Lowell. Atacul de re-identificare a persoanei (PRI-Attack) utilizează date publice disponibile, conforme cu HIPAA, de la dispozitive de sănătate purtabile pentru a stabili identitatea indivizilor din datele de ritm cardiac, respirație și gesticulație manuală, printre altele.

Vulnerabilitatea este posibilă în Statele Unite ale Americii, deoarece Legea privind portabilitatea și responsabilitatea asigurării de sănătate (HIPAA), deși cere ca datele medicale să rămână anonime, nu consideră datele brute de senzor (cum ar fi temperatura pielii și datele de accelerometru (ACC)) ca fiind sensibile din punct de vedere al confidențialității și, prin urmare, nu cere ca datele publice de acest tip să fie criptate sau supuse acelorași protecții generale pe care le oferă datelor tradiționale ale pacienților, cum ar fi fișele medicale.

De la vector la vizual

Un atac PRI utilizează date de imagine interpretate pentru a discerne tipare comune care se corelează cu alte tipuri de date de sănătate. Răspunsul pielii unei persoane, de exemplu, poate fi evaluat din video (fotopletismografie), și corelat cu ceea ce ar trebui să fie informații vector complet anonime de la dispozitive de monitorizare a sănătății, cum ar fi ceasurile purtabile, și alte tipuri de dispozitive de monitorizare. Fotopletismografia oferă date de ritm cardiac, care pot fi pereche cu date cardiace anonime de la dispozitive purtabile.

Recunoașterea gesturilor este o altă “cheie” care poate fi tradusă trivial din date vector într-o matrice vizuală care, din nou, permite datelor de imagine/video interpretate să fie corelate cu informațiile aparent anonime de la accelerometru din datele de sănătate.

Informații despre gesturile mâinii din datele purtabile.

Informații despre gesturile mâinii din datele purtabile. Sursă: https://arxiv.org/pdf/2106.11900.pdf

Date de senzor ca PII

Cercetarea, condusă de profesorul asistent Mohammad Arif Ul Alam de la UML, susține că datele de senzor fiziologic pot constitui, într-adevăr, informații de identificare personală (PII) și este, în esență, un analog biologic al tehnicilor de amprentare a browserului, care se crede că subminează în prezent inițiativele noi de protecție a confidențialității utilizatorilor pe web.

Pentru a testa ipoteza, cercetătorul a dezvoltat un cadru de recunoaștere și localizare a gesturilor care interpretează date de gesturi (înregistrate sub formă de mișcare vectorială) de la un accelerometru purtabil și le traduce într-un înregistrar vizual care poate fi corelat cu mișcările înregistrate de dispozitivele de sănătate purtabile.

O rețea neurală Siamese multi-modală (mm-SNN) a fost construită pentru a interpreta informațiile despre gesturi clasificate prin Mașina de Vectar Suport (SVM). O rețea se ocupă de informațiile vectoriale (interpretate ca informații de imagine într-un spațiu 3D) și a doua rețea se ocupă de datele fiziologice înregistrate de la datele de senzor.

Testare

Sistemul a fost testat pe diverse seturi de date, incluzând un “set de date de oboseală a jucătorilor” obținut prin colectarea datelor de la cinci studenți voluntari, cu vârste cuprinse între 19 și 25 de ani, care au jucat jocuri video timp de șapte zile purtând un brățar Empatica E4 wristband. Ceasul dispune de senzori ACC, electrodermal context (EDA), temperatură a pielii și fotopletismografie (PPG).

E4 a fost utilizat, de asemenea, într-un set de date “restaurant” nou, în care opt voluntari au pregătit și au mâncat sandwich-uri timp de douăzeci de minute, și într-un set de date “adulți mai în vârstă”, în care 22 de subiecți mai în vârstă, cu vârste cuprinse între 75 și 95 de ani, au efectuat 13 activități scriptate purtând ceasul.

În final, cercetătorii au utilizat setul de date public disponibil “Healthy Adults Fatigue Dataset”, care a monitorizat 28 de bărbați și femei sănătoși, cu o vârstă medie de 42 de ani, timp de 1-219 zile consecutive, purtând un dispozitiv purtabil multisenzor, asemănător cu capacitățile de colectare a datelor ale E4, incluzând un accelerometru triaxial, electrod de răspuns galvanic al pielii, senzor de temperatură și foto, precum și un barometru.

Rezultatele indică faptul că ritmul cardiac și ritmul respirator sunt mijloacele cele mai sigure de reidentificare, obținând o rată de acuratețe medie de peste 66%.

Rezultate din testarea metodei PRI-Attack.

Rezultate din testarea metodei PRI-Attack. Legendă: PPG: fotopletismografie; HR: ritm cardiac; BR: ritm respirator; PVP: pulsul volumului sanguin (obținut din PPG); IBI: intervalul inter-bătăi (obținut din PPG); TC: componenta tonică a semnalului EDA; Componenta fazică a datelor EDA (Ibid); Temp: temperatură.

Cercetarea concluzionează:

‘În timp ce tehnologia de viziune computerizată modernă poate fi utilizată cu ușurință pentru a învăța gesturi și semnale fiziologice corespunzătoare (ritm cardiac, ritm respirator) din camerele de supraveghere publică, aceste cantități mari de videoclipuri înregistrate pot fi utilizate cu ușurință de atacatori pentru a învăța biometrii specifice utilizatorilor și a dezvălui identitatea din datele de sănătate purtabile stocate pe servere conforme cu HIPAA.’

HIPAA consideră datele PHR “anonimizate implicit”

Guvernul Statelor Unite a recunoscut creșterea înregistrărilor de sănătate personale (PHR) și le clasifică ca ‘înregistrări electronice ale informațiilor de sănătate ale unui individ, prin care individul controlează accesul la informații și poate avea capacitatea de a gestiona, urmări și participa la propriile sale îngrijiri de sănătate’.

Cu toate acestea, deoarece acesta este un fenomen din sectorul privat, guvernul concesează că nu are niciun control oficial asupra acestor date, stabilind că nu conține informații de identificare personală (PII). Un raport din iunie 2016 privind entitățile non-acoperite de HIPAA de la Departamentul de Sănătate și Servicii Umane al Statelor Unite declară:

‘[Există] lacune mari în politicile de acces, securitate și confidențialitate, și persistă confuzia atât printre consumatori, cât și printre inovatori. Dispozitivele de fitness purtabile, rețelele sociale de sănătate și aplicațiile mobile de sănătate se bazează pe ideea de implicare a consumatorilor. Cu toate acestea, legile și reglementările noastre nu au ținut pasul cu aceste tehnologii noi.’

Scriitor pe machine learning, specialist în domeniul sintezei de imagini umane. Foster head of research content la Metaphysic.ai.