Cybersäkerhet
Återidentifiering av personer genom data från wearable-hälsoenheter och maskinlärande

En ny typ av integritetsattack baserad på data från wearable-hälsoenheter har identifierats av forskare från University of Massachusetts Lowell. Person Re-identification Attack (PRI-Attack) använder HIPAA-kompatibla, offentligt tillgängliga data från hälsoenheter för att fastställa identiteten hos individer från hjärtfrekvens-, andnings- och handgestikulationsdata, bland annat.
Den här sårbarheten möjliggörs i USA av det faktum att Health Insurance Portability and Accountability Act (HIPAA), medan den kräver att medicinska data förblir anonyma, inte betraktar rådata från sensorer (såsom hudtemperatur och accelerometer (ACC)-data) som känsliga för integritet, och därför inte kräver att offentligt delade data av denna typ ska krypteras eller omfattas av samma allmänna skydd som den ger till traditionella former av patientdata, såsom journaler.
Från vektor till visuell
En PRI-Attack använder tolkad bildinformation för att urskilja vanliga mönster som korrelerar till andra typer av hälsodata. En persons hudrespons, till exempel, kan utvärderas från video (photoplethysmography), och korreleras till vad som borde vara helt anonym vektorinformation från hälsövervakningsenheter, såsom wearable-klockor, och andra typer av övervakningsapparater. Photoplethysmography ger hjärtfrekvensdata, som kan paras ihop med icke-identifierad wearable-hjärtdata.
Gestigenkänning är en annan “nyckel” som kan översättas från vektordata till en visuell matris som, igen, tillåter tolkad bild-/videodata att korreleras till uppenbarligen anonym accelerometerinformation i hälsodata.

Handgestinformation från wearable-data. Källa: https://arxiv.org/pdf/2106.11900.pdf
Sensordata som PII
Forskningen, från UML Assistant Professor Mohammad Arif Ul Alam, hävdar att fysiologisk sensordata verkligen kan utgöra PII, och är i själva verket en biologisk analog till de tekniker för browser-fingerprinting som för närvarande anses undergräva nya initiativ för att skydda användarintegritet på webben.
För att testa hypotesen utvecklade forskaren en handgestigenkänning- och lokaliseringsram som tolkar gestdata (inspelad vektorbaserad rörelse) från en wearable-accelerometer, och översätter rörelserna till en visuell post som kan korreleras till rörelser som registrerats av wearable-hälsoenheter.
En Multi-Modal Siamese Neural Network (mm-SNN) konstruerades för att tolka gestinformation klassificerad via Support Vector Machine (SVM). En nätverk hanterar vektordata (tolkad som bildinformation i ett 3D-utrymme) och det andra nätverket hanterar fysiologiska data som registrerats från sensordata.
Testning
Systemet testades på olika dataset, inklusive ett “Gamer’s Fatigue Dataset” som samlades in genom att samla in data på fem volontärstudenter, åldern 19-25, som spelade videospel i sju dagar medan de bar Empatica E4 armband. Klockan har ACC, elektrodermal kontext (EDA), hudtemperatur och photoplethysmography (PPG)-sensorer.
E4 användes också i ett nytt “restaurangdata”-dataset, där åtta volontärer preparerade och åt smörgåsar i tjugo minuter, och i ett “äldre vuxna”-dataset, där 22 äldre försökspersoner, åldern 75-95, utförde 13 manusskrivna aktiviteter medan de bar klockan.
Slutligen använde forskarna det offentligt tillgängliga “Healthy Adults Fatigue Dataset”, som övervakade 28 friska män och kvinnor med en genomsnittsålder på 42 under 1-219 på varandra följande dagar medan de bar en multisensor wearable-enhet som liknade datainsamlingsförmågan hos E4, inklusive en 3-axlig ACC, galvanisk hudrespons-elektrod, temperatur- och fotosensorer, och en barometer.
Resultaten visar att hjärtfrekvens och andningsfrekvens är de säkraste sätten att återidentifiera, med en genomsnittlig noggrannhet på över 66%.

Resultat från testning av PRI-Attack-metoden. Förkortningar: PPG: photoplethysmography; HR: hjärtfrekvens; BR: andningsfrekvens; PVP: BlodvolymPuls (från PPG); IBI: Inter Beat Intervall (från PPG); TC: Tonisk komponent av EDA-signal; Fasisk komponent av EDA-data (Ibid); Temp: Temperatur.
Forskningen slutsats:
‘Medan modern datorseende-teknik kan lätt användas för att lära handgest och motsvarande fysiologisk signal (hjärtfrekvens, andningsfrekvens) från offentliga övervakningskameror, kan dessa stora mängder inspelade videor lätt användas av angriparna för att lära användarspecifika biometri för att avslöja identitet från HIPPA-kompatibla servrar som lagrar wearable-sensordata.’
HIPAA anser att PHR-data är “anonymiserad som standard”
Den amerikanska regeringen har erkänt tillväxten av personliga hälsojournaler (PHR), och klassificerar en sådan journal (inklusive data från hälsoenheter) som ‘en elektronisk journal över en persons hälsoinformation som den enskilda kontrollerar tillgång till och kan ha möjlighet att hantera, spåra och delta i sin egen hälsovård’.
Trots detta har regeringen ingen officiell tillsyn över sådana data, eftersom den har fastställt att det inte innehåller personligt identifierbar information (PII). En rapport från juni 2016 om icke-HIPAA-entiteter från USA:s hälso- och socialdepartement konstaterar:
‘[Stora] gap i policys kring åtkomst, säkerhet och integritet kvarstår, och förvirring råder bland både konsumenter och innovatörer. Wearable fitness-spårare, hälso-sociala medier och mobilhälso-appar bygger på idén om konsumentengagemang. Men våra lagar och regler har inte hållit jämna steg med dessa nya tekniker.’













