Connect with us

Переидентификация людей через носимые данные о здоровье и машинное обучение

Кибербезопасность

Переидентификация людей через носимые данные о здоровье и машинное обучение

mm

Новый тип атаки на конфиденциальность, основанный на данных о здоровье от носимых устройств, был выявлен исследователями из Университета Массачусетса в Лоуэлле. Атака переидентификации человека (PRI-Attack) использует данные, соответствующие требованиям HIPAA, и публично доступные данные от носимых устройств для здоровья, чтобы установить личность людей по данным о частоте сердечных сокращений, дыхании и жестах рук, среди прочего.

Уязвимость становится возможной в США благодаря тому, что Закон о переносимости и подотчетности страхования здоровья (HIPAA), хотя и требует, чтобы медицинские данные оставались анонимными, не считает сырые данные с датчиков (такие как температура кожи и данные акселерометра) конфиденциальными, и поэтому не требует, чтобы публично доступные данные этого типа были зашифрованы или подвергались тем же общим защитным мерам, что и традиционные формы данных пациентов, такие как медицинские записи.

От вектора к визуальному

Атака PRI-Attack использует интерпретированные изображения, чтобы определить общие закономерности, которые коррелируют с другими типами данных о здоровье. Например, реакция кожи человека может быть оценена по видео (фотоплетизмография), и коррелирована с тем, что должно быть совершенно анонимной векторной информацией от устройств для мониторинга здоровья, таких как носимые часы, и других видов мониторинговых приборов. Фотоплетизмография дает данные о частоте сердечных сокращений, которые можно сопоставить с неидентифицированными данными о сердечной деятельности от носимых устройств.

Распознавание жестов является еще одним “ключом”, который можно тривиально перевести из векторных данных в визуальную матрицу, что снова позволяет интерпретировать изображения/видео и коррелировать их с якобы анонимными данными акселерометра в данных о здоровье.

Информация о жестах рук из носимых данных.

Информация о жестах рук из носимых данных. Source: https://arxiv.org/pdf/2106.11900.pdf

Данные с датчиков как личная идентифицирующая информация

Исследование, проведенное ассистентом профессора Мохаммада Арифа Ула Алама из Университета Массачусетса в Лоуэлле, утверждает, что физиологические данные с датчиков могут действительно составлять личную идентифицирующую информацию, и по сути являются биологическим аналогом методов отслеживания браузера, которые в настоящее время считаются подрывающими новые инициативы по защите конфиденциальности пользователей в Интернете.

Чтобы проверить эту гипотезу, исследователь разработал框架 для распознавания и локализации жестов рук, который интерпретирует данные о жестах (записанные векторные движения) от носимого акселерометра и переводит движения в визуальную запись, которую можно коррелировать с движениями, записанными носимыми устройствами для здоровья.

Была создана многомодальная связанная нейронная сеть (mm-SNN) для интерпретации информации о жестах, классифицированной с помощью машины опорных векторов (SVM). Одна сеть работает с векторной информацией (интерпретируемой как изображение в 3D-пространстве), а вторая сеть работает с физиологическими данными, записанными с помощью датчиков.

Тестирование

Система была протестирована на различных наборах данных, включая набор данных “Усталость геймеров”, полученный путем сбора данных у пяти добровольцев-студентов в возрасте от 19 до 25 лет, которые играли в видеоигры в течение семи дней, носив наручный часы Empatica E4 Empatica E4. Часы оснащены акселерометром, электродермальным контекстом (EDA), температурой кожи и фотоплетизмографией (PPG).

E4 также использовался в новом наборе данных “ресторан”, где восемь добровольцев готовили и ели сэндвичи в течение двадцати минут, и в наборе данных “пожилые люди”, где 22 пожилых субъекта в возрасте от 75 до 95 лет выполняли 13 сценариев действий, носив часы.

Наконец, исследователи использовали публично доступный набор данных “Усталость здоровых взрослых”, который отслеживал 28 здоровых мужчин и женщин со средним возрастом 42 года в течение 1-219 последовательных дней, носив многосенсорное носимое устройство, аналогичное по возможностям сбора данных устройству E4, включая 3-осевой акселерометр, электрод дляSkin Response, температуру и фото датчики, и барометр.

Результаты показывают, что частота сердечных сокращений и дыхания являются наиболее надежными методами для переидентификации, с точностью более 66%.

Результаты тестирования методологии атаки PRI-Attack. PPG: фотоплетизмография; HR: частота сердечных сокращений; BR: частота дыхания; PVP: объем пульса крови (получено из PPG); IBI: интервал между ударами (получено из PPG); TC: тонический компонент сигнала EDA; Фазовый компонент данных EDA (Ibid); Temp: температура.

Результаты тестирования методологии атаки PRI-Attack. PPG: фотоплетизмография; HR: частота сердечных сокращений; BR: частота дыхания; PVP: объем пульса крови (получено из PPG); IBI: интервал между ударами (получено из PPG); TC: тонический компонент сигнала EDA; Фазовый компонент данных EDA (Ibid); Temp: температура.

Исследование заключает:

‘Хотя современные технологии компьютерного зрения можно легко использовать для изучения жестов рук и соответствующих физиологических сигналов (частота сердечных сокращений, частота дыхания) из публичных систем видеонаблюдения, эти огромные объемы записанных видео можно легко использовать атакующими для изучения биометрических данных пользователей и раскрытия их личности из данных, соответствующих требованиям HIPAA, хранящихся на сервере носимых устройств для здоровья.’

HIPAA считает данные электронных записей здоровья “анонимными по умолчанию”

Правительство США признало рост личных записей здоровья (PHR) и классифицирует такую запись (включая данные от носимых устройств для здоровья) как ‘электронную запись информации о здоровье человека, которой человек контролирует доступ к информации и может иметь возможность управлять, отслеживать и участвовать в своем собственном здравоохранении’.

Тем не менее, поскольку это явление из частного сектора, правительство признает, что не осуществляет официальный надзор за такими данными, установив, что они не содержат личной идентифицирующей информации (PII). Отчет от июня 2016 года о не покрываемых сущностях HIPAA от Министерства здравоохранения и социальных служб США гласит:

‘[Большие] пробелы в политике доступа, безопасности и конфиденциальности продолжают существовать, и путаница сохраняется как среди потребителей, так и среди инноваторов. Носимые фитнес-трекеры, социальные сети здравоохранения и мобильные приложения для здоровья основаны на идее вовлечения потребителей. Однако наши законы и правила не поспевают за этими новыми технологиями.’

Писатель о машинном обучении, специалист в области синтеза человеческих изображений. Бывший руководитель исследовательского контента в Metaphysic.ai.