Искусственный интеллект
Правительство Великобритании собирает конфиденциальные данные о здоровье для борьбы с COVID-19

Правительство Великобритании завербовало Palantir, американская компания по обработке больших данных, основанная Питером Тилем, и Преподавательский Состав, стартап, который специализируется на профессиональной стратегии обработки данных, программном обеспечении и обучении навыкам борьбы с распространением COVID-19. Хотя это может вызвать обеспокоенность по поводу вопросов конфиденциальности, следует отметить, что сбор больших данных, включая частные данные о здоровье населения в целом, необходим правительствам для принятия обоснованных решений о том, как остановить распространение COVID-19, определить, какие члены общества наиболее уязвимых, и узнайте, какие варианты лечения являются наиболее эффективными.
Palantir понимает, что есть основания для беспокойства о конфиденциальности пользователей, поэтому они выпустили обзор своих передовых методов использования данных во время кризиса. Палантир заявил: «Знание того, как грамотно применять науку о данных к правильному набору проблем, послужит критически важным активом для дополнения и улучшения комплексных стратегий борьбы с этим кризисом общественного здравоохранения»., это бесспорно верно.
Они также заявили следующее, что является признанием ненадежного риска, с которым общество сталкивается при доступе к этому типу обмена большими данными: «Богатые источники данных часто вдохновляют на непредвиденные — даже мошеннические — анализы. Установите и применяйте коллективные основные правила в отношении того, как следует использовать данные и кто должен иметь какие уровни доступа к данным и их использования. Неправильное использование данных может привести к недоверию общественности к институтам. Даже самые благонамеренные решатели проблем иногда не замечают рисков, связанных с решениями, которые они создают».
Какие данные собирает правительство Великобритании? В настоящее время соответствующие данные необходимы для решения проблемы COVID-19. Как сообщает ОпекунТекущие анонимные данные включают пол, защищенную информацию о состоянии здоровья, результаты тестов на Covid-19, содержание звонков людей в Национальную службу здравоохранения (NHS), линию медицинской консультации 111 и клиническую информацию о тех, кто находится в реанимации.
Хотя конфиденциальность данных должна быть анонимной, чтобы ее нельзя было отследить до конкретного человека, нам нужны эти данные для анализа систем машинного обучения. Системы глубокого обучения используют этот тип больших данных для выявления закономерностей и точек данных, которые люди упускают из виду. Такая тривиальная вещь, как пол, может раскрыть важные идеи. Примером может служить то, что мужчины, страдающие диабетом, являются более уязвимым сегментом населения, чем женщины, страдающие диабетом. Определенные варианты лечения могут лучше работать для разных возрастных групп, пола, генетического происхождения и т. д.
Вместо того, чтобы подвергаться критике, мы должны дать правительству Великобритании презумпцию невиновности. Этот тип сбора данных и усилия по обмену данными всеми аспектами системы здравоохранения должны поддерживаться в долгосрочной перспективе. Это может послужить нам в будущем как для борьбы с грядущими пандемиями, так и с обычными проблемами со здоровьем, раком и другими физиологическими недугами.
В настоящее время проект использует «псевдономер NHS» для перекрестного сопоставления больших наборов данных, включая основной индекс пациентов, существующий ресурс NHS, который использует «данные социального маркетинга» для сегментации британского населения на различные «типы» на уровне домохозяйства. Хотя еще предстоит выяснить, является ли это наиболее эффективным методом распространения данных, у нас есть опасения по поводу некоторых аспектов процесса сбора данных.
В настоящее время собираются данные о местоположении телефона. Хотя сведение данных к почтовому индексу может быть целесообразным, нет необходимости напрямую указывать точный источник телефонного звонка, поскольку эта информация не может быть анонимизирована или рандомизирована. Это может привести к тому, что больные люди будут бояться пользоваться телефонной линией, что может привести к ненужной смерти тех, кто больше всего нуждается в помощи.
Граждане Великобритании должны быть встревожены точкой данных о местоположении телефона, которая не нужна для эффективного обучения алгоритма глубокого обучения, но может быть непосредственно использована для отслеживания человека.
Если правительство Великобритании продолжит собирать такие большие данные и устранять описанные выше проблемы, а также другие проблемы с конфиденциальностью/правами пользователей, о которых мы не знаем, Соединенному Королевству может быть целесообразно заручиться поддержкой. Европейского Союза, чтобы собрать аналогичные точки данных из их соответствующих популяций. В конце концов, глубокое обучение работает так: чем больше данных собирается, тем эффективнее алгоритм. Это имело бы большое значение для объединения стран после закрытия международных границ.
Мы призываем к тщательному анализу и помощи некоммерческой организации, чтобы гарантировать, что правительство Великобритании не злоупотребит информацией, которую оно собирает. Тем не менее, следует признать, что это важный шаг на пути к борьбе с COVID-19.












