Лидеры мнений
Почему защита данных станет определяющей технологической проблемой 2024 года
В центре внимания мира технологий AI-чаты, такие как ChatGPT, привлекают внимание, преобразуя отрасли, как мы их знаем. С каждым новым достижением традиционные роли уходят в прошлое – писатели, гуру маркетинга, даже эксперты в области информационных технологий оказываются под угрозой сокращения. Только в июне 2023 года потрясающие 3,900 американцев потеряли свои работы из-за ИИ. Однако это нарушение является лишь предисловием к тому, что ждет впереди.
По мере того, как ИИ продолжает свои завоевания в различных отраслях, растет волна беспокойства по поводу нарушения авторских прав и утечки данных. Вопрос стоит очень остро: как можно обеспечить хрупкий баланс между прогрессом и защитой данных?
Источники беспокойства
Для начала я объясню, как функционируют модели ИИ, такие как ChatGPT. Они генерируют результаты на основе данных, которые они изучают во время обучения. Если модель может создавать текст, который выглядит так, как будто его написал Шекспир в том же старом английском литературном стиле, это означает, что она уже ‘видела’ этот контент ранее во время своего периода подготовки, до выпуска.
Фактически, алгоритмы машинного обучения (ML) за каждой моделью ИИ обучаются на огромных объемах данных, чтобы хорошо выполнять свои функции. Например, существуют системы, которые помогают врачам в диагностике — они анализируют компьютерные томограммы и находят аномалии, которые могут указывать на конкретные заболевания, такие как рак легких. Обычно они обучаются на миллионах медицинских изображений. Без этого они не смогли бы распознавать артефакты на сканах.
По мере того, как растет спрос на инструменты ИИ, технологические гиганты все больше собирают огромные объемы данных для обучения своих моделей. И иногда эти данные включают конфиденциальную информацию о людях и организациях. Кроме того, они часто получаются путем скрапинга миллионов веб-страниц без каких-либо соглашений с владельцами.
Это вызывает общественные опасения по поводу конфиденциальности, прозрачности и контроля над личной информацией в Интернете. Опрос Deloitte 2023 года раскрыл, что большинство респондентов стремятся к большей защите и контролю над тем, как используется их данные. Почти девять из десяти выразили желание просмотреть и удалить собранные данные, и 80% считают, что они заслуживают компенсации за то, что компании получают прибыль от их данных. Только в США граждане стали более беспокойными о том, как используются их данные, и примерно семь из десяти взрослых американцев (71%) разделяют эти опасения, что на 7% больше, чем в 2019 году.
Судебные битвы
Кроме того, некоторые организации ведут эти вопросы в суд. Согласно Fortune, на ноябрь 2023 года было более 100 судебных дел, связанных с ИИ, которые прошли через судебную систему. Эти дела охватывают ряд проблем, включая споры об интеллектуальной собственности, распространение вредоносного контента и случаи дискриминации.
Среди этих дел были иски, поданные художниками, которые обвинили разработчиков глубокого обучения и текст-изображение моделей, таких как Stable Diffusion и Midjourney, в использовании их цифрового искусства для обучения ИИ без согласия. Они утверждали, что компании, стоящие за этими продуктами, собрали миллиарды изображений из Интернета, включая их, чтобы обучить модели генерировать свои собственные изображения.
В декабре 2023 года крупная американская газета The New York Times присоединилась к этим юридическим битвам, подав иск против OpenAI, разработчика процветающего ChatGPT, за нарушение авторских прав. Иск подчеркнул, что миллионы статей, опубликованных медиа-организациями, были использованы для обучения автоматических чат-ботов, которые теперь конкурируют с новостным изданием как источником достоверной информации.
Будущие проблемы
В ответ на эти насущные проблемы правительства всего мира объединяются, чтобы противостоять общественным тревогам. Например, представители двенадцати регулирующих органов во всем мире выдали совместное заявление в августе 2023 года, сосредоточив внимание на скрапинге данных и защите конфиденциальности. Заявление было сделано властями из Аргентины, Австралии, Канады, Колумбии, Гонконга, Джерси, Мексики, Марокко, Новой Зеландии, Норвегии, Швейцарии и Великобритании. Тем временем в Калифорнии был подписан закон Delete Act, направленный на данные брокеров и устанавливающий дополнительные правила сбора и управления личными данными.
Несмотря на согласованные усилия, я предвижу, что проблемы конфиденциальности и владения данными сохранят свою актуальность в общественной дискуссии на протяжении 2024 года и далее. Кроме того, рост интеллектуальных-property судебных дел сигнализирует лишь о вершине айсберга. Мы, вероятно, станем свидетелями всплеска дел, сосредоточенных на точности и безопасности данных, особенно на фоне все более распространяющихся глубоких фейков и дезинформации.
Хотя как государственные, так и деловые секторы должны удвоить свои усилия, осторожный подход имеет решающее значение. Несмотря на растущие опасения, стоит отметить, что открытые данные продолжают играть важную роль в продвижении исследований и разработок. Возьмите, к примеру, бесценную роль публичного доступа к медицинским записям во время кризиса COVID-19, ускорившего разработку спасающих жизни медицинских прорывов, таких как вакцины, разработанные Moderna и Pfizer.
Важность открытых данных подчеркивается историческим примером проекта «Геном человека» в США, где общественный обмен генными данными преобразовал исследования генетики. Аналогичным образом, ИИ, анализирующий и обучающийся на данных, может принести пользу обществу, от категоризации генетических мутаций до решения насущных проблем, таких как изменение климата.
В бизнесе данные, собранные веб-скраперами, бесценны для рыночной разведки, отслеживания конкурентов и распознавания доминирующих тенденций. Если веб-скрапинг станет более ограниченным, компании могут столкнуться с ограниченным доступом к важным данным для принятия обоснованных решений, что потенциально может привести к снижению конкуренции и прозрачности в ценообразовании, препятствовать инновациям и обеспечить посредственный пользовательский опыт из-за более медленного и менее точного обновления данных.
Однако среди этих растущих проблем существуют пути, чтобы решить их напрямую. Я возлагаю свою надежду на силу прокси, чтобы преодолеть эти бурные воды. Эти инновационные технологии маскируют исходные IP-адреса пользователей, направляя их онлайн-активность через альтернативные серверы. Они не только укрепляют безопасность данных, но и становятся незаменимыми инструментами в гармонизации технологического прогресса с защитой индивидуальных свобод.












