Лідери думок
Чому захист даних буде визначальною технологічною проблемою 2024 року
У центрі уваги світу технологій штучні інтелектні чат-боти, такі як ChatGPT, привертають увагу, змінюючи галузі, як ми їх знаємо. З кожним кроком традиційні ролі зникають – письменники, маркетингові експерти, навіть спеціалісти з інформаційних технологій опиняються під загрозою звільнення. У червні 2023 року лише в США понад 3 900 американців втратили свої роботи через штучний інтелект. Однак, ця зміна є лише передмовою до того, що чекає нас попереду.
Оскільки штучний інтелект продовжує свої завоювання в різних галузях, зростає хвиля занепокоєння щодо порушення авторських прав і порушення конфіденційності. Постає питання: як можна забезпечити деликатний баланс між прогресом і конфіденційністю?
Іскри занепокоєння
Для початку поясню, як функціонують моделі штучного інтелекту, такі як ChatGPT. Вони генерують результати на основі даних, які вони вивчають під час навчання. Якщо модель може створити текст, який виглядає так, як ніби його написав Шекспір у старому англійському літературному стилі, це означає, що вона вже “бачила” цей контент раніше під час підготовчого періоду, до свого випуску.
Фактично, алгоритми машинного навчання (ML) за кожною моделлю штучного інтелекту навчаються на величезних обсягах даних, щоб добре виконувати свої функції. Наприклад, існують системи, які допомагають лікарям у діагностиці – вони аналізують комп’ютерні томографію і виявляють аномалії, які можуть вказувати на конкретні захворювання, такі як рак легенів. Вони зазвичай навчаються на мільйонах медичних зображень. Без цього вони не могли б розпізнавати артефакти на зображеннях.
Оскільки попит на інструменти штучного інтелекту зростає експоненційно, технологічні гіганти все частіше збирають величезні обсяги даних для навчання своїх моделей. І іноді ці дані включають конфіденційну інформацію про людей і організації. Крім того, ці дані часто отримуються шляхом скрапінгу мільйонів веб-сторінок без будь-яких угод з власниками.
Це викликає публічне занепокоєння щодо конфіденційності, прозорості та контролю над особистою інформацією в Інтернеті. Опитування Deloitte 2023 року показало, що більшість респондентів бажають більшої захисту та контролю над тим, як використовується їхня інформація. Практично дев’ять із десяти висловили бажання переглянути та видалити зібрані дані, а 80% вважають, що їм повинні виплатити компенсацію за те, що компанії заробляють на їхніх даних. У США лише громадяни стали більш занепокоєними щодо того, як використовується їхня інформація, близько семи з десяти дорослих американців (71%) поділилися цими занепокоєннями, що на 7% більше, ніж у 2019 році.
Юридичні битви
Крім того, деякі організації звертаються до суду щодо цих питань. За даними Fortune, станом на листопад 2023 року існувало понад 100 судових справ, пов’язаних зі штучним інтелектом, які проходили через юридичну систему. Ці справи стосуються різних питань, включаючи суперечки щодо інтелектуальної власності, поширення шкідливого контенту та випадків дискримінації.
Серед цих справ були судові позови, подані художниками, які звинуватили розробників глибокого навчання та моделей текст-образ, таких як Stable Diffusion і Midjourney, у використанні їхніх цифрових робіт у навчанні штучного інтелекту без згоди. Вони ствердили, що компанії, що стоять за цими продуктами, зібрали мільярди зображень з Інтернету, включаючи їхні, щоб навчити моделі генерувати свої власні зображення.
У грудні 2023 року велика американська газета The New York Times вступила у ці юридичні битви, подавши судовий позов проти OpenAI, розробника популярного ChatGPT, за порушення авторських прав. Судовий позов підкреслив, що мільйони статей, опублікованих медіа-організаціями, були використані для навчання автоматизованих чат-ботів, які тепер конкурують з новинним виданням як джерелом надійної інформації.
Майбутні проблеми
У відповідь на ці нагальні проблеми уряди всього світу об’єднуються, щоб вирішити публічні занепокоєння. Наприклад, представники від дванадцяти регуляторних органів у світі видали спільну заяву у серпні 2023 року, яка зосереджена на скрапінгу даних та захисті конфіденційності. Ця заява була зроблена органами влади Аргентини, Австралії, Канади, Колумбії, Гонконгу, Джерсі, Мексики, Марокко, Нової Зеландії, Норвегії, Швейцарії та Великої Британії. Тим часом у Каліфорнії був підписаний закон про видалення даних, який націлений на брокерів даних та встановлює додаткові правила збору та управління особистими даними.
Незважаючи на зусилля, я передбачаю, що питання конфіденційності та власності даних збережуть свою актуальність у публічній дискусії протягом 2024 року та далі. Крім того, зростання кількості судових справ щодо інтелектуальної власності свідчить лише про початок проблеми. Ми, ймовірно, побачимо зростання випадків, пов’язаних з точністю даних та безпекою, особливо серед поширення глибоких фейків та дезінформації.
Хоча урядові та бізнес-сектори повинні подвоїти свої зусилля, обачний підхід є необхідним. Незважаючи на зростаючі занепокоєння, варто відзначити, що відкриті дані продовжують відігравати ключову роль у розвитку досліджень та прогресу. Наприклад, публічний доступ до медичних записів під час кризи COVID-19 прискорив розвиток медичних проривів, таких як вакцини, розроблені компаніями Moderna та Pfizer.
Важливість відкритих даних підкреслюється історичним прикладом проекту “Людський геном” у США, де публічне подання генетичних даних революціонізувало дослідження генетики. Аналогічним чином, штучний інтелект, який аналізує та вивчає дані, може принести користь суспільству, від категоризації генетичних мутацій до вирішення нагальних проблем, таких як зміна клімату.
У бізнесі дані, зібрані веб-скраперами, мають величезну цінність для ринкової розвідки, відстежування конкурентів та визначення домінуючих тенденцій. Якщо веб-скрапінг стане більш обмеженим, компанії можуть зіткнутися з обмеженим доступом до важливих даних для прийняття інформованих рішень, що потенційно може привести до зниження конкуренції та прозорості у цінах, перешкоджання інноваціям та погіршення користувацького досвіду через повільніше та менш точне оновлення даних.
Однак серед цих зростаючих проблем існують шляхи для їх вирішення. Я покладаю надію на силу проксі для навігації у цих бурхливих водах. Ці інноваційні технології маскують оригінальні IP-адреси користувачів, направляючи їхню онлайн-активність через альтернативні сервери. Не лише вони посилюють безпеку даних, але також стають незамінними інструментами у гармонізуванні технологічного прогресу з захистом індивідуальних свобод.












