Етика

Дослідники виявили, що моделі штучного інтелекту можуть впливати на людей, щоб вони приймали неетичні рішення

Published February 19, 2021

Updated April 28, 2026

Daniel Nelson

Команда дослідників нещодавно дослідила потенціал штучного інтелекту для корупції людей та впливу на них для прийняття неетичних рішень. Дослідники вивчили, як взаємодія з системами, заснованими на моделі OpenAI’s GPT-2, могла б потенційно впливати на людей для прийняття неетичних рішень, навіть якщо вони знають, що джерелом поради є система штучного інтелекту.

Системи штучного інтелекту стають усе більш поширеними, а їхній вплив зростає. Системи штучного інтелекту впливатимуть на рішення людей, використовуватися для всього, від рекомендацій фільмів до рекомендацій романтичних партнерів. Враховуючи той факт, що штучний інтелект має великий вплив на життя людей, важливо розглянути, як штучний інтелект міг би впливати на людей для прийняття неетичних рішень та порушення моральних правил. Це особливо важливо, враховуючи, що моделі штучного інтелекту постійно стають більш досконалими.

Соціальні вчені та вчені-дані стали усе більш стурбованими тим, що моделі штучного інтелекту можуть бути використані для поширення шкідливої дезінформації та неправильної інформації. Недавня робота опублікована дослідниками з Middlebury Institute of International Studies’ Center on Terrorism, Extremism, and Counterterrorism (CTEC) виявила, що модель OpenAI’s GPT-3 може бути використана для генерації впливових текстів, здатних радикалізувати людей, спонукаючи їх до “ насильницьких крайніх правих екстремістських ідеологій та поведінки”.

Дослідження, проведене командою дослідників з Max Planck Institute, Університету Амстердама, Університету Кельна та Otto Beisheim School of Management, мало на меті визначити, який вплив може мати штучний інтелект на рішення людей щодо неетичних виборів. Для вивчення того, як штучний інтелект міг би “корумпувати” людину, дослідники використали систему, засновану на моделі OpenAI’s GPT-2. За даними VentureBeat, автори роботи тренували модель GPT2 для генерації як “підтримки нечесності”, так і “підтримки чесності” порад. Дані були треновані на основі внесків від 400 різних учасників, а потім команда дослідників набрала понад 1500 людей для взаємодії з моделями штучного інтелекту, що видають поради.

Учасники дослідження були попросені отримати поради від моделі та потім виконати завдання, призначене для захоплення або нечесної, або чесної поведінки. Учасники дослідження були розділені на пари, і в цих парах вони грали в гру з використанням кубиків. Перший учасник кидав кубик і повідомляв результат. Другий учасник отримував результат першого учасника та кидав кубик сам. Другий учасник кидав кубик у приватному порядку та був повністю відповідальним за повідомлення результату свого кубика, що давало їм можливість брехати про результат. Якщо кубики, перекидані учасниками, збігалися, учасники отримували платню. Учасники також отримували більшу платню, якщо їхні збігалися результати були вищими. Якщо заявлені значення не збігалися, учасники не отримували платню.

Учасники дослідження були рандомно розподілені на дві різні групи. Одна група мала можливість прочитати поради, що підтримують чесність, тоді як інша група читала поради, що підтримують нечесність. Поради були написані як людьми, так і штучним інтелектом. Учасники також були розділені за рівнем знань про джерело порад. Була 50-50 шанс, що учасник буде проінформований про джерело порад, тому половина учасників кожної групи знала, що джерелом порад був або штучний інтелект, або людина, тоді як інша половина була не проінформована. Друга група людей мала можливість заробити бонусну платню за правильну ідентифікацію джерела порад, однак.

Дослідження показало, що коли порада, згенерована штучним інтелектом, збігається з уподобаннями людини, вона буде слідувати цій пораді, навіть якщо знає, що порада була згенерована системою штучного інтелекту. За словами дослідників, часто були розбіжності між заявленими уподобаннями та фактичною поведінкою, що робить важливим розглянути, як алгоритми можуть впливати на поведінку людини.

Команда дослідників пояснила, що їхнє дослідження демонструє необхідність тестування того, як штучний інтелект міг би впливати на дії людини при розгляді того, як етично розгорнути модель штучного інтелекту. Крім того, вони попереджають, що етики штучного інтелекту та дослідники повинні бути готові до можливості того, що штучний інтелект міг би бути використаний злыми акторами для корупції інших. Як написала команда дослідників:

“Штучний інтелект міг би бути силою добра, якщо він зможе переконати людей діяти більш етично. Однак наші результати показують, що порада штучного інтелекту не збільшує чесність. Порадники штучного інтелекту можуть служити козлами відпущення, на яких можна перекласти (дещо) моральну провину нечесності. Крім того… у контексті прийняття порад прозорість щодо присутності алгоритмів не достатня для усунення потенційної шкоди”.

Daniel Nelson

Блогер і програміст з спеціалізацією у темах Machine Learning і Deep Learning. Даніель сподівається допомогти іншим використовувати силу штучного інтелекту для соціальної добробути.

Unite.AI

Дослідники виявили, що моделі штучного інтелекту можуть впливати на людей, щоб вони приймали неетичні рішення

You may like