ШІ 101
Що таке тест Тюрінга і чому він має значення?

Якщо ви знайомі з штучним інтелектом (AI), ви, безумовно, чули про “тест Тюрінга“. Це був тест, вперше запропонований Аланом Тюрінгом у 1950 році, який був розроблений як абсолютний експеримент щодо того, чи досяг штучний інтелект рівня людської інтелігентності. Концептуально, якщо штучний інтелект能够 пройти цей тест, він досяг рівня інтелігентності, еквівалентної або нерозрізнюваної від людської.
Ми дослідимо, хто такий Алан Тюрінг, що таке тест, чому він має значення, і чому визначення цього тесту може потребувати еволюції.
Хто такий Алан Тюрінг?
Тюрінг – це екцентричний британський математик, який визнаний за свої футуристичні революційні ідеї.
У 1935 році, у віці 22 років, його робота з теорії ймовірності принесла йому стипендію Королівського коледжу Кембриджського університету. Його абстрактні математичні ідеї спонукали його до зовсім іншого напрямку в галузі, яка ще не була винайдена.
У 1936 році Тюрінг опублікував роботу, яка тепер визнана як основа комп’ютерних наук. Саме тут він винайшов концепцію універсальної машини, яка могла розшифрувати та виконувати будь-який набір інструкцій.
У 1939 році Тюрінг була завербована британським урядом до відділу розшифрування кодів. На той час Німеччина використовувала так звану ‘енігму-машина‘ для зашифрування всіх військових та військово-морських сигналів. Тюрінг швидко розробив нову машину (Бомба), яка могла розшифрувати повідомлення Енігми на промисловому рівні. Ця розробка була визнана інструментальною в допомозі у стримуванні агресії нацистської Німеччини.
У 1946 році Тюрінг повернувся до роботи над своєю революційною ідеєю, опублікованою у 1936 році, для розробки електронного комп’ютера, здатного виконувати різні види обчислень. Він створив детальний проект того, що було названо Автоматичною обчислювальною машиною (ACE).
У 1950 році Тюрінг опублікував свою фундаментальну роботу, запитуючи, чи може “Машина думати?“. Ця робота повністю змінила обидві комп’ютерні науки та штучний інтелект.
У 1952 році, після того, як його повідомили поліції молодий чоловік, Тюрінг був засуджений за грубу непристойність через його гомосексуальну діяльність. Через це його доступ до державної безпеки був скасований, а його кар’єра була знищена. Для покарання його було хімічно кастровано.
З його життям, яке було зруйновано, він був пізніше виявлений у своєму будинку його прибиральницею 8 червня 1954 року. Він помер від отруєння ціанідом у попередній день. Напівз’їдений яблуко лежало поруч з його тілом. Вердикт коронера був самогубство.
На щастя, його спадщина продовжує жити.
Що таке тест Тюрінга?
У 1950 році Алан Тюрінг опублікував фундаментальну роботу під назвою “Комп’ютерна техніка та інтелект” у журналі Mind. У цій детальній роботі було поставлено питання “Чи може машина думати?”. Робота пропонувала відмовитися від пошуку визначення того, чи може машина думати, а натомість протестувати машину за допомогою “ігри-імітації”. Ця проста гра проводиться з трьома людьми:
- чоловік (А)
- жінка (Б),
- і допитувач (С) який може бути будь-якої статі.
Концепція гри полягає в тому, що допитувач залишається в кімнаті, окремій від чоловіка (А) та жінки (Б), мета полягає в тому, щоб допитувач визначив, хто є чоловіком, а хто жінкою. У цьому випадку мета чоловіка (А) полягає в тому, щоб обманути допитувача, тоді як жінка (Б) може спробувати допомогти допитувачу (С). Щоб зробити це чесно, не можна використовувати жодних вербальних підказок, а лише друкувані питання та відповіді, надіслані туди й назад. Питання тоді стає: Як допитувач знає, кому довіряти?
Допитувач знає їх лише за мітками X та Y, а в кінці гри він просто заявляє або “X – це А, а Y – це Б” або “X – це Б, а Y – це А”.
Питання тоді стає, якщо ми видалимо чоловіка (А) або жінку (Б) та замінили цю особу на інтелектуальну машину, чи може машина використовувати свій штучний інтелект, щоб обманути допитувача (С) у переконанні, що це чоловік або жінка? Це по суті є суттю тесту Тюрінга.
Іншими словами, якщо ви спілкувалися з системою штучного інтелекту, не знаючи про це, і ви вважали, що “об’єкт” на іншому кінці був людиною, чи могла б система штучного інтелекту обманути вас необмежено?
Чому тест Тюрінга має значення
У роботі Алана Тюрінга він натякнув на те, що він вважав, що тест Тюрінга можна буде пройти. Він заявляє: “до 2000 року я вважаю, що приблизно за п’ятдесят років буде можливо програмувати комп’ютери з пам’яттю близько 109, щоб вони грали в гру-імітацію так добре, що середній допитувач не матиме більше 70 відсотків шансів зробити правильну ідентифікацію після п’яти хвилин допиту.”
Коли дивитися на тест Тюрінга через сучасну лінзу, здається дуже можливим, що система штучного інтелекту зможе обманути людину протягом п’яти хвилин. Скільки разів люди взаємодіють з підтримуючими чат-ботами, не знаючи, чи є чат-бот людиною чи ботом?
Було багато повідомлень про проходження тесту Тюрінга. У 2014 році програма чат-бота під назвою Євген Гостман, яка імітує 13-річного українського хлопчика, як кажуть, пройшла тест Тюрінга на заході, організованому Університетом Редінга. Чат-бот, як кажуть, переконав 33% суддів у Королівському товаристві в Лондоні, що він людина. Тим не менш, критики швидко вказали на недоліки тесту, той факт, що так багато суддів не були переконані, тривалість тесту (лише 5 хвилин), а також відсутність надходження доказів цього досягнення.
У 2018 році система резервування Google Duplex з допомогою помічника Google зробила телефонний дзвінок до салону краси, щоб призначити стрижку. У цьому випадку система штучного інтелекту не представилася як штучний інтелект, а під час телефонної розмови видавала себе за людину, спілкуючись з ресепшністом салону. Після короткої розмови стрижка була успішно призначена, і обидві сторони повісили трубку.
Тим не менш, у добу обробки природної мови (NLP) з її підгалузями природної мови розуміння (NLU) та природної мови інтерпретації (NLI), питання потрібно поставити, якщо машина задає питання та відповідає без повного розуміння контексту того, що вона говорить, чи машина справді інтелектуальна?
Після всього, якщо ви переглядаєте технологію за Ватсоном, комп’ютерної системи, здатної відповідати на питання, поставлені в природній мові, розробленої IBM для перемоги над чемпіонами Джепорді, стає очевидним, що Ватсон зміг перемогти чемпіонів світу, завантаживши великий шматок світових знань через Інтернет, не розуміючи контексту мови. Там було 200 мільйонів сторінок інформації з різних джерел, включно з Вікіпедією. Там був обмеження, яке забороняло Ватсону доступ до Інтернету під час гри, але це є лише незначним обмеженням для штучного інтелекту, який може просто отримати доступ до всіх людських знань до початку гри.
Аналогічно пошуковій системі, ключові слова та посилання були зроблені. Якщо штучний інтелект може досягти цього рівня розуміння, то нам слід вважати, що з сучасними технологіями обманути людину протягом 5 або 10 хвилин просто не встановлює планку достатньо високо.
Чи повинен тест Тюрінга еволюціонувати?
Тест Тюрінга зробив чудову роботу, витримуючи перевірку часу. Тим не менш, штучний інтелект еволюціонував драматично з 1950 року. Кожного разу, коли штучний інтелект досягає подвигу, про який ми стверджували, що тільки люди здатні його зробити, ми встановлюємо планку вище. Це буде лише питання часу, поки штучний інтелект зможе постійно проходити тест Тюрінга, як ми його розуміємо.
Коли дивитися на історію штучного інтелекту, абсолютний вимір того, чи може штучний інтелект досягти людського рівня інтелігентності, майже завжди базується на тому, чи може він перемогти людей у різних іграх. У 1949 році Клод Шеннон опублікував свої думки щодо того, як комп’ютер можна зробити, щоб він грав у шахи, оскільки це вважалося абсолютним вершиною людської інтелігентності.
Це не сталося до 10 лютого 1996 року, після трьохгодинної гри, коли чемпіон світу з шахів Гаррі Каспаров програв першу гру у матчі з шести ігор проти Deep Blue, комп’ютера IBM, здатного оцінювати 200 мільйонів ходів за секунду. Це не зайняло багато часу, поки шахи не були більше вважалися вершиною людської інтелігентності. Шахи були замінені на гру Го, гру, яка виникла в Китаї понад 3000 років тому. Планка для досягнення людського рівня інтелігентності штучним інтелектом була підвищена.
Пропустимо вперед до жовтня 2015 року, AlphaGo зіграла свою першу гру проти чинного триразового чемпіона Європи, пана Фана Хуея. AlphaGo виграла першу гру проти професійного гравця у Го з рахунком 5-0. Го вважається найбільш складною грою у світі з її 10360 можливих ходів. Раптом планка була підвищена знову.
Зрештою, аргумент був такий, що штучний інтелект повинен бути здатний перемогти команди гравців у MMORPG (масові багатокористувацькі онлайн-ігри). OpenAI швидко піднялася до цього виклику, використовуючи глибоке підкріплення навчання.
Через це постійне підвищення планки ми повинні переглянути нове сучасне визначення тесту Тюрінга. Поточний тест може залежати надто сильно від обману та технології чат-бота. Потенційно, з еволюцією робототехніки нам може знадобитися, щоб штучний інтелект міг взаємодіяти та “жити” у нашому реальному світі, а не у грі чи симульованому середовищі з визначеними правилами.
Якщо замість обману робот може взаємодіяти з нами, як будь-яка інша людина, пропонуючи ідеї та рішення, можливо, лише тоді тест Тюрінга буде пройдений. Остання версія тесту Тюрінга буде тоді, коли штучний інтелект підійде до людини та спробує переконати нас, що він самосвідомий.
На цьому етапі ми досягнемо штучного загального інтелекту (AGI). Тоді буде неминучим, що штучний інтелект/робот швидко перевершить нас за інтелектом.












