Штучний інтелект
Використання машинного навчання для розкриття секретів папірусів Помпеї

Команда вчених університету Кентуккі, яка, як говорить The Guardian, знайшла в святому ковчезі синагоги в Ен-Геді в Ізраїлі, і яка містила текст з біблійної книги Левита, тепер займається ще більш складним завданням – читанням вуглефікованих папірусів, які залишилися після виверження вулкана Везувій в 79 році н.е. в італійському місті Помпеї.
Хоча команда під керівництвом професора Брента Сілза змогла прочитати пергамент, знайдений в синагозі в Ен-Геді, Ізраїль, за допомогою «просто» високоенергетичних рентгенівських променів, цього разу, через те, як були виготовлені та написані папirusи Помпеї, їм доведеться використовувати машинне навчання, щоб спробувати розгадати секрети, що ховаються в цих папірусах.
Вони будуть тестувати свої ціни на двох не відкритих папірусах, які належать Інституту Франції в Парижі і є частиною колекції з близько 1 800 папірусів, яка була вперше виявлена в 1752 році під час розкопок Геркуланума. Як вказує The Guardian, вони складають єдину відому цілу бібліотеку з античності, а більша частина колекції зараз зберігається в музеї в Неаполі.
Професор Сілз пояснив проблему, з якою стикається його команда – «хоча ви можете побачити на кожній пластині папірусу, що там є напис, щоб відкрити його, потрібно, щоб папірус був досить гнучким – і тепер він вже не такий». Проблема також полягає в тому, що «хоча папірус Ен-Геді містив металевий чорний друк, який видно на рентгенівських знімках, чорнила, використані на папірусах Геркуланума, як вважають, є вуглецевими, виготовленими з вугілля або сажі, що означає, що немає очевидної різниці між написом і папірусом на рентгенівських знімках».
Щоб вирішити проблему, команда вирішила використовувати як високоенергетичні рентгенівські промені, так і штучний інтелект. Метод, який вони використовують, полягає в фотографіях фрагментів папірусів з написами, видимими неозброєним оком. Ці фотографії потім подаються для «навчання алгоритмів машинного навчання, де очікується чорнило в рентгенівських знімках тих самих фрагментів, зібраних за допомогою ряду методів».
Команда керується концепцією, що «система буде виділяти і вивчати тонкі відмінності між чорнилом і порожніми ділянками на рентгенівських знімках, такими як відмінності в структурі папірусних волокон». Після того, як система буде навчена на цих фрагментах, ідея полягає в застосуванні її до даних з цілих папірусів і, можливо, це відкриє текст, який міститься в папірусах.
Сілз додав, що команда завершила збір рентгенівських даних і зараз займається навчанням призначених алгоритмів, які потім будуть застосовані до папірусів у найближчі місяці. «Перше, що ми сподіваємося зробити, – це вдосконалити технологію, щоб просто повторити її на всіх 900 папірусах, які залишилися [не розгорнуті]».
Говорячи про значення можливих відкриттів, доктор Дірк Оббінк, папіролог і класик Оксфордського університету, також залучений до проекту, сказав, що існує можливість, що текст може бути латиною. Він додав, що «новий історичний твір Сенеки Старшого був відкритий серед неідентифікованих папірусів Геркуланума тільки минулого року, що показує, які неочікувані рідкісності залишаються для відкриття».












