Connect with us

DeepScribe AI може допомогти перекласти стародавні таблиці

Штучний інтелект

DeepScribe AI може допомогти перекласти стародавні таблиці

mm

Дослідники з Орієнтального інституту Чиказького університету та кафедри комп’ютерних наук співпрацювали над розробкою штучного інтелекту, який може допомогти розшифрувати таблиці стародавніх цивілізацій. За даними Phys.org, штучний інтелект називається DeepScribe і був навчений на понад 6 000 анотованих зображень, взятих з архіву фортечних укріплень Персеполя, коли модель буде завершена, вона зможе інтерпретувати неаналізовані таблиці, що полегшить вивчення стародавніх документів.

Експерти, які вивчають стародавні документи, як-от дослідники, які вивчають документи, створені під час Ахеменідської імперії в Персії, повинні перекладати стародавні документи вручну, це довгий процес, який схильний до помилок. Дослідники використовували комп’ютери для допомоги в інтерпретації стародавніх документів з 1990-х років, але комп’ютерні програми, які використовувалися, мали обмежену допомогу. Складні клиноподібні символи, а також трикутна форма таблиць, обмежували корисність комп’ютерних програм.

Алгоритми комп’ютерного зору та архітектури глибокого навчання принесли нові можливості в цій галузі. Санджай Крішнан з кафедри комп’ютерних наук ОІ співпрацював з асоційованим професором ассиріології Сюзанною Паулус, щоб запустити програму DeepScribe. Дослідники керували платформою управління базами даних під назвою OCHRE, яка організовувала дані археологічних розкопок. Метою є створення інструменту штучного інтелекту, який буде якісним і гнучким,能够 інтерпретувати скрипти з різних географічних регіонів і періодів часу.

Як повідомляє Phys.org, Крішнан пояснив, що виклики розпізнавання скрипту, з якими стикаються археологічні дослідники, є суттєво однаковими з викликами, з якими стикаються дослідники комп’ютерного зору:

“З точки зору комп’ютерного зору це справді цікаво, оскільки ці виклики однакові, з якими ми стикаємося. Комп’ютерний зір за останні п’ять років суттєво покращився; десять років тому це було б невизначеним, ми б не добилися такого прогресу. Це хороша задача машинного навчання, оскільки точність тут об’єктивна, у нас є анотований навчальний набір, і ми досить добре знаємо скрипт, що допомагає нам. Це не зовсім невідома задача.”

Навчальний набір у питанні є результатом того, що таблиці та переклади були зроблені за понад 80 років археологічних досліджень в ОІ та Університеті Чикаго, і з них були створені високоякісні анотовані зображення. На даний момент навчальний набір становить приблизно 60 терабайт. Дослідники змогли використовувати цей набір даних і створити словник з понад 100 000 індивідуально ідентифікованих знаків, з яких модель могла вивчити. Коли навчена модель була протестована на невидимому наборі зображень, модель досягла приблизно 80% точності.

Хоча команда дослідників намагається підвищити точність моделі, навіть 80% точності можуть допомогти в процесі транскрипції. За словами Паулус, модель могла б бути використана для ідентифікації або перекладу високореπεїтивних частин документів, дозволяючи експертам витрачати свій час на інтерпретацію більш складних частин документа. Навіть якщо модель не може сказати з певністю, до чого перекладеться символ, вона може надати дослідникам імовірності, що вже ставить їх вперед.

Команда також спрямована на те, щоб зробити DeepScribe інструментом, який інші археологи можуть використовувати в своїх проектах. Наприклад, модель могла б бути перенастроєна на інші клиноподібні мови, або модель могла б робити обґрунтовані оцінки щодо тексту на пошкоджених або незавершених таблицях. Достатньо потужна модель потенційно навіть могла б оцінити вік і походження таблиць або інших артефактів, що зазвичай робиться за допомогою хімічних тестів.

Проект DeepScribe фінансується Центром розвитку передових обчислень (CDAC). Комп’ютерний зір був використаний в інших проектах CDAC, таких як проект, призначений для розпізнавання стилю в творах мистецтва, та проект, розроблений для кількісної оцінки біорізноманіття морських двостулкових. Команда дослідників також сподівається, що їхнє співробітництво призведе до майбутніх співробітництв між кафедрою комп’ютерних наук та ОІ в Університеті Чикаго.

Блогер і програміст з спеціалізацією у темах Machine Learning і Deep Learning. Даніель сподівається допомогти іншим використовувати силу штучного інтелекту для соціальної добробути.