Connect with us

DeepScribe AI może pomóc w tłumaczeniu starożytnych tablic

Sztuczna inteligencja

DeepScribe AI może pomóc w tłumaczeniu starożytnych tablic

mm

Naukowcy z Oriental Institute i Wydziału Informatyki Uniwersytetu Chicagowskiego współpracowali przy projektowaniu sztucznej inteligencji, która może pomóc w odszyfrowaniu tablic ze starożytnych cywilizacji. Według Phys.org, sztuczna inteligencja nosi nazwę DeepScribe i została wyszkolona na ponad 6 000 opatrzonych adnotacjami obrazach pobranych z Archiwum Fortyfikacji Persepolis, kiedy model zostanie ukończony, będzie w stanie interpretować niewydane tabletki, co ułatwi badanie starożytnych dokumentów.

Eksperci, którzy badają starożytne dokumenty, jak na przykład naukowcy, którzy badają dokumenty stworzone podczas imperium Achemenidów w Persji, muszą tłumaczyć starożytne dokumenty ręcznie, co jest długim procesem podatnym na błędy. Naukowcy od lat 90. używali komputerów do pomocy w interpretowaniu starożytnych dokumentów, ale programy komputerowe, które były używane, były ograniczone. Złożone znaki klinowe, a także trójwymiarowy kształt tabliczek, ograniczały użyteczność programów komputerowych.

Algoritmy komputerowego widzenia i architektury głębokiego uczenia się przyniosły nowe możliwości w tym polu. Sanjay Krishnan z Wydziału Informatyki w OI współpracował z associate profesorem asyrologii Susanne Paulus, aby uruchomić program DeepScribe. Naukowcy nadzorowali platformę zarządzania bazą danych o nazwie OCHRE, która organizowała dane z wykopalisk archeologicznych. Celem jest stworzenie narzędzia sztucznej inteligencji, które jest zarówno obszernym, jak i elastycznym, w stanie interpretować pisma z różnych regionów geograficznych i okresów czasowych.

Jak donosi Phys.org, Krishnan wyjaśnił, że wyzwania rozpoznawania pisma, z którymi mierzą się badacze archeologiczni, są podstawowo tymi samymi wyzwaniami, z którymi mierzą się naukowcy komputerowego widzenia:

“Z perspektywy komputerowego widzenia jest to naprawdę interesujące, ponieważ są to te same wyzwania, z którymi mamy do czynienia. Komputerowe widzenie w ciągu ostatnich pięciu lat znacznie się poprawiło; dziesięć lat temu byłoby to niepewne, nie doszlibyśmy tak daleko. To jest dobry problem uczenia maszynowego, ponieważ dokładność jest obiektywna, mamy oznaczony zestaw szkoleniowy i dobrze rozumiemy pismo, co nam pomaga. To nie jest zupełnie nieznany problem.”

Zestaw szkoleniowy w question jest wynikiem pobrania tabliczek i tłumaczeń, z ponad 80 lat badań archeologicznych przeprowadzonych w OI i U Chicago, a następnie utworzenia z nich wysokiej rozdzielczości obrazów z adnotacjami. Obecnie zestaw danych szkoleniowych ma rozmiar około 60 terabajtów. Naukowcy byli w stanie wykorzystać zestaw danych i utworzyć słownik ponad 100 000 indywidualnie zidentyfikowanych znaków, z których model mógł się uczyć. Kiedy wytrenowany model został przetestowany na nieznanym zestawie obrazów, model osiągnął około 80% dokładności.

Chociaż zespół naukowców próbuje zwiększyć dokładność modelu, nawet 80% dokładności może pomóc w procesie transkrypcji. Według Paulus, model może być użyty do identyfikacji lub tłumaczenia bardzo powtarzalnych części dokumentów, pozwalając ekspertom spędzać czas na interpretowaniu trudniejszych części dokumentu. Nawet jeśli model nie może powiedzieć z pewnością, co symbol tłumaczy, może dać naukowcom prawdopodobieństwa, co już daje im przewagę.

Zespół również stara się uczynić DeepScribe narzędziem, które inne zespoły archeologiczne mogą wykorzystać w swoich projektach. Na przykład, model może być przeszkolony na innych językach klinowych, lub model może dokonywać świadomych szacunków dotyczących tekstu na uszkodzonych lub niekompletnych tabliczkach. Wystarczająco wytrzymały model może potencjalnie nawet oszacować wiek i pochodzenie tabliczek lub innych artefaktów, co zwykle jest robione za pomocą testów chemicznych.

Projekt DeepScribe jest finansowany przez Centre for the Development of Advanced Computing (CDAC). Komputerowe widzenie zostało wykorzystane w innych projektach finansowanych przez CDAC, takich jak projekt mający na celu rozpoznanie stylu w dziełach sztuki i projekt zaprojektowany w celu ilościowego określenia różnorodności biologicznej w mięczakach morskich. Zespół naukowców również liczy, że ich współpraca doprowadzi do przyszłych współprac między Wydziałem Informatyki a OI na Uniwersytecie Chicagowskim.

Blogger i programista ze specjalnościami w Machine Learning i Deep Learning tematy. Daniel liczy, że pomoże innym wykorzystać moc sztucznej inteligencji dla dobra społecznego.