Umělá inteligence
DeepScribe AI může pomoci přeložit starověké tabulky

Vědci z Oriental Institute a Department of Computer Science na University of Chicago spolupracovali na návrhu umělé inteligence, která může pomoci dešifrovat tabulky ze starověkých civilizací. Podle Phys.org, umělé inteligence se jmenuje DeepScribe a byla vyškolena na více než 6 000 označených obrázků z Persepolis Fortification Archive, když bude dokončena, model umělé inteligence bude schopen interpretovat neanalyzované tabulky, což usnadní studium starověkých dokumentů.
Odborníci, kteří studují starověké dokumenty, jako jsou vědci, kteří studují dokumenty vytvořené během Achaemenid Empire v Persii, potřebují přeložit starověké dokumenty ručně, což je dlouhý proces, který je náchylný k chybám. Vědci používají počítače k pomoci při interpretaci starověkých dokumentů od 90. let, ale počítačové programy, které byly použity, měly omezenou pomoc. Komplexní klínové znaky, stejně jako trojrozměrný tvar tablet, omezily, jak užitečné mohli být počítačové programy.
Algoritmy počítačového vidění a architektury hlubokého učení přinesly nové možnosti do tohoto oboru. Sanjay Krishnan z Department of Computer Science na OI spolupracoval s asociátorem profesorem asyriologie Susanne Paulus, aby spustil program DeepScribe. Vědci dohlíželi na platformu pro správu databáze nazvanou OCHRE, která organizovala data z archeologických vykopávek. Cílem je vytvořit nástroj umělé inteligence, který je både rozsáhlý a flexibilní, schopný interpretovat skripty z různých geografických regionů a časových období.
Jak uvádí Phys.org, Krishnan vysvětlil, že výzvy spojené s rozpoznáním skriptu, kterým čelí archeologičtí výzkumníci, jsou v podstatě stejné výzvy, kterým čelí výzkumníci počítačového vidění:
“Z pohledu počítačového vidění je to opravdu zajímavé, protože tyto jsou stejné výzvy, kterým čelíme. Počítačové vidění se za posledních pět let výrazně zlepšilo; před deseti lety by to bylo nejasné, nedostali bychom se tak daleko. Je to dobrý problém strojového učení, protože přesnost je objektivní, máme označený tréninkový soubor a rozumíme skriptu poměrně dobře a to nám pomáhá. Není to úplně neznámý problém.”
Tréninkový soubor v otázce je výsledkem pořízení tablet a překladů z více než 80 let archeologického výzkumu na OI a U Chicago a vytvoření высокorozlišených označených obrázků z nich. V současné době je tréninková data přibližně 60 terabajtů velikosti. Vědci byli schopni použít datový soubor a vytvořit slovník více než 100 000 jednotlivě identifikovaných znaků, ze kterých mohl model učit. Když byl vyškolený model testován na neznámém souboru obrázků, model dosáhl přibližně 80% přesnosti.
Zatímco tým výzkumníků se snaží zvýšit přesnost modelu, i 80% přesnost může pomoci při procesu transkripce. Podle Paulus může model být použit k identifikaci nebo překladu vysoce opakujících se částí dokumentů, což umožňuje odborníkům trávit čas interpretací složitějších částí dokumentu. I když model nemůže s jistotou říci, co symbol překládá, může poskytovat výzkumníkům pravděpodobnosti, což je již lepší.
Tým také cílí na to, aby DeepScribe byl nástrojem, který mohou používat i jiní archeologové ve svých projektech. Například model může být znovu vyškolena na jiných klínových jazycích nebo model může dělat informované odhady o textu na poškozených nebo neúplných tabulkách. Dostatečně robustní model by mohl potenciálně dokonce odhadnout stáří a původ tablet nebo jiných artefaktů, což je obvykle prováděno chemickým testováním.
Projekt DeepScribe je financován Centrem pro rozvoj pokročilého počítačového zpracování (CDAC). Počítačové vidění bylo použito v jiných projektech financovaných CDAC, jako je projekt určený k rozpoznání stylu v uměleckých dílech a projekt navržen pro kvantifikaci biodiverzity v mořských bivalvech. Tým výzkumníků také doufá, že jejich spolupráce povede k budoucím spolupracím mezi Department of Computer Science a OI na University of Chicago.












