Kunstig intelligens
DeepScribe AI kan hjælpe med at oversætte gamle tavler

Forskere fra University of Chicagos Oriental Institute og Department of Computer Science har samarbejdet om at designe en AI, der kan hjælpe med at afkode tavler fra gamle civilisationer. Ifølge Phys.org, hedder AI’en DeepScribe og er blevet trænet på over 6.000 annoterede billeder fra Persepolis Fortification Archive, og når modellen er færdig, vil den være i stand til at fortolke ikke-analyserede tavler, hvilket gør det lettere at studere gamle dokumenter.
Eksperter, der studerer gamle dokumenter, som f.eks. forskerne, der studerer dokumenterne fra Achaemenid-riget i Persien, må oversætte gamle dokumenter hånd i hånd, en langvarig proces, der er udsat for fejl. Forskere har brugt computere til at hjælpe med at fortolke gamle dokumenter siden 1990’erne, men computerprogrammerne, der blev brugt, var begrænsede. De komplekse cuneiform-tegn samt tavlernes tredimensionale form satte en grænse for, hvor nyttige computerprogrammerne kunne være.
Computer vision-algoritmer og deep learning-arkitekturer har åbnet nye muligheder i dette felt. Sanjay Krishnan fra Department of Computer Science på OI samarbejdede med lektor i assyriologi Susanne Paulus om at lancere DeepScribe-programmet. Forskerne stod i spidsen for en databaseadministrationsplatform kaldet OCHRE, der organiserede data fra arkæologiske udgravninger. Målet er at skabe et AI-værktøj, der er både omfattende og fleksibelt, og kan fortolke skrift fra forskellige geografiske regioner og tidsperioder.
Som Phys.org rapporterede, forklarede Krishnan, at udfordringerne ved at genkende skrift, som arkæologiske forskere står over for, i virkeligheden er de samme udfordringer, som computer vision-forskere står over for:
“Set fra et computer vision-perspektiv er det virkelig interessant, fordi disse udfordringer er de samme, som vi står over for. Computer vision har udviklet sig så meget over de sidste fem år; for ti år siden ville dette have været noget, man kun kunne have drømt om, vi ville ikke have nået så langt. Det er et godt maskinlæringsproblem, fordi nøjagtigheden er objektiv her, vi har en mærket træningssæt og vi forstår skrifttet ret godt, og det hjælper os. Det er ikke et helt ukendt problem.”
Træningssættet i spørgsmålet er resultatet af at tage tavlerne og oversættelserne fra over 80 års arkæologisk forskning på OI og U Chicago og lave højopløste annoterede billeder fra dem. For øjeblikket er træningsdataen på ca. 60 terabyte i størrelse. Forskerne kunne bruge datasættet og oprette en ordbog med over 100.000 individuelt identificerede tegn, som modellen kunne lære fra. Da den trænede model blev testet på et uset billedsæt, opnåede modellen en nøjagtighed på ca. 80%.
Selvom forskerholdet forsøger at øge modellens nøjagtighed, kan selv 80% nøjagtighed hjælpe i transskriptionsprocessen. Ifølge Paulus kan modellen bruges til at identificere eller oversætte højt repetitive dele af dokumenterne, så eksperter kan bruge deres tid på at fortolke de mere svære dele af dokumentet. Selv hvis modellen ikke kan sige med sikkerhed, hvad et symbol oversætter til, kan den give forskerne sandsynligheder, hvilket allerede sætter dem i fordel.
Holdet har også til hensigt at gøre DeepScribe til et værktøj, som andre arkæologer kan bruge i deres projekter. F.eks. kan modellen blive gentrænet på andre cuneiform-sprog, eller modellen kan give informerede estimater om teksten på beskadigede eller ufuldstændige tavler. En tilstrækkeligt robust model kunne potentielt endda estimere alderen og oprindelsen af tavler eller andre genstande, noget som normalt bliver gjort med kemiske tests.
DeepScribe-projektet er finansieret af Centre for the Development of Advanced Computing (CDAC). Computer vision er blevet brugt i andre CDAC-finansierede projekter, som f.eks. et projekt, der er designet til at genkende stil i kunstværker, og et projekt, der er designet til at kvantificere biodiversitet i marine bivalver. Forskerholdet håber også, at deres samarbejde vil føre til fremtidige samarbejder mellem Department of Computer Science og OI på University of Chicago.












