Connect with us

Kunstig intelligens

DeepScribe AI kan hjelpe med å oversette gamle tavler

mm

Forskere fra University of Chicagos Oriental Institute og Department of Computer Science har samarbeidet om å designe en AI som kan hjelpe med å avkode tavler fra gamle sivilisasjoner. Ifølge Phys.org, heter AIen DeepScribe og ble trent på over 6 000 annoterte bilder hentet fra Persepolis Fortification Archive, og når modellen er fullstendig, vil den kunne tolke ikke-analysete tavler, og gjøre det lettere å studere gamle dokumenter.

Eksperter som studerer gamle dokumenter, som forskerne som studerer dokumentene som ble skapt under Achaemenid-riket i Persia, må oversette gamle dokumenter for hånd, en lang prosess som er utsatt for feil. Forskere har brukt datamaskiner til å assistere i tolkning av gamle dokumenter siden 1990-årene, men dataprogrammene som ble brukt var av begrenset nytte. De komplekse kileskrift-tegnene, samt den tredimensjonale formen på tavlene, satte en grense for hvor nyttige dataprogrammene kunne være.

Datavisjonsalgoritmer og dyptlæringsarkitekturer har brakt nye muligheter til dette feltet. Sanjay Krishnan, fra Department of Computer Science at OI, samarbeidet med associate professor of Assyriology Susanne Paulus for å lansere DeepScribe-programmet. Forskerne overvåket en databasehåndteringplattform kalt OCHRE, som organiserte data fra arkeologiske utgravninger. Målet er å skape et AI-verktøy som er både omfattende og fleksibelt, i stand til å tolke skript fra forskjellige geografiske regioner og tidsperioder.

Ifølge Phys.org, forklarte Krishnan at utfordringene med å gjenkjenne skript, som arkeologiske forskere står overfor, er essensielt de samme utfordringene som datavisjonsforskere står overfor:

“Fra datavisjonsperspektivet er det virkelig interessant fordi disse er de samme utfordringene som vi står overfor. Datavisjon har forbedret seg så mye de siste fem årene; for ti år siden, ville dette vært håndvift, vi ville ikke ha kommet så langt. Det er et godt maskinlæringsproblem, fordi nøyaktigheten er objektiv her, vi har en merket treningssett og vi forstår skriptet ganske godt og det hjelper oss. Det er ikke et fullstendig ukjent problem.”

Treningssettet i question er resultatet av å ta tavlene og oversettelsene, fra over omtrent 80 år av arkeologisk forskning gjort ved OI og U Chicago, og lage høyoppløste annoterte bilder fra dem. For øyeblikket er treningsdataen omtrent 60 terabyte stor. Forskerne kunne bruke datasettet og skape en ordbok med over 100 000 individuelt identifiserte tegn som modellen kunne lære fra. Når den trente modellen ble testet på et usett bilde, oppnådde modellen omtrent 80 % nøyaktighet.

Mens teamet av forskere prøver å øke nøyaktigheten til modellen, kan selv 80 % nøyaktighet assistere i prosessen med transkripsjon. Ifølge Paulus, kan modellen brukes til å identifisere eller oversette høyt repetitive deler av dokumentene, og la eksperter bruke sin tid på å tolke de mer vanskelige delene av dokumentet. Selv om modellen ikke kan si med sikkerhet hva et symbol oversettes til, kan den gi forskerne sannsynligheter, som allerede setter dem i forkant.

Teamet har også som mål å gjøre DeepScribe til et verktøy som andre arkeologer kan bruke i sine prosjekter. For eksempel, kan modellen bli omtrukket på andre kileskrift-språk, eller modellen kan gi informerte estimater om teksten på skadde eller ufullstendige tavler. En tilstrekkelig robust modell kunne potensielt sogar estimere alderen og opphavet til tavler eller andre artefakter, noe som vanligvis gjøres med kjemiske tester.

DeepScribe-prosjektet er finansiert av Centre for the Development of Advanced Computing (CDAC). Datavisjon har blitt brukt i andre CDAC-finansierte prosjekter også, som et prosjekt som skulle gjenkjenne stil i kunstverk og et prosjekt som var designet til å kvantifisere biodiversitet i marine bivalver. Teamet av forskere håper også at deres samarbeid vil føre til fremtidige samarbeid mellom Department of Computer Science og OI ved University of Chicago.

Blogger og programmerer med spesialområder i Machine Learning og Deep Learning emner. Daniel håper å hjelpe andre med å bruke kraften av AI for sosialt godt.