Intelligenza artificiale
DeepScribe AI può aiutare a tradurre tavolette antiche

I ricercatori dell’Istituto Orientale dell’Università di Chicago e del Dipartimento di Informatica hanno collaborato per progettare un’intelligenza artificiale in grado di aiutare a decodificare tavolette di antiche civiltà. Secondo Phys.org, l’intelligenza artificiale si chiama DeepScribe e è stata addestrata su oltre 6.000 immagini annotate tratte dall’Archivio di Fortificazione di Persepoli, quando sarà completata, il modello di intelligenza artificiale sarà in grado di interpretare tavolette non analizzate, rendendo più facile lo studio di documenti antichi.
Gli esperti che studiano documenti antichi, come i ricercatori che studiano i documenti creati durante l’Impero achemenide in Persia, devono tradurre documenti antichi a mano, un processo lungo e soggetto a errori. I ricercatori utilizzano computer per assistere nell’interpretazione di documenti antichi dal 1990, ma i programmi informatici utilizzati erano di limitata utilità. I caratteri cuneiformi complessi, nonché la forma tridimensionale delle tavolette, hanno posto un limite alla loro utilità.
Gli algoritmi di visione computerizzata e le architetture di apprendimento profondo hanno aperto nuove possibilità in questo campo. Sanjay Krishnan, del Dipartimento di Informatica dell’OI, ha collaborato con la professoressa associata di assiriologia Susanne Paulus per lanciare il programma DeepScribe. I ricercatori hanno supervisionato una piattaforma di gestione dei dati chiamata OCHRE, che ha organizzato i dati degli scavi archeologici. L’obiettivo è creare uno strumento di intelligenza artificiale che sia sia estensivo che flessibile, in grado di interpretare script da diverse regioni geografiche e periodi di tempo.
Come riportato da Phys.org, Krishnan ha spiegato che le sfide di riconoscimento dello script, che i ricercatori archeologici affrontano, sono essenzialmente le stesse sfide affrontate dai ricercatori di visione computerizzata:
“Da una prospettiva di visione computerizzata, è realmente interessante perché queste sono le stesse sfide che affrontiamo. La visione computerizzata negli ultimi cinque anni è migliorata significativamente; dieci anni fa, questo sarebbe stato un problema irrisolto, non saremmo arrivati fin qui. È un buon problema di apprendimento automatico, perché l’accuratezza è oggettiva qui, abbiamo un set di addestramento etichettato e comprendiamo lo script abbastanza bene e ciò ci aiuta. Non è un problema completamente sconosciuto.”
Il set di addestramento in questione è il risultato di aver preso le tavolette e le traduzioni, da oltre 80 anni di ricerche archeologiche condotte all’OI e all’Università di Chicago, e di aver creato immagini ad alta risoluzione annotate da esse. Attualmente, i dati di addestramento sono di circa 60 terabyte. I ricercatori sono stati in grado di utilizzare il set di dati e creare un dizionario di oltre 100.000 segni individuali identificati che il modello poteva imparare. Quando il modello addestrato è stato testato su un set di immagini non viste, il modello ha raggiunto un’accuratezza del 80%.
Mentre il team di ricercatori sta cercando di aumentare l’accuratezza del modello, anche un’accuratezza dell’80% può aiutare nel processo di trascrizione. Secondo Paulus, il modello potrebbe essere utilizzato per identificare o tradurre parti altamente ripetitive dei documenti, permettendo agli esperti di spendere il loro tempo interpretando le parti più difficili del documento. Anche se il modello non può dire con certezza cosa significhi un simbolo, può fornire ai ricercatori delle probabilità, il che li mette già in vantaggio.
Il team sta anche cercando di rendere DeepScribe uno strumento che altri archeologi possano utilizzare nei loro progetti. Ad esempio, il modello potrebbe essere riaddestrato su altre lingue cuneiformi, o il modello potrebbe fare stime informate sul testo di tavolette danneggiate o incomplete. Un modello sufficientemente robusto potrebbe potenzialmente anche stimare l’età e l’origine di tavolette o altri manufatti, qualcosa che di solito viene fatto con test chimici.
Il progetto DeepScribe è finanziato dal Centro per lo sviluppo dell’informatica avanzata (CDAC). La visione computerizzata è stata utilizzata anche in altri progetti finanziati dal CDAC, come un progetto destinato a riconoscere lo stile nelle opere d’arte e un progetto progettato per quantificare la biodiversità nei bivalvi marini. Il team di ricercatori spera che la loro collaborazione porterà a future collaborazioni tra il Dipartimento di Informatica e l’OI all’Università di Chicago.












