Connect with us

Inteligență artificială

DeepScribe AI poate ajuta la traducerea tăblițelor antice

mm

Cercetătorii de la Institutul Oriental al Universității din Chicago și Departamentul de Științe ale Calculatoarelor au colaborat pentru a proiecta o inteligență artificială care poate ajuta la decodificarea tăblițelor din civilizațiile antice. Conform Phys.org, inteligența artificială se numește DeepScribe și a fost antrenată pe peste 6.000 de imagini annotate extrase din Arhiva Fortificației Persepolis, când va fi finalizată, modelul de inteligență artificială va putea interpreta tăblițe neanalizate, făcând studiul documentelor antice mai ușor.

Experții care studiază documente antice, precum cercetătorii care studiază documentele create în timpul Imperiului Ahemenid din Persia, trebuie să traducă documentele antice de mână, un proces lung și predispus la erori. Cercetătorii au folosit computere pentru a ajuta la interpretarea documentelor antice din anii 1990, dar programele de calculator folosite au fost de ajutor limitat. Caracterele cuneiforme complexe, precum și forma tridimensională a tăblițelor, au pus o limită asupra utilității programelor de calculator.

Algoritmii de viziune computațională și arhitecturile de învățare profundă au adus posibilități noi în acest domeniu. Sanjay Krishnan, de la Departamentul de Științe ale Calculatoarelor de la OI, a colaborat cu profesoara asociată de asiriologie Susanne Paulus pentru a lansa programul DeepScribe. Cercetătorii au supervizat o platformă de gestionare a bazelor de date numită OCHRE, care a organizat date din săpături arheologice. Scopul este de a crea un instrument de inteligență artificială care să fie atât extensiv, cât și flexibil, capabil să interpreteze scripturi din regiuni geografice și perioade de timp diferite.

Așa cum a raportat Phys.org, Krishnan a explicat că provocările recunoașterii scripturilor, cu care se confruntă cercetătorii arheologici, sunt esențialmente aceleași provocări cu care se confruntă cercetătorii de viziune computațională:

“Din perspectiva viziunii computaționale, este foarte interesant, deoarece acestea sunt aceleași provocări cu care ne confruntăm. Viziunea computațională a evoluat semnificativ în ultimii cinci ani; acum zece ani, acest lucru ar fi fost imposibil, nu am fi ajuns atât de departe. Este o problemă bună de învățare automată, deoarece acuratețea este obiectivă aici, avem un set de antrenare etichetat și înțelegem scriptul destul de bine, ceea ce ne ajută. Nu este o problemă complet necunoscută.”

Setul de antrenare în cauză este rezultatul obținerii tăblițelor și traducerilor, din aproximativ 80 de ani de cercetare arheologică efectuată la OI și U Chicago, și creării unor imagini annotate de înaltă rezoluție din ele. În prezent, datele de antrenare sunt de aproximativ 60 de terabytes. Cercetătorii au reușit să utilizeze setul de date și să creeze un dicționar de peste 100.000 de semne individuale identificate pe care modelul le poate învăța. Când modelul antrenat a fost testat pe un set de imagini nevizualizate, modelul a obținut o acuratețe de aproximativ 80%.

Deși echipa de cercetători încearcă să crească acuratețea modelului, chiar și o acuratețe de 80% poate ajuta la procesul de transcriere. Conform lui Paulus, modelul poate fi utilizat pentru a identifica sau traduce părți foarte repetitive ale documentelor, permițând experților să-și petreacă timpul interpretând părțile mai dificile ale documentului. Chiar dacă modelul nu poate spune cu certitudine la ce simbol se traduce, poate oferi cercetătorilor probabilități, ceea ce îi pune deja înainte.

Echipa își propune, de asemenea, să facă DeepScribe un instrument pe care și alți arheologi îl pot utiliza în proiectele lor. De exemplu, modelul poate fi reantrenat pe alte limbi cuneiforme, sau modelul poate face estimări informate despre textul de pe tăblițe deteriorate sau incomplete. Un model suficient de robust ar putea chiar estima vârsta și originea tăblițelor sau a altor artefacte, ceea ce se face de obicei prin testări chimice.

Proiectul DeepScribe este finanțat de Centrul pentru Dezvoltarea Calculatoarelor Avansate (CDAC). Viziunea computațională a fost utilizată și în alte proiecte finanțate de CDAC, cum ar fi un proiect destinat să recunoască stilul în lucrări de artă și un proiect proiectat pentru a cuantifica biodiversitatea în moluște marine. Echipa de cercetători speră, de asemenea, că colaborarea lor va duce la colaborări viitoare între Departamentul de Științe ale Calculatoarelor și OI de la Universitatea din Chicago.

Blogger și programator cu specializări în Machine Learning și Deep Learning subiecte. Daniel speră să ajute pe alții să folosească puterea inteligenței artificiale pentru binele social.