ciot Cercetătorul șef al Amazon Alexa susține că testul Turing este învechit - Unite.AI
Conectează-te cu noi

Informații generale artificiale

Cercetătorul șef al Amazon Alexa susține că testul Turing este învechit

mm
Actualizat on

Rohit Prasad, vicepreședinte și om de știință șef al Alexa la Amazon, a susținut recent faptul că Testul Turing, folosit de mult timp pentru a măsura sofisticarea modelelor AI, ar trebui retras ca reper pentru AI.

Informaticianul și matematicianul Alan Turing a introdus inițial conceptul testului Turing cu mai bine de 70 de ani în urmă. Intenția testului Turing a fost de a ajuta la răspunsul la întrebarea despre inteligența mașinii, determinând dacă o mașină era capabilă de „gândire” în sensul uman. Pentru a răspunde la această întrebare, Turing a susținut că dacă mașinile ar putea prezenta un comportament conversațional atât de sofisticat încât un observator uman nu ar putea discerne între dialogul computerului și dialogul unui om, mașina ar trebui considerată capabilă de gândire.

Limitări ale testului Turing

Prasad a susținut că testul Turing este limitat în multe feluri și că Turing însuși a remarcat chiar unele dintre aceste limitări. în lucrarea sa inițială. Pe măsură ce IA a devenit din ce în ce mai integrată în fiecare fațetă a vieții noastre, oamenilor le pasă mai puțin că nu se poate distinge de un om și mai mult că interacțiunile lor cu AI sunt perfecte, susține Prasad. Din acest motiv, testul Turing ar trebui considerat învechit și înlocuit cu benchmark-uri mai utile.

Prasad a remarcat că mulți chatboți timpurii au fost proiectați având în vedere trecerea testului Turing, iar în ultimii ani unii chatboți au reușit în mod constant să păcălească mai mult de o treime dintre judecătorii umani (bara care trebuia să treacă testul Turing). Cu toate acestea, fiind capabil să imite cu succes tiparele de vorbire ale oamenilor nu înseamnă că o mașină poate fi cu adevărat considerată „inteligentă”. Modelele AI pot fi extrem de competente într-un domeniu și extrem de lipsite în altele, neavând nicio formă de inteligență generală. În ciuda acestui fapt, testul Turing rămâne un punct de referință folosit în mod obișnuit pentru chatboți și asistenți digitali, Prasad observând că liderii de afaceri și jurnaliştii întreabă în mod constant când Alexa va fi capabilă să treacă testul Turing.

Potrivit lui Prasad, una dintre problemele principale legate de utilizarea testului Turing pentru a evalua inteligența mașinilor este că acesta reduce aproape în totalitate capacitatea mașinilor de a căuta informații și de a efectua calcule fulgerătoare. Programele AI injectează pauze artificiale ca răspuns la întrebări complicate de matematică și geografie pentru a păcăli oamenii, dar au un răspuns la astfel de întrebări aproape instantaneu. Dincolo de aceasta, testul Turing nu ține cont de capacitatea crescândă a AI de a utiliza datele colectate de senzorii externi, ignorând modul în care IA pot interacționa cu lumea din jurul lor prin intermediul algoritmilor de viziune și mișcare, bazându-se doar pe comunicarea text.

Crearea de noi repere

Prasad a susținut că ar trebui create noi forme de măsurare a inteligenței, metode care sunt mai potrivite pentru evaluarea unui tip general de inteligență. Aceste teste ar trebui să reflecte modul în care AI este utilizată de fapt în societatea modernă și obiectivele oamenilor pentru ao folosi. Testele ar trebui să poată stabili cât de bine AI mărește inteligența umană și cât de bine AI îmbunătățește viața de zi cu zi a oamenilor. În plus, un test ar trebui să înțeleagă modul în care o inteligență artificială manifestă caracteristici umane ale inteligenței, inclusiv competența lingvistică, auto-supravegherea și „bunul simț”.

Domeniile actuale și importante ale cercetării AI, cum ar fi raționamentul, corectitudinea, conversația și înțelegerea senzorială nu sunt evaluate de testul Turing, dar pot fi măsurate într-o varietate de moduri. Prasad a explicat că o modalitate de a măsura aceste caracteristici ale inteligenței este împărțirea provocărilor în sarcini constitutive. O altă metodă de evaluare este crearea unei provocări la scară largă în lumea reală pentru interacțiunea om-calculator.

Când Amazon a creat Premiul Alexa, a creat o rubrică care le cere ca boții sociali să vorbească cu un om timp de 20 de minute. Boții ar fi evaluați în funcție de capacitatea lor de a conversa în mod coerent pe o mare varietate de subiecte precum tehnologie, sport, politică și divertisment. Clienții erau responsabili pentru notarea boților în timpul fazei de dezvoltare, atribuindu-le scoruri în funcție de dorința lor de a discuta din nou cu botul. În timpul rundei finale, judecătorii independenți au fost responsabili pentru notarea roboților folosind o scală de 5 puncte. Rubrica folosită de judecători s-a bazat pe metode care permit AI-urilor să prezinte atribute umane importante, cum ar fi empatia, acolo unde era cazul.

În cele din urmă, Prasad a susținut că proliferarea tot mai mare a dispozitivelor bazate pe inteligență artificială precum Alexa reprezintă o oportunitate importantă de a măsura progresul inteligenței artificiale, dar vom avea nevoie de valori diferite pentru a profita de această nouă oportunitate.

„Asemenea IA trebuie să fie un expert într-un număr mare, din ce în ce mai mare de sarcini, ceea ce este posibil doar cu o capacitate de învățare mai generalizată în loc de inteligență specifică sarcinii”, a explicat Prasad. „Prin urmare, pentru următorul deceniu și nu numai, utilitatea serviciilor AI, cu abilitățile lor de asistență conversațională și proactivă pe dispozitivele ambientale, sunt un test demn.”

 

Blogger și programator cu specialități în Invatare mecanica și Invatare profunda subiecte. Daniel speră să-i ajute pe alții să folosească puterea AI pentru binele social.