Inteligență artificială

Echipa dezvoltă o abordare pentru compararea rețelelor neuronale

mm

O echipă de cercetători de la Los Alamos National Laboratory a dezvoltat o abordare inovatoare pentru compararea rețelelor neuronale. Conform echipei, această nouă abordare examinează “cutia neagră” a inteligenței artificiale (IA) și le ajută să înțeleagă comportamentul rețelelor neuronale. Rețelele neuronale, care recunosc modele în seturi de date, sunt utilizate într-o gamă largă de aplicații, cum ar fi sistemele de recunoaștere facială și vehiculele autonome.

Echipa a prezentat lucrarea lor, „If You’ve Trained One You’ve Trained Them All: Inter-Architecture Similarity Increases With Robustness”, la Conferința privind incertitudinea în inteligența artificială.

Haydn Jones este cercetător în grupul de cercetare avansată în sisteme cibernetice de la Los Alamos și autor principal al lucrării de cercetare.

Înțelegerea mai bună a rețelelor neuronale

„Comunitatea de cercetare a inteligenței artificiale nu are neapărat o înțelegere completă a ceea ce fac rețelele neuronale; ele ne oferă rezultate bune, dar nu știm cum sau de ce”, a spus Jones. „Metoda noastră nouă face o treabă mai bună de comparare a rețelelor neuronale, ceea ce este un pas crucial spre o înțelegere mai bună a matematicii din spatele IA.

Noile cercetări vor juca, de asemenea, un rol în ajutarea experților să înțeleagă comportamentul rețelelor neuronale robuste.

Deși rețelele neuronale au o performanță ridicată, ele sunt și fragile. Schimbări mici în condiții, cum ar fi un semn de stop parțial acoperit care este procesat de un vehicul autonom, pot determina rețeaua neuronală să greșească semnul. Acest lucru poate duce la consecințe periculoase.

Antrenarea adversă a rețelelor neuronale

Cercetătorii au încercat să îmbunătățească aceste tipuri de rețele neuronale prin examinarea modalităților de îmbunătățire a robusteții rețelelor. Una dintre abordări implică “atacarea” rețelelor în timpul procesului de antrenare, în care cercetătorii introduc intenționat aberații pentru a antrena IA să le ignore. Procesul, cunoscut sub numele de antrenare adversă, face ca rețelele să fie mai greu de înșelat.

Echipa a aplicat noua metrică a similarității rețelelor la rețelele neuronale antrenate advers. Ei au fost surprinși să constate că antrenarea adversă determină rețelele neuronale din domeniul viziunii computaționale să converge către reprezentări de date similare, indiferent de arhitectura rețelei, pe măsură ce crește magnitudinea atacului.

„Am descoperit că atunci când antrenăm rețelele neuronale pentru a fi robuste împotriva atacurilor adverse, ele încep să facă același lucru”, a spus Jones.

Acesta nu este primul caz în care experții au căutat să găsească arhitectura perfectă pentru rețelele neuronale. Cu toate acestea, noile descoperiri demonstrează că introducerea antrenării adverse reduce semnificativ decalajul, ceea ce înseamnă că comunitatea de cercetare a IA poate să nu mai fie nevoită să exploreze atâtea arhitecturi noi, deoarece se știe acum că antrenarea adversă determină arhitecturi diverse să converge către soluții similare.

„Prin faptul că găsim că rețelele neuronale robuste sunt similare unele cu altele, facem ca înțelegerea modului în care funcționează IA robustă să fie mai ușoară”, a spus Jones. „Putem descoperi chiar și indicii cu privire la modul în care se produce percepția la oameni și la alte animale.”

Alex McFarland este un jurnalist și scriitor de inteligență artificială, care explorează cele mai recente dezvoltări în domeniul inteligenței artificiale. El a colaborat cu numeroase startup-uri de inteligență artificială și publicații din întreaga lume.