Lideri de opinie
De ce Industria 5.0 are nevoie de Inteligență Artificială Generală

De: Bas Steunebrink, Co-fondator și Director de Inteligență Artificială Generală, Eric Nivel, Inginer Principal AGI și Jerry Swan, Cercetător științific la NNAISENSE.
Luăm automatizarea ca pe ceva de la sine înțeles în lumea noastră modernă, beneficiind în fiecare zi de lanțuri de aprovizionare care se întind pe glob, livrând o gamă vastă de bunuri pe rafturile noastre. Dar, în spatele scenei, producția și mișcarea bunurilor generează multe provocări de optimizare, cum ar fi ambalarea, programarea, rutarea și automatizarea liniilor de asamblare. Aceste provocări de optimizare sunt dinamice și se schimbă în mod constant odată cu lumea reală. De exemplu, rutele de aprovizionare așteptate pot deveni brusc compromise din cauza unor împrejurări neprevăzute – de exemplu, Canalul Suez poate fi blocat; rutele aeriene pot fi modificate din cauza erupțiilor vulcanice; țări întregi pot fi inaccesibile din cauza conflictelor. Schimbările legislative, prăbușirile monetare și resursele rare sunt, de asemenea, exemple de variabile ale ofertei care se schimbă în mod constant.
Pentru a oferi un alt exemplu, uneori este necesar să se incorporeze o componentă nouă într-o mașină sau flux de lucru (utilizatorii pot dori materiale sau culori diferite, de exemplu). În prezent, este necesară munca umană de specialitate pentru a face modificări în sistem, sau – în cazul învățării automate – pentru a reantrena și redeploya soluția. În mod similar, “gemenii digitali” ai Industriei 4.0 sunt încă puternic dependenți de noțiunea că descrierea problemei și distribuția intrărilor pot fi specificate o singură dată și pentru totdeauna la momentul proiectării inițiale a sistemului.
Pandemia recentă subliniază fragilitatea planificării lanțurilor de aprovizionare “just-in-time”. Devine mai evident că, într-o lume din ce în ce mai complexă și incertă, industria nu-și mai poate permite o asemenea inflexibilitate. În prezent, producția trebuie să facă o alegere fixă între “Low-Mix High-Volume” (LMHV) și “High-Mix Low-Volume” (HMLV). Industria 5.0 anticipează perspectiva “High-Mix High-Volume” (HMHV), în care fluxul de lucru poate fi reconfigurat la costuri reduse pentru a satisface cerințele fluide. Pentru a realiza acest lucru, este necesar să “automatizăm automatizarea”, pentru a elimina nevoia de intervenție umană și/sau de timp de închidere a sistemului atunci când problema sau mediul se schimbă. Acest lucru necesită sisteme care “lucrează la comandă”, reacționând la astfel de schimbări, în timp ce încă au o șansă rezonabilă de a-și îndeplini sarcinile atribuite în cadrul constrângerilor de timp din lumea reală. Luați, de exemplu, instruirea unui robot de asamblare, în prezent implicat în sarcina X, astfel:
“Opriți asamblarea X imediat: iată o specificație a lui Y, și iată majoritatea vechilor și câteva noi efectoare. Acum începeți asamblarea lui Y, evitând astfel de defecte și irosire.”
În ciuda discuțiilor recente despre sosirea iminentă a “Inteligenței Artificiale Generale” (AGI) prin aşa-numitele Modele de Limbaj Mare, cum ar fi GPT-3, niciuna dintre abordările propuse nu este cu adevărat capabilă de “lucru la comandă”. Adică, nu pot fi însărcinate cu ceva complet în afara setului lor de antrenament fără închiderea sistemului pentru reantrenare, verificare și redeployare.
Este sigur că orice noțiune reală de inteligență este strâns legată de răspunsul la schimbare. Un sistem care rămâne neschimbat – indiferent de câte evenimente neașteptate este expus – nu este nici autonom, nici inteligent. Acest lucru nu diminuează puternicele puncte forte ale unor astfel de abordări de învățare profundă (DL), care au avut un mare succes ca mijloc de sinteză a programelor pentru probleme care sunt greu de specificat în mod explicit.
Deci, ce funcționalitate a sistemului ar putea permite ca IA să meargă dincolo de acest paradigma de antrenament, înghețare și deploy, către una care este capabilă de învățare adaptivă neîntreruptă? Luați în considerare nevoia de a înlocui o componentă defectă într-un flux de lucru de producție cu una de la un furnizor diferit, care ar putea avea toleranțe diferite. Cu modelarea de la capăt la capăt a cutiei negre a IA contemporane, procesul de “gemeni digitali” trebuie făcut din nou. Pentru a aborda limitările abordărilor contemporane, o schimbare radicală este necesară: un model care poate raționa direct despre consecințele schimbării unei componente – și, în general, scenarii contrafactice “ce s-ar întâmpla dacă”. Dezmembrarea unui flux de lucru în componente cu proprietăți cunoscute și reasamblarea lor după cum este necesar necesită ceea ce se numește “compoziționalitate”.
Compoziționalitatea a evitat până acum IA contemporană, unde este adesea confundată cu noțiunea mai slabă de modularitate. Modularitatea se ocupă de capacitatea de a “lipi” componente împreună, dar aceasta nu reușește să capteze esența compoziționalității, care este capacitatea de a raționa despre comportamentul fluxului de lucru rezultat, pentru a determina și asigura conservarea unei anumite proprietăți. Această capacitate este vitală din motive de verificare și siguranță: de exemplu, capacitatea sistemului de a raționa că “adoptarea unui motor de la un producător alternativ va crește puterea generală a instalației, în timp ce toate celelalte componente rămân în limitele de temperatură”.
Deși abordările contemporane de rețele neuronale excelente învăță reguli din date, ele lipsesc de raționament compozițional. Ca alternativă la speranța că raționamentul compozițional va apărea din interiorul arhitecturilor de rețele neuronale, este posibil să se facă uz direct de construcțiile teoriei categoriilor, studiul matematic al compoziționalității. În special, subdomeniul său de cibernetică categorială se ocupă de controlori bidirecționali ca elemente de reprezentare fundamentală. Bidirecționalitatea este capacitatea de a efectua atât inferența directă, cât și cea inversă: predicția de la cauze la efecte și viceversa. Inferența inversă compozițională este deosebit de importantă, deoarece permite încorporarea feedback-ului din mediu la orice scară de reprezentare structurală – acest lucru facilitează învățarea rapidă dintr-un număr mic de exemple.
Dată o anumită comportare a sistemului, sarcina de învățare este atunci să se construiască o structură de control agregată care să o îndeplinească. Structurile inițial învățate acționează ca un schelet pentru învățarea ulterioară.
Pe măsură ce cunoștințele sistemului cresc, acest schelet poate fi decorat cu proprietăți compoziționale învățate, similare cu modul în care o moleculă de H2O poate fi determinată să aibă proprietăți diferite de cele ale atomilor săi constituenți. În plus, așa cum “aruncarea unei mingi” și “lovirea unei rachete de tenis” pot fi văzute ca acțiuni musculare legate pentru un om, astfel și sarcinile legate pot împărtăși o structură de control scheletică care este împodobită în mod specific pentru sarcină prin feedback din mediu. Această decuplare a structurii cauzale de la specificitățile sarcinii poate facilita învățarea de noi sarcini fără uitarea catastrofală care afectează abordările contemporane. Prin urmare, o abordare hibrid numeric-simbolice de forma descrisă mai sus poate combina punctele forte ale ambelor abordări neuronale și simbolice, având atât o noțiune explicită de structură, cât și capacitatea de a învăța adaptiv cum sunt compuse proprietățile. Raționamentul despre proprietățile compoziționale este fundamentat pe o bază continuă de lucru pe care sistemul este în prezent comandat să o execute.
În concluzie, este clar că o abordare nouă este necesară pentru a crea sisteme cu adevărat autonome: sisteme capabile să se adapteze la schimbări semnificative și/sau să funcționeze în medii necunoscute. Acest lucru necesită învățare adaptivă neîntreruptă și generalizarea cunoștințelor existente. În ciuda numelui lor, abordările de învățare profundă au o reprezentare superficială a lumii care nu poate fi manipulată la un nivel înalt de procesul de învățare. În contrast, propunem că sistemele AGI care vor apărea în următoarea generație vor încorpora învățarea profundă într-o arhitectură mai largă, echipată cu capacitatea de a raționa direct despre ceea ce știu.
Capacitatea unui sistem de a raționa simbolic despre propria reprezentare conferă beneficii semnificative pentru industrie: cu o reprezentare explicit compozițională, sistemul poate fi auditat – fie de către oameni, fie intern de către sistemul însuși – pentru a îndeplini cerințele vitale de siguranță și echitate. În timp ce a existat o preocupare academică semnificativă cu privire la așa-numitul risc-x al AGI, focalizarea adecvată este mai degrabă problema de inginerie concretă a reconfigurării unui sistem de control în timp ce păstrează aceste cerințe vitale, un proces pe care îl numim aliniere interactivă. Este doar prin adoptarea acestui tip de sisteme de control, care sunt de încredere și eficienți învățători continua, că vom putea realiza următoarea generație de autonomie vizualizată de Industria 5.0.






