ciot De ce industria 5.0 are nevoie de inteligență generală artificială - Unite.AI
Conectează-te cu noi

Liderii gândirii

De ce industria 5.0 are nevoie de inteligență generală artificială

mm
Actualizat on

De: Bas Steunebrink, co-fondator și director al Inteligenței generale artificiale, Eric Nivel, inginer principal AGI și Jerry Swan, cercetător la NNAISENSE.

Considerăm automatizarea de la sine înțeles în lumea noastră modernă, beneficiind în fiecare zi de lanțurile de aprovizionare care se întind pe tot globul, livrând o selecție vastă de mărfuri la rafturile noastre. Dar în culise, producția și mișcarea mărfurilor generează multe provocări de optimizare, cum ar fi ambalarea, programarea, rutarea și automatizarea liniei de asamblare. Aceste provocări de optimizare sunt dinamice și se schimbă constant în tandem cu lumea reală. De exemplu, rutele de aprovizionare preconizate pot deveni brusc compromise din cauza unor circumstanțe neprevăzute – de exemplu, Canalul Suez poate fi blocat; rutele aeriene se pot schimba din cauza erupțiilor vulcanice; țări întregi pot fi inaccesibile din cauza conflictului. Schimbările în legislație, prăbușirile monedei și resursele limitate sunt, de asemenea, exemple de variabile din partea ofertei în continuă schimbare.

Pentru a oferi un alt exemplu, uneori o componentă nouă trebuie să fie încorporată într-o mașină sau într-un flux de lucru (utilizatorii pot dori diferite materiale sau culori, de exemplu). În prezent, este nevoie de forță umană expertă pentru a face modificări sistemului sau, în cazul învățării automate, pentru a reinstrui și redistribui soluția. Într-o manieră similară, „gemenii digitali” ai Industriei 4.0 sunt încă foarte dependenți de ideea că descrierea problemei și distribuția intrărilor pot fi specificate o dată pentru totdeauna în momentul proiectării inițiale a sistemului.

Pandemia recentă evidențiază fragilitatea planificării lanțului de aprovizionare „just-in-time”. Devine mai evident că, într-o lume din ce în ce mai complexă și mai incertă, industria nu își mai permite o asemenea inflexibilitate. În prezent, producția trebuie să facă o alegere fixă ​​între „Low-Mix High-Volume” (LMHV) și „High-Mix Low-Volume” (HMLV). Industry 5.0 anticipează perspectiva „High-Mix High-Volume” (HMHV), în care fluxul de lucru poate fi reconfigurat la costuri reduse pentru a îndeplini cerințele de fluide. Pentru a realiza acest lucru, este necesară „automatizarea automatizării”, pentru a elimina necesitatea intervenției umane și/sau a opririi sistemului atunci când problema sau mediul se schimbă. Acest lucru necesită sisteme care „funcționează la comandă”, reacționând la astfel de schimbări, având totuși o perspectivă rezonabilă de a-și îndeplini sarcinile atribuite în limitele de timp din lumea reală. Luați în considerare, ca exemplu, instruirea unui robot de linie de asamblare, angajat în prezent cu sarcina X, după cum urmează:

„Opriți asamblarea X imediat: iată o specificație a lui Y și iată majoritatea efectelor vechi și câțiva noi. Acum începeți să asamblați Y, evitând astfel de defecte și risipa.”

În ciuda discuțiilor recente pe scară largă despre sosirea iminentă a „Inteligentei generale artificiale” (AGI) prin așa-numitele modele de limbaj mari, cum ar fi GPT-3, niciuna dintre abordările propuse nu este cu adevărat capabilă să „lucreze la comandă”. Adică, ei nu pot fi însărcinați cu ceva complet în afara setului lor de instruire fără timpul de nefuncționare al reantrenării, verificării și redistribuirii offline.

Este cu siguranță clar că orice noțiune din lumea reală a inteligenței este inextricabil asociată cu receptivitatea la schimbare. Un sistem care rămâne neschimbat – indiferent la câte evenimente neașteptate este expus – nu este nici autonom, nici inteligent. Acest lucru nu este pentru a diminua punctele forte indubitabile ale unor astfel de abordări de învățare profundă (DL), care s-au bucurat de un mare succes ca mijloc de sinteză a programelor pentru probleme care sunt greu de specificat în mod explicit.

Deci, ce fel de funcționalitate de sistem ar putea permite AI să treacă dincolo de această paradigmă de antrenare, înghețare și implementare, către una care este capabilă de învățare adaptivă neîntreruptă? Luați în considerare necesitatea de a înlocui o componentă defecte într-un flux de lucru de producție cu una de la un furnizor diferit, care s-ar putea bucura de toleranțe diferite. Cu modelarea cutie neagră de la capăt la capăt a IA contemporană, procesul de înfrățire digitală trebuie reluat. Pentru a aborda limitările abordărilor contemporane, este necesară o schimbare radicală: un model care să poată raționa în mod direct asupra consecințelor unei schimbări componente – și într-adevăr scenarii contrafactuale mai generale „ce ar fi dacă”. Descompunerea unui flux de lucru în componente cu proprietăți cunoscute și recombinarea lor după cum este necesar necesită ceea ce este cunoscut sub numele de „compoziționalitate”.

Compoziționalitatea a eludat până acum IA contemporană, unde este adesea confundată cu noțiunea mai slabă de modularitate. Modularitatea se referă la capacitatea de a „lipi” componente între ele, dar aceasta nu reușește să surprindă esența compoziționalității, care este capacitatea de a raționa despre comportamentul fluxului de lucru rezultat pentru a determina și a asigura păstrarea unei proprietăți dorite. Această capacitate este vitală din motive de verificare și siguranță: de exemplu, capacitatea sistemului de a argumenta că „adoptarea unui motor de la un producător alternativ va crește puterea totală a fabricii, în timp ce toate celelalte componente ale acesteia rămân în limitele de temperatură”.

Deși abordările contemporane ale rețelelor neuronale excelează la învățarea regulilor din date, le lipsește raționamentul compozițional. Ca o alternativă la speranța că raționamentul compozițional va apărea din interiorul arhitecturilor rețelelor neuronale, este posibil să se utilizeze direct construcțiile teoriei categoriilor, studiul matematic al compoziționalității. În special, subdomeniul său cibernetică categorială se preocupă de controlere bidirecționale ca elemente de reprezentare fundamentale. Bidirecționalitatea este capacitatea de a efectua atât inferențe directe, cât și inverse: realizarea de predicții de la cauze la efecte și invers. Inferența inversă compozițională este deosebit de importantă deoarece permite încorporarea feedback-ului din mediu la orice scară de reprezentare structurală - acest lucru facilitează învățarea rapidă dintr-un număr mic de exemple.

Având în vedere un anumit comportament al sistemului dorit, sarcina de învățare este apoi de a construi o structură de control agregată care să o îndeplinească. Structurile invatate initial actioneaza ca un schelet pentru invatarea ulterioara.

Pe măsură ce cunoștințele sistemului cresc, acest schelet poate fi decorat cu proprietăți compoziționale învățate, similar modului în care se poate determina că o moleculă de H2O are proprietăți diferite decât cele ale atomilor săi constitutivi. În plus, la fel cum „aruncarea unei mingi” și „swingarea unei rachete de tenis” pot fi văzute ca acțiuni musculo-scheletice asociate pentru un om, la fel sarcinile conexe pot împărtăși o structură de control scheletică care este înfrumusețată într-o manieră specifică sarcinii prin feedback din partea mediu inconjurator. Această decuplare a structurii cauzale de specificul sarcinii poate facilita învățarea de noi sarcini fără uitarea catastrofală care afectează abordările contemporane. Prin urmare, o abordare hibridă numerică-simbolică a formei descrise mai sus poate combina punctele forte atât ale abordărilor neuronale, cât și ale abordărilor simbolice, având atât o noțiune explicită de structură, cât și capacitatea de a învăța adaptativ cum sunt compuse proprietățile. Raționamentul cu privire la proprietățile compoziționale se bazează pe o bază continuă pe munca pe care sistemul este comandat să o efectueze în prezent.

În concluzie, este clar că este necesară o nouă abordare pentru a crea sisteme cu adevărat autonome: sisteme capabile să accepte schimbări semnificative și/sau să funcționeze în medii necunoscute. Acest lucru necesită o învățare adaptativă neîntreruptă și o generalizare din ceea ce este deja cunoscut. În ciuda numelui lor, abordările de învățare profundă au doar o reprezentare superficială a lumii care nu poate fi manipulată la un nivel înalt de procesul de învățare. În schimb, propunem ca sistemele AGI care apar în următoarea generație să încorporeze învățarea profundă într-o arhitectură mai largă, dotată cu capacitatea de a raționa direct despre ceea ce știe.

Capacitatea unui sistem de a raționa simbolic despre propria sa reprezentare conferă beneficii semnificative pentru industrie: cu o reprezentare explicit compozițională, sistemul poate fi auditat – fie de către oameni, fie intern de către sistemul însuși – pentru a îndeplini cerințele vitale de siguranță și corectitudine. Deși a existat multă îngrijorare academică cu privire la așa-numitele x-risc al AGI, focalizarea adecvată este mai degrabă problema de inginerie concretă a re-sarcinării unui sistem de control, păstrând în același timp aceste cerințe vitale, un proces pe care îl numim aliniere interactivă. Doar prin adoptarea acestui tip de sisteme de control, care sunt cursanți continui de încredere și eficienți, vom fi capabili să realizăm următoarea generație de autonomie preconizată de Industria 5.0.

De la o vârstă fragedă, Bas s-a întrebat cum inteligența permite cuiva să performeze competent, în ciuda resurselor inevitabil insuficiente. Pentru a înțelege mai bine raționalitatea naturală delimitată, cercetarea sa s-a concentrat inițial pe emoțiile artificiale, înainte de a trece la abordări prietenoase cu siliciul ale inteligenței generale în calitate de postdoctorat IDSIA, unde a primit câteva premii pentru cea mai bună lucrare și un grant de la Institutul Future of Life. La NNAISENSE, Bas conduce efortul de a dezvolta IA cu scop general.