Connect with us

Când “cunoștințele” IA sunt vechi de 50 de ani: Riscul de conformitate pe care nu-l poți ignora

Lideri de opinie

Când “cunoștințele” IA sunt vechi de 50 de ani: Riscul de conformitate pe care nu-l poți ignora

mm

Problema insight-urilor false ale IA este o provocare urgentă, pe măsură ce întreprinderile își cresc utilizarea instrumentelor generative. În ciuda entuziasmului larg răspândit cu privire la adoptarea IA, există și o puternică curentă de critică. Comentatorii critici adesea atrag atenția asupra inexactităților aparent aleatorii și imprevizibile din output-ul IA, care subminează valoarea acesteia și pot chiar pune în pericol sănătatea umană, în special în sectoare precum sănătatea și transporturile, unde output-urile false ar putea duce teoretic la totul, de la prescrierea greșită a medicamentelor la trenuri pe cale de coliziune.

Adesea, aceste inexactități au fost puse pe seama “halucinațiilor” IA – instanțe în care IA generează un răspuns “cel mai bun”, prezentat cu aceeași încredere ca și un răspuns “autentic”, în loc să informeze utilizatorul despre o lacună în cunoștințele sau capacitățile sale. Halucinațiile pot fi greu de detectat la prima vedere – dar există o problemă mai gravă și mai tăcută, care este și mai greu de detectat.

Datoria calității datelor: Talonul lui Ahile al IA

Când sistemele IA extrag informații din date învechite, incomplete sau inexacte, output-urile false apar, dar sunt mai greu de detectat. De exemplu, puteți cere IA să identifice simptomele unei afecțiuni medicale și să primiți un răspuns bazat pe o lucrare de 50 de ani, în loc de cercetări actuale. Rezultatul este puțin probabil să apară evident, ridicol de greșit – dar acea aparență inițială de plauzibilitate prezintă un risc real atât pentru pacient, cât și pentru furnizorul de servicii medicale.

Același lucru este valabil și în alte industrii – dacă datele furnizate modelului IA conțin informații vechi, învechite sau parțiale, există un risc ridicat de output-uri false. Pe măsură ce mai multe companii integrează IA în procesele de afaceri critice, riscul de a trage concluzii false din datele slab gestionate crește.

Exactitate pentru regulator

Acesta nu este doar un problemă pentru operațiunile zilnice – este și o provocare semnificativă de conformitate. Cerințele de reglementare se dezvoltă rapid pentru a aborda preocupările legate de IA inexactă. De exemplu, au avut loc o serie de acțiuni de reglementare timpurie cu privire la IA; în special, atunci când Italia a interzis temporar ChatGPT din cauza problemelor de confidențialitate, iar Grupul de lucru al UE pentru protecția datelor a lansat o echipă specială pentru a coordona acțiunile de aplicare a legii împotriva ChatGPT.

Una dintre cele mai semnificative modificări de reglementare a fost adoptarea Actului UE privind IA, primul cadru juridic cuprinzător pentru IA. Actul stabilește obligații bazate pe nivelul de risc al sistemelor IA, de la sisteme cu “risc inacceptabil”, care sunt interzise, la sisteme cu “risc ridicat”, care fac obiectul unor cerințe stricte privind transparența, calitatea datelor, guvernanța și supravegherea umană.

Importanța Actului UE privind IA nu constă în amploarea sa ambițioasă, ci în precedentul pe care îl stabilește. Regulatorii fac clar că IA va fi supusă unor reguli obligatorii și că organizațiile trebuie să trateze conformitatea și transparența cu privire la modul și locul în care se utilizează IA ca o parte integrantă a adoptării IA, și nu ca o grijă ulterioară.

Actul are un domeniu de aplicare larg, cu potențialul de a afecta o proporție semnificativă a dezvoltărilor IA. La baza sa se află scopul de a face IA sigură, respectând în același timp drepturile și valorile fundamentale. În cadrul acestui nou ecosistem bazat pe principii, se diagnostichează potențiale surse de inexactități ale IA, inclusiv datele și seturile de date care alimentează modelele, opacitatea și accesul la modele, precum și proiectarea și utilizarea sistemelor. Soluțiile IA sunt un construct al tuturor acestor elemente – problemele cu oricare dintre acestea pot avea un rezultat negativ. Nu numai atât, dar datele care intră în proiectarea, dezvoltarea, implementarea și operarea IA sunt probabil să fie alcătuite în principal din înregistrări comerciale, care sunt supuse la rândul lor unor cerințe de conformitate diverse.

Cu alte cuvinte, mediul de reglementare în jurul IA devine din ce în ce mai strict – și acest lucru este la fel de valabil și pentru datele de intrare, precum și pentru datele de ieșire, deși acestea din urmă primesc mai multe titluri.

Cinci pași pentru a alimenta IA cu date conforme, actuale și relevante

Pentru a rezolva această provocare duală – asigurarea atât a manipulării datelor conforme, cât și a intrărilor de înaltă calitate care permit ieșiri de înaltă calitate – întreprinderile au nevoie de control asupra datelor de antrenament și de inferență. Din nefericire, acest lucru este ceva pe care multe întreprinderi încă nu îl dețin.

Cel puțin, organizațiile ar trebui să aplice programele lor mai ample de conformitate și guvernanță inițiativelor IA. Ei trebuie să înceapă să capteze și să mențină înregistrări adecvate cu privire la datele pe care le alimentează modelele IA, la modul în care sunt proiectate modelele și sistemele, precum și la deciziile și conținutul generat prin IA.

Cu toate acestea, este devenit din ce în ce mai important ca organizațiile să meargă dincolo de acest lucru și să se asigure că au control deplin asupra tuturor datelor care ar putea fi utilizate în mod fezabil în implementările IA, atât pentru antrenamentul inițial, cât și pentru “lucrul live”. Acest lucru necesită o strategie de gestionare și stocare a datelor de înaltă calitate, care să asigure că toate datele relevante sunt colectate inteligent, curățate, stocate, clasificate și îndreptățite. Pentru a realiza acest lucru, organizațiile trebuie să ia în considerare patru pași cheie:

1. Proveniența și linia de date

Acest lucru include menținerea unei înregistrări a sursei datelor, a originii, a proprietarului și a oricăror modificări ale metadatelor (dacă este permis) pe parcursul ciclului de viață. Acest lucru înseamnă, de asemenea, menținerea metadatelor bogate și a tuturor documentelor sau artifactelor subiacente din care provine.

2. Autenticitatea datelor

Acest lucru necesită menținerea unei lanțuri clare de custodie pentru toate datele, stocarea obiectelor în formele lor native și hasharea obiectelor primite pentru a demonstra că datele rămân neschimbate. În plus, organizațiile trebuie să mențină o istorie completă de audit pentru fiecare obiect și pentru toate acțiunile și evenimentele legate de orice modificări.

3. Clasificarea datelor

Stabilirea naturii unui set sau tip de date este importantă. Organizațiile trebuie să poată guverna date structurate, date semi-structurate și seturi structurate de date. Atribuirea unei scheme unice pentru fiecare clasă poate permite organizațiilor să gestioneze diverse seturi de date fără o ontologie fixă de tip “unul pentru toți” – evitând manipularea inutilă a datelor pentru a le forța într-o structură de date inflexibilă.

4. Normalizarea datelor

Stabilirea definițiilor și formatele comune ale metadatelor este importantă pentru utilizarea în analize și soluții IA. Schemele clar definite sunt un element important, împreună cu instrumentele care pot transforma sau mapa datele pentru a menține vederi normalizate și consistente ale datelor legate.

5. Împuternicirile datelor

Întreprinderile au nevoie de controale granulare de împuternicire, inclusiv la nivel de obiect sau câmp, pe baza profilurilor de utilizator sau sistem. Acest lucru înseamnă că datele corecte sunt disponibile utilizatorilor și sistemelor care au dreptul de a le accesa, în timp ce se restricționează sau se limitează accesul la acestea pentru cei care nu au acest drept.

Cu aceste elemente esențiale în loc, afacerile vor fi cel mai bine plasate pentru a se asigura că datele furnizate modelelor IA sunt atât de înaltă calitate, cât și conforme. IA va conduce la îmbunătățiri și eficiențe pe întregul spectru al industriilor – dar pentru ca acest lucru să se întâmple, o fundație solidă a datelor este esențială.

George Tziahanas este VP de Conformitate și Avocat General Asociat la Archive360. George este un lider executiv cu o înțelegere profundă a tehnologiei complexe, reglementărilor bancare, guvernanței datelor și managementului riscului. Și, lucrează îndeaproape cu clienții actuali și potențiali pentru a asigura îndeplinirea cerințelor complexe de guvernanță a datelor și conformitate, aliniindu-se cu soluțiile Archive360.