Lideri de opinie
De ce calitatea datelor decide dacă inteligența artificială a companiilor reușește sau eșuează

De la lansarea ChatGPT de către OpenAI la sfârșitul anului 2022, fiecare companie s-a grăbit să accelereze cu inteligența artificială. Marii jucători din domeniul hardware, cum ar fi Nvidia, vând mai multe procesoare grafice decât oricând, în timp ce marii constructori de modele, cum ar fi OpenAI și Anthropic, continuă să construiască modele din ce în ce mai mari.
Și totuși, chiar și cu cele mai avansate modele și cele mai mari bugete, multe proiecte de inteligență artificială nu reușesc să atingă scopul propus. Am văzut acest lucru în diverse industrii, de la sănătate la transport și finanțe. Motivul nu este departe de a fi înțeles: inteligența artificială este la fel de bună pe cât este de bună datele pe care este antrenată și pe care le primește în timp real. Când aceste date sunt etichetate prost, învechite sau incomplete, niciun model nu poate oferi rezultate consistente sau de încredere.
Acesta este marele problemă cu care se confruntă multe companii astăzi. Ei investesc masiv în instrumente de inteligență artificială, în timp ce sistemele lor de date rămân dispersate și neverificabile. Rezultatul este o iluzie de progres. În timp ce modelele oferă răspunsuri impresionante, informațiile sunt adesea bazate pe fundații slabe. Barierele reale pentru succesul inteligenței artificiale nu sunt performanța modelului. Este calitatea datelor.
Ce înseamnă realmente date de calitate
Datele de calitate nu se referă doar la acuratețe. Înseamnă informații care sunt actuale, complete și relevante pentru problema în cauză. Imaginați-vă un client care încearcă să anuleze o comandă pe un site de comerț electronic. Sistemul trebuie să verifice detaliile comenzii, starea de livrare și înregistrarea plății. Dacă oricare dintre aceste puncte de date se află în sisteme diferite care nu comunică între ele, asistentul de inteligență artificială va eșua în a oferi un răspuns util.
Datele de calitate conectează aceste puncte instantaneu. Permite inteligenței artificiale să vadă o imagine completă, în loc de fragmente ale acesteia. Datele proaste, pe de altă parte, forțează modelul să ghicească. Și atunci când inteligența artificială începe să ghicească, face greșeli care costă bani și afectează încrederea. Exemple recente arată cât de periculoase pot fi astfel de presupuneri.
Chatbot-ul de afaceri al orașului New York a oferit sfaturi ilegale pentru că a extras informații din surse juridice învechite sau incomplete. Botul de asistență pentru clienți al companiei aeriene Air Canada a făcut cereri false de rambursare pentru că a lipsit contextul din politica companiei. Chiar și sistemele de angajare pe scară largă au filtrat în mod greșit candidații din cauza datelor biasate sau etichetate incorect, așa cum se vede în primul acord de soluționare a litigiilor legate de inteligență artificială al EEOC. Aceste eșecuri nu sunt doar tehnice. Sunt de natură reputațională și financiară și provin din sisteme de inteligență artificială antrenate pe date neverificabile.
Studiile din industrie confirmă amploarea acestei probleme. Gartner raportează că 80 la sută din proiectele de inteligență artificială eșuează în a scala din cauza calității proaste a datelor și a lipsei de guvernanță. Similar, un sondaj al MIT Sloan Management Review a constatat că problemele de date, și nu algoritmii, sunt principala cauză pentru care proiectele de inteligență artificială a companiilor eșuează.
Cultura este la fel de importantă ca și codul
Îmbunătățirea calității datelor nu este ceva ce poate fi reparat cu un singur instrument sau comandă. Acesta necesită o schimbare culturală. De aceea, liderii de afaceri trebuie să trateze datele ca pe un sistem viu care necesită îngrijire și responsabilitate. Acest lucru nu se referă doar la a declara că “vrem să facem datele mai bune” — acesta nu este suficient. Fiecare parte a organizației trebuie să înțeleagă cum se mișcă informația, cine o deține și ce se întâmplă atunci când se schimbă.
Am văzut cum se desfășoară acest lucru în sistemele din lumea reală. Multe aplicații de inteligență artificială se bazează pe actualizări nocturne de date. Dacă baza dvs. de date se actualizează o dată pe zi, cunoștințele modelului vor fi întotdeauna în urmă față de realitate. În medii cu schimbări rapide, această întârziere poate însemna informații învechite și decizii proaste. Companiile trebuie să reevalueze întregul flux de date, de la modul în care se colectează informațiile până la modul în care sunt livrate modelului.
Realizarea acestui lucru poate economisi enorm timp și costuri. Atunci când conductele de date sunt proiectate cu claritate și scop, sistemele de inteligență artificială pot învăța și acționa pe baza informațiilor recente și relevante. Când nu sunt, echipele petrec mai mult timp curățând datele decât utilizându-le.
Experții în gestionarea datelor subliniază adesea că cheia pentru o calitate puternică a datelor este un buclă de feedback între oameni, procese și platforme. Fără această buclă, informațiile devin învechite și modelele pierd contactul cu condițiile din lumea reală — o problemă cunoscută uneori sub numele de “alunecare a datelor”.
Echilibrarea vitezei cu integritatea
Există adesea o tensiune între a se deplasa rapid și a rămâne precis. Multe organizații doresc rezultate instantanee din investițiile lor în inteligență artificială, dar grăbirea poate duce la probleme mai mari ulterior. Scopul ar trebui să fie agilitatea datelor cu integritate. Cu alte cuvinte, construirea unor sisteme care pot să se deplaseze rapid fără a pierde precizia.
Pentru acest lucru, fiecare companie ar trebui să definească căi clare pentru ca datele să curgă de la sursă la model în timp real. De asemenea, ajută să se definească ce tip de informație este permisă și ce trebuie să rămână în afara modelului. Datele sensibile sau private nu ar trebui să ajungă la model, chiar dacă utilizatorul are acces tehnic la ele. Protejarea acestei limite construiește încredere și împiedică sistemele de inteligență artificială să scurgă sau să utilizeze în mod necorespunzător informații.
Pe măsură ce inteligența artificială devine mai autonomă, supravegherea umană va rămâne critică. Modelul nu ar trebui să aibă control deplin asupra acțiunilor de afaceri. Cu siguranță, nu ar trebui să ia decizii. În schimb, ar trebui să facă solicitări. Mai important, oamenii trebuie să revizuiască și să aprobe acțiunile sale pentru a se asigura că se aliniază cu politica companiei și reglementările.
Construirea calității de la zero
Menținerea calității datelor la scară nu este doar o chestiune de curățare a erorilor. Acesta începe cu arhitectura. Trebuie să identificați unde se află datele dvs. cele mai de încredere, apoi să proiectați un sistem care să le aducă împreună într-un singur loc de încredere. De acolo, puteți urmări ce date utilizează modelul și de unde provin.
Acest abordare preveni confuzia și menține sistemul transparent. De asemenea, ajută echipele să identifice și să corecteze mai rapid problemele atunci când apar. Când știți exact ce date au alimentat răspunsul modelului, puteți verifica și corecta erorile înainte de a se răspândi.
Viitorul inteligenței artificiale a companiilor va aparține companiilor care încorporează calitatea în infrastructura lor din start. Ne așteptăm să vedem mai multe sisteme de inteligență artificială “plug-and-play” care să gestioneze atât raționamentul, cât și integrarea datelor într-un singur pachet. Aceste “aparate de inteligență artificială” ar putea face mai ușor pentru organizații să implementeze sisteme inteligente fără a pierde controlul asupra datelor lor.
Analisti prevăd că organizațiile capabile să unească și să guverneze datele lor în mod eficient vor vedea o adoptare mai rapidă și un randament mai mare al investițiilor din proiectele de inteligență artificială. Un raport recent despre pregătirea datelor explică faptul că această capacitate separă companiile care inovează continuu de cele care se opresc după primele teste. Diferența adesea se reduce la faptul că sistemele lor de inteligență artificială sunt construite pe informații consistente și bine structurate.
Rezumatul
Calitatea datelor poate să nu pară atât de interesantă în comparație cu progresele în proiectarea modelului, dar este forța tăcută care decide dacă inteligența artificială reușește sau eșuează. Fără date curate, actuale și consistente, chiar și cele mai inteligente sisteme vor eşua. Cu ele, chiar și proiectele modeste de inteligență artificială pot crea valoare durabilă.
Fiecare lider care investește în inteligență artificială ar trebui să pună o întrebare simplă: Ne putem încrede în datele care ne conduc deciziile? Din ceea ce am văzut, companiile care pot răspunde cu încredere “da” sunt cele care conduc deja în cursa inteligenței artificiale.












