Lideri de opinie

Arhitectura de revizuire contează mai mult decât modelul în Inteligența Artificială pentru întreprinderi

mm

Următoarea fază a maturității IA în întreprinderi depinde mai puțin de modele mai bune și mai mult de construirea unei arhitecturi de încredere în jurul lor.

Fiecare conversație despre guvernanța IA pe care am avut-o în ultimii doi ani se învârte în jurul acelorași preocupări: ratele de halucinație, benchmark-urile de acuratețe și testele de aliniere. Acestea sunt probleme reale, desigur, dar conversația a fost ancorată în partea greșită a problemei.

Deși modelele s-au îmbunătățit considerabil, numărul de ieșiri neverificate ale IA care ajung la factorii de decizie de nivel superior a crescut alături de ele. Această supraveghere indică o problemă de arhitectură de revizuire, și industria abia discută despre acest lucru.

Povestea centrată pe model a depășit realitatea

Cadrul dominant în IA pentru întreprinderi încă tratează calitatea modelului ca variabila principală: dacă modelul este suficient de precis, ieșirea este de încredere. Această logică era înțeleasă cu doi ani în urmă, când primele LLM-uri erau mai inconsistente și predispuse la halucinație, dar situația s-a schimbat.

Modelele de astăzi produc răspunsuri politicoase, bine structurate, bogate în citate, într-o gamă enormă de sarcini, formulate în limbajul factorilor de decizie. Organizațiile utilizează acum IA într-un volum care depășește cu mult capacitatea proceselor lor de revizuire. Cercetările despre adoptarea IA în dezvoltarea de software au documentat acest decalaj, unde dezvoltatorii asistați de IA finalizează 21% mai multe sarcini, în timp ce timpul de revizuire a solicitărilor de extragere crește cu 91%. Producția crește, deci capacitatea nu mai este un blocaj. Capacitatea de revizuire este adevăratul obstacol.

Ce arată datele în munca de analiză

Industria de analiză este un loc avantajos pentru a studia această problemă, deoarece profesioniștii din cercetare sunt sceptici instruiți. Ei știu diferența dintre corelație, cauzalitate, descoperiri și concluzii. Punerea la îndoială a calității datelor face parte din munca lor.

Conform Indexului de încredere Knit AI, 92% dintre profesioniștii din domeniul analiză din întreprinderi raportează că ieșirile generate de IA ajung la conducerea superioară fără o revizuire cuprinzătoare.
Rezultatele Indexului de încredere identifică trei puncte de presiune majore:

  • Volumul a depășit capacitatea de verificare. Echipele generează mai multe ieșiri decât au capacitatea de a le examina cu atenție.
  • Încrederea a crescut mai repede decât comportamentul de verificare s-a schimbat. Cercetătorii se simt în general pozitivi cu privire la calitatea IA, în timp ce recunosc că practicile lor de revizuire nu au ținut pasul.
  • Instrumentele pentru revizuirea lucrării IA sunt în urmă față de instrumentele pentru producerea acesteia. Organizațiile au investit masiv în capacitățile de generare și relativ puțin în infrastructura pentru revizuirea și urmărirea a ceea ce a produs IA.

Ieșirile politicoase invită la o examinare mai puțin atentă

Modul de eșec mai greu de abordat nu este cazul în care IA produce un răspuns evident greșit și cineva îl prinde. Problema mai grea este biasul de automatizare, tendința de a reduce examinarea ieșirilor care par autoritare și bine structurate. O revizuire sistematică din 2025 publicată în AI & Society a examinat acest lucru în 35 de studii peer-review și a constatat că ieșirile IA politicoase și de încredere reduc constant adâncimea examinării umane — chiar și printre profesioniștii experimentați. Când ceva pare corect, alocăm mai puțină atenție pentru a verifica dacă este.

Această supraveghere creează o problemă de propagare. O ieșire de cercetare pe care un analist o examinează doar superficial devine un punct de date într-un raport de nivel VP, care devine baza unei discuții la nivel de consiliu de administrație. Până când o eroare ajunge atât de departe, originea ei este invizibilă și corectarea ei este scumpă. Pierderile globale ale afacerilor din cauza inexactităților generate de IA au depășit 67 de miliarde de dolari în 2024. Costurile de verificare pe angajat pot ajunge la 14.200 de dolari pe an, doar pentru a verifica dacă conținutul generat de IA este precis. Din nou, acestea nu sunt probleme de calitate a modelului; sunt probleme de arhitectură de revizuire.

Ce arată fluxurile de lucru IA mature

Organizațiile care gestionează bine această problemă nu folosesc modele mai bune decât oricine altcineva. În schimb, au construit o infrastructură de revizuire mai cuprinzătoare în jurul modelului pe care îl utilizează. Patru principii definesc abordarea lor:

  1. Proveniență vizibilă

Fiecare ieșire a IA poartă un record transparent al originii sale. Acest record oferă revizorilor o perspectivă valoroasă asupra a ceea ce trebuie să evalueze pentru a evalua eficient ieșirile. Nu puteți evalua o pretenție care nu poate fi urmărită.

  1. Revizuire în trepte, după mize

Nu toate ieșirile IA au același risc. Fluxurile de lucru mature aplică intensitatea revizuirii proporțional cu consecințele downstream ale greșelii. Ieșirile cu risc ridicat primesc mai multe examinări și verificări structurate. Ieșirile de rutină se deplasează mai repede.

  1. Fricțiune în locurile potrivite

Organizațiile care se luptă cel mai mult cu încrederea în IA au eliminat fricțiunea în mod uniform, tratând viteza ca scopul universal. Cele de succes au fost selective: au păstrat fricțiunea intenționată la punctele de predare unde ieșirile IA devin decizii organizaționale. Procesele lor necesită aprobare înainte ca o constatare generată de IA să intre într-un raport de nivel consiliu de administrație sau o etapă de provocare structurată înainte ca constatările să intre în discuții de strategie.

  1. Bucle de feedback către stratul de model

Cele mai bune fluxuri de lucru tratează revizuirea ca un proces generativ de date, nu ca un punct de control. Când un revizor semnalează o eroare sau anulează o recomandare a IA, acel semnal este capturat și returnat în modul în care IA este implementată în munca viitoare. Raportul OpenAI despre starea IA pentru întreprinderi a constatat că organizațiile cu cele mai bune performanțe se disting nu prin sofisticarea modelelor, ci prin rigurozitatea proceselor de implementare. Organizațiile fără acest buclă de feedback încep de la zero de fiecare dată.

Următoarea fază se câștigă la nivelul de revizuire

Adevăntajul competitiv real în industria de analiză este cine poate avea încredere constantă în ceea ce produce. Acea încredere vine din a ști de unde provine o ieșire, cine a revizuit-o și ce s-a întâmplat când ceva a fost greșit. Istoria recentă a răspuns la întrebarea modelului; infrastructura organizațională pentru implementarea responsabilă a modelului la scară este unde industria încă se recuperează.

Faptul că 92% dintre profesioniștii din domeniul analiză au văzut conținutul neexaminat al IA care ajunge la conducerea superioară nu este o eșec a tehnologiei. Este o eșec a proiectării organizaționale, și se manifestă în toate industriile, oriunde viteza a fost optimizată și revizuirea a fost tratată ca un cost. Compania cu modelul cel mai deștept nu va câștiga următoarea fază a IA pentru întreprinderi, ci compania cu cea mai de încredere arhitectură de revizuire în jurul acesteia.

Aneesh Dhawan este co-fondator și CEO al Knit, Agenția de Cercetare Nativă AI. El a petrecut ultimii 5 ani la intersecția inteligenței artificiale pentru întreprinderi și metodologie de cercetare. Knit lucrează cu organizații precum Google, Amazon, T-Mobile și ESPN pentru a oferi insight-uri gata de luat decizii la viteza inteligenței artificiale.