Connect with us

Lideri de opinie

Personalitatea AI dvs. contează la fel de mult ca și coeficientul său de inteligență — și va face sau va strica implementarea la nivel de întreprindere

mm
A woman and a man standing on a high-rise balcony looking at a glowing data visualization that blends sharp blue geometric lines with soft amber waves, symbolizing the balance between AI benchmarks and personality.

Majoritatea companiilor încă aleg modelele de inteligență artificială pe baza benchmark-urilor. În practică, rareori acest lucru determină dacă aceste sisteme funcționează cu adevărat.

Până acum, majoritatea conversațiilor despre modelele de limbaj larg în medii de întreprindere au fost dominate de benchmark-uri. Echipele se îndreaptă spre performanța măsurabilă, cum ar fi care model este cel mai inteligent, cel mai puternic la codare, cel mai precis la rezumare sau la raționament matematic.

Dar pe măsură ce echipele încep să treacă dincolo de faza de experimentare și să se scufunde în implementarea reală la scară largă, alte factori importanți, care sunt în mare măsură neglijați de majoritatea directorilor executivi, se vor dovedi a fi la fel de cruciali pentru succesul unei afaceri.

Angajabilitatea AI

Inteligența brută și capacitatea analitică sunt, în mod evident, importante, dar cea mai subestimată variabilă în implementarea AI la nivel de întreprindere este personalitatea. Personalitatea, în contextul modelelor de limbaj larg, se referă la vocea, tonul și comportamentul constant pe care un model le transmite în interacțiuni. Este ceea ce face un AI să pară coerent și de încredere.

Atunci când implementează AI, afacerile trebuie să adopte aceeași abordare pe care o adoptă atunci când angajează un angajat uman: să evalueze nu numai cât de bine un model poate completa o sarcină, ci și atitudinea sa față de sarcină, modul în care comunică și modul în care se integrează în fluxul de lucru mai larg.

Capacitatea unui model de a menține coerența, de a răspunde adecvat și de a gestiona nuanțele în diferite contexte poate avea un impact semnificativ asupra rezultatelor afacerii. Un AI tehnic strălucit care răspunde lent, se abate în ton sau nu gestionează interacțiunile nuanțate poate fi aplicat incorect de afaceri, frustrând utilizatorii, scăzând implicarea și, în cele din urmă, reducând eficacitatea AI și succesul afacerii.

Acest lucru este mai ales important în industrii precum suportul pentru clienți, promovarea politică sau comunicarea internă, deoarece schimbările subtile în ton sau frazare între răspunsuri pot cauza confuzie, eroda încrederea și reduce implicarea generală. La fel ca și în cazul oamenilor, nu există un singur model de vis care să depășească concurența în fiecare categorie. Unele modele sunt mai bune la efectuarea de sarcini analitice, cum ar fi codarea sau matematica, în timp ce altele funcționează mult mai bine la scrierea conversațională și la rezumarea întâlnirilor.

Dar o provocare pentru echipele care construiesc pe baza acestor sisteme este că aceste caracteristici nu sunt fixe.

Un țintă în mișcare

Peisajul AI se evoluează mai repede decât majoritatea organizațiilor pot ține pasul. Noi versiuni sunt lansate frecvent, iar caracteristicile de performanță pot să se schimbe de la o actualizare la alta. Seria de modele Gemini a Google este un exemplu recent.

Gemini 2.0 Pro a fost lansat în februarie 2025 și a fost imediat prezentat ca modelul steag pentru dezvoltatori și întreprinderi care îl utilizează pentru codare și prompturi complexe la nivel mondial.

A venit cu ceea ce, la acea vreme, era cea mai mare fereastră de context oferită vreodată de Google, de două milioane de tokeni, ceea ce i-a dat capacitatea de a analiza și înțelege comprehensive cantități uriașe de informații deodată, și, în același timp, de a utiliza instrumente precum Google Search și chiar de a scrie cod.

Pentru echipele care construiesc sisteme care necesită procesarea rapidă și precisă a unor volume mari de date, părea a fi alegerea evidentă. Dar, în decurs de doar câteva săptămâni, Google a lansat Gemini 2.5 Pro, care a depășit liderii și a zburat dincolo de predecesorul său cu îmbunătățiri la codare, matematică și știință.

Peste noapte, modelul care tocmai devenise cea mai bună opțiune pe piață era deja înlocuit, mai puțin de două luni de la lansare. Dar adoptatorii timpurii au observat imediat că schimbările nu au fost doar incrementale sau analitice — întreaga personalitate a AI-ului fusese schimbată peste noapte. Mai mulți dezvoltatori au mers atât de departe încât au spus că AI-ul părea a fi “lobotomizat” după actualizare.

Ei s-au plâns că AI-ul părea să devină, literalmente, “mai prost” — producând constant răspunsuri mai lente, ieșiri mai puțin coerente și afișând incoerențe în modul în care gestiona prompturile pe care le-a gestionat anterior și sarcinile care au devenit rigide.

Și acesta este momentul în care strategia unei companii în jurul implementării AI începe să se schimbe fundamental.

Dincolo de benchmark-uri

Pe hârtie, Gemini 2.5 Pro ar fi trebuit să fie câștigătorul evident, cu îmbunătățirile sale uriașe în ceea ce privește capacitatea și siguranța.

Dar, în practică, aceste schimbări au alterat complet modul în care modelul era de încredere, modul în care se comporta, răspundea la prompturi și, în schimb, a trimis echipele care tocmai cheltuiseră o avere și petrecuseră ore nesfârșite construind în jurul acestor sisteme înapoi la punctul de plecare, dacă noile capacități ale modelului nu se aliniau cu pipeline-ul lor existent.

Chiar și schimbările mici în comportament pot perturba sistemele construite în jurul coerenței și previzibilității. Acest lucru creează un risc operațional real dacă o afacere este strâns legată de un singur model, deoarece orice actualizare poate introduce imediat instabilitate în echipele care se bazează pe aceste sisteme.

Pentru a combate acest lucru, multe companii cu viziune de viitor au început să implementeze o strategie multi-model, în care direcționează diferite sarcini către modelele cel mai bine adaptate pentru ele, în loc de a se baza pe un singur model pentru a gestiona totul.

Această abordare nu numai că îmbunătățește performanța adaptată fiecărei sarcini, ci reduce și riscul asociat cu implementarea AI, deoarece, dacă un model ar degrada după o actualizare, nu ar aduce întregul sistem care se bazează pe el la podea, deoarece există backup-uri disponibile.

Simplu spus, personalitatea și fiabilitatea AI sunt la fel de importante ca și inteligența brută atunci când vine vorba de aplicarea modelului într-un mediu de lucru pentru a completa diverse sarcini. Această schimbare de gândire reprezintă o schimbare fundamentală în modul în care afacerile nu mai cumpără doar “un instrument mai inteligent”, ci construiesc și gestionează un întreg sistem de infrastructură digitală.

Pentru ca companiile să nu numai supraviețuiască, ci să prospere în peisajul actual al afacerilor, echipele trebuie să stabilească conducte care pot înlocui diferite modele în funcție de sarcină și să monitorizeze constant cum actualizările afectează atât performanța, cât și calitatea interacțiunii.

În cele din urmă, modelele însele vor continua să evolueze la un ritm greu de urmat. Dar afacerile care planifică schimbarea, construiesc redundanță și tratează AI atât ca un instrument, cât și ca un coleg de echipă vor fi cele care transformă aceste schimbări rapide într-un avantaj competitiv.

Andrew Missey este co-fondatorul Convos, fost PubSent, o platformă de textare bidirecțională bazată pe inteligență artificială care ajută strategii politici, campanii, organizații non-profit și grupuri de lobby să livreze conversații personalizate, bazate pe fapte, cu alegătorii la scară națională, unde conduce produsul și ingineria. Înainte de Convos, Andrew a lucrat ca inginer software pentru mai multe companii, inclusiv o companie de startup cu sediul în Seattle, sprijinită de venture, care deservește branduri naționale de alimente și retail, cum ar fi Starbucks, Crumbl și Mod Pizza. În plus, Andrew este fluent în Javascript, Python și Typescript.