Lideri de opinie
Revoluția „Exolucie” a IA

Astăzi, aflându-ne la limita unei linii de falie tehnologice, observăm călătoria de la LLM-uri la agenți și, în cele din urmă, la IA agențială și IA generală, și nu este vorba doar de modele mai mari sau răspunsuri mai rapide. Este vorba și despre mașini care trec de la a fi asistenți pasivi la colaboratori activi și, poate, într-o zi, gânditori independenți.
Să urmărim acest drum și să explorăm ce înseamnă acest lucru pentru muncă, expertiză și rolul oamenilor în modelarea inteligenței de mâine.
Diferența dintre LLM-uri, sisteme bazate pe agenți și IA agențială
Pentru a înțelege mai bine diferența, iată un exemplu. Dacă îi cer unui LLM ceva de genul: „Vreau să călătoresc de la Chicago la Austin, să conduc nu mai mult de patru ore pe zi și să opresc în locuri pitorești”, un LLM obișnuit va returna un răspuns static în format de text, bazat pe generarea de limbaj. Va răspunde probabil doar la solicitare, fără a efectua o analiză amănunțită.
Un agent va clasifica mai întâi solicitarea ca fiind legată de călătorii. Apoi, va determina ce date sunt necesare: rute utilizând servicii de hartă, informații meteo, costuri de carburant, hoteluri, restaurante etc. După aceea, agentul va împărți solicitarea în sub-însărcinări și le va trimite la module specializate sau LLM-uri antrenate pe surse relevante. Acesta este orchestrarea și coordonarea mai multor modele și instrumente sub o logică unitară.
Astăzi, majoritatea sistemelor majore, cum ar fi ChatGPT sau Claude de la Anthropic, sunt, în esență, agenți. Deși poate părea utilizatorului că interacționează cu un singur model, în spatele scenei se află o arhitectură complexă care implică multe modele și sisteme. Ei pot already gestiona solicitări complexe, dar capacitățile lor sunt, în mare măsură, limitate la furnizarea de informații; nu pot lua încă acțiuni.
Un agent complet autonom este un sistem care adună informații și poate, de exemplu, rezerva independent un hotel, cumpăra un bilet sau iniția o plată, cu condiția să aibă acces la API-uri relevante sau date ale utilizatorului. Asemenea agenți se află în stadii incipiente de dezvoltare. În acest moment, ei sunt mai degrabă semi-agenți, capabili să proceseze informații, dar nu să efectueze acțiuni autonome.
O zonă interesantă de discuție în comunitatea de cercetare este IA agențială. În contrast cu un agent obișnuit, al cărui comportament este programat de dezvoltatori, IA agențială este un sistem care decide independent ce sarcini să execute, ce date are nevoie și chiar cum să-și continue propria pregătire. Acest lucru depășește executarea de instrucțiuni; implică luarea de decizii autonome. Cu toate acestea, IA agențială rămâne teoretică la acest stadiu; nu există astfel de sisteme în practică.
IA generală – un nou orizont. Dar este realizabilă?
Meta a investit în Scale AI acum trei luni. Scopul a fost să se alăture pe calea de a construi IA generală, capabilă să execute orice sarcină la nivel uman sau chiar să o depășească. Dacă IA de astăzi este o revoluție tehnologică, IA generală va fi o adevărată mega-revoluție; uneori o numesc „exolucie”, ceea ce înseamnă „exodul” IA din umbră. Cineva care o realizează primul va obține un avantaj strategic global.
În ceea ce privește cât de aproape suntem de IA generală reală, depinde foarte mult de cum o definim. Sunt de acord cu punctul de vedere al lui Ilya Sutskever: IA generală este un sistem capabil să execute orice sarcină intelectuală pe care o poate face un om. Nu doar să răspundă la întrebări, ci să raționeze, să ia decizii, să generalizeze și să interpreteze în diverse domenii. IA generală adevărată este universală și nu este limitată la sarcini înguste.
Niciunul dintre modelele actuale nu a atins acest nivel. Ne mișcăm în acea direcție, dar IA generală adevărată, în sens teoretic, încă nu există. Și, poate, că este mai bine așa. Ne aflăm încă într-o fază de aproximare și este probabil că vom rămâne acolo pentru o perioadă lungă de timp.
Baza IA generale va fi, probabil, un sistem bazat pe agenți. Nu va depinde neapărat de un singur LLM, deoarece, la fel cum niciun om, indiferent de cât de strălucit, nu poate stăpâni toate domeniile de cunoaștere și abilități, niciun LLM nu poate gestiona întregul spectru de sarcini ale IA generale de unul singur. Ce vom avea nevoie este o formă de „inteligență colectivă”: o arhitectură capabilă să coordoneze multiple modele și componente.
IA generală va apărea, probabil, nu doar ca un agent proiectat de om, ci ca un meta-agent. Va fi un sistem care este parțial dezvoltat și evoluează cu ajutorul IA însăși. Acest lucru este important, deoarece sistemele proiectate în întregime de oameni pot avea limitări inerente. Implicarea IA în procesul de proiectare poate ajuta la depășirea acestor limitări și la facerea sistemului mai adaptabil.
IA generală nu va veni, probabil, dintr-o singură descoperire specifică. Nu din modele LLM mai mari, agenți mai deștepți sau arhitecturi complet noi, ci dintr-o sinteză a tuturor acestor elemente. Probabil, ceva fundamental nou care depășește categoriile pe care le folosim în prezent.
„Ultimul examen al omenirii” și alte repere pentru IA generală
„Ultimul examen al omenirii” (HLE) este una dintre reperele mai ambițioase discutate în contextul LLM-urilor, agenților și IA generale. În esență, este un test care constă din aproximativ 2.500 de întrebări care acoperă o gamă largă de discipline academice – matematică, fizică, biologie, chimie, inginerie, informatică și chiar șah. Ideea este să se evalueze dacă un sistem IA poate rezolva probleme la un nivel care reflectă o înțelegere umană adevărată.
Modelele lingvistice actuale obțin rezultate foarte slabe la HLE, adesea scoruri sub 5% acuratețe. Acest lucru este în contrast puternic cu alte repere, cum ar fi MMLU sau GPQA, unde modelele obțin scoruri semnificativ mai mari. Dificultățile pe care le întâmpină modelele cu HLE subliniază cât de departe sunt acestea de adevărata inteligență generală.
Este important de remarcat că o performanță ridicată la repere cu seturi de date cunoscute sau înguste nu indică neapărat prezența adevăratei inteligențe generale. Un model poate fi ajustat sau „antrenat pentru test”, ceea ce poate infla aparent abilitățile sale. Chiar și un scor perfect la HLE nu ar însemna că am atins IA generală; ar însemna doar că am trecut un anumit test.
Ce pune în mișcare IA generală
Sunt de acord în totalitate că pilonii de bază ai IA generale sunt datele, calculul și talentul. Situația cu calculul este clară. Jucători cheie, cum ar fi Meta, au încercat să producă propriile cipuri, investind miliarde în procesul de dezvoltare a cipurilor. Dar companiile încă se bazează foarte mult pe cipuri și putere de calcul a altor jucători, cum ar fi Nvidia, care nu numai că furnizează hardware-ul necesar, dar și înțeleg importanța creșterii producției.
Mai multe întrebări sunt legate de date și talente. Internetul s-a epuizat — nu există niciun text creat de om din surse deschise care să nu fi fost folosit pentru antrenarea modelelor până în acest moment. Volumul total de informații pe care l-a produs omenirea până acum se dovedește a fi surprinzător de mic. De aceea, companiile încep să colaboreze activ cu cei care pot genera date de calitate umană.
Automatizare completă sau omul în buclă?
Un alt punct — scăderea cererii de anotare manuală a datelor. Acum câțiva ani, industria se extindea la viteza maximă. Mii de anotatori erau angajați pentru a hrăni foamea de date a pipeline-urilor IA. Astăzi, mult din această dinamică s-a mutat către automatizare. Modelele au maturizat, și tot astfel a făcut și instrumentarul din jurul lor.
Luați, de exemplu, recunoașterea facială. A fost una dintre principalele motoare ale volumului de anotare a imaginilor. Dar această categorie este, în mare măsură, rezolvată în prezent. Modele precum YOLO, SAM și Samurai absorb rapid munca de rutină. Aceste sisteme comprimă săptămâni de efort manual în minute, adesea cu o acuratețe uimitoare. Am implementat, de asemenea, multe instrumente asistate de ML în platforma noastră proprie Keylabs. Acest lucru ajută realmente la reducerea fluxului de lucru de rutină.
Toate aceste modele sunt limitate, însă, de capacitatea lor de generalizare și sunt potrivite pentru automatizarea operațiunilor standard și uniforme. Cazurile complexe sau unice încă necesită atenția umană.
Ne îndepărtăm de vechiul paradigme în care un anotator era doar o persoană atentă la detalii care putea recunoaște un obiect sau o emoție. În noua realitate, sunt necesari profesioniști: medici pentru a anota imagini medicale, programatori pentru a codifica, arhitecți pentru a crea planuri, marketeri pentru insight-uri de clienți și experți militari pentru scenarii de apărare.
Începem deja să vedem cazuri din lumea reală, cum ar fi piloții de luptă care anotează date pentru IA și câștigă 1.000 de dolari pe oră pentru expertiza lor. Deoarece asemenea specialiști sunt rari, iar cunoștințele lor sunt critice pentru antrenarea IA de înaltă performanță.
Lumea se schimbă: din ce în ce mai mult, oamenii devin operatori și „antrenori” ai inteligenței artificiale. Chiar ieri, am primit un mesaj pe LinkedIn care mă ruga să verific un set de date pentru o aplicație IA destinată directorilor executivi. În viitor, oricare dintre noi ar putea primi o ofertă de a lucra ca anotator, nu doar ca o persoană care apasă butoane, ci ca expert a cărui cunoaștere modelează inteligența de mâine.
Deja trăim în această nouă realitate, o lume de etichetare a datelor și antrenare a IA. Cei care o recunosc și se adaptează vor obține un avantaj semnificativ.












