Vođe misli
Ako vaša umjetna inteligencija halucinira, nemojte kriviti umjetnu inteligenciju

"Halucinacije" umjetne inteligencije - ti uvjerljivo zvučeći, ali lažni odgovori - privlače mnogo medijske pozornosti, kao što je to slučaj s nedavnim člankom u New York Timesu, Umjetna inteligencija postaje sve moćnija, ali njezine halucinacije su sve goreHalucinacije su stvarna opasnost kada imate posla s chatbotom za potrošače. U kontekstu poslovnih primjena umjetne inteligencije, to je još ozbiljnija briga. Srećom, kao lider u poslovnoj tehnologiji imam i veću kontrolu nad tim. Mogu se pobrinuti da agent ima prave podatke za davanje smislenog odgovora.
Jer to je pravi problem. U poslu nema opravdanja za AI halucinacijePrestani kriviti umjetnu inteligenciju. Krivi sebe što ne koristiš umjetnu inteligenciju pravilno.
Kada generativni AI alati haluciniraju, oni rade ono za što su namijenjeni – daju najbolji mogući odgovor na temelju dostupnih podataka. Kada izmišljaju stvari, proizvodeći odgovor koji nije utemeljen na stvarnosti, to je zato što im nedostaju relevantni podaci, ne mogu ih pronaći ili ne razumiju pitanjeDa, novi modeli poput OpenAI-jevih o3 i o4-mini više haluciniraju, ponašajući se još „kreativnije“ kada nemaju dobar odgovor na postavljeno pitanje. Da, moćniji alati mogu više halucinirati – ali također mogu proizvesti snažnije i vrijednije rezultate ako ih postavimo za uspjeh.
Ako ne želite da vaša umjetna inteligencija halucinira, nemojte je izgladnjivati za podacima. Dajte umjetnoj inteligenciji najbolje i najrelevantnije podatke za problem koji želite riješiti i neće biti u iskušenju da skrene s puta.
Čak i tada, pri radu s bilo kojim AI alatom, preporučujem da zadržite svoje vještine kritičkog mišljenja netaknutima. Rezultati koje AI agenti postižu mogu biti produktivni i ugodni, ali poanta nije isključiti mozak i pustiti softver da obavi sav posao umjesto vas. Nastavite postavljati pitanja. Kada vam AI agent da odgovor, preispitajte taj odgovor kako biste bili sigurni da ima smisla i da je potkrijepljen podacima. Ako je tako, to bi trebao biti ohrabrujući znak da se isplati uložiti vrijeme u postavljanje dodatnih pitanja.
Što više pitanja postavljate, to ćete dobiti bolje uvide.
Zašto se javljaju halucinacije
Nije to neka misterija. Umjetna inteligencija ne pokušava vas lagati. Svaka umjetna inteligencija zasnovana na modelu velikih jezika (LLM) u biti predviđa sljedeću riječ ili broj na temelju vjerojatnosti.
Na višoj razini, ono što se ovdje događa jest da LLM-ovi nižu rečenice i odlomke riječ po riječ, predviđajući sljedeću riječ koja bi se trebala pojaviti u rečenici na temelju milijardi drugih primjera u svojim podacima za obuku. Preci LLM-ova (osim Clippyja) bili su upiti za automatsko dovršavanje tekstualnih poruka i računalnog koda, automatizirani alati za prevođenje ljudskog jezika i drugi probabilistički lingvistički sustavi. S povećanom snagom grube sile računanja, plus obukom na količinama podataka internetske skale, ovi su sustavi postali dovoljno „pametni“ da su mogli voditi puni razgovor putem chata, kao što je svijet naučio uvođenjem ChatGPT-a.
Skeptici umjetne inteligencije vole istaknuti da to nije isto što i prava „inteligencija“, već samo softver koji može destilirati i povratiti ljudsku inteligenciju koja je u njega uložena. Zamolite ga da sažme podatke u pisanom izvješću i on će oponašati način na koji su drugi pisci saželi slične podatke.
To mi se čini kao akademski argument sve dok su podaci točni i analiza korisna.
Što se događa ako umjetna inteligencija nema podatke? Popunjava praznine. Ponekad je smiješno. Ponekad je to potpuni kaos.
Prilikom gradnje AI agenti, ovo je 10 puta veći rizik. Agenti bi trebali pružati praktične uvide, ali donose više odluka putem. Izvršili su zadatke u više koraka, gdje rezultat koraka 1 utječe na korake 2, 3, 4, 5, ... 10 ... 20. Ako su rezultati koraka 1 netočni, pogreška će se pojačati, što će rezultat u koraku 20 učiniti još gorim. Pogotovo jer agenti mogu donositi odluke i preskakati korake.
Ako se pravilno postupi, agenti postižu više za tvrtku koja ih koristi. No, kao menadžeri AI proizvoda, moramo prepoznati veći rizik koji ide uz veću nagradu.
Što je naš tim i učinio. Uvidjeli smo rizik i uhvatili se u koštac s njim. Nismo samo izgradili otmjenog robota; pobrinuli smo se da radi na pravim podacima. Evo što mislim da smo ispravno napravili:
- Izgradite agenta tako da postavlja prava pitanja i provjerava ima li ispravne podatke. Pobrinite se da je početni proces unosa podataka agenta zapravo determinističkiji, manje "kreativan". Želite da agent kaže kada nema ispravne podatke i da ne nastavlja na sljedeći korak, umjesto da izmišlja podatke.
- Strukturirajte priručnik za svog agenta – pobrinite se da ne izmišlja svaki put novi plan, već da ima polustrukturiran pristup. Struktura i kontekst izuzetno su važni u fazi prikupljanja i analize podataka. Možete pustiti agenta da se opusti i djeluje „kreativnije“ kada ima činjenice i spreman je napisati sažetak, ali prvo se pobrinite da činjenice budu točne.
- Izradite visokokvalitetni alat za izdvajanje podataka. To bi trebalo biti više od pukog API poziva. Odvojite vrijeme za pisanje koda (ljudi to još uvijek rade) koji će prikupiti pravu količinu i raznolikost podataka, ugrađujući provjere kvalitete u proces.
- Neka agent pokaže svoj rad. Agent treba navesti svoje izvore i povezati se s mjestom gdje korisnik može provjeriti podatke, iz originalnog izvora, i dalje ih istražiti. Nije dopušteno podcjenjivanje!
- Zaštitne ograde: Razmislite što bi moglo poći po zlu i ugradite zaštite od pogrešaka koje apsolutno ne smijete dopustiti. U našem slučaju to znači da kada agent zadužen za analizu tržišta nema podatke - pod čime mislim na naše podatke sa Similarweba, a ne na neki slučajni izvor podataka izvučen s weba - osiguravanje da se nešto ne izmisli ključna je zaštitna ograda. Bolje je da agent ne može odgovoriti nego dati lažan ili obmanjujući odgovor.
Ove smo principe uključili u nedavno izdanje naša tri nova agenta, a uskoro će ih biti još. Na primjer, naš AI Meeting Prep Agent za prodajne predstavnike ne traži samo naziv ciljane tvrtke, već i detalje o cilju sastanka i s kim je, pripremajući ga za pružanje boljeg odgovora. Ne mora nagađati jer koristi obilje podataka o tvrtki, digitalnih podataka i profila rukovoditelja kako bi informirao svoje preporuke.
Jesu li naši agenti savršeni? Ne. Nitko još ne stvara savršenu umjetnu inteligenciju, čak ni najveće tvrtke na svijetu. Ali suočavanje s problemom puno je bolje od ignoriranja.
Želite manje halucinacija? Dajte svojoj umjetnoj inteligenciji dobar dio visokokvalitetni podaci.
Ako halucinira, možda nije umjetna inteligencija ta koju treba popraviti. Možda je to vaš pristup iskorištavanju ovih moćnih novih mogućnosti bez ulaganja vremena i truda da ih se ispravno dovede u red.