Ajatusjohtajat

Kun tekoÀly keksii faktat: Yrityksen riski, jota kukaan johtaja ei voi jÀttÀÀ huomiotta

mm

Se kuulostaa oikealta. Se näyttää oikealta. Se on väärin. Tämä on tekoäly, joka hallucinoi. Ongelma ei ole siinä, että nykyiset generatiiviset tekoälymallit hallusinoi. Se on, että meillä on sellainen tunne, että jos rakennamme tarpeeksi turvallisuutta, hienosäätöämme, RAG:ia ja kesytämme sen jollain tavoin, niin pystymme ottamaan sen käyttöön yrityksen laajuisesti.

Tutkimus Ala Hallusinaatioaste Tärkeimmät löydökset
Stanford HAI & RegLab (tammikuu 2024) Laki 69%–88% LLM-mallit osoittivat korkeita hallusinaatioasteita vastatessaan lakiin liittyviin kysymyksiin, usein ilman itsetietoisuutta virheistään ja vahvistaen virheellisiä oikeudellisia oletuksia.
JMIR-tutkimus (2024) Akateemiset viittaukset GPT-3.5: 90.6%, GPT-4: 86.6%, Bard: 100% LLM-malleilla luodut viittaukset olivat usein merkityksettömiä, virheellisiä tai tukemattomia saatavilla olevalla kirjallisuudella.
UK-tutkimus tekoälyluoduista sisällöistä (helmikuu 2025) Rahoitus Ei määritelty Tekoälyluodut disinformaatiot lisäsivät pankkien konkurssien riskiä, ja merkittävä osa pankkien asiakkaista harkitsi rahojensa siirtämistä tekoälyluodun väärän sisällön nähtyään.
Maailman talousfoorumin globaaliriskiraportti (2025) Globaali riskiarvio Ei määritelty Väärät tiedot ja disinformaatio, joita tekoäly vahvistaa, olivat korkein globaali riski kahden vuoden näkymässä.
Vectaran hallusinaatiolista (2025) Tekoälymallien arviointi GPT-4.5-Preview: 1.2%, Google Gemini-2.0-Pro-Exp: 0.8%, Vectara Mockingbird-2-Echo: 0.9% Arvioitiin eri LLM-mallien hallusinaatioasteita, paljastaen merkittäviä eroja suorituskyvyssä ja tarkkuudessa.
Arxiv-tutkimus tosiasiallisista hallusinaatioista (2024) Tekoälytutkimus Ei määritelty Esiteltiin HaluEval 2.0, jolla voidaan systemaattisesti tutkia ja havaita LLM-mallien hallusinaatioita, keskittyen tosiasiallisiin virheisiin.

Hallusinaatioasteet vaihtelevat 0,8%:sta 88%:iin

Kyllä, se riippuu mallista, alasta, käyttötarkoituksesta ja kontekstista, mutta tuo jakauma pitäisi herättää huomion yritysjohtajissa. Nämä eivät ole reunatapauksia. Ne ovat järjestelmällisiä. Miten teet oikean päätöksen, kun on kyse tekoälyn käyttöönotosta yrityksessäsi? Missä, miten, kuinka syvällä, kuinka laajasti?

Esimerkkejä tämän kaltaisten todellisten seurausten havaitsemisesta tulee päivittäin uutisvirrassa. G20:n rahoitusvakausneuvosto on korostanut generatiivista tekoälyä disinformaation välikappaleena, joka voi aiheuttaa markkinakriisejä, poliittista epävakautta ja pahempaa – välähdyksiä, vääriä uutisia ja petoksia. Toisessa äskettäin raportoidussa tarinassa lakifirma Morgan & Morgan lähetti hätämuistion kaikille lakimiehille: Älä jätä tekoälyllä luotuja asiakirjoja ilman tarkastusta. Väärä oikeustapaus on “potkittava” rikkomus.

Tämä ei välttämättä ole paras aika panostaa siihen, että hallusinaatioasteet laskevat nollaan pian. Erityisesti säännellyissä aloissa, kuten laki, elämänalueet, pääomamarkkinat tai muissa, joissa virheen kustannukset voivat olla suuria, mukaan lukien korkeakoulutus.

Hallusinaatio ei ole pyöristysvirhe

Tämä ei ole kyseessä satunnaisesta väärästä vastauksesta. Se on riskeistä: maineeseen, oikeudelliseen, operatiiviseen.

Generatiivinen tekoäly ei ole päättelykone. Se on tilastollinen loppukäyttäjä, stokastinen papukaija. Se täydentää kysymyksesi todennäköisimmällä tavalla koulutusdatan perusteella. Jopa totuudelta kuulostavat osat ovat arvauksia. Kutsumme äärimmäisiä osia “hallusinaatioiksi”, mutta koko tuotos on hallusinaatio. Hyvin muotoiltu sellainen. Se toimii silti hyvin – kunnes se ei toimi.

Tekoäly infrastruktuurina

Ja silti on tärkeää sanoa, että tekoäly on valmis yrityksen laajuisesti käytettäväksi, kun alkamme käsitellä sitä infrastruktuurina eikä magiana. Ja missä vaaditaan, se on oltava avoimena, selitettävissä ja jäljitettävissä. Ja jos se ei ole, niin yksinkertaisesti, se ei ole valmis yrityksen laajuisesti käytettäväksi näille käyttötarkoituksille. Jos tekoäly tekee päätöksiä, se pitäisi olla hallituksen tutkittavissa.

EU:n tekoälylain johtaa tässä. Korkean riskin alueet kuten oikeus, terveydenhuolto ja infrastruktuuri säännellään kuin kriittiset järjestelmät. Asiakirjat, testit ja selitettävyys ovat pakollisia.

Mitä yrityksen turvalliset tekoälymallit tekevät

Yritykset, jotka erikoistuvat yrityksen turvallisten tekoälymallien kehittämiseen, tekevät tietoisen päätöksen rakentaa tekoälyä toisin. Niiden vaihtoehtoisissa tekoälyarkkitehtuureissa kieliopit eivät ole koulutettu dataan, joten ne eivät ole “tarttuneet” mihinkään epätoivotuvaan dataan, kuten harhaanjohtavaan, immateriaalioikeusloukkauksiin tai hallusinaatioita aiheuttavaan.

5-vaiheinen pelikirja tekoälyn vastuullisuudesta

  1. Kartoi tekoälymaisemaasi – Missä tekoälyä käytetään liiketoiminnassasi? Mitkä päätökset ne vaikuttavat? Mihin hintaan pystyt jäljittämään nämä päätökset takaisin avoimiin analyyseihin luotettavasta lähdeaineistosta?
  2. Linjaudu organisaatiotasi – Riippuen tekoälyn käytön laajuudesta, aseta roolit, komiteat, prosessit ja tarkastusmenetelmät yhtä tiukat kuin taloudellisille tai kyberrikosriskeille.
  3. Tuo tekoäly hallitukseen – Jos tekoälysi puhuu asiakkaiden tai viranomaisten kanssa, se kuuluu riskiraportteihisi. Hallitus ei ole sivunäyttämö.
  4. Kohdela toimittajia vastuullisina – Jos toimittajasi tekoäly keksii asioita, sinä omistat edelleen seuraukset. Laajenna tekoälyvastuullisuusperiaatteitasi heihin. Vaadi asiakirjoja, tarkastusoikeuksia ja SLA:ita selitettävyydestä ja hallusinaatioasteista.
  5. Harjoita skeptisyyttä – Käsittele tiimisi tekoälyä kuin juniorianalyytikkoa – hyödyllistä, mutta ei virheetöntä. Juhli, kun joku tunnistaa hallusinaation. Luottamus on ansaittava.

Tekoälyn tulevaisuus yrityksissä ei ole suurempia malleja. Mitä tarvitaan, on enemmän tarkkuutta, enemmän avoimuutta, enemmän luottamusta ja enemmän vastuullisuutta.

Joy Dasgupta on Gyan:n toimitusjohtaja ja kokenut johtaja AI-vetoinen ratkaisujen parissa yli kaksi vuosikymmentÀ globaalia johtamiskokemusta yhtiöiden kuten Hewlett-Packard, American Express ja Genpact.

Gyan on perustavanlaatuisesti uusi AI-arkkitehtuuri, joka on suunniteltu yrityksille, joilla on matala tai nolla toleranssi hallucinaatioille, IP-riskeille tai energianhimokkaille malleille. MissÀ luottamus, tarkkuus ja vastuu ovat tÀrkeitÀ, Gyan takaa, ettÀ jokainen oivallus on selitettÀvissÀ, jÀljitettÀvissÀ luotettaviin lÀhteisiin, ja siinÀ on tÀysi tietosuojaa ydintÀÀn.