Ajatusjohtajat

Kun tekoälyn “tiedot” ovat 50 vuoden vanhat: Noudattamisriski, jota et voi jättää huomiotta

Published September 22, 2025

Updated April 26, 2026

George Tziahanas, VP of Compliance, at Archive360

Tekoälyn virheellisten oivallusten ongelma on kiireellinen haaste, kun yritykset lisäävät generatiivisten työkalujen käyttöä. Huolimatta laajasta tekoälyn omaksumisen innostuksesta, on myös vahva arvostelun virta. Kriittiset kommentaattorit usein viittaavat tekoälyn tulosteiden ilmeiseen satunnaisuuteen ja ennustamattomiin epätarkkuuksiin, jotka heikentävät sen arvoa – ja voivat jopa uhata ihmisten turvallisuutta, erityisesti terveydenhuollossa ja liikenteessä, missä virheelliset tulosteet voivat teoriassa johtaa kaikkeen väärästä reseptistä junaonnettomuuksiin.

Usein nämä epätarkkuudet on pantu tekoälyn “hallusinaatioiden” tilille – tilanteita, joissa tekoäly generoi “parhaan arvauksensa” vastauksen, joka esitetään yhtä varmasti kuin “aito” vastaus, sen sijaan, että ilmoittaisi käyttäjälle tiedon puutteesta tai kyvyttömyydestä. Hallusinaatioita voi olla vaikea havaita ensi silmäyksellä – mutta on olemassa hiljaisempi, yhtä vakava ongelma, joka on vielä vaikeampi havaita.

Tietojen laadun velka: Tekoälyn akillesjänne

Kun tekoälyjärjestelmät käyttävät vanhentunutta, epätäydellistä tai epätarkkaa dataa, virheelliset tulosteet ilmenevät, mutta ne ovat vähemmän välittömästi havaittavissa. Esimerkiksi voit pyytää tekoälyä tunnistamaan tietyn sairauden oireita ja saada vastauksen, joka perustuu 50 vuoden vanhaan tutkimukseen sen sijaan, että se perustuisi nykyiseen tutkimukseen. Tuloksena on epätodennäköistä, että se näyttäisi ilmiselvästi, naurettavasti väärältä – mutta aluksi uskottavan olemuksen aiheuttama riski on olemassa sekä potilaalle että terveydenhuollon tarjoajalle.

Sama pätee muihin aloihin – jos tekoälymalliin syötettävät tiedot sisältävät vanhentunutta, vanhentunutta tai osittaisia tietoja, on suuri riski virheellisistä tulosteista. Ja kun yritykset integroivat tekoälyä liiketoimintakriittisiin prosesseihin, riski virheellisten johtopäätösten tekemisestä huonosti johdetuista tiedoista kasvaa.

Tarkkuus sääntelijälle

Tämä ei ole vain päivittäisten toimintojen ongelma – se on myös merkittävä noudattamisriski. Sääntelyvaatimukset kehittyvät nopeasti osoittamaan huolta tekoälyn epätarkkuudesta. Esimerkiksi useita varhaisia sääntelytoimia tekoälystä on tehty; merkittävimpinä Italia kielsi tilapäisesti ChatGPT:n tietosuojaluokan vuoksi, ja EU:n tietosuojalautakunta perusti omistajan tehtävän koordinoimaan mahdollisia toimia ChatGPT:ä vastaan.

Yksi merkittävimmistä sääntelymuutoksista on EU:n tekoälylain hyväksyminen, maailman ensimmäinen kattava lainsäädäntö tekoälystä. Laki asettaa velvollisuuksia tekoälyjärjestelmien riskitasoon perusteella, “hyväksymättömän riskin” järjestelmistä, jotka on kielletty, “korkean riskin” järjestelmiin, jotka kohtaavat tiukat vaatimukset avoimuudesta, tietojen laadusta, hallinnosta ja ihmisen valvonnasta.

EU:n tekoälylain merkitys ei olekaan sen kunnianhimoisessa laajuudessa, vaan sen asettamassa esimerkissä. Sääntelijät tekevät selväksi, että tekoälylle asetetaan sitovia, täytäntöönpanokelpoisia sääntöjä ja että organisaatioiden on käsiteltävä tekoälyn noudattamista ja avoimuutta siitä, missä ja miten tekoälyä käytetään, liiketoiminnan yhtenä osana eikä jälkikäteen.

Laki on laaja-alainen, ja sen vaikutusalue ulottuu suureen osaan tekoälykehityksestä. Sen ydin on tehdä tekoälystä turvallista kunnioittaen perusarvoja ja -oikeuksia. Tässä uudessa periaatteellisessa ekosysteemissä diagnosoidaan tekoälyn epätarkkuuden mahdollisia lähteitä, mukaan lukien tiedot ja tietojoukot, jotka syötetään malleihin, mallien läpinäkyvyys ja pääsy, sekä järjestelmän suunnittelu ja käyttö. Tekoälyratkaisut ovat näiden kaikkien yhdistelmä – ongelmia missä tahansa näistä voi johtaa kielteiseen lopputulokseen. Ei vain sitä, vaan tietoja, joita käytetään tekoälyn suunnittelussa, mallin kehityksessä, käyttöönotossa ja toiminnassa, on todennäköisesti pääasiassa liiketoimintatietoja, jotka itsekin ovat alttiina erilaisille noudattamisvaatimuksille.

Toisin sanoen tekoälyä koskeva sääntelyympäristö muuttuu yhä tiukemmaksi – ja se on yhtä totta tietojen syötölle kuin tietojen tulostukselle, vaikka jälkimmäisestä puhutaan enemmän.

Videste askelta tekoälylle noudattavan, ajantasaisen ja relevantin tietojen syöttämiseksi

Ratkaisemaan tämän kaksinkertaisen haasteen – varmistamaan sekä noudattavan tietojen käsittelyn että korkealaatuisen syötteen, joka mahdollistaa korkealaatuisen tulosteen – yritysten on hallittava koulutus- ja päätöksentekotietoja. Valitettavasti monet yritykset ovat edelleen tästä puuttellisia.

Ainakin organisaatioiden on sovellettava laajempia noudattamis- ja hallintiohjelmiaan tekoälyaloitteisiinsa. Heidän on aloitettava asianmukaisten tietojen tallentaminen ja ylläpitäminen siitä, mitä tietoja he syöttävät tekoälymalleihin, miten malleja ja järjestelmiä suunnitellaan, sekä tekoälyn avulla tehtyjä päätöksiä ja sisältöä.

Kuitenkin on myös tärkeää, että organisaatiot menevät askelen eteenpäin ja varmistavat, että heillä on täysi hallinta kaikista tiedoista, joita voidaan käyttää tekoälynkäyttökohteissa, olipa kyseessä sitten alkuperäinen koulutus tai “live”-työ. Tämä vaatii korkealaatuisen tietojen hallinta- ja tallennusstrategian, joka takaa, että kaikki asiaankuuluvat tiedot kerätään älykkäästi, puhdistetaan, tallennetaan, luokitellaan ja oikeutetaan. Tämän saavuttamiseksi organisaatioiden on tarkasteltava neljää avainaskelta:

1. Tietojen polku ja alkuperä

Tämä sisältää tietojen lähteen, alkuperän, omistajuuden ja mahdollisten muutosten kirjaamisen metadataan (jos sallittu) koko elinkaaren ajan. Se sisältää myös rikkaan metadata ja kaikki asiakirjat tai artefaktit, joista se on johdettu.

2. Tietojen aitoutta

Tämä vaatii selkeän hallinnan kaikista tiedoista, tallentamisen alkuperäisessä muodossa ja objektiiden tallentamisen muuttumattomassa muodossa. Lisäksi organisaatioiden on ylläpidettävä kattava auditointihistoria kunkin objektille ja kaikille toimille ja tapahtumille, jotka liittyvät niihin.

3. Tietojen luokittelu

On tärkeää määritellä tietojen luonne. Organisaatioiden on kyettävä hallitsemaan rakenteisia tietoja, puolirakenteisia tietoja ja rakenteisia tietojoukkoja. Antamalla kullekin luokalle yksilöllinen schema voidaan hallita monimuotoisia tietojoukkoja ilman yhdenmukaista, joustamatonta tietorakennetta – välttäen tarvetta muuttaa tietoja pakosta soveltuvaksi epäjoustavaan tietorakenteeseen.

4. Tietojen normalisointi

On tärkeää määritellä yhteiset määritelmät ja formaatit metadataa varten, joita voidaan käyttää analytiikassa ja tekoälyratkaisuissa. Selkeästi määritellyt schemat ovat tärkeitä elementtejä, ja työkalut, jotka voivat muuttaa tai kartoittaa tietoja, ovat tärkeitä pysyäkseen johdonmukaisissa ja normalisoiduissa näkymissä liittyvistä tiedoista.

5. Tietojen oikeudet

Yritysten on oltava hienorakeiset oikeudet, mukaan lukien objekti- tai kenttätason oikeudet, perustuen käyttäjän tai järjestelmän profiileihin. Tämä tarkoittaa, että oikeat tiedot ovat käytettävissä niille käyttäjille ja järjestelmille, joilla on oikeus päästä niihin, rajoittaen tai rajoittamalla pääsyn niille, joilla ei ole.

Näiden tärkeiden elementtien ollessa paikallaan yritykset ovat parhaiten asemissa varmistamaan, että tekoälymalleihin syötettävät tiedot ovat sekä korkealaatuisia että noudattavat sääntöjä. Tekoäly tuottaa parannuksia ja tehokkuutta eri aloilla – mutta jotta tämä voi tapahtua, vankka tietopohja on välttämätön.

George Tziahanas, VP of Compliance, at Archive360

George Tziahanas on Archive360:n Compliance- ja Associate General Counsel -johtaja. George on johtaja, jolla on syvä ymmärrys monimutkaisesta teknologiasta, pankkisäännöksistä, tietohallinnosta ja riskienhallinnasta. Hän työskentelee läheisesti nykyisten ja potentiaalisten asiakkaiden kanssa varmistaakseen, että monimutkaiset tietohallinta- ja vaatimukset täyttyvät, ja ne ovat linjassa Archive360:n ratkaisujen kanssa.