Connect with us

Ajatusjohtajat

Teidän AI:n persoonallisuus on yhtä tärkeä kuin sen älykkyys — ja se määrittää yrityksen käyttöönoton onnistumisen

mm
A woman and a man standing on a high-rise balcony looking at a glowing data visualization that blends sharp blue geometric lines with soft amber waves, symbolizing the balance between AI benchmarks and personality.

Useimmat yritykset valitsevat edelleen AI-malleja benchmarkien perusteella. Käytännössä se harvoin määrää, toimivatko nämä järjestelmät todella.

Tähän asti suurten kielen mallien keskustelu yritysympäristöissä on ollut valtaisuutta benchmarkien hallussa. Tiimit suuntautuvat mitattavaan suorituskykyyn, kuten mihin malli on älykkäin, vahvin koodauksessa, tarkin yhteenvetona tai matemaattisessa päättelyssä.

Mutta kun tiimit alkavat siirtyä kokeiluvaiheesta todelliseen käyttöönottoon laajassa mittakaavassa, muut tärkeät tekijät, joita useimmat johtajat jättävät huomiotta, osoittautuvat yhtä olennaisiksi yrityksen menestykselle.

AI:n rekrytointi

Raaka älykkyys ja analytiikka ovat selvästi tärkeitä, mutta yleisin arvioitu muuttuja yritysten AI-käyttöönotossa on persoonallisuus. Persoonallisuus suurten kielen mallien kontekstissa viittaa johdonmukaiseen ääneen, sävyyn ja käyttäytymiseen, jonka malli välittää vuorovaikutuksissa. Se tekee AI:sta koherentin ja luotettavan tunteen.

Kun AI:ta toteutetaan, yritysten on otettava sama lähestymistapa kuin kun he palkkaavat ihmistyöntekijää: arvioida ei vain sitä, miten hyvin malli voi suorittaa tehtävän, vaan myös sen asennetta työhön, miten se viestii ja miten se sopii laajempaan työnkulkuun.

Mallin kyky ylläpitää johdonmukaisuutta, vastata asianmukaisesti ja käsitellä hienovaraisuutta eri konteksteissa voi vaikuttaa merkittävästi liiketoimintatuloksiin. Teknisesti loistava AI, joka vastaa hitaasti, muuttaa sävyä tai käsittelee epätarkasti hienovaraisia vuorovaikutuksia, voidaan soveltaa väärin yrityksissä, jolloin se ärsyttää käyttäjiä, vähentää sitoutumista ja lopulta vähentää AI:n ja liiketoiminnan tehokkuutta.

Tämä on erityisen tärkeää aloilla, kuten asiakastuki, poliittinen viestintä tai sisäinen viestintä, koska hienoiset sävyn tai sanamuodon muutokset vastauksissa voivat aiheuttaa sekaannusta, heikentää luottamusta ja vähentää sitoutumista. Kuten ihmisillä, ei ole yhtä unelmamallia, joka suorittaa jokaisessa kategoriassa paremmin kuin kilpailijat. Jotkut mallit ovat parempia analytiikassa, kuten koodauksessa tai matematiikassa, kun taas toiset suoriutuvat paljon paremmin keskustelukirjoittelusta ja kokousten yhteenvetoista.

Mutta haaste tiimille, jotka rakentavat näiden järjestelmien päälle, on, että nämä ominaisuudet eivät ole kiinteitä.

Liikkuva maalitaulu

AI-maailma kehittyy nopeammin kuin useimmat organisaatiot voivat seurata. Uudet versiot julkaistaan usein, ja suorituskykyominaisuudet voivat muuttua yhden päivityksen jälkeen. Google Gemini -mallisarja on vastaava esimerkki.

Gemini 2.0 Pro julkaistiin helmikuussa 2025 ja siitä tuli heti lippulaivamalli kehittäjille ja yrityksille, jotka käyttävät sitä koodaukseen ja monimutkaisiin ohjelmiin maailmanlaajuisesti.

Se tuli suurimman kontekstiruudun myötä, jonka Google oli koskaan tarjonnut, kaksi miljoonaa merkkiä, mikä antoi sille kyvyn kattavasti analysoida ja ymmärtää valtavia määriä tietoa kerran, ja samalla käyttää työkaluja, kuten Google-haku, ja jopa kirjoittaa koodia.

Tiimille, jotka tarvitsivat järjestelmiä, jotka pystyivät prosessoimaan suuria tietomääriä nopeasti ja tarkasti, se näytti selvältä valinnalta. Mutta jo muutamassa viikossa Google julkaisi Gemini 2.5 Pro:n, joka heti ohitti edeltäjänsä parannuksilla koodauksessa, matematiikassa ja tieteessä.

Yöllä malli, joka oli vasta ollut markkinoiden paras vaihtoehto, korvattiin jo alle kahdessa kuukaudessa julkaisun jälkeen. Mutta varhaiset käyttäjät huomasivat heti, että muutokset eivät olleet ainoastaan pieniä tai analyyttisiä — Gemini:n koko persoonallisuus oli muuttunut yöllä. Useat kehittäjät menivät niin pitkälle, että sanoivat, että AI toimi kuin se olisi “lobotomisoitu” päivityksen jälkeen.

He valittivat, että AI vaikutti olevan kirjaimellisesti “tyhmempää” — se tuotti jatkuvasti hitaampia vastauksia, vähemmän koherentteja tuloksia ja näytti epäjohdonmukaisuuksia siinä, miten se käsittelee aiemmin ongelmattomia tehtäviä ja tehtäviä, jotka aikaisemmin tuntuivat sujuvilta, mutta jotka nyt tuntuivat jähmeiltä.

Ja tässä vaiheessa yrityksen strategia AI-käyttöönoton ympärillä alkaa perustavanlaatuisesti muuttua.

Benchmarkien ulkopuolella

Paperilla Gemini 2.5 Pro olisi pitänyt olla selvä voittaja sen laajojen parannusten ansiosta kyvyssä ja turvallisuudessa.

Mutta käytännössä nämä muutokset muuttivat täysin, miten luotettava malli oli, miten se käyttäytyi, vastasi ohjelmiin ja miten se käsittelee nuansseja eri konteksteissa, mikä lähetti tiimit, jotka olivat vasta rikastuneet ja viettäneet lukemattomia tunteja rakentamassa näitä järjestelmiä, takaisin nollapisteeseen, jos mallin uudet ominaisuudet eivät sopineet heidän olemassaolevaan putkiinsa.

Jopa pienet muutokset käyttäytymisessä voivat häiritä järjestelmiä, jotka on rakennettu yhdenmukaisuuden ja ennustettavuuden ympärille. Tämä luo todellisen operatiivisen riskin, jos yritys on tiiviisti kytköksissä yhteen malliin, koska mikä tahansa päivitys voi aiheuttaa välittömän epävakauden tiimille, jotka riippuvat näistä järjestelmistä.

Tätä vastaan useat eturintamaiset yritykset ovat alkaneet toteuttaa monimallistrategiaa, jossa he ohjaavat eri tehtäviä malleihin, jotka ovat parhaiten soveltuva niiden tarpeisiin, sen sijaan, että riippuvat yhdestä mallista, joka käsittelee kaikkea.

Tämä lähestymistapa parantaa suorituskykyä tehtävikohtaisesti ja vähentää AI-toteutuksen riskiä, koska jos yksi malli heikkenee päivityksen jälkeen, se ei kaata koko järjestelmää, johon se on kytköksissä, koska on varamuisteja saatavilla.

Yksinkertaisesti sanottuna, AI:n persoonallisuus ja luotettavuus ovat yhtä tärkeitä kuin sen raaka älykkyys, kun on sovellettava mallia työympäristössä eri tehtävien suorittamiseen. Tämä ajattelutapa edustaa perustavanlaatuista muutosta siinä, miten yritykset eivät enää ostako “älykkämpää työkalua”, vaan rakentavat ja hallinnoivat koko digitaalista infrastruktuurijärjestelmää.

Jotta yritykset voivat selviytyä, mutta menestyä nykyisessä liiketoimintakentässä, tiimien on luotava putkistot, jotka voivat vaihtaa eri malleja tehtävien mukaan, ja jatkuvasti seurata, miten päivitykset vaikuttavat sekä suorituskykyyn että vuorovaikutuksen laatuun.

Lopulta mallit itse jatkavat kehittymistä tahdissa, joka on vaikea seurata. Mutta yritykset, jotka suunnittelevat muutosta, rakentavat varmuuden ja kohtelevat AI:ta sekä työkaluna että tiimikumppanina, ovat ne, jotka muuttavat nopeat muutokset kilpailuedulla.

Andrew Missey on Convosin, aiemmin PubSent, kaksi-suuntainen tekoälykäyttöinen tekstausalusta, joka auttaa poliittisia strategioita, kampanjoita, voittoa tavoittelemattomia organisaatioita ja vaikuttamisryhmiä toimittamaan henkilökohtaisia, tosiasiallisia äänestäjien keskusteluita kansallisesiirtymässä, jossa hän johtaa tuotantoa ja insinööritöitä. Ennen Convosia Andrew työskenteli ohjelmistosuunnittelijana useissa yrityksissä, mukaan lukien Seattle-pohjainen venture-rahoitteinen tekoälystart-up, joka palvelee kansallisia elintarvike- ja vähittäiskaupan merkkejä, kuten Starbucks, Crumbl ja Mod Pizza. Lisäksi Andrew on sujuva Javascriptissä, Pythonissa ja Typescriptissä.