Kyberturvallisuus

Simbian julkaisee kyberpuolustuksen vertailuarvon, paljastaen suuren aukon tekoälyturvallisuuden kyvyissä

Published April 28, 2026

Antoine Tardif, CEO & Founder of Unite.AI

Simbian uusi vertailuarvo haastaa yhden tekoälyssä laajimmin hyväksytyn oletuksen: sen, että samat mallit, jotka pystyvät löytämään haavoittuvuuksia, voivat myös puolustaa niitä vastaan.

Yrityksen uusi Kyberpuolustuksen vertailuarvo, jonka kehitti Simbian Research Lab, arvioi, miten hyvin johtavat suuret kielen mallit (LLM) suoriutuvat todellisissa kyberpuolustusskenaarioissa. Tulokset ovat dramaattiset. Vaikka modernit tekoälyjärjestelmät ovat yhä tehokkaampia haavoittuvuuksien löytämisessä ja hyödyntämisessä, ne kamppailevat merkittävästi, kun niiden tehtäväksi annetaan hyökkäysten tunnistaminen ja estäminen.

Etumaiset mallit eivät saavuta puolustuksen vähimmäisvaatimusta

Vertailuarvo testasi johtavia malleja, kuten Claude Opus 4.6, GPT-5, Gemini 3.1 Pro ja muita, simuloiduissa yritysympäristöissä.

Yhtään mallia ei saavuttanut läpäisevää tulosta.

Claude Opus 4.6, joka oli vahvin suorittaja testissä, tunnisti vain osan hyökkäysmerkkejä MITRE ATT&CK -taktiikoissa, kun taas monet mallit eivät onnistuneet tunnistamaan kokoja luokkia vaarallista toimintaa. Riippumaton akateeminen tutkimus oli linjassa näiden tuloksien kanssa, osoittaen, että jopa parhaat mallit kamppailevat avoimessa uhkien metsästysssä, tunnistamalla vain pienen osan vaarallisia tapahtumia realistisissa skenaarioissa.

Tämä aukko korostaa kriittistä rajoitusta. Nykyiset tekoälyjärjestelmät saattavat menestyä strukturoiduissa kysymyksissä tai ratkaista suljettuja ongelmia, mutta ne epäonnistuvat, kun niiden on tutkittava monimutkaisia, kehittyviä hyökkäysketjuja ilman ohjausta.

Siirtyminen realistisempaan, agenttipohjaiseen arviointiin

Se, mikä erottaa tämän vertailuarvon, on sen suunnittelu.

Toisin kuin aikaisemmat kyberturvallisuustestit, jotka nojaavat monivalintakysymyksiin tai staattisiin tietokantoihin, Simbian lähestymistapa käyttää todellista telemetria-dataa ja asettaa mallit agenteille tutkimussilmukkaan. Sen sijaan, että mallit saavat tietää, mitä etsiä, tekoäly joutuu tutkimaan lokit, muodostamaan hypoteeseja ja tunnistamaan uhkat itsenäisesti.

Tämä heijastaa sitä, miten ihmiset turvallisuusanalyytikot toimivat todellisissa turvallisuuskeskuksissa.

Vertailuarvo sisältää kymmeniä hyökkäystekniikoita useissa vaiheissa, minkä vuoksi mallien on yhdistettävä signaaleja ajassa ja järjestelmissä. Samaan aikaan se vähentää mallien muistamisen riskiä pakottamalla deterministisen pisteytysjärjestelmän ja muuttamalla kontekstia.
Tämä siirtyminen realismin suuntaan on merkittävä. Tekoälykehityksessä realistisen haasteen luominen on usein ensimmäinen askel ongelman ratkaisemiseksi.

Kasvava kuilu hyökkäävän ja puolustavan tekoälyn välillä

Löydökset vahvistavat laajempaa suuntausta, joka on näkyvissä koko alalla.

Tekoäly parantaa nopeasti kykyjään hyökkäävissä kybertehtävissä. Viimeaikaiset tutkimukset osoittavat, että etumaiset mallit voivat jo suorittaa monivaiheisia hyökkäyksiä simuloituissa ympäristöissä ja tekevät niin yhä useammin vähäisellä työkaluilla. Samaan aikaan puolustuskyky on jäljessä.

Tämä epätasapaino luo laajenevan epäsymmetrian. Hyökkääjät voivat hyödyntää automaatiota ja skaalautuvuutta, kun taas puolustajat luottavat edelleen voimakkaasti ihmisen asiantuntemukseen ja hajanaisiin työkaluihin. Vaikka tekoäly tunnistaa haavoittuvuuden, se saattaa tulkita sen vakavuuden väärin tai epäonnistua toimimasta asianmukaisesti, korostaen aukkoa havaitsemisen ja ymmärtämisen välillä.

Miksi “valmiiksi tehty” tekoäly ei riitä

Simbian johtopäätös ei ole, että tekoäly ei voi puolustaa järjestelmiä, vaan että se ei voi tehdä sitä yksin.

Vertailuarvo osoittaa, että LLM-malleja vaaditaan yrityksen mukaan “hienostunut valjastus” – yhdistelmä ulkoista älykkyyttä, strukturoiduista työvirroista ja järjestelmätasolla tapahtuvasta integraatiosta – toimiakseen tehokkaasti turvallisuusympäristöissä.

Tämä linjassa laajemman tutkimuksen kanssa, joka osoittaa, että työkalujen, muistin ja kontekstin lisääminen parantaa merkittävästi tekoälysuoritykykyä kyberturvallisuustehtävissä.

Tuotantoympäristöissä Simbian on väittää saavuttaneensa huomattavasti paremman havaitsemistarkin luotettavuuden yhdistämällä malleja näiden lisäkerrosten kanssa. Viittaus on selvä: raaka mallin kyky on vain yksi palanen palapelistä.

Uusi kategoria tekoälyturvallisuuden vertailuarvoista

Kyberpuolustuksen vertailuarvon julkaisu on tärkeä askel siinä, miten tekoälyjärjestelmiä arvioidaan todellisen käytön kannalta.

Kohdistamalla huomio todisteiden perusteella uhkien metsästykseen kysymys-vastaus -järjestelmän sijaan, se uudelleenmäärittelee ongelman älykkyydestä toimeenpanoon. Se esittää myös kustannuksen mitattavana tekijänä, korostaen suorituskyvyn ja tehokkuuden välistä tasapainoa malleja verrattaessa.

Kun tekoäly jatkaa kyberturvallisuuden muokkaamista, tämänkaltaiset vertailuarvot saattavat tulla välttämättömiksi työkaluiksi ymmärtääkseen ei vain sitä, mitä mallit voivat tehdä, vaan missä ne epäonnistuvat – ja miksi.

Toistaiseksi johtopäätös on suoraviivainen. Vaikka tekoäly on edennyt nopeasti, täysin autonomisen kyberpuolustuksen saavuttaminen on edelleen ulottumattomissa. Seuraava innovaatiovaihe riippuu todennäköisesti vähemmän suurempien mallien rakentamisesta ja enemmän järjestelmien suunnittelusta, jotka yhdistävät tekoälyä strukturoidun älykkyyden, kontekstin ja ihmisen valvonnan kanssa.