Rapporter

Hack The Box Benchmark: AI-forsterkede team overgår menneskelige cybersecurity-analytikere

mm

En ny studie fra Hack The Box med tittelen “AI-forsterket vs menneskelig cybersecurity-ytelse Benchmark-rapport” viser at AI-forsterkede cybersecurity-team kan overgå menneskelige team, med elite-team som fullfører oppgaver opptil 4,1 ganger raskere. Funndene er basert på ytelsesdata fra NeuroGrid Capture the Flag (CTF)-konkurransen, en av de største realverdens benchmarkene som sammenligner agente AI-assisterte team og tradisjonelle menneskelige team som utfører cybersecurity-oppdrag.

Benchmarken analyserte data fra NeuroGrid Capture the Flag (CTF)-konkurransen, som inkluderte 1 337 menneskelige team og 156 AI-agent-team som var registrert, med 958 menneskelige team og 120 AI-team som aktivt forsøkte å løse utfordringer over 36 cybersecurity-utfordringer i ni tekniske domener og fire vanskelighetsnivåer.

Resultatene høydepunkter både produktivitetsgevinstene av AI-forsterkede cybersecurity-operasjoner og de fremvoksende arbeidskraftutfordringene organisasjonene kan møte når automatisering endrer hvordan sikkerhetsteam opererer.

AI-forsterkede team leverer målbare ytelsesforbedringer

Benchmarken demonstrerer at integrering av AI-agenter i cybersecurity-arbeidsflyter kan dramatisk øke utgangen, særlig når de kombineres med erfarne menneskelige operatører.

Nøkelfunn inkluderer:

  • Opptil 4,1 ganger mer utgang for elite AI-forsterkede team sammenlignet med menneskelige team
  • 1,4 ganger produktivitetsforbedring over alle team i samme tidsvindu
  • 70% høyere løsningsrate for AI-forsterkede team
  • 27% løsningsrate for AI-team sammenlignet med 16% for topp menneskelige team
  • 3,2 ganger høyere løsningsrate over alle deltakere

Ifølge Hack The Box-sjef og grunnlegger Haris Pylarinos viser resultatene at AI kan dramatisk øke operasjonshastigheten, men må likevel kombineres med menneskelig tilsyn.

“AI kan heve standarden for cybersecurity-ytelse, men det eliminerer ikke behovet for menneskelig ekspertise,” sa Pylarinos. “Organisasjoner må utvikle AI-kyndige team og menneske-i-løkken-arbeidsflyter for å trygt låse opp disse fordelene.”

I motsetning til syntetiske benchmarkene som ofte brukes i AI-evalueringer, ble konkurransen brukt profesjonelle cybersecurity-utfordringer under real konkurranse-press, og tilbyr en mer operasjonell realistisk sammenligning mellom AI-assisterte og menneskelige team.

Menneske-AI-hybridmodellen oppstår som den vinnende strategien

Mens AI betydelig akselererte ytelsen, fant studien at hybridteam som kombinerer AI-agenter med menneskelige operatører produserte de sterkeste resultatene totalt.

I konkurransen:

  • 73,3% av AI-forsterkede team fullførte minst en utfordring, sammenlignet med 46% av menneskelige team
  • AI-agenter forbedret ofte basisproduktiviteten, men trengte likevel menneskelig validering og strategisk retning når de møtte komplekse oppgaver

For CISO-er og sikkerhetsledere betoner rapporten at AI bør sees primært som en kraftmultiplier, ikke en erstatning for cybersecurity-eksperter.

AI-påvirkning varierer dramatisk etter ferdighetsnivå

En av de viktigste innsiktene fra rapporten er at AI påvirker cybersecurity-utøvere forskjellig avhengig av deres erfaringnivå.

Tidlig karriere: “Produktivitetsillusjonen”

For nybegynnere kan AI fungere som en kompetansebro, og hjelpe dem med å løse utfordringer de ellers ville ha problemer med. Rapporten advarer likevel mot at dette kan skape en falsk følelse av produktivitet hvis junioranalytikere mangler ekspertisen til å verifisere AI-utgang eller lede agent-arbeidsflyter effektivt.

I noen tilfeller var lavere presterte AI-forsterkede team faktisk 12,5% langsommere, ofte fanget i ineffektive løkker når operatørene manglet tilstrekkelig tilsynsferdigheter.

Midtkarriere: Søtpotten for AI

De største produktivitetsgevinstene inntraff blant midtkarriereanalytikere, særlig når de tok seg av medium-kompleksitetsoppgaver.

I denne kategorien:

  • AI-fordel toppet på 3,89 ganger bedre ytelse på medium-vanskelighetsproblemer
  • Mid-tier-team opplevde 40–70% raskere oppgavefullføring sammenlignet med menneskelige team

Dette tyder på at bedrifter kan se den mest umiddelbare avkastningen på AI-investeringer ved å deployere agente systemer sammen med midtnivåanalytikere.

Elite-operatører: Fartfordel, ikke erstatning for evner

Blant topppresterende snørte gapet mellom AI-forsterkede team og menneskelige eksperter seg betydelig.

For eksempel:

  • Det beste menneskelige team løste alle 36 utfordringer, mens det beste AI-forsterkede team fullførte 32 av 36
  • Ved topp 5% prestasjonsnivået sank løsningsratens fordelen til 1,69 ganger

Likevel leverte AI en betydelig fartfordel, med elite AI-forsterkede team som løste utfordringer tre til fire ganger raskere.

“Vanskelighetsparadokset” avslører hvor AI-struggler

Studien identifiserte også hva forskerne kaller et “vanskelighetsparadoks” i AI-ytelse.

AI-fordelen øker med oppgavens kompleksitet – opp til et punkt:

  • Meget enkle utfordringer: ~2,4 ganger fordelen for AI-team
  • Medium utfordringer: 3,89 ganger fordelen, toppytelsessonen
  • Hard utfordringer: fordelene synker til 2,97 ganger, avslører grenser i AI-resonnering

Bestemte kreative domener – som kodning og omvendt ingeniørkunst – viste nær likhet mellom elite-mennesker og AI-systemer, og høydepunkter områder hvor menneskelig intuisjon og ny resonnering forblir kritisk.

Over domener varierte AI-ytelsen bredt, fra 5,15 ganger fordelen i sikker kodning til 1,68 ganger i digital kriminalteknikk.

En potensiell talentpipelinekrise

Forbi produktivitetsgevinstene reiser rapporten en langvarig arbeidskraftsufordring: AI kan forstyrre treningspipelinen som produserer fremtidige cybersecurity-eksperter.

Inngangs-nivå sikkerhetsoppgaver – tradisjonelt brukt til å trene junioranalytikere – er stadig mer automatiserbare. AI-team overgikk menneskelige team på de enkleste utfordringsnivåene, og antyder at arbeidet som historisk har blitt brukt til å trene nye analytikere stadig mer kan håndteres av automatisering.

Hvis organisasjoner automatiserer for mye tidligkarrierearbeid, advarer rapporten mot at de risikerer å skape en “manglende midte” i talentpipelinen, hvor færre analytikere utvikler ferdighetene som trengs for å bli senior sikkerhetsekspert.

Konsekvenser for sikkerhetsledere

For CISO-er og bedriftssikkerhetsledere antyder funnene at å adoptere AI-verktøy ikke lenger er valgfritt.

Organisasjoner som ikke integrerer AI i sine sikkerhetsoperasjoner, kan møte motstandere som allerede utnytter AI for å akselerere angrep og utnytte sårbarheter raskere enn tradisjonelle team kan reagere.

Rapporten anbefaler en tredelt strategi for AI-integrering:

  • Omskol entry-nivåroller til å fokusere på AI-styring og validering i stedet for manuelle oppgaver
  • Deploy AI sammen med midtkarriereanalytikere først, hvor produktivitetsgevinstene er størst
  • Behold elite-talent og par dem med AI-kopiloter for å akselerere hendelserespons og avansert trusselanalyse

Til slutt antyder rapporten at fremtiden for cybersecurity ikke vil være AI mot mennesker – men AI-forsterkede mennesker som opererer i maskinhastighet.

Antoine er en visjonær leder og medstifter av Unite.AI, drevet av en urokkelig lidenskap for å forme og fremme fremtiden for AI og robotikk. En serial entrepreneur, han tror at AI vil være like disruptiv for samfunnet som elektrisitet, og blir ofte fanget i å prise potensialet for disruptive teknologier og AGI.

Som en futurist, er han dedikert til å utforske hvordan disse innovasjonene vil forme vår verden. I tillegg er han grunnlegger av Securities.io, en plattform fokusert på å investere i banebrytende teknologier som omdefinerer fremtiden og omformer hele sektorer.