Rapporter

Hack The Box Benchmark: AI-forstærkede hold overgår menneskelige cybersecurity-analytikere

mm

En ny undersøgelse fra Hack The Box med titlen “AI-forstærket vs menneskeligt cybersecurity-performance-benchmark-rapport” viser, at AI-forstærkede cybersecurity-hold kan overgå menneskeligt-only-hold væsentligt, med elitehold, der kan udføre opgaver op til 4,1 gange hurtigere. Resultaterne er baseret på performance-data fra NeuroGrid Capture the Flag (CTF)-konkurrencen, en af de største realverden-benchmark-konkurrencer, der sammenligner agentic AI-assisterede hold og traditionelle menneskelige hold, der udfører cybersecurity-opgaver.

Benchmarket analyserede data fra NeuroGrid Capture the Flag (CTF)-konkurrencen, der inkluderede 1.337 menneskeligt-only-hold og 156 AI-agent-hold, der var tilmeldt, med 958 menneskelige hold og 120 AI-hold, der aktivt forsøgte at løse udfordringer på tværs af 36 cybersecurity-udfordringer i ni tekniske domæner og fire sværhedsgrader.

Resultaterne fremhæver både produktivitetsgevinsterne fra AI-forstærkede cybersecurity-operationer og de fremtidige arbejdskraftudfordringer, som organisationer kan stå overfor, når automatisering ændrer, hvordan sikkerhedshold opererer.

AI-forstærkede hold leverer målbare performance-forbedringer

Benchmarket demonstrerer, at integration af AI-agenter i cybersecurity-arbejdsgange kan dramatisk øge output, især når de kombineres med erfarne menneskelige operatører.

Nøglefund inkluderer:

  • Op til 4,1 gange mere output for elite AI-forstærkede hold i forhold til menneskeligt-only-hold
  • 1,4 gange produktivitetsforbedring på tværs af alle hold i samme tidsrum
  • 70% højere udfordringsløsningsrate for AI-forstærkede hold
  • 27% løsningsrate for AI-hold i forhold til 16% for de bedste menneskeligt-only-hold
  • 3,2 gange højere samlet løsningsrate på tværs af alle deltagere

Ifølge Hack The Box’ CEO og grundlægger Haris Pylarinos viser resultaterne, at AI kan dramatisk øge operationsspeed, men stadig skal kombineres med menneskelig oversigt.

“AI kan hæve niveauet for cybersecurity-performance, men eliminerer ikke behovet for menneskelig ekspertise,” Pylarinos sagde. “Organisationer må udvikle AI-fluente hold og menneske-i-løkken-arbejdsgange for at sikre disse fordele.”

I modsætning til syntetiske benchmark-test, der ofte bruges i AI-evalueringer, brugte konkurrencen professionelle cybersecurity-udfordringer under real konkurrencepres, hvilket giver en mere operationelt realistisk sammenligning mellem AI-assisterede og menneskelige hold.

Menneske-AI-hybridmodellen opstår som den vindende strategi

Selv om AI accelererede performance væsentligt, fandt studiet, at hybridhold, der kombinerer AI-agenter med menneskelige operatører, producerede de stærkeste resultater samlet.

I konkurrencen:

  • 73,3% af AI-forstærkede hold løste mindst én udfordring, i forhold til 46% af menneskeligt-only-hold
  • AI-agenter forbedrede ofte baseline-produktiviteten, men krævede stadig menneskelig validering og strategisk retning, når de stod overfor komplekse opgaver

For CISO’er og sikkerhedsledere fremhæver rapporten, at AI skal ses primært som en force multiplier, ikke en erstatning for cybersecurity-fagfolk.

AI’s indvirkning varierer dramatisk efter kompetenceniveau

En af de vigtigste indsighter fra rapporten er, at AI påvirker cybersecurity-praktikere forskelligt afhængigt af deres erfaringniveau.

Tidlig karriere: “Produktivitetsillusionen”

For nyuddannede operatører kan AI fungere som en kompetencebro, der hjælper dem med at løse udfordringer, de ellers ville have svært ved. Rapporten advarer imidlertid om, at dette kan skabe en falsk fornemmelse af produktivitet, hvis junior-analytikere mangler den ekspertise, der er nødvendig for at verificere AI-udgangspunkter eller guide agent-arbejdsgange effektivt.

I visse tilfælde var lavere-præsterende AI-forstærkede hold faktisk 12,5% langsommere, ofte fastlåst i ineffektive løkker, når operatørerne manglede tilstrækkelig oversigt over arbejdsgangene.

Midt i karrieren: Det søde punkt for AI

De største produktivitetsgevinster fandt sted blandt midt i karrieren-analytikere, især når de løste mellem-sværhedsgrads-opgaver.

I denne kategori:

  • AI-fordelet toppede med 3,89 gange forbedret performance på mellem-sværhedsgrads-problemer
  • Mid-tier-hold oplevede 40-70% hurtigere opgave-løsning i forhold til menneskeligt-only-modparter

Dette antyder, at virksomheder kan se den mest umiddelbare afkast på AI-investeringer ved at deployere agentic-systemer sammen med mid-niveau-analytikere.

Elite-operatører: Fartfordel, ikke kapacitets-erstatning

Blandt top-præsterende snævredes forskellen mellem AI-forstærkede hold og menneskelige eksperter betydeligt ind.

For eksempel:

  • Det bedste menneskelige hold løste alle 36 udfordringer, mens det bedste AI-forstærkede hold løste 32 af 36
  • Ved Top 5%-performance-niveauet faldt løsningsrate-fordelen til 1,69 gange

Alligevel leverede AI stadig en betydelig fartfordel, med elite-AI-forstærkede hold, der løste udfordringer tre til fire gange hurtigere.

“Sværheds-paradokset” afslører, hvor AI-struggler

Studiet identificerede også, hvad forskerne kalder et “sværheds-paradoks” i AI-performance.

AI-fordelet øges med opgavens sværhedsgrad – op til et punkt:

  • Meget lette udfordringer: ~2,4 gange fordel for AI-hold
  • Medium-udfordringer: 3,89 gange fordel, det top-performance-område
  • Svære udfordringer: fordellet falder til 2,97 gange, afslørende begrænsninger i AI-resonnering

Visse kreative domæner – såsom kodning og reverse-engineering – viste næsten lighed mellem elite-mennesker og AI-systemer, fremhævende områder, hvor menneskelig intuition og nytænkning stadig er afgørende.

På tværs af domæner varierede AI-performance bredt, fra 5,15 gange fordel i sikker kodning til 1,68 gange i digital forensik.

En potentiel talent-pipeline-krise

Ud over produktivitetsgevinster rejser rapporten en langsigts-arbejdskraft-bekymring: AI kan forstyrre uddannelses-pipeline’en, der producerer fremtidens cybersecurity-eksperter.

Indledende sikkerhedsopgaver – traditionelt brugt til at træne junior-analytikere – er stadig mere automatiserbar. AI-hold overgik menneskelige hold på de letteste udfordrings-niveauer, hvilket antyder, at arbejdet, der historisk har været brugt til at træne nye analytikere, stadig mere kan håndteres af automatisering.

Hvis organisationer automatiserer for meget tidligt arbejde, advarer rapporten om, at de risikerer at skabe en “manglende midte” i talent-pipeline’en, hvor færre analytikere udvikler de færdigheder, der er nødvendige for at blive senior-sikkerhedseksperter.

Konsekvenser for sikkerhedsledere

For CISO’er og virksomheds-sikkerhedsledere antyder fundene, at implementering af AI-værktøjer ikke længere er valgfrit.

Organisationer, der ikke integrerer AI i deres sikkerhedsoperationer, kan risikere at stå overfor modstandere, der allerede udnytter AI til at accelerere angreb og udnytte sårbarheder hurtigere, end traditionelle hold kan reagere.

Rapporten anbefaler en tre-trins-strategi for AI-integration:

  • Genoptræn entry-level-roller til at fokusere på AI-styring og validering i stedet for manuelle opgaver
  • Deploy AI sammen med midt i karrieren-analytikere først, hvor produktivitetsgevinster er højest
  • Behold elite-talent og par dem med AI-co-piloter til at accelerere incident-svar og avanceret trusselsanalyse

Til sidst antyder rapporten, at fremtidens sikkerhed ikke vil være AI versus mennesker – men AI-forstærkede mennesker, der opererer med maskine-hastighed.

Antoine er en visionær leder og medstifter af Unite.AI, drevet af en urokkelig passion for at forme og fremme fremtiden for AI og robotteknologi. En serieiværksætter, han tror, at AI vil være lige så disruptiv for samfundet som elektricitet, og bliver ofte fanget i at tale om potentialet for disruptiv teknologi og AGI.

Som en futurist, er han dedikeret til at udforske, hvordan disse innovationer vil forme vores verden. Derudover er han grundlægger af Securities.io, en platform fokuseret på at investere i skarp teknologi, der gendefinerer fremtiden og omformer hele sektorer.