Rapporter
Hack The Box Benchmark: AI-forstærkede hold overgår menneskelige cybersecurity-analytikere

En ny undersøgelse fra Hack The Box med titlen “AI-forstærket vs menneskelig kun cybersecurity-ydelse Benchmark Rapport” viser, at AI-forstærkede cybersecurity-hold kan overgå menneskelige hold væsentligt, med elitehold, der kan gennemføre opgaver op til 4,1 gange hurtigere. Resultaterne er baseret på ydelsesdata fra NeuroGrid Capture the Flag (CTF) konkurrencen, en af de største realverden-benchmarks, der sammenligner agente AI-assisterede hold og traditionelle menneskelige hold, der udfører cybersecurity-opgaver.
Benchmarken analyserede data fra NeuroGrid Capture the Flag (CTF) konkurrencen, der omfattede 1.337 menneskelige hold og 156 AI-agent hold, der var tilmeldt, med 958 menneskelige hold og 120 AI-hold, der aktivt forsøgte udfordringer på tværs af 36 cybersecurity-udfordringer i ni tekniske domæner og fire sværhedsgrader.
Resultaterne fremhæver både produktivitetsgevinsterne ved AI-forstærkede cybersecurity-operationer og de opdykkende arbejdsudfordringer, organisationer kan stå overfor, når automation omdanner, hvordan sikkerhedshold opererer.
AI-forstærkede hold leverer målbare ydelsesforbedringer
Benchmarken demonstrerer, at integration af AI-agenter i cybersecurity-arbejdsgange kan dramatisk øge output, især når de parres med erfarne menneskelige operatører.
Nøglefinderne omfatter:
- Op til 4,1 gange mere output for elite AI-forstærkede hold i forhold til menneskelige hold
- 1,4 gange produktivitetsforbedring på tværs af alle hold i samme tidsvindue
- 70% højere udfordringsløsningsrate for AI-forstærkede hold
- 27% løsningsrate for AI-hold versus 16% for top-menneskelige hold
- 3,2 gange højere samlet løsningsratio på tværs af alle deltagere
Ifølge Hack The Box CEO og grundlægger Haris Pylarinos viser resultaterne, at AI kan dramatisk øge operationel hastighed, men stadig skal parres med menneskelig oversigt.
“AI kan hæve niveauet for cybersecurity-ydelse, men det eliminerer ikke behovet for menneskelig ekspertise,” sagde Pylarinos. “Organisationer må udvikle AI-kompetente hold og menneske-i-løkken-arbejdsgange for sikkert at låse disse fordele op.”
I modsætning til syntetiske benchmarks, der ofte bruges i AI-evalueringer, brugte konkurrencen professionelle cybersecurity-udfordringer under reel konkurrencepres, hvilket giver en mere operationelt realistisk sammenligning mellem AI-assisterede og menneskelige hold.
Det menneskelige-AI-hybridmodell opstår som den vindende strategi
Selv om AI betydeligt accelererede ydelsen, fandt studiet, at hybridhold, der kombinerer AI-agenter med menneskelige operatører, producerede de stærkeste resultater samlet.












