Connect with us

Kig på MIT NANDA-rapporten juli 2025: Hvorfor 95% AI-pilot fejlrate ikke er enden

Tankeledere

Kig på MIT NANDA-rapporten juli 2025: Hvorfor 95% AI-pilot fejlrate ikke er enden

mm

Jeg er en beviset optimist, og jeg holder mit sind åbent for enhver ny teknologi, der kommer min vej. Min seneste besættelse, der er bundet til at blive på længere sigt? AI.

MIT NANDA har nyligt offentliggjort sin rapport kaldet ‘The GenAI Divide. State of AI in Business in 2025’, og jeg synes, rapporten er virkelig værd at læse. Den giver en realistisk udgangspunkt på AI og dens plads i forretningen i dag. Linkedin-feed kan synes næsten hysterisk om, hvordan AI kom til at ændre alt, men rapporten tegner et andet billede.

Først og fremmest, hvad er MIT NANDA?

Networked Agents and Decentralized AI (akronymiseret til NANDA) er et ambitiøst forskningsinitiativ fra MIT Media Lab. Projektet omfatter mere end 18 førende forskningsinstitutioner fra 6 kontinenter og nogle store navne i tech-industrien – tænk Meta, Dell, Microsoft og lignende. Målet med NANDA er virkelig futuristisk, hvis ikke banebrydende. Ambitionen er at opbygge den grundlæggende infrastruktur for Internet of AI-agenter, dvs. et decentraliseret netværk, hvor AI-agenter opdager, verificerer og samarbejder med hinanden online på tværs af organisationsgrænser. Grundlæggende arbejder NANDA på klare regler, protokoller, retningslinjer og rammer, der ermögiller AI-agenter at interagere med andre agenter på vegne af mennesker og organisationer. NANDA-projektet er open-source, hvilket betyder, at det omfatter iværksættere, visionærer, teknologer og politikere som fuldtids-samarbejdspartnere. (Får du Wikipedia-vibber?)

Grunden til, at jeg fortæller dig om dette, er, at MIT NANDA’s rapport er toppen af forskningskagen, når det kommer til AI. Forfatterne er på forkanten af AI-verdenen, og deres fund skal tages alvorligt (om end med en gran salt).

Rapporten var under udarbejdelse siden januar og blev endelig offentliggjort i juli 2025. Rapporten er baseret på en systematisk gennemgang af 300+ offentligt kendte AI-initiativer og interviews med ledere fra 52 organisationer samt undersøgelser af 153 seniorledere på fire store industrikonferencer.

5% AI-pilot succesrate

Rapporten introducerer begrebet ‘The GenAI Divide’, som beskriver disruptionen, der sker (eller ikke sker) med organisationer og endda industrier, der med held (eller uden held) anvender AI. Hvis en forretning er på ‘den forkerte side af divide’, ifølge NANDA, mislykkes forretningen med at ændre, udvikle og omstrukturere sin struktur og forretningsoperationer. At være på den rigtige side af divide betyder derfor at have en konkrete udbytte af at anvende AI – “Denne investeringsbias fastholder GenAI Divide ved at dirigere ressourcer mod synlige, men ofte mindre transformative anvendelsesområder, mens de højeste ROI-muligheder i bagkontor-funktioner forbliver underfinansieret”.

Grunden til, at rapporten er blevet så hypet, er dens nøglefund. Den eksekutive sammenfatning siger: “Trods 30-40 milliarder dollar i virksomhedsinvestering i GenAI, afslører denne rapport en overraskende result, at 95% af organisationer får zero afkast … Kun 5% af integrerede AI-piloter udtrækker millioner i værdi, mens den overvejende majoritet forbliver fast med ingen målbart P&L-indflydelse. Ikke særlig lovende, hvad?

Den fundamentale begrænsning, der forhindrer organisationer i at realisere den sande værdi af AI, er, hvad rapporten definerer som ‘læringsgapet’. De fleste GenAI-systemer mangler grundlæggende evnen til at beholde feedback, tilpasse sig kontekst eller forbedre sig over tid.

  • Systemer lærer ikke af feedback. I virkeligheden betyder det, at en leder føder det samme datasæt igen og igen, men ingen forbedring sker i ydelsen. En mid-market fabrikationsleder beskrev gentagne gange at uploade den samme produktmanual til deres AI-system for at finjustere opfyldelseslister, men hver iteration kopierede identiske udeladelser og fejl, uden nogen målbart forbedring i outputkvalitet, på trods af multiple feedbacksessioner.
  • Overmål af manuel kontekst er påkrævet hver gang. AI-værktøjer mangler hukommelse mellem sessioner, så hver interaktion betyder at genfodre det med tidligere viden og tidligere kontekst. Komplekse arbejdsgange, i modsætning til simple enkeltstående opgaver, trækker ud og bliver ikke en pålidelig støtte til løbende projekter. Rapporten citerer en korporativ juridisk hold, der for hvert kontraktudkast skal genindtaste kundepræferencer, tidligere forhandlingsnoter og regulatoriske begrænsninger i AI-værktøjet – hvilket omdanner, hvad der burde være en støttende arbejdsgang, til en tidskrævende sysselsætning, der undergraver produktiviteten i komplekse, multi-stages projekter.
  • Utilstrækkelig tilpasning til visse forretningsprocesser. I stedet for at få et responsivt værktøj, der tilpasser sig den større kontekst, tilpasser den større kontekst sig til værktøjet, og tvinger brugerne til at arbejde omkring stive systemer. En CIO bemærkede, at deres vendor-leverede risikoanalyse-AI “føltes som en one-size-fits-all-box”, der tvang holdene til at omstrukturere deres kreditgodkendelsesarbejdsgange til at passe værktøjets stive inputs, i stedet for at have AI til at tilpasse sig etablerede processer. Misforholdet førte til opgivne pilotprojekter

Mine top-fund fra NANDA-rapporten

1. Den skygge-AI-økonomi florerer

Rapporten introducerer begrebet ‘skygge-AI-økonomi’ for at beskrive, hvordan medarbejdere bruger AI på deres niveau som et personligt værktøj, ikke som et organisationsomfattende godkendt værktøj. Dette lyder bekendt for mig, faktisk. En ven af mig fra en kinesisk bilbrand afdeling i CIS delte, at hun bruger ChatGPT til at skrive indhold i appen (nyhedsindlæg, annoncer og mere). Hun siger, at på hovedkontoret var der ingen AI-værktøj godkendt til almindelig brug, så hendes brug af AI er hendes egen booster og tidssparende, som hun ikke rigtig taler med sin leder om.

Rapporten giver meget specifikke tal. Mens kun 40% af virksomhederne har købt officielle LLM-abonnementer, rapporterede medarbejdere fra over 90% af de undersøgte virksomheder regelmæssig brug af personlige AI-værktøjer til arbejdsgange. Denne skyggebrug afleverer ofte bedre ROI end formelle virksomhedsinitiativer, og afslører, hvad der virkelig fungerer, når individer har adgang til fleksible, responsive værktøjer.

2. Investeringssfordeling afspejler mislagde prioriteter

Rapporten afslører en betydelig misalignering mellem AI-investering og faktisk ROI-potentiale. Cirka 50% af GenAI-budgetterne flyder til salgs- og marketingfunktioner, primært fordi resultater kan måles let og stemmer overens med bestyrelsesniveauets KPI’er. Imidlertid opstår de højeste afkast oftest fra bagkontor-automatisering, som f.eks. BPO-eliminering, der kan spare op til 10 millioner dollar om året, 30% reduktion i eksterne kreative omkostninger og 1 million dollar om året på outsourcede risikostyringsomkostninger. Denne investeringsbias fastholder GenAI Divide ved at dirigere ressourcer mod synlige, men ofte mindre transformative anvendelsesområder.

Men min personlige overbevisning er denne. Fra hvad jeg husker fra min erfaring i en international bankvirksomhed, der ejer detailbanker verden over, var det en stor risiko at introducere et værktøj, der graver i virksomhedens indre, føder på dens data og (hvem ved?) lækker insiderinfo ud der. Så jeg forstår, hvorfor det er en no-brainer at tilmelde sig en AI-indholdsfabrik til lette kreative for Facebook-annoncer, mens komplekse backend-disruptioner ikke er lige så entusiastisk accepteret. Medmindre det var en kommando direkte fra C-niveau, ville implementering af alvorlige disruptiv AI-værktøjer i virksomhedens kerne have taget mindst 12 måneder.

Heldigvis havde jeg chancen for at se indersiden af en AI-automatisering lavet til salgsteamet i en lokal vinduefabrik. De hyrede en freelancer fra n8n, og han byggede dem et AI-drevet opkalds- og chatsanalyseværktøj. Forretningen kunne nu finde flaskehalsen i deres salgsproces hurtigere, og flere smertepunkter kom til syne, da AI hjalp forretningen med at behandle skrevet og talt sprog. Deres tilfredshedsrate var skyhøj, med mere data, der blev behandlet hurtigere.

3. Interne bygninger taber til eksterne leverandører

For at være brutal ærlig, denne fund tog mig på sengen. I modsætning til den almindelige opfattelse, at virksomheder skal bygge deres egne AI-værktøjer, viser forskningen, at strategiske partnerskaber med eksterne leverandører er to gange så sandsynlige at nå deployment sammenlignet med interne udviklingsindsats. Hvem ville have troet det, right? Vel, åbenbart ikke mig.

Virksomheder, der behandler AI-leverandører som business-serviceudbydere – kræver dyb tilpasning og holder dem ansvarlige for operationelle resultater i stedet for modelbenchmarks – opnår betydeligt højere succesrater og hurtigere tid-til-værdi.

4. Højere investering betyder højere disruption? Ikke rigtig.

Ved hjælp af en sammensat AI-markedsdisruptionsindeks afslører rapporten, at kun to industrier – Teknologi og Medier & Telekommunikation – viser tydelige tegn på strukturel disruption fra GenAI. Syv af ni store sektorer viser betydelig pilotaktivitet, men minimal strukturel ændring, med industrier som Sundhedsvesen, Finansiel Service og Energi, der viser disruptionskorer under 0,5 på en 5-punkts-skala. Denne gap mellem investerings synlighed og faktisk transformation eksemplificerer GenAI Divide på industrieniveau.

Hvorfor 95% fejlrate er midlertidig

Trods synligt håbløse midlertidige resultater er der noget lys i tunnelens ende. Rapporten forklarer, at GenAI Divide er midlertidig og vil blive overvundet gennem fremvoksende udviklinger.

NANDA selv er en af de førende bidragydere til en endnu mere forbundet AI-verden. Mekanismerne, som rapporten citerer, er Model Context Protocol (eller MCP) og Agent-to-Agent (eller A2A) som infrastrukturgrundlag for ubesværet agent-interoperabilitet og autonom koordination på tværs af systemer.

NANDA’s indsats og disse værktøjer er vejbanen til netop, hvad NANDA er efter – Agentic Web, et netværk af agenter, der kan koordinere autonomt på tværs af internettet. Deres interaktion vil blive designet til at erstatte statiske arbejdsgange med dynamiske selvuddannende systemer.

Lyder det for godt til at være sandt eller måske magi? Vel, Microsoft Copilot Studio’s Multi-Agent Orchestration er det nærmeste lignende til visionen. Systemet hjælper med at bygge et træ af agenter, hvor en hoved-Copilot-agent udløser underagenter, der er ansvarlige for bestemte opgaver som planlægning eller dokumentgenerering. Hver agent forbliver inden for sit ekspertiseområde, mens de koordinerer med andre. For at sige det på mere praktisk vis, når en bruger anmoder om “Planlæg vores Q4-produktlancering”, udløser orchestrator-agenten automatisk underagenter – en håndterer markedsforskning, en anden håndterer tidsplanoprettelse, og en tredje koordinerer med projektledelsesværktøjer. Arbejdet sker i samklang, men autonomt.

Så, hvad efterlader rapporten os med? Vinduet for at krydse GenAI Divide er smallende hurtigt, da virksomheder begynder at låse fast leverandørrelationer med læring-kapable værktøjer, der producerer disruption og udvikler og optimerer forretningsoperationer i bagenden, og tilføjer hastighed til virksomhedens kerne. Succesen ligger i at købe AI-agentsystemer i stedet for at bygge dem fra bunden internt. Da agentic læring, husk og selvstændige systemer bliver mere udbredte, vil den nuværende 95% fejlrate give plads til en ny æra, hvor AI-systemer samarbejder ubesværet på tværs af leverandører, domæner og organisationsgrænser. Denne fremtid er den sande ROI på nuværende investeringer.

Alternative synspunkter på AI-adopterings

NANDA-projektet gjorde et fantastisk arbejde med at samle data fra multiple kilder og afhøre ledere fra multiple felter. Men er det den ultimative mundvig til verdensomspændende AI-adopterings? Hvis du, ligesom jeg, fandt The GenAI Divide lidt deprimerende, hvis ikke decideret deciderende, har jeg fundet disse alternative synspunkter på AI-adopterings for at holde mit personlige AI-ild brændende.

  • Jed Nykolle Harme fra IT Brief UK brød ned CIO Playbook 2025 af Lenovo. Studiet inkluderer feedback fra IT-ledere på tværs af EMEA (Europa, Mellemøsten og Afrika), og dens konklusion er langt mere lovende. Det viser sig, at detailindustrien er førende, når det kommer til AI-tilfredshed, hvor 96% af AI-pilotpræstationer enten opfylder eller overgår forventninger.
  • Foruden at jeg tidligere udtrykte medfølelse med kæmpestore enterprise-markedsaktører, der finder AI svært at implementere og ikke er særlig åbne for intensiv inkorporering. Lenovo præsenterer dog et andet billede med Banking, Financial Services og Insurance (BFIS)-industrier: på trods af den laveste AI-adopteringsrate på 7%, rapporterer 33% af dem, der tester AI, at piloter oversteg forventninger. Hemmeligheden bag så positive tendenser er ‘en forsigtig tilgang’, som Arabian Business siger.
  • Endnu en beroligende rapport IBM CEO Study åbner med en dristig forord af IBM Vice Chairman Gary Cohn: “Som AI-adopterings accelererer… den ultimative gevinst kommer kun til CEOs med mod til at acceptere risiko som mulighed. … Når forretningsmiljøet er usikkert, kan brug af AI og virksomhedens egen data til at identificere, hvor man har gevind, være en konkurrencemæssig fordel. På dette punkt er ledere, der ikke udnytter AI og deres egen data til at fremme sig, med vilje valgt ikke at konkurrere.
  • IBM CEO-undersøgelsen viser nogle inspirerende fakta. For eksempel forventes AI-investeringens vækst at mere end fordobles over de næste to år, så næsten 20% af den samlede IT-budget vil blive allokeret til AI – engagementet demonstrerer, at på trods af synlige og beviste udfordringer, er troen på AI stærk og vigtigst, en strategisk investering snarere end reaktivt udgifter.
  • Sidst men ikke mindst er 64% af CEOs i rapporten enige om, at risikoen for at falde bagud driver investering i ny teknologi langt før en klar forståelse af dets indvirkning er opnået. Imidlertid er der ingen hurtige beslutninger. I stedet vælger beslutningstagerne ‘strategisk hedging’. På simple vis, når en konkurrent lancerer en AI-chatbot til personlige anbefalinger, gør du det samme for din hjemmeside. Du må ikke være sikker på om indtægtsstigning, men du ved, at hvis du lader det gå i to år mere, til ‘den perfekte datasæt’ samles, vil du irreversibelt miste momentum. Så reglen er enkel: aggressivt kopier, så se på udfaldet.

Konklusion

I konklusion vil jeg udtrykke min personlige hjertelige overbevisning i AI. Som iværksætter, en CMO, en forretningsudvikler og en tidligere kontoransat i bankvirksomhed, ser jeg så mange måder, AI kan hjælpe med at optimere budgetter, strømline arbejdsgange og booste hold. Fremtiden er forstærket og accelereret. Hvis en forretning vil konkurrere, skal den være AI-fluent. Selvom fundene, jeg præsenterede, er kontroversielle, er jeg overbevist om, at den nuværende AI-landskab, med dets tinder og dalende, er en naturlig læringsperiode, gentaget igen og igen med hver ny teknologi.

Ilya Romanov er iværksætter og AI-entusiast med over 15 års erfaring inden for marketing på tværs af brancher som rejse, bank, e-commerce, krypto og AI. Denne diverse baggrund giver ham dyb indsigt i naturen af forskellige virksomheder. I hans skrivning fokuserer han på, hvordan AI anvendes i forretning og hvordan det transformerer verden omkring os.