Connect with us

Tankeledere

Din AI-agent ved alt — og forstår intet

mm

“Vi skal deltage i min forældres rejse til Irland” — denne tilsyneladende uskyldige udtalelse sendte rysninger ned ad ryggen på mig.

Min kone og jeg rejser omfattende. Vi ved, hvad vi kan lide. Min kones forældre rejser derimod sjældent længere end få hundred mile fra deres hjem og har forladt landet sammen i alt én gang — til vores bryllup.

For at toppen det hele af, var denne rejse en julegave fra min svigerfar til min svigermor, så hun kunne besøge sin familie, måske for sidste gang.

Jeg kunne se, hvordan denne rejse ville udvikle sig i ét ord: katastrofe. Hvordan i verden skulle vi kunne syntetisere vilde forskellige oplevelser og forventninger, så vi kunne have en fantastisk rejse — eller i hvert fald ikke hade hinanden ved rejsens afslutning?

Som enhver selvrespekterende techie greb jeg efter teknologi — specifikt efter AI.

Men det, jeg ikke havde forventet, var, at mit lille eksperiment med at kode en AI-drevet familie-rejseplanlægningsapp ville lære mig næsten alt, hvad jeg havde brug for at vide om at anvende AI inden for enterprise IT.

Jo mere du føder AI, jo dummere bliver den

De fleste enterprise AI-udrulninger følger et forudsigeligt mønster. Organisationer starter med at give en agent en sæt instruktioner og tilknytte den til en informationskilde, enten det er et RAG (Retrieval-Augmented Generation)-ramme, en eksisterende videnbas eller endda en MCP-server. Dernæst lagde man et LLM og lade det gøre sin ting.

Problemet er, at LLM’er i deres kerne er dumme. De ved ikke, hvordan de skal prioritere all den information, de har til rådighed, så de tenderer til at behandle hver enkelt kontekst lige. En menneskelig skal tilføje et lag af kuratering, undervise modellen i, hvad der er vigtigt, og hvad der ikke er. Uden kuratering får man AI, der ved alt og forstår intet.

De tre typer af hukommelse, der betyder noget

Effektiv enterprise AI-kuratering indebærer at udnytte tre bestemte typer af hukommelse.

Den første er institutionel hukommelse, der kan synes ret grundlæggende i begyndelsen. Når nogen siger “finansiel service”, ved agenten, at de mener virksomhedens Finansiel Service-afdeling og ikke hele industrien. Det bliver til en varig organisatorisk viden fyldt med definitioner, præferencer og konventioner, der ikke ofte ændrer sig. Da dette udvides til institutionel viden omkring strategiske prioriteter, nøgleinitiativer og organisatoriske dynamikker, bliver det en rig kilde til institutionel kontekst.

Dernæst er der handlingshistorik, der fokuserer på betydningsfulde beslutninger, opgaver og begivenheder. Når en servicebillett er indgivet eller et system er installeret, genkender agenten denne specifikke handling og optager den i handlingshistorikken. Det bliver til den historiske optagelse, der syr sammen organisatorisk kontekst.

Til sidst er der kortvarig konversationkontekst. Tænk på det som øjeblik-til-øjeblik-interaktionen med en agent. Det er nyttigt i øjeblikket, men tenderer til at miste relevans hurtigt.

Taget sammen skaber disse tre typer af hukommelse det vægningssystem, der mangler i generiske AI-modeller. Nu, når nogen fortæller en agent om forretningen, klassificerer og prioriterer de alle disse hukommelser og kuraterer den vigtige information. Det danner kernen af, hvad AI skal levere: ikke kun domæne-data, men domæne-dømmekraft.

Hvad kurateret hukommelse ser ud som i stor skala

Men nok om rammeværket, hvordan ser det ud i praksis? Her er, hvad vi har opdaget ved at bygge disse agenter selv.

En almindelig IT-scenario er at sende en fejlrapport til en hjælpeagent. Sådan noget som, hvis dit Outlook ikke virker, så skriver du en beskrivelse af problemet og venter på, at agenten skal gennemgå og foreslå en løsning.

Men med kurateret hukommelse til din fordel, kunne en bedre proces indebære at tage et skærmbillede, der viser Outlook-fejlen, og uploade det til agenten. Nu (1) trækker agenten på institutionel hukommelse for at forstå dit arbejdsmiljø; (2) tjekker handlingshistorikken for relaterede begivenheder; og (3) anvender kontekstuel dømmekraft for en specifik løsning, ikke kun en generisk besked.

Resultatet er en intelligent agent, der ikke behøver at gætte svaret ud fra et skærmbillede. Det er nu faktisk under afhøring, ser på allerede kørende information og leverer en mere nyttig besked. Agenten kunne endda udvide sig til en netværk eller sværmeffekt, se på andre brugere i systemet for at se, om Outlook-problemet kun er dig eller et virksomhedsomfattende problem.

Kontekstualiseringen af historik eller hukommelse er forskellen. Hvis du ikke kuraterer din hukommelse effektivt, vil du blive overhalet af dem, der gør. Det er afgørende at have en arkitektur, der ved, hvordan man skal håndtere denne data over tid og forstå, hvad man skal beholde, hvad man skal fremhæve, og hvad man skal lade gå.

Tilbage til rejsen

Så, hvordan ændrede min AI-drevne rejseplanlægner min opfattelse af AI i enterprise IT?

Hvad jeg byggede, var en app, der fungerede som vores personlige rejsekoncierge og startede med at “afhøre” hver deltager. Vi forklarede alle, hvad der betød noget for os på rejsen: hvad der var et måske-dø og hvad vi kunne springe over. Endnu vigtigere var, at den spurgte os om vores “hvorfor” — hvorfor var noget vigtigt for os, hvad betød det for os.

Ved at bruge denne information gjorde den to ting. Først kuraterede den en rejsoplan, der var balanceret for at levere noget for alle — vi kunne alle se vores ønsker og præferencer repræsenteret i planen, den producerede.

Men, selvfølgelig, var denne første itinerær kun et udkast. Der var stadig mange spørgsmål at besvare.

Og det var, da den rigtige magi skete. Vi spurgte agenten om et hotel eller en attraktion eller en køretur, og svarene, den gav os, var beriget med konteksten af vores unikke situation: “Det ville være en lang køretur for børnene, men min svigerfar ville elske slottet (og den unikke kaffebar lige ved siden af) — og dette kunne være lige stedet for min kone at få den massage.”

Fyldt med denne rige forståelse af, hvad der var vigtigt for os, kunne den hjælpe os med at planlægge og finpudse vores rejse på en måde, som jeg ikke tror ville have været mulig på nogen anden måde.

Og det var i ét af disse første øjeblikke, at jeg forstod, hvad vi havde brug for at bygge for vores enterprise-kunder: intelligente systemer, der var så lastet med organisatorisk, transaktionsbaseret og personlig kontekst, at hver besked og hver interaktion ville være som en fingeraftryk: helt unik for det øjeblik og den interaktion, og ville levere en type værdi, der ikke kunne ske på nogen anden måde.

Udnyttende en tre-decenniers karriere, der spænder over IT-ledelse, digital transformation og som en industrianalytiker, fungerer Charles Araujo nu som præsident for SymphonyAI's Enterprise IT-afdeling. Hans unikke perspektiv kombinerer dyb erfaring med enterprise-teknologi med en dyb forståelse for CIO-udfordringer og muligheder.