Kunstig intelligens

Hvorfor store språkmodeller glemmer midten: Avdekker AIs skjulte blindsone

Publisert Juli 5, 2025

Dr. Tehseen Zia

Ettersom store språkmodeller (LLM-er) er mye brukt til oppgaver som dokumentoppsummering, juridisk analyse og evaluering av sykehistorie, er det avgjørende å erkjenne begrensningene til disse modellene. Selv om vanlige problemer som hallusinasjoner og Bias er velkjente, har forskere nylig identifisert en annen betydelig svakhet: når de behandler lange tekster, har LLM-er en tendens til å beholde informasjon i begynnelsen og slutten, men forsømmer ofte midten.

Dette problemet, omtalt som «tapt-i-midten”-fenomenet, kan ha alvorlig innvirkning på ytelsen til disse modellene i virkelige applikasjoner. Hvis for eksempel en AI har i oppgave å oppsummere et langt juridisk dokument, kan det å utelate kritiske detaljer fra midten føre til misvisende eller ufullstendige sammendrag. I medisinske settinger kan det å overse informasjon fra midten av en pasients historie føre til unøyaktige anbefalinger. Å forstå hvorfor dette skjer er fortsatt en utfordrende oppgave for forskere som prøver å bygge tryggere og mer pålitelig AI. Imidlertid har nylig en studere gir noen av de klareste svarene hittil, og avslører at dette problemet er dypt forankret i arkitekturen til disse modellene.

«Tapt i midten»-problemet

«Lost-in-the-middle»-fenomenet refererer til tendensen til at LLM-er gir mindre oppmerksomhet til informasjon midt i lange inputsekvenser. Det ligner på hvordan mennesker ofte husker det første og siste elementet i en liste bedre enn de i midten. Denne kognitive skjevheten hos mennesker er ofte kjent som primat- og nyhetseffektFor LLM-er betyr dette at de presterer bedre når nøkkelinformasjon er i begynnelsen eller slutten av en tekst, men sliter når den er begravd i midten. Dette resulterer i en «U-formet» ytelseskurve, hvor nøyaktigheten er høy i starten, synker betydelig i midten og deretter øker igjen på slutten.

Dette fenomenet er ikke bare et teoretisk problem. Det har blitt observert i en rekke oppgaver, fra spørsmålsbesvarelse til dokumentoppsummering. Hvis du for eksempel stiller et LLM-spørsmål der svaret finnes i de første avsnittene av en lang artikkel, vil den sannsynligvis svare riktig. Det samme gjelder hvis svaret finnes i de siste avsnittene. Men hvis den kritiske informasjonen er skjult et sted i midten, synker modellens nøyaktighet kraftig. Dette er en alvorlig begrensning, da det betyr at vi ikke fullt ut kan stole på disse modellene med oppgaver som krever forståelse av en lang og kompleks kontekst. Det gjør dem også sårbare for manipulasjon. Noen kan med vilje plassere misvisende informasjon i begynnelsen eller slutten av et dokument for å påvirke AI-ens utdata.

Forstå arkitekturen til LLM-er

For å forstå hvorfor LLM-er glemmer midten, må vi se på hvordan de er bygget opp. Moderne LLM-er er basert på en arkitektur som kalles TransformatorTransformeren var et gjennombrudd innen kunstig intelligens fordi den introduserte en mekanisme kalt selvoppmerksomhetSelvoppmerksomhet lar modellen veie viktigheten av forskjellige ord i inndatateksten når den behandler et gitt ord. For eksempel, når den behandler setningen «Katten satt på matten», kan selvoppmerksomhetsmekanismen lære at «katt» og «satt» er sterkt beslektet. Dette lar modellen bygge en mye rikere forståelse av forholdet mellom ord enn tidligere arkitekturer kunne.

En annen nøkkelkomponent er posisjonell kodingSiden selvoppmerksomhetsmekanismen i seg selv ikke har en iboende sans for ordrekkefølge, legges posisjonskodinger til inputen for å gi modellen informasjon om posisjonen til hvert ord i sekvensen. Uten dette ville modellen se inputteksten som bare en «pose med ord«uten struktur. Disse to komponentene, selvoppmerksomhet og posisjonskoding, jobber sammen for å gjøre LLM-er mer effektive. Den nye forskningen viser imidlertid at måten de samhandler på også er kilden til denne skjulte blindsonen.

Hvordan posisjonsskjevhet oppstår

En fersk studere bruker en smart tilnærming for å forklare dette fenomenet. Den modellerer informasjonsflyten inne i en Transformer som en graf, der hvert ord er en node og oppmerksomhetsforbindelsene er kantene. Dette lar forskerne matematisk spore hvordan informasjon fra forskjellige posisjoner behandles gjennom modellens mange lag.

De avdekket to hovedinnsikter. For det første, bruken av kausal maskering I mange LLM-er skaper dette iboende en skjevhet mot begynnelsen av sekvensen. Kausal maskering er en teknikk som sikrer at når modellen genererer et ord, kan den bare fokusere på ordene som kom før det, ikke etter. Dette er avgjørende for oppgaver som tekstgenerering. Over mange lag skaper dette imidlertid en sammensatt effekt. De første ordene i en tekst behandles igjen og igjen, og representasjonene deres blir mer og mer innflytelsesrike. I motsetning til dette ser ord i midten alltid tilbake på denne allerede veletablerte konteksten, og deres eget unike bidrag kan drukne i.

For det andre så forskerne på hvordan posisjonskodinger samhandler med denne kausale maskeringseffekten. Moderne LLM-er bruker ofte relative posisjonskodinger, som fokuserer på avstanden mellom ord i stedet for deres absolutte posisjon. Dette hjelper modellen med å generalisere til tekster av ulik lengde. Selv om dette virker som en god idé, skaper det et konkurrerende press. Den kausale masken skyver modellens fokus til starten, mens den relative posisjonskodingen oppmuntrer den til å fokusere på ord i nærheten. Resultatet av denne tautrekkingen er at modellen vier mest oppmerksomhet til selve begynnelsen av teksten og til den umiddelbare lokale konteksten til et gitt ord. Informasjon som er langt unna og ikke i begynnelsen, med andre ord i midten, får minst oppmerksomhet.

De bredere implikasjonene

Fenomenet «tapt i midten» har betydelige konsekvenser for applikasjoner som er avhengige av å behandle lange tekster. Forskningen viser at problemet ikke bare er en tilfeldig effekt, men en grunnleggende konsekvens av måten vi har designet disse modellene på. Dette betyr at det er usannsynlig at det å bare trene dem på mer data vil løse problemet. I stedet må vi kanskje revurdere noen av de viktigste arkitektoniske prinsippene til Transformers.

For brukere og utviklere av AI er dette en kritisk advarsel. Vi må være klar over denne begrensningen når vi designer applikasjoner som er avhengige av LLM-er. For oppgaver som involverer lange dokumenter, kan det hende vi må utvikle strategier for å redusere denne skjevheten. Dette kan innebære å dele dokumentet opp i mindre deler eller lage modeller som spesifikt retter modellens oppmerksomhet mot forskjellige deler av teksten. Det fremhever også viktigheten av grundig testing. Vi kan ikke anta at en LLM som yter bra på korte tekster, vil være pålitelig når den står overfor lengre, mer komplekse input.

Bunnlinjen

AI-utvikling har alltid fokusert på å identifisere begrensninger og finne måter å overvinne dem på. «Lost-in-the-middle»-problemet er en betydelig svakhet i store språkmodeller, der de har en tendens til å overse informasjon midt i lange tekstsekvenser. Dette problemet oppstår på grunn av skjevheter i Transformer-arkitekturen, spesielt samspillet mellom kausal maskering og relativ posisjonskoding. Selv om LLM-er fungerer bra med informasjon i begynnelsen og slutten av en tekst, sliter de når viktige detaljer plasseres i midten. Denne begrensningen kan redusere nøyaktigheten til LLM-er i oppgaver som dokumentoppsummering og spørsmålsbesvarelse, noe som kan ha alvorlige implikasjoner innen felt som jus og medisin. Utviklere og forskere må løse dette problemet for å forbedre påliteligheten til LLM-er i praktiske anvendelser.

Relaterte temaer:Avanserte LLM-er AI kognitive evner oppmerksomhetsmekanisme Bias Forklarer LLM-er forbedre LLM-nøyaktigheten stor språkmodell transformatorarkitektur

Neste

Forbedring av AI-effektivitet med kortere resonneringskjeder i store språkmodeller

Ikke gå glipp av

Betyr AI slutten på jobber på inngangsnivå?

Dr. Tehseen Zia

Dr. Tehseen Zia er en fast førsteamanuensis ved COMSATS University Islamabad, med en doktorgrad i AI fra Wiens teknologiske universitet, Østerrike. Med spesialisering i kunstig intelligens, maskinlæring, datavitenskap og datasyn, har han gitt betydelige bidrag med publikasjoner i anerkjente vitenskapelige tidsskrifter. Dr. Tehseen har også ledet ulike industrielle prosjekter som hovedetterforsker og fungert som AI-konsulent.