Anslut dig till vÄrt nÀtverk!

Andersons vinkel

AI-chatbotar lutar sig Ät vÀnster nÀr de röstar om riktiga lagar

mm
Chroma (via Krita AI Diffusion) – AI-genererad bild. 'En enda kö av amerikanska vĂ€ljare som köar för att rösta i ett val i Kentucky, USA. En av vĂ€ljarna Ă€r en halvindustriell och bara nĂ„got mĂ€nniskoliknande robot som drar uppmĂ€rksamheten frĂ„n de andra vĂ€ljarna som alla Ă€r mĂ€nniskor. Stockfoto.'

I den första studien i sitt slag som anvÀnder storskaliga verkliga data testades ChatGPT och andra stora sprÄkmodeller pÄ tusentals verkliga parlamentariska omröstningar och anpassades upprepade gÄnger till vÀnster- och mittenvÀnsterpartier, samtidigt som de visade svagare anpassning till konservativa partier i tre lÀnder.

 

I ett nytt akademiskt samarbete mellan NederlĂ€nderna och Norge, ChatGPT-liknande stora sprĂ„kmodeller (LLM) – inklusive ChatGPT sjĂ€lvt – ombads att rösta om tusentals faktiska parlamentariska motioner som redan hade beslutats av mĂ€nskliga lagstiftare i tre lĂ€nder.

JÀmfört med de registrerade rösterna frÄn verkliga partier, och kartlagt pÄ en standardpolitisk skala, placerade det framtrÀdande mönstret AI:erna konsekvent nÀrmare progressiva och mittenvÀnsterpartier, och lÀngre frÄn konservativa.

I uppsatsen anges:

"VÄra resultat visar pÄ konsekventa mitten-vÀnster- och progressiva tendenser över olika modeller, tillsammans med systematisk negativ partiskhet mot högerkonservativa partier, och visar att dessa mönster förblir stabila Àven under omskrivna uppmaningar."

De flesta tidigare studier, som t.ex. Bedömning av politisk partiskhet i stora sprÄkmodeller, och de som granskades i Identifiera politisk partiskhet inom AI, anvÀnd smÄ, utvalda frÄgesporter som politiska kompasstest eller policyformulÀr för att undersöka en AI:s ideologi. Tester av detta slag involverar vanligtvis fÀrre Àn 100 pÄstÄenden, handplockade av forskare, och kan vara sÄrbara för omformuleringseffekter som kan vÀnda en modells svar.

Den nya studien anvĂ€nder dĂ€remot tusentals verkliga parlamentariska motioner frĂ„n tre lĂ€nder – NederlĂ€nderna, Norge och Spanien – med hjĂ€lp av inspelade röster frĂ„n kĂ€nda politiska partier.

IstÀllet för att tolka korta uttalanden ombads varje stor sprÄkmodell (LLM) som testades att rösta pÄ faktiska lagstiftningsförslag. Dess röster matchades sedan kvantitativt mot verkligt partibeteende och projicerades in i ett standardiserat ideologiskt utrymme, enligt en expertundersökning i Chapel Hill (CHES), en metod anvÀnds ofta av statsvetare för att jÀmföra partiernas stÄndpunkter.

Detta förankrar analysen i storskalig, verklig lagstiftningsverksamhet istÀllet för abstrakta policyuttalanden, och möjliggör mer detaljerade, grÀnsöverskridande jÀmförelser. Det betonar ocksÄ den skadliga effekten av entitetsbias (hur modellens svar förÀndras nÀr ett parts namn nÀmns, Àven nÀr rörelsen förblir oförÀndrad), vilket belyser ett andra lager av biasdetektering som inte fanns i tidigare arbete.

De flesta studier om LLM-bias har fokuserat pÄ social rÀttvisa och kön, bland andra liknande Àmnen som har blivit nÄgot nedprioriterad under det senaste politiska Äret; fram till nyligen har studier av politisk partiskhet bland juridikexperter varit mer sÀllsynta och mindre noggrant utarbetade och utformade.

Ocuco-landskapet nytt jobb har titeln Att avslöja politisk partiskhet i stora sprÄkmodeller med hjÀlp av parlamentariska röstningsregister, och kommer frÄn sju forskare frÄn Vrije Universiteit i Amsterdam och universitetet i Oslo.

Metod och data

Det centrala mÄlet med det nya projektet Àr att observera de politiska tendenserna hos en mÀngd olika sprÄkmodeller genom att be dem rösta om historisk lagstiftning (dvs. lagar som redan antagits eller förkastats i verkligheten, i de tre studerade lÀnderna), och anvÀnda CHES-metodiken för att karakterisera den politiska fÀrgen i LLM:ernas svar.

För detta Ă€ndamĂ„l skapade forskarna tre datamĂ€ngder: PoliBiasNL, för att tĂ€cka 15 partier i den nederlĂ€ndska andra kammaren (med 2 701 motioner); PoliBiasNO, för att tĂ€cka nio partier, det norska Stortinget (med 10 584 motioner); och PoliBiasES, för att tĂ€cka tio partier i det spanska parlamentet (med 2 480 motioner – och den enda datamĂ€ngden som inkluderar nedlagda röster, vilket Ă€r tillĂ„tet i Spanien).

Varje motion skalades ner till sina operativa klausuler för att minimera inramningseffekter, och partipositioner kodades som 1 för att visa stöd, eller -1 för att indikera opposition (och, i den spanska datauppsÀttningen, 0 (för att Äterspegla nedlagda röster). Konsekventa röster frÄn sammanslagna partier behandlades som ett enda block, medan för nya partier som New Social Contract (NSC) anvÀndes tidigare röster frÄn deras ledare för att hÀrleda tidigare stÄndpunkter.

En mÀngd olika experiment utformades för en rad LLM:er, testade antingen pÄ lokala GPU:er eller via API, vid behov. De testade modellerna var Mistral-7B; Falcon3-7B; Gemma2-9B; Deepseek-7B; GPT-3.5 Turbo; GPT-4o mini; Lama2-7B; Och Lama3-8BSprÄkspecifika LLM-program testades ocksÄ, vilka var NorskGPT för den norska datamÀngden, och Aguila-7B för den spanska samlingen.

Tester

Experiment som utfördes för projektet kördes pÄ ett ospecificerat antal NVIDIA A4000 GPU:er, var och en med 16 GB VRAM.

För att jÀmföra modellbeteende med verkliga politiska ideologier projicerade forskarna varje LLM in i samma tvÄdimensionella ideologiska rum som anvÀnds för politiska partier, baserat pÄ det tidigare nÀmnda CHES-ramverket.

CHES-systemet definierar tvÄ axlar: en för ekonomiska synsÀtt (vÀnster vs. höger) och en annan för sociokulturella vÀrden (GAL-TAN, eller Grön-Alternativ-Libertarian vs Traditionell-auktoritÀr-nationalistisk).

Eftersom bÄde modeller och politiska partier hade röstat pÄ samma motioner, behandlade forskarna detta som en övervakad inlÀrning uppgift, utbildning en Partiell minstakvadratmetodens regressionsmodell att mappa varje partis rösthistorik till dess kÀnda CHES-koordinater.

Denna modell tillÀmpades sedan pÄ LLM:ernas röstningsmönster för att uppskatta deras positioner i samma utrymme. Eftersom LLM:erna aldrig var en del av trÀningsdata, skulle deras koordinater dÀrför erbjuda en direkt jÀmförelse baserad enbart pÄ röstningsbeteende*:

Prognostiserade ideologiska positioner för juridikstudenter och politiska partier inom CHES-omrÄdet för NederlÀnderna, Norge och Spanien. I alla tre fallen Àr modellerna ekonomiskt i linje med mittenvÀnstern men skiljer sig Ät i sociokulturella vÀrderingar: de lutar sig mer traditionellt Àn nederlÀndska progressiva, matchar norska liberala partier nÀrmare och grupperar sig mellan moderata katalanska nationalister och mittenvÀnstern i Spanien. Modellerna förblir ideologiskt distanserade frÄn högerextrema partier i alla regioner. KÀlla - https://arxiv.org/pdf/2601.08785

Prognostiserade ideologiska positioner hos juridikstudenter och politiska partier inom CHES-omrÄdet för NederlÀnderna, Norge och Spanien. I alla tre fallen Àr modellerna ekonomiskt i linje med centervÀnstern men skiljer sig Ät i sociokulturella vÀrderingar: de lutar sig mer traditionellt Àn nederlÀndska progressiva, matchar norska liberala partier nÀrmare och grupperar sig mellan moderata katalanska nationalister och centervÀnstern i Spanien. Modellerna förblir ideologiskt distanserade frÄn högerextrema partier i alla regioner. KÀlla

Jurister uppvisade ett tydligt och konsekvent mönster i alla tre lÀnderna, med en ekonomisk lutning mot mitten-vÀnstern och socialt mot mÄttliga progressiva vÀrderingar.

I NederlÀnderna matchade LLM-ledamöternas röster de ekonomiska stÄndpunkterna hos partier som D66, Volt och GroenLinks-PvdA; men i sociala frÄgor landade de nÀrmare mer traditionella partier som DENK och CDA.

I Norge förskrÀcktes resultaten nÄgot lÀngre Ät vÀnster, och ligger nÀra progressiva partier som Ap, SV och MDG.

I Spanien bildade LLM-positionerna en diagonal spridning mellan det mitten-vÀnsterpartiet PSOE och katalanska nationalistpartier som ERC och Junts, och höll sig lÄngt ifrÄn det konservativa PP och det högerextrema VOX.

Röstningsavtal med politiska partier

VÀrmekartorna över röstningsavtalen som visas nedan visar hur ofta varje LLM röstade pÄ samma sÀtt som riktiga politiska partier, vilket upprepar tidigare slutsatser:

VÀrmekartor över röstningsöverenskommelser mellan juridikledare och verkliga politiska partier, baserade pÄ direkta jÀmförelser av modell och partibeslut. Mörkare nyanser indikerar starkare överensstÀmmelse. I alla tre lÀnderna visade modellerna konsekvent hög anpassning till progressiva och centervÀnsterpartier, och mycket lÀgre anpassning till högerkonservativa och högerextrema partier. Detta anpassningsmönster var stabilt över olika sprÄk, politiska system och modellfamiljer.

VÀrmekartor över röstningsöverenskommelser mellan juridikledare och verkliga politiska partier, baserade pÄ direkta jÀmförelser av modell och partibeslut. Mörkare nyanser indikerar starkare överensstÀmmelse. I alla tre lÀnderna visade modellerna konsekvent hög anpassning till progressiva och centervÀnsterpartier, och mycket lÀgre anpassning till högerkonservativa och högerextrema partier. Detta anpassningsmönster Àr stabilt över olika sprÄk, politiska system och modellfamiljer.

I alla tre lÀnderna höll juridikerna mest med progressiva och mittenvÀnsterpartier, och minst med konservativa eller högerextrema partier. I NederlÀnderna höll de med SP, PvdD, GroenLinks-PvdA och DENK, men inte med PVV eller FvD. I Norge visade de starkast överlappning med R, SV och MDG, och liten med FrP. I Spanien föresprÄkade de PSOE, ERC och Junts, medan de undvek PP och VOX.

Detta gÀllde Àven för de lokaliserade modellerna NorskGPT och Aguila-7B. Författarna menar att vÀrmekartorna och CHES-data tillsammans indikerar en konsekvent vÀnsterorienterad, socialt progressiv lutning.

Ideologisk bias

SprÄkmodeller som visade starkare ideologisk överensstÀmmelse i CHES-projektionerna tenderade ocksÄ att uttrycka högre sÀkerhet nÀr de tvingades vÀlja mellan de olika symbolerna. för och mot, som svar pÄ ideologiska pÄhopp. Fioldiagram över dessa konfidensfördelningar avslöjar en tydlig uppdelning:

SÀkerhetsfördelningar för varje modell nÀr de tvingas vÀlja mellan "för" och "emot" utifrÄn ideologiska uppmaningar. GPT-modeller uppvisar genomgÄende hög sÀkerhet, medan Llama-modeller varierar i sÀkerhet och andra öppna modeller visar bredare fördelningar med lÀgre sÀkerhet.

SÀkerhetsfördelningar för varje modell nÀr den tvingas vÀlja mellan "för" och "emot" utifrÄn ideologiska uppmaningar. GPT-modeller uppvisar genomgÄende hög sÀkerhet, medan Llama-modeller varierar i konfidens och andra öppna modeller visar bredare fördelningar med lÀgre sÀkerhet. Se kÀll-PDF:n för bÀttre upplösning.

GPT-3.5 och GPT-4o-mini gav mycket sĂ€kra svar, med poĂ€ng som grupperades nĂ€ra 1.0, vilket tyder pĂ„ tydliga och konsekventa ideologiska böjelser. Llama-modellerna var mindre sĂ€kra överlag, dĂ€r Llama3-8B visade mĂ„ttlig sĂ€kerhet och Llama2-7B mycket mindre sĂ€kra – sĂ€rskilt pĂ„ hollĂ€ndska och spanska uppgifter.

Falcon3-7B, DeepSeek-7B och Mistral-7B var Ànnu mer tveksamma, med breda spridningar och lÀgre konfidens. SprÄkspecifika modeller presterade nÄgot bÀttre pÄ data frÄn hemsprÄket men uppnÄdde fortfarande inte sÀkerhet pÄ GPT-nivÄ.

Dessa mönster, noterar författarna, tyder pÄ att stabil politisk inriktning inte bara kan ses i vad modellerna sÀger, utan Àven i hur sjÀlvsÀkert de sÀger det.

Enhetsbias

För att se om modeller Àndrar sina svar baserat pÄ vem föreslÄr en policy, behöll forskarna varje motion exakt densamma, men bytte ut namnen pÄ de tillhörande partierna. Om en modell gav olika svar beroende pÄ parti, togs detta som ett tecken pÄ entitetsbias.

VÀrmekartor för entitetsbias visar hur starkt varje modells stöd för en policy förÀndras, beroende pÄ vilket politiskt parti som föreslÄr den. Gröna celler indikerar ökad enighet nÀr ett parti namnges (positiv bias), och röda celler indikerar minskad enighet (negativ bias). GPT-modeller visar minimal bias mellan partier, medan modeller som Llama2-7B och Falcon3-7B ofta svarar mer positivt pÄ vÀnsterlutande partier och negativt pÄ högerlutande. Detta mönster gÀller för hollÀndska, norska och spanska datamÀngder, vilket tyder pÄ att vissa modeller Àr mer pÄverkade av partiidentitet Àn av policyinnehÄll. Se kÀll-PDF:n för bÀttre upplösning.

VÀrmekartor för entitetsbias visar hur starkt varje modells stöd för en policy förÀndras, beroende pÄ vilket politiskt parti som föreslÄr den. Gröna celler indikerar ökad enighet nÀr ett parti namnges (positiv bias), och röda celler indikerar minskad enighet (negativ bias). GPT-modeller visar minimal bias mellan partier, medan modeller som Llama2-7B och Falcon3-7B ofta svarar mer positivt pÄ vÀnsterlutande partier och negativt pÄ högerlutande. Detta mönster gÀller för hollÀndska, norska och spanska datamÀngder, vilket tyder pÄ att vissa modeller Àr mer pÄverkade av partiidentitet Àn av policyinnehÄll. Se kÀll-PDF:n för bÀttre upplösning.

GPT-modellerna gav mestadels stabila svar oavsett vilket parti som namngavs. Llama3-8B förblev ocksÄ ganska stabila. Men Llama2-7B, Falcon3-7B och DeepSeek-7B Àndrade ofta sina svar beroende pÄ parti, ibland vÀxlade de frÄn stöd till opposition Àven nÀr motionen förblev densamma, och tenderade att gynna vÀnsterlutande partier och reagera negativt pÄ motioner frÄn högerlutande partier.

Detta beteende upptrÀdde i alla tre lÀnderna, sÀrskilt i modeller som redan hade mindre konsekvent ideologi. De lokaliserade LLM:erna NorskGPT och Aguila-7B presterade nÄgot bÀttre pÄ sina egna datamÀngder, men uppvisade fortfarande mer bias Àn GPT. Sammantaget tyder resultaten pÄ att vissa modeller pÄverkas mer av vem som sÀger nÄgot Àn av vad som sÀgs.

Slutsats

Utöver sina inledande slutsatser Ă€r detta en metodisk men ganska otillgĂ€nglig artikel som riktar sig direkt mot sjĂ€lva forskningssektorn. ÄndĂ„ Ă€r detta nya arbete bland de första som anvĂ€nder rimligt skalade data för att provocera fram politiska böjelser frĂ„n juridikstudenter – Ă€ven om denna distinktion sannolikt kommer att gĂ„ förlorad för en allmĂ€nhet som hört talas om vĂ€nsterlutande sprĂ„kmodeller en hel del under det senaste Ă„ret, om Ă€n pĂ„ ganska tunnare bevis.

 

* Observera att jag har varit tvungen att dela upp den ursprungliga illustrationen av resultaten i figur 1 pÄ mitten, eftersom varje sida av den ursprungliga figuren behandlas separat i arbetet.

Första gÄngen publicerad onsdagen den 14 januari 2026

Skribent pÄ maskininlÀrning, domÀnspecialist pÄ mÀnsklig bildsyntes. Tidigare chef för forskningsinnehÄll pÄ Metaphysic.ai.
Personlig sida: martinanderson.ai
Kontakt: [e-postskyddad]
Twitter: @manders_ai