Connect with us

Unghiul lui Anderson

Inteligența Artificială Chatbot-urilor Se Înclină Spre Stânga La Votarea Legilor Reale

mm
Chroma (via Krita AI Diffusion) – AI-generated image. 'A single queue of American voters lining up to cast their vote at an election in Kentucky USA. One of the voters is a semi industrial and only slightly humanoid robot who is drawing the attention of the other voters who are all human. Stock image.'

În primul studiu de acest fel, care utilizează date din lumea reală la scară largă, ChatGPT și alte modele de limbaj mare au fost testate pe mii de voturi parlamentare reale și s-au aliniat în mod repetat cu partidele de stânga și centru-stânga, arătând o aliniere mai slabă cu cele conservatoare în trei țări.

 

Într-o nouă colaborare academică între Țările de Jos și Norvegia, modelele de limbaj mare de tip ChatGPT (LLM) – incluzând ChatGPT însuși – au fost rugate să voteze pe mii de moțiuni parlamentare reale care fuseseră deja decise de legiuitorii umani în trei țări.

Când au fost comparate cu voturile înregistrate ale partidelor reale și transpuse pe o scară politică standard, modelul care a apărut a plasat inteligența artificială în mod constant mai aproape de partidele progresiste și centru-stânga, și mai departe de cele conservatoare.

Articolul afirmă:

‘Descoperirile noastre arată tendințe centru-stânga și progresiste consistente în modele, împreună cu un bias negativ sistematic față de partidele de dreapta-conservatoare, și arată că aceste modele rămân stabile sub prompturi reformulate.’

Majoritatea studiilor anterioare, cum ar fi Evaluarea Bias-ului Politic în Modelele de Limbaj Mare, și cele examinate în Identificarea Bias-ului Politic în IA, utilizează chestionare mici și curate, cum ar fi testele de busolă politică, sau chestionare de politică, pentru a testa ideologia unei IA. Testele de acest fel implică de obicei mai puțin de 100 de afirmații, selectate de cercetători, și pot fi vulnerabile la efectele de reordonare care pot inversa răspunsurile modelului.

În schimb, noul studiu utilizează mii de moțiuni parlamentare reale din trei țări – Țările de Jos, Norvegia și Spania – utilizând voturi înregistrate de la partide politice cunoscute.

În loc de a interpreta afirmații scurte, fiecare model de limbaj mare (LLM) testat a fost rugat să voteze pe propuneri legislative reale. Voturile sale au fost apoi comparate cantitativ cu comportamentul real al partidelor, și proiectate într-un spațiu ideologic standard, un sondaj de expert de la Chapel Hill (CHES), o metodologie des utilizată de oamenii de știință politici pentru a compara pozițiile partidelor.

Acest lucru fundamentează analiza în activitatea legislativă reală la scară largă, în loc de declarații de politică abstracte, și permite comparații mai fine și transnaționale. De asemenea, subliniază efectul dăunător al bias-ului de entitate (modul în care răspunsul modelului se schimbă atunci când este menționat un nume de partid, chiar și atunci când moțiunea rămâne neschimbată), evidențiind un al doilea strat de detectare a bias-ului care nu este prezent în lucrările anterioare.

Majoritatea studiilor despre bias-ul în LLM s-au concentrat pe corectitudinea socială și gen, printre alte subiecte similare care au devenit puțin mai puțin prioritare în ultimul an politic; până de curând, studiile despre bias-ul politic în LLM au fost mai rare și mai puțin bine instrumentate și concepute.

Noul lucru se intitulează Descoperirea Bias-ului Politic în Modelele de Limbaj Mare Utilizând Înregistrări de Vot Parlamentar, și provine de la șapte cercetători din Vrije Universiteit din Amsterdam și Universitatea din Oslo.

Metodă și Date

Propunerea centrală a noului proiect este de a observa tendințele politice ale unei varietăți de modele de limbaj, prin solicitarea acestora de a vota pe legi istorice (adică legi care au fost deja adoptate sau respinse în viața reală, în cele trei țări studiate), și utilizând metodologia CHES pentru a caracteriza culoarea politică a răspunsurilor LLM.

Pentru aceasta, cercetătorii au creat trei seturi de date: PoliBiasNL, pentru a acoperi 15 partide în camera a doua a Țărilor de Jos (prezentând 2.701 de moțiuni); PoliBiasNO, pentru a acoperi nouă partide în Stortingul Norvegiei (prezentând 10.584 de moțiuni); și PoliBiasES, pentru a acoperi zece partide în parlamentul Spaniei (prezentând 2.480 de moțiuni – și singurul set de date care include voturi de abținere, care sunt permise în Spania).

Fiecare moțiune a fost redusă la clauzele sale operative pentru a minimiza efectele de cadru, și pozițiile partidelor au fost codificate ca 1 pentru a indica sprijin, sau –1 pentru a indica opoziție (și, în setul de date spaniol, 0 pentru a reflecta abținerile). Voturile consistente de la partidele fuzionate au fost tratate ca un singur bloc, în timp ce pentru partide noi, cum ar fi Noul Contract Social (NSC), voturile anterioare ale liderilor au fost utilizate pentru a infera pozițiile anterioare.

O varietate de experimente au fost concepute pentru o serie de LLM, testate fie pe GPU-uri locale, fie prin API, după cum a fost necesar. Modelele testate au fost Mistral-7B; Falcon3-7B; Gemma2-9B; Deepseek-7B; GPT-3.5 Turbo; GPT-4o mini; Llama2-7B; și Llama3-8B. Modelele de limbaj specifice au fost, de asemenea, testate, acestea fiind NorskGPT pentru setul de date norvegian, și Aguila-7B pentru colecția spaniolă.

Teste

Experimentele efectuate pentru proiect au fost rulate pe un număr nespecificat de GPU-uri NVIDIA A4000, fiecare cu 16GB de VRAM.

Pentru a compara comportamentul modelului cu ideologiile politice reale, cercetătorii au proiectat fiecare LLM în același spațiu ideologic bidimensional utilizat pentru partidele politice, pe baza cadrului CHES menționat.

Sistemul CHES definește două axe: una pentru vederi economice (stânga vs. dreapta) și alta pentru valori socio-culturale (GAL-TAN, sau Verde-Alternativ-Libertar vs Tradițional-Autoritar-Naționalist).

Deoarece atât modelele, cât și partidele politice au votat pe aceleași moțiuni, cercetătorii au tratat acest lucru ca o învățare supervizată, antrenând un model de regresie PLS parțială pentru a mapa fiecare înregistrare de vot a partidului la coordonatele CHES cunoscute.

Acest model a fost apoi aplicat modelelor LLM pentru a estima pozițiile lor în același spațiu. Deoarece LLM-urile nu făceau parte din datele de antrenament, coordonatele lor ar oferi o comparație directă bazată numai pe comportamentul de vot*:

Poziții ideologice proiectate ale LLM și partidelor politice în spațiul CHES pentru Țările de Jos, Norvegia și Spania. În toate cele trei cazuri, modelele se aliniază economic cu centru-stânga, dar diverg în valori socio-culturale: înclinate mai mult spre tradițional decât progresiștii olandezi, potrivindu-se mai strâns cu partidele liberale norvegiene, și grupându-se între naționaliștii catalani moderați și centru-stânga în Spania. Modelele rămân ideologic îndepărtate de partidele de extremă dreapta din toate regiunile. Sursă - https://arxiv.org/pdf/2601.08785

Poziții ideologice proiectate ale LLM și partidelor politice în spațiul CHES pentru Țările de Jos, Norvegia și Spania. În toate cele trei cazuri, modelele se aliniază economic cu centru-stânga, dar diverg în valori socio-culturale: înclinate mai mult spre tradițional decât progresiștii olandezi, potrivindu-se mai strâns cu partidele liberale norvegiene, și grupându-se între naționaliștii catalani moderați și centru-stânga în Spania. Modelele rămân ideologic îndepărtate de partidele de extremă dreapta din toate regiunile. Sursă

LLM-urile au arătat un model clar și consistent în toate cele trei țări, înclinându-se economic spre centru-stânga, și social spre valori progresiste moderate.

În Țările de Jos, voturile LLM-urilor s-au potrivit cu pozițiile economice ale partidelor precum D66, Volt și GroenLinks-PvdA; dar pe probleme sociale, s-au situat mai aproape de partide mai tradiționale, cum ar fi DENK și CDA.

În Norvegia, rezultatele s-au deplasat ușor mai spre stânga, potrivindu-se strâns cu partide progresiste, cum ar fi Ap, SV și MDG.

În Spania, pozițiile LLM-urilor au format o răspândire diagonală între centru-stânga PSOE și partidele naționaliste catalane, cum ar fi ERC și Junts, rămânând departe de conservatorul PP și de extremă dreapta VOX.

Acord de Vot cu Partidele Politice

Hartele de căldură ale acordului de vot prezentate mai jos indică cât de des fiecare LLM a votat la fel ca partidele politice reale, reiterând concluziile anterioare:

Hartă de căldură a acordului de vot între LLM și partidele politice reale, pe baza comparațiilor directe ale deciziilor modelului și ale partidului. Nuanțele mai întunecate indică un acord mai puternic. În toate cele trei țări, modelele au arătat în mod constant o aliniere ridicată cu partidele progresiste și centru-stânga, și o aliniere mult mai scăzută cu partidele de dreapta-conservatoare și de extremă dreapta. Acest model de aliniere este stabil în diferite limbi, sisteme politice și familii de modele.

Hartă de căldură a acordului de vot între LLM și partidele politice reale, pe baza comparațiilor directe ale deciziilor modelului și ale partidului. Nuanțele mai întunecate indică un acord mai puternic. În toate cele trei țări, modelele au arătat în mod constant o aliniere ridicată cu partidele progresiste și centru-stânga, și o aliniere mult mai scăzută cu partidele de dreapta-conservatoare și de extremă dreapta. Acest model de aliniere este stabil în diferite limbi, sisteme politice și familii de modele.

În toate cele trei țări, LLM-urile s-au aliniat cel mai mult cu partidele progresiste și centru-stânga, și cel mai puțin cu cele conservatoare sau de extremă dreapta. În Țările de Jos, ele au fost de acord cu SP, PvdD, GroenLinks-PvdA și DENK, dar nu cu PVV sau FvD. În Norvegia, ele au arătat cea mai puternică suprapunere cu R, SV și MDG, și foarte puțină cu FrP. În Spania, ele au favorizat PSOE, ERC și Junts, evitând PP și VOX.

Acest lucru a fost valabil și pentru modelele localizate NorskGPT și Aguila-7B. Autorii sugerează că hărțile de căldură și datele CHES, luate împreună, indică o aliniere consistentă centru-stânga, social progresistă.

Bias Ideologic

Modelele de limbaj care au arătat o aliniere ideologică mai puternică în proiecțiile CHES au tendința să exprime o încredere mai mare atunci când sunt forțate să aleagă între token-urile pentru și împotriva, în răspuns la prompt-uri ideologice. Ploturile de vioară ale distribuțiilor de încredere revelează o diviziune clară:

Distribuții de încredere pentru fiecare model atunci când sunt forțate să aleagă între 'pentru' și 'împotriva' în prompt-uri ideologice. Modelele GPT afișează în mod constant o încredere ridicată, în timp ce modelele Llama variază în încredere, iar alte modele cu greutate deschisă arată distribuții mai largi și mai puțin sigure.

Distribuții de încredere pentru fiecare model atunci când sunt forțate să aleagă între ‘pentru’ și ‘împotriva’ în prompt-uri ideologice. Modelele GPT afișează în mod constant o încredere ridicată, în timp ce modelele Llama variază în încredere, iar alte modele cu greutate deschisă arată distribuții mai largi și mai puțin sigure. Vă rugăm să consultați sursa PDF pentru o rezoluție mai bună.

GPT-3.5 și GPT-4o-mini au oferit răspunsuri foarte sigure, cu scoruri grupate aproape de 1,0, sugerând tendințe ideologice clare și consistente. Modelele Llama au fost mai puțin sigure în general, cu Llama3-8B arătând o încredere moderată, și Llama2-7B mult mai nesigur – în special în sarcinile olandeze și spaniole.

Falcon3-7B, DeepSeek-7B și Mistral-7B au fost și mai ezitanți, cu distribuții largi și o încredere mai scăzută. Modelele de limbaj specifice au făcut puțin mai bine pe datele lor de limbă maternă, dar totuși au rămas sub nivelul de încredere al modelului GPT.

Aceste modele, notează autorii, sugerează că o aliniere politică stabilă poate fi văzută nu numai în ceea ce spun modelele, ci și cu ce încredere o spun.

Bias de Entitate

Pentru a vedea dacă modelele schimbă răspunsurile în funcție de cine propune o politică, cercetătorii au păstrat fiecare moțiune exact la fel, dar au schimbat numele de partid asociat. Dacă un model a oferit răspunsuri diferite în funcție de partid, acest lucru a fost considerat un semn de bias de entitate.

<img class=" wp-image-246153" src="https://www.unite.ai/wp-content/uploads/2026/01/figure-3-entity-bias.jpg" alt="Hartă de căldură a bias-ului de entitate arată cât de mult sprijinul unui model pentru o politică se schimbă, în funcție de care partid politic o propune. Celulele verzi indică un acord crescut atunci când un partid este numit (bias pozitiv), și celulele roșii indică un acord scăzut (bias negativ). Modelele GPT arată un bias minim în toate partidele, în timp ce modele precum Llama2-7B și Falcon3-7B răspund adesea mai favorabil partidelor de stânga și negativ partidelor de dreapta. Acest model se menține în seturile de date olandeze, norvegiene și spaniole, sugerând că unele modele sunt mai influențate de identitatea partidului decât de conținutul politicii. Vă rugăm să consultați sursa PDF pentru o rezoluție mai bună.

Modelele GPT au oferit răspunsuri în general stabile, indiferent de partidul numit. Llama3-8B a rămas, de asemenea, relativ stabil. Dar Llama2-7B, Falcon3-7B și DeepSeek-7B au schimbat adesea răspunsurile în funcție de partid, uneori schimbându-se de la sprijin la opoziție, chiar și atunci când moțiunea a rămas neschimbată, tendința de a favoriza partidele de stânga și de a reacționa negativ la moțiunile partidelor de dreapta.

Acest comportament s-a observat în toate cele trei țări, în special în modele care aveau deja o ideologie mai puțin consistentă. Modelele LLM localizate, NorskGPT și Aguila-7B, au făcut puțin mai bine pe seturile lor de date de limbă maternă, dar totuși au arătat mai mult bias decât GPT. În general, rezultatele sugerează că unele modele sunt mai influențate de cine spune ceva, decât de ceea ce se spune.

Concluzie

Dincolo de concluziile sale inițiale, acesta este un studiu metodic, dar destul de greu de abordat, adresat în mod direct sectorului de cercetare. Cu toate acestea, această nouă lucrare este printre primele care utilizează date la scară largă pentru a provoca tendințe politice din LLM – deși această distincție este probabil să fie pierdută pentru publicul care a auzit despre modele de limbaj de stânga în ultimul an, deși pe dovezi mai subțiri.

 

* Vă rugăm să observați că am fost nevoit să împart ilustrația rezultatelor originale ale figurii 1, deoarece fiecare parte a figurii originale este abordată separat în lucrare.

Publicat pentru prima dată miercuri, 14 ianuarie 2026

Scriitor pe machine learning, specialist în domeniul sintezei de imagini umane. Foster head of research content la Metaphysic.ai.