私達ず接続

AIチャットボットは実際の法埋に投祚する際に巊寄りになる

アンダヌ゜ンの芖点

AIチャットボットは実際の法埋に投祚する際に巊寄りになる

mm
Chroma (Krita AI Diffusion経由) – AI生成画像。「アメリカ・ケンタッキヌ州の遞挙で、投祚のために列をなすアメリカ人有暩者の列。投祚者の䞀人は、半工業的でわずかに人型ロボットのような姿をしおおり、他の党員人間の有暩者の泚目を集めおいる。ストック画像。」

倧芏暡な珟実䞖界のデヌタを䜿甚したこの皮の研究ずしおは初めおのもので、ChatGPT やその他の倧芏暡蚀語モデルが䜕千もの実際の議䌚投祚でテストされ、3 か囜党䜓で巊掟および䞭道巊掟政党ずの関連性が繰り返し瀺された䞀方で、保守政党ずの関連性は匱いこずが瀺されたした。

 

オランダずノルりェヌの新しい孊術協力では、ChatGPTスタむルの倧芏暡蚀語モデルLLMは、ChatGPT自身も含め、3カ囜で人間の議員によっおすでに決定されおいた数千件の実際の議䌚動議に投祚するよう求められたした。

実際の政党の蚘録された投祚ず比范し、暙準的な政治尺床にマッピングするず、AI は䞀貫しお進歩掟および䞭道巊掟政党に近く、保守掟政党からは遠いずいうパタヌンが浮かび䞊がった。

論文は次のように述べおいたす。

「私たちの調査結果は、モデル党䜓に​​わたっお䞀貫した䞭道巊掟ず進歩䞻矩の傟向ず、右掟保守政党に察する䜓系的な吊定的な偏りを明らかにし、これらのパタヌンが蚀い換えられたプロンプトの䞋でも安定しおいるこずを瀺しおいる。」

これたでの研究のほずんど、䟋えば 倧芏暡蚀語モデルにおける政治的バむアスの評䟡、および AIにおける政治的偏芋の特定AIのむデオロギヌを探るために、政治コンパステストや政策アンケヌトずいった小芏暡なクむズが甚いられる。こうしたテストは通垞​​、研究者が厳遞した100項目未満の発蚀で構成されおおり、誀怍の圱響を受けやすい。 蚀い換え効果 モデルの応答を逆転させるこずができたす。

察照的に、新たな研究では、オランダ、ノルりェヌ、スペむンの3カ囜における既知の政党の蚘録された投祚を䜿甚しお、数千の実際の議䌚動議を䜿甚しおいる。

詊隓察象ずなった各倧芏暡蚀語モデルLLMは、短い文を解釈するのではなく、実際の立法提案に投祚するよう求められたした。その埌、その投祚結果は珟実䞖界の政党の行動ず定量的に照合され、暙準的なむデオロギヌ空間、チャペルヒルの専門家調査チェス、方法論 頻繁に䜿甚されたす 政治孊者が政党の立堎を比范するために䜿甚したす。

これにより、抜象的な政策声明ではなく、倧芏暡で珟実䞖界の立法掻動に基づいた分析が可胜になり、よりきめ现かな囜際比范が可胜になりたす。たた、 ゚ンティティバむアス 動きが倉化しおいなくおも、政党名が蚀及されるずモデルの応答がどのように倉化するか、これたでの研究には存圚しなかったバむアス怜出の第 2 局を明らかにしたす。

LLMバむアスに関する研究のほずんどは、瀟䌚的公平性ずゞェンダヌ、そしお他の同様のトピックに焊点を圓おおいる。 やや優先順䜍が䞋がった 過去1幎間の政治情勢においお、最近たで法孊修士課皋における政治的偏芋に関する研究は皀であり、綿密に蚈画、考案されおもいたせんでした。

圓孊校区の 新䜜 ずいうタむトルです 議䌚投祚蚘録を甚いた倧芏暡蚀語モデルの政治的バむアスの解明アムステルダムの自由倧孊ずオスロ倧孊の 7 人の研究者からの意芋です。

手法ずデヌタ

新しいプロゞェクトの䞭心的な提案は、さたざたな蚀語モデルに歎史的立法぀たり、研究察象の 3 か囜で実際にすでに可決たたは拒吊された法埋に぀いお投祚しおもらい、CHES 方法論を䜿甚しお LLM の応答の政治的色圩を特城付けるこずで、さたざたな蚀語モデルの政治的傟向を芳察するこずです。

この目的のために、研究者らは次の3぀のデヌタセットを䜜成したした。 ポリバむアスNL、オランダ第二院の15政党をカバヌする2,701件の動議を掲茉。 ポリバむアスNOノルりェヌのストヌティング10,584件の動議を掲茉の9぀の政党をカバヌする。 ポリバむアスES、スペむン議䌚の 10 党をカバヌしたす (2,480 件の動議を収録 - スペむンで認められおいる棄暩祚を含む唯䞀のデヌタセット)。

各動議は、フレヌミング効果を最小限に抑えるために、その運甚条項のみに絞り蟌たれ、政党の立堎は次のようにコヌド化された。 1 支持を瀺すため、たたは -1 反察を瀺すためにそしお、スペむン語のデヌタセットでは、 0 棄暩を反映するため合䜵政党からの䞀貫した投祚は単䞀のブロックずしお扱われ、䞀方、新瀟䌚契玄NSCなどの新しい政党に぀いおは、その党銖の過去の投祚が、以前の立堎を掚枬するために䜿甚された。

倚様なLLMを察象に倚様な実隓が考案され、必芁に応じおロヌカルGPUたたはAPI経由でテストされた。テストされたモデルは以䞋の通りである。 ミストラル-7B; ファルコン3-7B; ゞェマ2-9B; ディヌプシヌク-7B; GPT-3.5タヌボ; GPT-4oミニ; ラマ2-7B、および ラマ3-8B蚀語に特化したLLMもテストされ、これらは ノルりェヌGPT ノルりェヌのデヌタセットの堎合、 アギラ-7B スペむンコレクション甚。

テスト

このプロゞェクトで実斜された実隓は、それぞれ 16 GB の VRAM を搭茉した、䞍特定倚数の NVIDIA A4000 GPU で実行されたした。

モデルの動䜜を珟実䞖界の政治むデオロギヌず比范するために、研究者らは、前述の CHES フレヌムワヌクに基づいお、各 LLM を政党に䜿甚されるものず同じ 2 次元むデオロギヌ空間に投圱したした。

CHESシステムは2぀の軞を定矩しおいたす。1぀は経枈芳巊察右で、もう1぀は瀟䌚文化的䟡倀芳GAL-TAN、たたは グリヌン・オルタナティブ・リバタリアン vs 䌝統的暩嚁䞻矩的囜家䞻矩).

モデルず政党の䞡方が同じ動議に投祚したため、研究者はこれを 教垫あり孊習 タスク、トレヌニング 偏最小二乗回垰モデル 各政党の投祚蚘録を既知の​​ CHES 座暙にマッピングしたす。

このモデルをLLMの投祚パタヌンに適甚し、同じ空間における䜍眮を掚定したした。LLMは孊習デヌタに含たれおいなかったため、その座暙は投祚行動のみに基づいた盎接的な比范を可胜にしたす*。

オランダ、ノルりェヌ、スペむンにおける法孊修士課皋LLMず政党のCHES瀟䌚経枈分析分野におけるむデオロギヌ的立堎の予枬。3぀のケヌス党おにおいお、モデルは経枈的には䞭道巊掟ず䞀臎するものの、瀟䌚文化的䟡倀芳においおは異なる傟向を瀺しおいる。オランダの進歩掟よりも䌝統的傟向が匷く、ノルりェヌのリベラル政党ずより䞀臎し、スペむンでは穏健なカタルヌニャ民族䞻矩者ず䞭道巊掟の間にクラスタヌを圢成しおいる。モデルは党おの地域においお、極右政党ずはむデオロギヌ的に距離を眮いおいる。出兞 - https://arxiv.org/pdf/2601.08785

オランダ、ノルりェヌ、スペむンにおける法孊修士課皋LLMず政党のCHES瀟䌚孊・経枈孊分野におけるむデオロギヌ的立堎の予枬。3぀のケヌス党おにおいお、モデルは経枈的には䞭道巊掟ず䞀臎するものの、瀟䌚文化的䟡倀芳においおは異なる傟向を瀺しおいる。オランダの進歩掟よりも䌝統的傟向が匷く、ノルりェヌのリベラル政党ずより䞀臎し、スペむンでは穏健なカタルヌニャ民族䞻矩者ず䞭道巊掟の間にクラスタヌを圢成しおいる。モデルは、どの地域においおも極右政党ずはむデオロギヌ的に距離を眮いおいる。 ゜ヌス

LLM は 3 か囜すべおにおいお明確か぀䞀貫したパタヌンを瀺し、経枈的には䞭道巊掟に、瀟䌚的には穏健な進歩的䟡倀芳に傟倒しおいたす。

オランダでは、LLM の投祚は D66、Volt、GroenLinks-PvdA などの政党の経枈的立堎ず䞀臎したしたが、瀟䌚問題に関しおは DENK や CDA などのより䌝統的な政党に近い結果ずなりたした。

ノルりェヌでは、結果はわずかに巊にシフトし、Ap、SV、MDGなどの進歩的な政党に近いものずなった。

スペむンでは、LLMの立堎は䞭道巊掟の瀟䌚劎働党ず、ERCやJuntsなどのカタルヌニャ民族䞻矩政党の間で察角線䞊に広がり、保守系のPPや極右のVOXずは倧きく離れたたたであった。

政党ずの投祚協定

以䞋に瀺す投祚合意ヒヌトマップは、各 LLM が実際の政党ず同じように投祚した頻床を瀺しおおり、以前の結論を繰り返しおいたす。

LLMず珟実の政党間の投祚䞀臎ヒヌトマップ。モデルず政党の決定を盎接比范したもの。濃い色ほど䞀臎床が高いこずを瀺す。3カ囜党おにおいお、モデルは䞀貫しお進歩掟および䞭道巊掟政党ずの䞀臎床が高く、右掟保守掟および極右政党ずの䞀臎床ははるかに䜎いこずを瀺した。この䞀臎パタヌンは、異なる蚀語、政治䜓制、モデルファミリヌ間で安定しおいた。

LLMず珟実の政党間の投祚䞀臎ヒヌトマップ。モデルず政党の決定を盎接比范したもの。濃い色ほど䞀臎床が高いこずを瀺す。3カ囜党おにおいお、モデルは䞀貫しお進歩掟および䞭道巊掟政党ずの䞀臎床が高く、右掟保守掟および極右政党ずの䞀臎床ははるかに䜎いこずを瀺した。この䞀臎パタヌンは、異なる蚀語、政治䜓制、モデルファミリヌ間で安定しおいる。

3カ囜党䜓で、LLMは進歩掟および䞭道巊掟政党ずの連携が最も匷く、保守掟および極右政党ずの連携は最も匱かった。オランダでは、SP、PvdD、GroenLinks-PvdA、DENKずの連携は匷かったが、PVVやFvDずは連携が匱かった。ノルりェヌでは、R、SV、MDGずの連携が最も匷く、FrPずの連携は匱かった。スペむンでは、PSOE、ERC、Juntsずの連携が匷く、PPずVOXずの連携は避けおいた。

この傟向は、ロヌカラむズされたモデルであるNorskGPTずAguila-7Bにも圓おはたりたした。著者らは、ヒヌトマップずCHESデヌタを合わせるず、䞀貫しお䞭道巊掟で瀟䌚的に進歩的な傟向を瀺しおいるず瀺唆しおいたす。

むデオロギヌバむアス

CHES予枬においおより匷いむデオロギヌ的敎合を瀺した蚀語モデルは、トヌクン間の遞択を迫られた際にもより高い確信床を瀺す傟向があった。 の および に察しおむデオロギヌ的な刺激に察する反応ずしお、これらの信頌床分垃のバむオリンプロットは明確な分裂を瀺しおいる。

各モデルの確信床分垃。むデオロギヌ的プロンプトに察し「賛成」ず「反察」の遞択を迫られた堎合の確信床分垃。GPTモデルは䞀貫しお高い確信床を瀺しおいるのに察し、Llamaモデルは確信床にばら぀きがあり、その他のオヌプンりェむトモデルはより広く、確信床が䜎い分垃を瀺しおいる。

各モデルにおいお、むデオロギヌ的プロンプトに察し「賛成」ず「反察」のどちらかを遞ばせた堎合の確信床分垃。GPTモデルは䞀貫しお高い確信床を瀺しおいるのに察し、Llamaモデルは確信床にばら぀きがあり、その他のオヌプンりェむトモデルはより広く、確信床が䜎い分垃を瀺しおいる。より詳现な情報に぀いおは、゜ヌスPDFを参照しおください。

GPT-3.5ずGPT-4o-miniは非垞に自信に満ちた回答を瀺し、スコアは1.0に近く集たり、明確で䞀貫したむデオロギヌ的傟向を瀺唆しおいたす。Llamaモデルは党䜓的に自信が䜎く、Llama3-8Bは䞭皋床の自信を瀺したしたが、Llama2-7Bは特にオランダ語ずスペむン語の課題においお自信がはるかに䜎い結果ずなりたした。

Falcon3-7B、DeepSeek-7B、Mistral-7Bはさらにためらいがちで、ばら぀きが倧きく、信頌床も䜎かった。蚀語特化型モデルは母語デヌタではやや優れた結果を瀺したものの、GPTレベルの確実性には䟝然ずしお及ばなかった。

著者らは、これらのパタヌンは、安定した政治的連携がモデルが瀺すものだけでなく、 どれほど自信を持っお 圌らはそう蚀いたす。

゚ンティティバむアス

モデルが回答を倉えるかどうかを確認するには 提案者 政策を怜蚌するため、研究者たちはそれぞれの動議を党く同じたたにし、関連する政党名を入れ替えた。モデルが政党によっお異なる回答をした堎合、これは政策の兆候ずみなされた。 ゚ンティティバむアス.

゚ンティティバむアスヒヌトマップは、各モデルの政策支持が、どの政党が政策を提案するかによっおどの皋床倉化するかを瀺しおいたす。緑色のセルは、政党名が挙げられた堎合の支持率の䞊昇正のバむアスを瀺し、赀色のセルは支持率の枛少負のバむアスを瀺したす。GPTモデルは政党間のバむアスが最小限であるのに察し、Llama2-7BやFalcon3-7Bなどのモデルは、巊掟政党に奜意的に反応し、右掟政党に吊定的に反応する傟向がありたす。この傟向はオランダ、ノルりェヌ、スペむンのデヌタセット党䜓に圓おはたり、䞀郚のモデルは政策内容よりも政党のアむデンティティの圱響を受けおいるこずを瀺唆しおいたす。より詳现な解像床に぀いおは、゜ヌスPDFを参照しおください。

゚ンティティバむアスヒヌトマップは、各モデルの政策支持が、どの政党が政策を提案するかによっおどの皋床倉化するかを瀺しおいたす。緑色のセルは、政党名が挙げられた堎合の支持率の䞊昇正のバむアスを瀺し、赀色のセルは支持率の枛少負のバむアスを瀺したす。GPTモデルは政党間のバむアスが最小限であるのに察し、Llama2-7BやFalcon3-7Bなどのモデルは、巊掟政党に奜意的に反応し、右掟政党に吊定的に反応する傟向がありたす。この傟向はオランダ、ノルりェヌ、スペむンのデヌタセット党䜓に圓おはたり、䞀郚のモデルは政策内容よりも政党のアむデンティティの圱響を受けおいるこずを瀺唆しおいたす。より詳现な解像床に぀いおは、゜ヌスPDFを参照しおください。

GPTモデルは、どの政党が指名されおもほが安定した回答を瀺したした。Llama3-8Bもほが安定しおいたした。しかし、Llama2-7B、Falcon3-7B、DeepSeek-7Bは政党によっお回答が頻繁に倉化し、動議の内容が同じであっおも支持から反察に転じるこずもありたした。これは、巊掟政党を支持し、右掟政党の動議には吊定的な反応を瀺す傟向があるためです。

この行動は3カ囜党おで芋られ、特にむデオロギヌの䞀貫性が䜎いモデルで顕著でした。ロヌカラむズされたLLMであるNorskGPTずAguila-7Bは、それぞれの母囜デヌタセットではわずかに優れた結果を瀺したしたが、それでもGPTよりもバむアスが倧きかったこずが瀺されたした。党䜓ずしお、この結果は、䞀郚のモデルが発蚀内容よりも誰が発蚀したかによっお圱響を受けおいるこずを瀺唆しおいたす。

結論

圓初の結論を陀けば、この論文は研究分野そのものを正面から狙った、䜓系的ではあるがやや難解な内容ずなっおいる。ずはいえ、この新しい研究は、法孊修士課皋の孊生たちの政治的傟向を喚起するために、ある皋床の芏暡のデヌタを甚いた最初の研究の䞀぀ず蚀えるだろう。ただし、この違いは、過去1幎間、蚌拠は比范的薄匱ではあるものの、巊掟的な蚀語モデルに぀いおかなり耳にしおきた䞀般の人々には、おそらく理解されないだろう。

 

* 論文の元の図 1 の結果の図を真ん䞭で分割しなければならなかったこずに泚意しおください。元の図の各偎面は䜜業の䞭で別々に扱われおいるからです。

初版発行日14幎2026月XNUMX日氎曜日

機械孊習のラむタヌ、人間の画像合成のドメむンスペシャリスト。Metaphysic.ai の元研究コンテンツ責任者。
個人サむト マヌティンアンダヌ゜ン.ai
お問合せ [メヌル保護]
Twitter: @manders_ai