人工知能
社交メディアの誤情報を検出するための統計モデル

アメリカ大学の数学教授とその共同研究者は、社会メディアの投稿から誤情報を検出できる統計モデルを開発しました。
マシンラーニングは、誤情報の拡散を防ぐためにますます使用されていますが、ブラックボックスの問題が依然として大きな障害となっています。これは、研究者がマシンが人間のトレーナーと同じ決定に到達する方法を理解できないことを指します。
統計モデルを使用した誤情報の検出
アメリカ大学数学・統計学科の助教授であるZois Boukouvalasは、COVID-19に関する誤情報ツイートを含むTwitterデータセットを使用して、統計モデルがパンデミックや災害などの大規模なイベント中に社会メディアで誤情報を検出できることを実証しました。
Boukouvalasと彼の同僚、AUの学生Caitlin Moroneyとコンピューターサイエンス教授Nathalie Japkowicsは、新しく公開された研究で、モデルの決定が人間の決定と一致することを実証しました。
「マシンが決定を下すときに何を考えているのか、そしてどうして人間のトレーナーと同意するのかを知りたいです」とBoukouvalasは述べました。「モデルの偏った決定によって誰かの社会メディアアカウントをブロックしたくありません」
チームが使用した方法は、統計に依存するタイプのマシンラーニングです。統計モデルは有効であり、誤情報に対抗する別の方法を提供します。
モデルは高い予測性能を達成し、112の実際のツイートと誤情報ツイートのテストセットを約90%の精度で分類しました。
「この発見の重要な点は、モデルが透明性を保ちながら高い精度を達成したことです」とBoukouvalasは続けました。「ディープラーニング方法では、このような精度と透明性を達成することはできません」
モデルのトレーニングと準備
研究者は、人間が提供する情報が偏見やブラックボックスを導入する可能性があるため、モデルのトレーニング前にデータセットを準備しました。
ツイートは、誤情報で使用される言語に関する事前に定義されたルールに基づいて、研究者によって実際のものまたは誤情報としてラベル付けされました。チームはまた、誤情報に関連する人間の言語のニュアンスや言語特性も考慮しました。
モデルのトレーニング前に、メリーランド大学バルティモーカウンティーの社会言語学教授クリスティン・マリソンソンは、誤情報、偏見、ニュースメディアの信頼性の低い情報源に関連する書き込みスタイルのツイートを特定しました。
「これらの入力をモデルに追加すると、良い情報と悪い情報を区別する根本的な要因を理解しようとします」とJapkowiczは述べました。「モデルはコンテキストと単語の相互作用を学習しています」
研究者は、今後、モデルのユーザーインターフェイスと、画像やその他のマルチメディアを含む社会メディアの投稿からの誤情報を検出する能力を改善することを目指しています。統計モデルは、さまざまな要素が誤情報を生成する方法を学習する必要があります。
BoukouvalasとJapkowiczは、人間の知性とニュースリテラシーが誤情報の拡散を防ぐために重要であると述べています。
「私たちの研究を通じて、マシンラーニングに基づくツールを設計して、公衆を警告し、教育し、誤情報を排除することを目指していますが、人間が最初から誤情報を拡散しないように積極的に役割を果たす必要があると強く信じています」とBoukouvalasは述べました。










