私達と接続

Artificial Intelligence

AI は新しいアルゴリズムで特定の望ましくない動作を回避できる

mm

公開済み

 on

人工知能のアルゴリズムとシステムがより洗練され、より大きな責任を担うようになるにつれて、AI システムが危険で望ましくない動作を確実に回避することがますます重要になります。 最近、マサチューセッツ大学アマースト校とスタンフォード大学の研究者チームが 論文を発表 これは、AI の動作を微調整するために使用できる正確な数学的命令を引き出す技術を使用することで、特定の AI の動作をどのように回避できるかを示しています。

TechXploreによると、研究は、不公平/危険な行動は数学関数と変数で定義できるという仮定に基づいていました。 これが本当であれば、研究者はこれらの特定の動作を回避するようにシステムをトレーニングすることが可能になるはずです。 研究チームは、AI のユーザーが AI に避けてほしい動作を指定するために使用できるツールキットを開発し、AI エンジニアが現実世界のシナリオで使用されるときに望ましくない動作を回避するシステムを確実にトレーニングできるようにすることを目的としていました。

この論文の筆頭著者であり、ミシガン大学アマースト大学コンピュータサイエンス助教授のフィリップ・トーマス氏は、研究チームの目的は、機械学習アルゴリズムの設計者がAI利用者が望ましくない動作を記述しやすくし、高度な動作を実現できることを実証することだと説明した。 AI システムがその行動を回避する可能性が高くなります。

研究チームは、データサイエンスにおける一般的な問題であるジェンダーバイアスにその技術を適用してテストしました。 研究チームは、性別による偏見を減らすことで、大学生の GPA を予測するために使用されるアルゴリズムをより公平なものにすることを目指しました。 研究チームは実験データセットを利用し、ある性別の GPA を全体的に過小評価/過大評価するモデルの作成を避けるよう AI システムに指示しました。 研究者の指示の結果、アルゴリズムは学生の GPA をより正確に予測し、以前の既存のモデルよりも体系的な性別バイアスが大幅に少ないモデルを作成しました。 以前の GPA 予測モデルは、バイアス削減モデルが限定されすぎて役に立たなかったり、バイアス削減がまったく使用されなかったりするため、バイアスに悩まされていました。

研究チームは別のアルゴリズムも開発した。 このアルゴリズムは自動インスリン ポンプに実装されており、パフォーマンスと安全性の両方のバランスをとることを目的としています。 自動インスリン ポンプは、患者にどのくらいの量のインスリンを投与するかを決定する必要があります。食後にポンプは、血糖値を抑えるのに十分な量のインスリンを理想的に送達します。 投与されるインスリンの投与量は多すぎても少なすぎてもいけません。

機械学習アルゴリズムは、インスリン投与量に対する個人の反応のパターンを特定することにすでに熟練していますが、これらの既存の分析方法では、低血糖値の急落など、避けるべき結果を医師が特定することはできません。 対照的に、研究チームは、両極端の範囲内に収まるインスリン用量を投与し、過少投与または過剰投与を防ぐように訓練できる方法を開発することができました。 このシステムはまだ実際の患者でテストする準備ができていませんが、このアプローチに基づいたより洗練された AI は、糖尿病に苦しむ人々の生活の質を向上させる可能性があります。

研究論文では、研究者らはこのアルゴリズムを「セレドニアン」アルゴリズムと呼んでいます。 これは、SF 作家アイザック・アシモフによって説明されたロボット工学の XNUMX つの法則を参照しています。 この意味するところは、AI システムは「人間に危害を加えたり、不作為によって人間に危害を加えたりすることはできない」ということです。 研究チームは、彼らのフレームワークによって、AIの研究者やエンジニアが危険な行動を回避するさまざまなアルゴリズムやシステムを作成できるようになることを期待している。 論文の上級著者でスタンフォード大学コンピューターサイエンス助教授のエマ・ブランスキル氏は、 TechXplore に次のように説明しました。

「私たちは、人間のユーザーの価値観を尊重し、自律システムへの信頼を正当化する AI を進化させたいと考えています。」

専門分野を持つブロガーおよびプログラマー 機械学習 および 深層学習 トピック。 ダニエルは、他の人が社会利益のために AI の力を活用できるよう支援したいと考えています。