人工知能
チームがニューラルネットワークの比較アプローチを開発

ロスアラモス国立研究所の研究者チームは、ニューラルネットワークの比較のための新しいアプローチを開発しました。チームによると、この新しいアプローチは、人工知能(AI)の「ブラックボックス」の中を調べ、ニューラルネットワークの動作を理解するのに役立ちます。パターンを認識するニューラルネットワークは、顔認識システムや自動運転車などの幅広いアプリケーションで使用されています。
チームは、論文「If You’ve Trained One You’ve Trained Them All: Inter-Architecture Similarity Increases With Robustness」を不確実性のある人工知能に関する会議で発表しました。
ロスアラモス研究所のサイバーシステム研究グループの研究者であるHaydn Jonesは、この研究の第一著者です。
ニューラルネットワークのより良い理解
「人工知能研究コミュニティは、ニューラルネットワークが何をしているのかについて、完全に理解していない;彼らは良い結果をもたらしてくれるが、どのようにして、またなぜそれが機能するのかについてはわかっていない」とジョーンズさんは述べています。「私たちの新しい方法は、ニューラルネットワークを比較することに役立ちます。これは、人工知能の背後にある数学をよりよく理解するための重要なステップです。」
新しい研究は、ロバストなニューラルネットワークの動作を理解するのにも役立ちます。
ニューラルネットワークは、高性能ですが、もろいです。条件の小さな変化、たとえば自動運転車が処理する部分的に覆われた停止標識などの場合、ニューラルネットワークは標識を誤認識する可能性があります。これは、停止することがない可能性があるため、危険になる可能性があります。
アドバーシャル・トレーニング・ニューラル・ネットワーク
研究者たちは、これらの種類のニューラルネットワークを改善するために、ネットワークのロバスト性を向上させる方法を調べました。アプローチの1つは、ネットワークを「攻撃」することです。ここで、研究者は、AIをトレーニングする際に意図的に異常を導入し、AIがそれらを無視するようにします。このプロセスは、アドバーシャル・トレーニングと呼ばれ、ネットワークを欺くことがより困難になります。
チームは、アドバーシャルにトレーニングされたニューラルネットワークに、新しいネットワークの類似性の尺度を適用しました。攻撃の大きさが増加するにつれて、コンピュータビジョンのドメインのニューラルネットワークが、ネットワークのアーキテクチャに関係なく、類似したデータの表現に収束することを発見したことが驚きでした。
「私たちがニューラルネットワークをロバストに対してトレーニングするとき、それらは同じことを始める」とジョーンズさんは述べています。
これは、専門家がニューラルネットワークの最適なアーキテクチャを探そうとした最初の試みではありません。しかし、新しい発見は、アドバーシャル・トレーニングがギャップを大幅に埋め、AI研究コミュニティが多くの新しいアーキテクチャを探索する必要がないことを示しています。なぜなら、アドバーシャル・トレーニングは、さまざまなアーキテクチャが類似したソリューションに収束するからです。
「ロバストなニューラルネットワークは互いに似ていることがわかっているので、ロバストなAIが実際にどのように機能するかを理解するのがより容易になります」とジョーンズさんは述べています。「私たちは、人間や他の動物で認識がどのように発生するかについてのヒントを明らかにするかもしれません」












