スタブ コンピューターは 200 枚の写真から XNUMX 種の鳥を識別できる - Unite.AI
私達と接続

Artificial Intelligence

コンピュータは200枚の写真からXNUMX種の鳥を識別できる

更新中 on

デューク大学の研究者は、最大 200 種類の鳥を識別できるようにコンピューターを訓練するために機械学習を使用しました。コンピューターが識別プロセスを完了するには、写真が XNUMX 枚だけ必要です。人間の場合、異なる種を互いに識別できるようになるまでには、何年ものバードウォッチングが必要になることがよくあります。 

この研究は、デュークのコンピューターサイエンス博士が主導しました。 学生のチャオファン・チェンさんと学部生のオスカー・リーさん。 この研究には、デューク大学のシンシア・ルーディン教授が所長を務める予測分析ラボの他のチームメンバーも取り組んだ。 

思考を示すAI

識別プロセスは印象的ですが、開発にはさらに重要な側面があります。 AI は思考を示すことができるため、経験の浅いバードウォッチャーでもプロセスを理解できます。 

ディープ ニューラル ネットワーク、つまり脳の働きに基づくアルゴリズムは、11,788 枚の写真を使用してトレーニングされました。 写真にはアヒルからハチドリまでを含む 200 種類の鳥が含まれていました。 

研究チームは、くちばしや翼の羽を識別するためにネットワークを特別に訓練する必要はありませんでした。 その代わりに、ネットワークは鳥の写真を撮り、画像内の特定のパターンを識別することができます。 次に、それらのパターンを取得し、典型的な種の形質ですでに遭遇した以前のパターンを特定します。 

研究チームによると、ネットワークは特定の特性を識別する一連のヒート マップを作成します。 たとえば、通常のウグイスとズキンウグイスの違いや、仮面をかぶった頭や黄色い腹などの特徴の違いを見分けることができます。 そして、これらの特徴が識別につながったことを示します。 

他のシステムとは異なります

ニューラル ネットワークは、最大 84% の確率で正しい種を識別できました。 これは、最もパフォーマンスの高いシステムの一部と同様です。 違いは、これらのシステムでは、このシステムのように思考プロセスが説明されていないことです。 

Rudin 氏によると、このプロジェクトの最も革新的な点は、ディープ ニューラル ネットワークが画像を見たときに何が見えるかを視覚化できることです。 

この技術は現在、ソーシャルメディアサイトでも使用されており、監視カメラ内の犯罪容疑者を特定したり、自動運転車が信号機や歩行者を識別したりするのに役立っている。 

深層学習ソフトウェアでは、データから学習するために明示的にプログラムする必要がないことがよくありますが、従来のソフトウェアには当てはまりません。 ただし、プロセスが必ずしも明確または示されているわけではないため、画像を分類するときにアルゴリズムがどのように「考える」かを説明するのが難しいことがよくあります。 

将来は

ルーディンらは現在、AI 用の新しい深層学習モデルに取り組んでおり、この分野を前進させています。 新しいモデルは、その推論と識別プロセスを説明できます。 これにより、研究者は最初から最後まで確認することができ、間違いや問題の背後にある理由を特定しやすくなります。 

ルーディン氏と彼女のチームは、医療分野でのアルゴリズムの使用に取り組む予定です。 マンモグラムなどの医療画像内の特定の問題領域を特定できる可能性があります。 これは、医療専門家が乳がんのしこり、石灰化、その他の兆候を検出するのに役立ちます。 

ルーディン氏によると、このネットワークは医師が診断を下す方法を模倣しているという。 

「これは事例に基づいた推論です」とルーディン氏は言う。 「私たちは、医師や患者に対し、ネットワークによってなぜ彼らの画像が悪性か良性のいずれかに分類されたのかをよりよく説明できることを望んでいます。」

同チームは、2019月12日にバンクーバーで開催される第XNUMX回神経情報処理システム会議(NeurlIPSXNUMX)で研究内容を含む論文を発表する予定だ。 

この研究には、著者のダニエル・タオ氏とデューク大学のアリーナ・バーナー氏、およびMITリンカーン研究所のジョナサン・スー氏も参加している。 

 

Alex McFarland は、AI ジャーナリスト兼ライターであり、人工知能の最新の発展を調査しています。彼は世界中の数多くの AI スタートアップ企業や出版物と協力してきました。