スタブ Waymo の自動運転技術がさらにスマートになり、コンテンツ検索のおかげで数十億の物体を認識 - Unite.AI
私達と接続

インベストメント

Waymo の自動運転技術がさらにスマートになり、コンテンツ検索のおかげで数十億の物体を認識

mm
更新中 on

Waymo が開発した自動運転車は、コンピューター ビジョン技術と人工知能を利用して周囲の環境を認識し、車両がどのように反応して移動すべきかをリアルタイムで決定します。車内のカメラやセンサーで物体が認識されると、認識するためにアルファベットが編集した大規模なデータベースと照合されます。

大規模なデータセットは、自動運転車のトレーニングにとって非常に重要です。これにより、車両内の AI が改善され、パフォーマンスが向上します。 ただし、エンジニアは、特定の種類の画像に対して AI がどのように実行されるかを調査できるように、データセット内のアイテムをクエリに効率的に照合する何らかの方法が必要です。 この問題を解決するために、 VentureBeatの報道によると、最近ウェイモ 「コンテンツ検索」と呼ばれるツールを開発しました, これは、Google 画像検索や Google フォトの動作と同様に機能します。 これらのシステムは、クエリを画像内の意味論的な内容と照合し、自然言語クエリに基づく画像検索を容易にするオブジェクトの表現を生成します。

コンテンツ検索が登場する前は、Waymo の研究者がログから特定のサンプルを取得したい場合、ヒューリスティックを使用してオブジェクトを記述する必要がありました。 Waymo のログは、ルールに基づいてオブジェクトを検索するコマンドを使用して検索する必要がありました。これは、「高さ X 未満」のオブジェクト、または「時速 y マイルで移動」するオブジェクトの検索を実行することを意味します。 これらのルールベースの検索の結果は非常に広範囲にわたることが多く、研究者は返された結果を手動で精査する必要があります。

コンテンツ検索は、データのカタログを作成し、オブジェクトが提示されたときに最も類似したカテゴリを見つけるために、さまざまなカタログに対して類似性検索を実行することで、この問題を解決します。 コンテンツ検索にトラックまたは樹木が表示されると、Waymo の自動運転車が遭遇した他のトラックまたは樹木が返されます。 Waymo 車両が走行すると、周囲のオブジェクトの画像が記録され、これらのオブジェクトが埋め込み/数学的表現として保存されます。 これは、このツールがオブジェクト カテゴリ間の比較を行い、保存されているオブジェクト画像が提供されたオブジェクトにどの程度類似しているかによって応答をランク付けできることを意味します。 これは、 埋め込み類似性マッチングサービス Googleワークスが運営。

Waymo の車両が遭遇する物体にはさまざまな形やサイズがある可能性がありますが、コンテンツ検索が機能するためには、それらすべてを重要なコンポーネントに抽出し、分類する必要があります。 これを実現するために、Waymo はさまざまなオブジェクトでトレーニングされた複数の AI モデルを利用します。 さまざまなモデルは、さまざまなオブジェクトを認識することを学習し、コンテンツ検索によってサポートされています。これにより、モデルは、特定のカテゴリに属する​​アイテムが特定の画像内で見つかるかどうかを理解できます。 追加の光学式文字認識モデルがメイン モデルと並行して利用され、Waymo 車両が画像内で見つかったテキストに基づいて画像内のオブジェクトに追加の識別情報を追加できるようになります。 たとえば、標識が装備されたトラックには、コンテンツ検索の説明に標識のテキストが含まれます。

上記のモデルが連携して動作するおかげで、Waymo の研究者とエンジニアは、特定の種類の樹木や車のメーカーなど、非常に特殊なオブジェクトの画像データ ログを検索することができます。

VentureBeat が引用したように、Waymo によると:

「コンテンツ検索を使用すると、運転履歴内のオブジェクトに自動的に注釈を付けることができ、その結果、ラベル付けのために送信するデータの速度と品質が飛躍的に向上しました。 ラベル付けを高速化する機能は、子供たちが歩道に出ようとしているスクールバスや電動スクーターに乗っている人の検出から、道路を横切る猫や犬の検出まで、システム全体の多くの改善に貢献しました。 Waymo がより多くの都市に拡大するにつれて、私たちは新しいオブジェクトやシナリオに遭遇し続けるでしょう。」

Waymoが車両の信頼性と精度を高めるために複数の機械学習モデルを使用したのはこれが初めてではない。ウェイモ 過去にAlphabet/Googleと協力したことがある、DeepMind と並行して AI 技術の開発を支援します。 AI システムは進化生物学からインスピレーションを得ています。 まず、さまざまな機械学習モデルが作成され、トレーニング後にパフォーマンスが低下したモデルが淘汰され、子孫モデルに置き換えられます。 この技術により、必要な計算リソースとトレーニング時間を削減しながら、誤検知を大幅に減らすことができたと報告されています。

Waymo の AI コンテンツ検索ツールにより、エンジニアは運転記録内のオブジェクトを迅速に検索できます

専門分野を持つブロガーおよびプログラマー 機械学習 & 深層学習 トピック。 ダニエルは、他の人が社会利益のために AI の力を活用できるよう支援したいと考えています。