ロボット工学
新しい方法により、人間はロボットが環境を「見る」ことができるようになります

ライス大学のエンジニアチームは、ロボットが環境を「認識」し、さまざまなタスクを完了できるよう人間が支援できる新しい方法を開発した。
この新しい戦略は、BLIND (Bayesian Learning IN the Dark) と呼ばれ、死角が存在する環境で動作するロボットの動作計画の問題に対する新しい解決策です。
AIマーケティング業界は、 研究 コンピューター科学者のリディ・カブラキ氏とヴァイバブ・ウンヘルカー氏が主導し、ライス大学ジョージ・R・ブラウン工学院のカルロス・キンテロ・ペーニャ氏とコンスタンティノス・チャムザス氏が共同主導者となった。 これは電気電子学会のロボティクスとオートメーションに関する国際会議で発表された。
ヒューマン・イン・ザ・ループ
研究によると、このアルゴリズムは人間を常に監視し、「ロボットの認識を強化し、重要なことに、危険な動作の実行を防止する」という。
研究チームは、ベイジアン逆強化学習と確立された動作計画技術を組み合わせて、可動部分が多いロボットを支援しました。
BLIND をテストするために、XNUMX つの関節を備えた多関節アームを備えたロボットに、テーブルから小さなシリンダーを掴んでから別のテーブルに移動させるという任務が与えられました。 ただし、ロボットは最初に障壁を越えて移動する必要がありました。
「関節の数が増えると、ロボットへの指示が複雑になります」とキンテロ・ペーニャ氏は言う。 「人間を指示している場合は、『手を上げて』と言うだけで済みます。」
ただし、ロボットには、その軌道の各点での各関節の動きに特化したプログラムが必要であり、ロボットの「視界」を遮る障害物がある場合、これはさらに重要になります。
障害物の周囲を「見る」ことを学ぶ
BLIND は、事前に軌道をプログラムしません。 代わりに、ロボットのアルゴリズムによって提案された振り付けオプションを改良するために、プロセスの途中に人間が挿入されます。
「BLIND を使用すると、人間の頭の情報を取得し、この自由度の高い空間で軌道を計算できるようになります」とキンテロ・ペーニャ氏は述べています。 「私たちは批評と呼ばれる特定のフィードバック方法を使用しています。これは基本的に、人間が軌跡の一部にラベルを付けるという二値形式のフィードバックです。」
ラベルは接続された緑色の点として表示され、可能なパスを表します。 BLIND が点から点へと進むにつれて、人間はそれぞれの動きを承認または拒否し、経路を調整し、障害物を回避します。
「これは人々にとって使いやすいインターフェースです。『これが好き』または『あれは好きじゃない』と言うと、ロボットがその情報を使って計画を立てるからです」とチャムザス氏は語った。 ロボットは、その動きに対して報酬を受け取った後、そのタスクを実行できます。
「ここで最も重要なことの一つは、人間の好みは数式で説明するのが難しいということです」とキンテロ=ペーニャ氏は語った。 「私たちの仕事は、人間の好みを組み込むことで人間とロボットの関係を簡素化します。 そうすることで、アプリケーションがこの取り組みから最大限の恩恵を受けることができると私は考えています。」
カブラキ氏は、国際宇宙ステーションにいる NASA の人型ロボノートの高度なプログラミングに取り組んできました。
「この研究は、一部の部品がロボットにとっては完全に未知であるが、人間にとっては既知である環境において、わずかではあるが的を絞った人間の介入が、ロボットの複雑なタスクを実行する能力を大幅に向上させることができることを見事に例証しています」とカブラキ氏は述べた。
「これは、私の同僚のウンヘルカー教授の研究テーマである人間とロボットのインタラクションの手法と、私の研究室で長年にわたって開拓された自動計画がどのように融合して、人間の好みも尊重する信頼性の高いソリューションを提供できるかを示しています。」