ソートリーダー
ボックスの外で考え、AIのイノベーションを推進する
私たち多くがAIの分野でイノベーションを起こしているが、未踏の領域で仕事をしている。AI企業が新しいテクノロジーを急速に開発していることから、舞台裏での頑張りを当たり前のように思ってしまうかもしれない。しかし、XRのような分野では、現実世界とデジタル世界の境界を曖昧にするという使命があり、現在、歴史的なデータや研究に頼ることができないため、ボックスの外で考えなければならない。
機械学習の伝統的な知恵や確立された実践に頼ることは最も便利だが、新興分野ではこれは可能ではないか、または完全な解決策ではない。以前解決されたことがない問題を解決するには、新しい方法でアプローチする必要がある。
これは、私たちをエンジニアリング、データサイエンス、または製品開発の分野に入った理由を思い出させる課題である:発見への情熱。私は、Ultraleapでの私の役割で毎日これを経験している。ここでは、混合現実環境で人間の手の動きを追跡して対応するソフトウェアを開発している。私たちが機械学習モデルをトレーニングすることについて知っていることは、人間の手とそれが遭遇する物体や環境は非常に予測不可能であるため、逆転される。
ここでは、私と私のチームが、デジタル世界に直感的なインタラクションをもたらすために、実験とデータサイエンスを再想像するために取ったいくつかのアプローチを紹介する。
線内でのイノベーション
新興分野でイノベーションを起こすとき、互いに反するように見える制約に直面することが多い。私のチームは、手と指の動きの複雑さと、手と指が周囲の世界とどのように相互作用するかを捉えることが課題である。これは、XRハードウェアに収まる制約付きコンピューティングで、手追跡モデルにパッケージ化される。これは、モデルが高度で複雑であるにもかかわらず、ストレージを大量に占有したり、エネルギーを大量に消費したりしないことを意味する(大きなLLMが占めるのとは100,000分の1の割合)。これは、無慈悲な実験と評価を必要とする興奮する課題を提示する。
しかし、数えきれないテストと実験は価値がある:低推論コスト、電力消費、待ち時間で強力なモデルを作成することは、エッジコンピューティングでXRの外でも適用できる驚異である。
私たちが実験中に直面する制約は、他の業界にも影響を与えるだろう。いくつかの企業は、アプリケーションドメインの微妙さのために、独自の課題を持っているかもしれない。ほかには、ニッチ市場であるため、大手テクノロジー企業がまだ触れていないため、データが限られている可能性がある。
ワンサイズフィットオールのソリューションは、一部のタスクには十分かもしれないが、多くのアプリケーションドメインでは、タスク固有の実際の課題を解決する必要がある。例えば、自動車組み立てラインでは、欠陥検査のためにMLモデルを実装する。これらのモデルは、車の広い表面上の小さな欠陥を特定するために必要な非常に高解像度の画像に取り組む必要がある。この場合、アプリケーションは高性能を要求するが、解決すべき問題は、低フレームレートながら高解像度のモデルを達成する方法を見つけることである。
イノベーションを推進するためのモデルアーキテクチャの評価
良いデータセットは、どのAIブレークスルーでも推進力となる。しかし、特定の目的のために「良い」データセットとは何を意味するのか?そして、以前解決されたことがない問題を解決する場合、既存のデータが関連することをどうやって信頼できるのか?他のMLタスクに適したメトリックが別の特定のビジネスタスクのパフォーマンスに翻訳されることを仮定することはできない。これは、共通のML「真実」に反して、代わりにラベル付け、クリーンアップ、シミュレートされたデータと実世界のデータの両方をどのように適用するかを積極的に探求する必要がある。
私たちのドメインは、自然に評価が難しく、手作業による品質保証が必要である。私たちはただデータの品質メトリックを見ているのではない。私たちはデータセットとデータソースを繰り返し評価し、それらが生み出すモデルの特性に基づいて評価する。私たちがデータをグレードして分類する方法を再評価するとき、しばしば私たちが見過ごしていたデータセットまたは傾向を見つける。
Ultraleapの最新のハンドトラッキングプラットフォーム、Hyperionは、これの良い例である。私たちのデータセットの進歩は、微細なジェスチャーを正確に追跡し、ユーザーがオブジェクトを持っている間でも手の動きを追跡できる、より洗練されたハンドトラッキングの開発に役立った。
一歩後ろに下がり、大きな飛躍を前進する
イノベーションのペースは、見かけ上は決して遅くならないが、私たちは遅くすることができる。私たちは実験、学習、開発のビジネスに従事しており、実践ドメインで測定されたモデルパフォーマンスに対してモデルを評価するとき、しばしば、単に本に従って次のテクノロジーイノベーションを出すよりも、はるかに大きな価値を持つものを作成する。データアノテーションを探求し、データソースに疑問を持ち、品質メトリック自体を再定義するブレークスルーに相当するものはない。私たちがこれを行う唯一の方法は、実践ドメインでモデルパフォーマンスを測定して評価することである。私たちは、まれな要件や制約を制限と見なすのではなく、これらの課題をイノベーションの機会、そして最終的には競争上の優位性に変えることができる。












