Connect with us

エドワード・クイ、Gravitiの創設者&CEO – インタビュー・シリーズ

インタビュー

エドワード・クイ、Gravitiの創設者&CEO – インタビュー・シリーズ

mm

エドワード・クイは、Gravitiの創設者&CEOです。Gravitiは、開発者が非構造化データとやり取りする方法を根本的に変える次世代のデータプラットフォームを構築している会社です。Gravitiを使用すると、AI開発者はデータの取得、保存、処理をより迅速かつ簡単に行うことができ、人工知能を活用してすべての業界を強化するための基盤が整えられます。

あなたは、機械工学を学ぶことを目指して大学に入学しました。コンピューターサイエンスと人工知能への転身の理由は何ですか?

私は2012年に機械工学を学ぶために大学に入学しました。ペンシルバニア大学で機械学習についての授業を受けたのですが、それは私の考えを変えるものでした。私は、その分野でキャリアを築くことを決意しました。その授業を受けた後、コンピューターサイエンスに転向しました。

卒業後、ペンシルバニア大学で強化学習についての研究を行いました。2015年、元の上司であるジェフ・スナイダーがUberに参加し、私もUber ATGに参加するよう招待されました。那が私の自律走行車産業でのキャリアの始まりでした。

Gravitiの創設ストーリーを共有してください。

Uberで働くことは、初めのうちは非常に複雑でした。人々は大きな機械学習モデルを使用しておらず、計算能力とデータ管理プラットフォームが不足していました。自律走行車で収集したデータはすべて非構造化されていました。例えば、画像、動画、LIDARポイントなどのリアルワールドのセンサーからのデータでした。毎日大量の非構造化データを収集しました。1週間で自律走行車部門で収集したデータ量は、1年間で世界中のレストラン事業で収集されるデータ量に相当するという統計がありました。毎日大量の非構造化データが蓄積し、それをどのようにして保存し、管理し、どのようにしてそれを活用してさまざまな組織に価値を生み出すかという大きな問題が生じました。

Uberで3年間働いた後、非構造化データの管理を改善する機会を見つけました。そこで、2019年にGravitiを設立し、非構造化データ管理プラットフォームを構築してAIの革新を加速させました。

Gravitiは、大規模なデータを管理するプラットフォームであるという点で、どのように機能するかについて説明してください。

Gravitiの目標は、革新的なAIアプリケーションを実現するために、大量の非構造化データを活用できる最初のデータプラットフォームを立ち上げることです。このプラットフォームは、開発者が大規模な非構造化データを管理する手間を減らし、チームとともにそれを管理できるようにします。

AI開発で利用可能な情報のほとんどは低品質で非構造化されています。開発チームは、通常、モデルを構築するのではなく、非構造化データを特定、増強、またはクリーンアップするのに50%以上の時間を費やします。Gravitiは、開発者を解放し、非構造化データを分析し、人工知能モデルをトレーニングするためのより専門的なデータ管理方法を提供します。

私たちは、開発者を3つの次元で支援しています: データの発見、データの反復、ワークフローの自動化。

データの発見:

Gravitiは、データホスティング機能を提供し、生データ、注釈、メタデータを整理することを容易にします。開発者がGravitiを通じてさまざまなデータセットにアクセスする場合、データ形式を変換する必要はありません。管理、クエリ、注釈の付与などの操作が簡素化されます。Gravitiは、生データや注釈のミスマッチのリスクを軽減するのに役立ちます。さらに、Gravitiプラットフォームは、データ視覚化機能を使用してデータセットの品質を評価することができます。これにより、開発者は週に少なくとも8時間を節約できます。

データの反復:

開発者が人工知能をトレーニングする場合、さまざまなバージョンのデータセットでテストを行い、結果を確認し、注釈を付ける必要があります。課題は、プロジェクトに取り組むチームメンバーがさまざまな編集やバージョンを追跡することです。Gravitiは、従業員にさまざまなレベルのアクセス権を割り当てることで解決策を提供し、注釈をアップロードしてプロジェクトの進捗を追跡し、同時に作業を行うことができます。

ワークフローの自動化:

「アクション」と呼ばれる機能を使用すると、エンジニアはワークフローを自動化し、繰り返し、時間がかかり、手動での作業を減らすことができます。これにより、開発者はこれらのワークフローを実現するために大量の手動スクリプトを書く必要がなくなり、必要な作業に集中できるようになります。

非構造化データは、AIの未来です。なぜですか?

現在、企業の80%以上のデータは非構造化されています。画像、音声、動画、ソーシャルメディア投稿などです。AIは、非構造化データから価値を提供するための鍵です。企業は、より深い研究と分析をサポートするために非構造化データを活用し始めています。

Gravitiは最近、Linux Foundationがホストする非営利のオープンデータプロジェクトであるOpenBytesを立ち上げました。OpenBytesについて具体的に説明してください。

OpenBytesの使命は、データ標準、形式、プロセスの作成を通じて、AIコミュニティでのデータの共有を促進することです。OpenBytesの範囲には、オープンライセンスの下でオープンソースプロジェクトをサポートするためのオープンデータセットのキュレーション、オープンデータ仕様、共同開発が含まれます。

OpenBytesは、データ提供者の責任リスクを軽減できます。データセット所有者は、データライセンスに関する知識不足のため、データセットを公開することを躊躇しています。データセット提供者がOpenBytesに参加すると、そのデータは保護され、より多くのオープンデータが利用可能になります。

また、データの公開、共有、交換に際して標準的なデータ形式を生成しています。統一された形式は、データ提供者がデータセットを理解し、必要なデータを見つけることを容易にし、高品質なオープンデータセットの貢献につながります。

オープンソースのデータセットの利点については?

これらは、研究者に利益をもたらします。科学者は、モデルをトレーニングし、研究を完了するために使用できる無料のリソースが多くあります。

これらは、AI能力を構築し、従来の企業からAI企業への移行を促進するためにデータセットを使用する企業にも利益をもたらします。

Gravitiは、データセットの品質をどのように認証しますか?

COCOやKITTIなどの人気のあるデータセットでも、バグが発生し、開発者がモデルをトレーニングするときに誰もが完璧な方法を見つけられていません。Gravitiは、データセット評価モデルが確立されるか、または他の技術革新がコミュニティに問題を解決するのに役立つと考えています。これは、Gravitiの将来の使命を達成するための部分でもあります。

開発者が将来的にデータにアクセスする方法について、どのようなビジョンを持っていますか?

少量のデータの場合、開発者は簡単にデータにアクセスできるはずです。大規模なデータセットの場合、モデルをトレーニングするために、フェデレーテッドラーニング技術が協力的な方法で機能するのに役立ちます。データを中央サーバーに保存する能力から、マシンラーニングの能力を切り離すことになります。

Gravitiについて、他に共有したいことはありますか?

Gravitiは進化を続けています。クライアントからのフィードバックに耳を傾けています。スタートアップ、企業、個人の開発者、研究者からのコラボレーションやパートナーシップの機会も歓迎しています。

私たちは、近い将来にオープンデータからAI開発の大きな機会を見ています。オープンデータを共有し、貢献するコミュニティを構築しています。これにより、研究者は科学の境界をさらに押し広げ、企業はモデルを洗練し、技術を相互に利益のある環境で進化させることができます。

素晴らしいインタビュー、詳しく知りたい読者は、Gravitiを訪問してください。

アントワーヌは、Unite.AIの創設パートナーであり、ビジョナリーなリーダーです。彼は、AIとロボティクスの未来を形作り、推進するという、揺るぎない情熱に突き動かされています。シリアルエントレプレナーである彼は、AIは電気と同じように社会に大きな変革をもたらすと信じており、破壊的な技術やAGIの潜在能力について熱く語ることがよくあります。

As a futurist、彼は、これらのイノベーションが私たちの世界をどのように形作るかを探求することに尽力しています。さらに、彼は、Securities.ioの創設者であり、未来を再定義し、全セクターを再構築する最先端技術への投資に焦点を当てたプラットフォームです。