インタビュー

OxylabsのDenas Grybauskas氏、チーフ・ガバナンス&戦略担当官 – インタビュー・シリーズ

mm

Denas Grybauskas氏は、Oxylabsのチーフ・ガバナンス&戦略担当官です。Oxylabsは、ウェブ・インテリジェンス・コレクションとプレミアム・プロキシ・ソリューションの世界的リーダーです。

2015年に設立されたOxylabsは、世界最大級の倫理的にソースされたプロキシ・ネットワークを提供しており、195カ国にわたる1億7700万を超えるIPアドレスをカバーしています。また、Web Unblocker、Web Scraper API、OxyCopilotなどの高度なツールを提供しています。OxyCopilotは、AIパワードのスクレイピング・アシスタントで、自然言語を構造化されたデータ・クエリに変換します。

あなたは、リトアニアの法テック・スペースで印象的な法的およびガバナンスの経歴を持っています。Oxylabsでの役割で、AIの最も両極端な課題の1つである倫理と著作権に取り組むことを何が動機づけたのですか。

Oxylabsは、業界で責任あるイノベーションの旗手として常に活動してきました。私たちは、倫理的なプロキシ・ソーシングとウェブ・スクレイピング・インダストリー・スタンダードを最初に主張しました。現在、AIが急速に進化しているため、イノベーションと責任のバランスを保つ必要があります。

私たちは、この問題をAI業界が直面している大きな課題と見なし、解決策も見いだしました。データセットを提供することで、AI企業とクリエイターが公平なAI開発について同じページに立つことができるようになります。これは、関係者全員にとって有益です。クリエイターの権利を最優先にしながら、将来のAIシステムの開発のためにコンテンツを提供する必要性も認識しました。したがって、これらのデータセットを、今日の市場のニーズに応えるものとして作成しました。

イギリスでは、著作権に関する激しい論争が行われています。AIイノベーションとクリエイターの権利の間の現在の論争の状態をどう解釈しますか。

イギリス政府が生産的な技術イノベーションを優先することは重要ですが、クリエイターもAIによって保護され、損害を受けないようにすることが重要です。現在議論されている法的枠組みは、イノベーションを促進し、クリエイターを保護するバランスを見つける必要があります。近々、政府がこのバランスを見つける方法を見いだすことを期待しています。

Oxylabsは、クリエイターの同意に基づく世界初の倫理的なYouTubeデータセットを立ち上げました。同意プロセスはどうなっていますか。また、音楽や出版などの他の業界でもスケーラブルなのでしょうか。

データセット内の数百万のオリジナル・ビデオすべてに、AIトレーニングに使用するためのクリエイターの明示的な同意が得られています。クリエイターとイノベーターを倫理的に結び付けるものです。Oxylabsが提供するすべてのデータセットには、ビデオ、トランスクリプト、豊富なメタデータが含まれています。こうしたデータには多数の潜在的な用途がありますが、Oxylabsは、クリエイターが明示的に同意したAIトレーニングに特化してデータを洗練し、準備しました。

多くのテクノロジー・リーダーは、すべてのクリエイターから明示的なオプトインを要求することは、AI業界を「殺す」ことになるという主張をしています。そうした主張に対するあなたの反論は何ですか。また、Oxylabsのアプローチは、こうした主張の反証となるものですか。

AIトレーニングに使用するすべての素材について、事前の明示的なオプトインを要求することは、重大な運用上の課題を提起し、AIイノベーションに多大なコストをもたらします。代わりに、クリエイターの権利を保護するのではなく、企業がより厳格な規制のない管轄区域への開発活動の移行を奨励することになりかねません。しかし、これは、AI開発を促進しながら著作権を尊重するための中間的な道がないということを意味するわけではありません。必要なのは、AI企業とクリエイターの関係を簡素化する実行可能なメカニズムです。

これらのデータセットは、前進するための1つのアプローチを提供します。オプトアウト・モデル、つまり著作権所有者が明示的にオプトアウトしない限りコンテンツを使用できるというモデルもあります。3つ目の方法は、オンライン・プラットフォームなどの技術ソリューションを通じて、出版社、クリエイター、AI企業間の取引を促進することです。

最終的に、どのような解決策でも、適用される著作権およびデータ保護法の範囲内で運用される必要があります。Oxylabsでは、AIイノベーションは責任を持って追求されるべきであると信じており、クリエイターを尊重しながら進歩を可能にする、合法的で実用的な枠組みに貢献することを目指しています。

同意ベースのデータセットを実現するために、チームが克服しなければならなかった最大の課題は何でしたか。

YouTubeがコンテンツ・クリエイターにAIトレーニングのための作品のライセンスを簡単に提供できるようにしたことで、道が開けました。その後、私たちの仕事は、データの収集、クリーンアップ、構造化、企業が必要なデータにアクセスできる技術的なセットアップの構築など、主に技術的なものでした。ただし、これは私たちが何年も行ってきたことです。もちろん、各ケースには独自の課題があります。特に、多モーダル・データのような複雑なものに取り組む場合です。しかし、私たちには知識と技術的な能力がありました。YouTubeの著者が同意する機会を得た後、残りは時間とリソースを投入することだけでした。

YouTubeのコンテンツを超えて、音楽、文章、デジタル・アートなどの他の主要なコンテンツ・タイプも、将来、システム・トレーニング・データとして体系的にライセンスされる可能性がありますか。

しばらくの間、私たちは、AIイノベーションを可能にする一方で、クリエイターの権利とバランスをとるための、体系的なアプローチの必要性を強調してきました。双方が目標を達成するための便利で協力的な方法がある場合にのみ、相互に利益があります。

これはただの始まりです。さまざまな業界にわたるデータセットを提供することで、最終的に著作権論争にamicableな決着をつけることができる解決策を提供できることを信じています。

EU、イギリス、その他の管轄区域でのAIガバナンス・アプローチの違いによって、Oxylabsの倫理的なデータセットの重要性は変わりますか。

一方で、明示的な同意に基づくデータセットの利用性は、より厳格な規制を重視する管轄区域に基づくAI企業にとって、競争環境を均等にします。こうした企業の主な懸念は、クリエイターを保護するのではなく、厳格な同意取得ルールが、他の管轄区域にあるAI開発者に不当な優位性を与えることになるということです。問題は、これらの企業が同意に気付いていないのではなく、同意を取得するための便利な方法がないと、後れを取ることになるということです。

一方で、クリエイターの同意を得たり、AIトレーニングにライセンスされたデータにアクセスしたりすることが簡素化されれば、世界中でこれが優先されるアプローチになる理由はないと信じています。YouTubeコンテンツに基づく私たちのデータセットは、この簡素化への一歩です。

AIのトレーニング方法に対する一般の不信感が高まっている中で、透明性と同意はどのようにしてテクノロジー企業にとって競争上の優位性となることができますか。

透明性は、競争上の優位性への障害と見なされることがありますが、実際には、不信感に対抗するための最も強力な武器です。AI企業が提供できる透明性が増えるほど、倫理的で有益なAIトレーニングの証拠が増え、AI業界に対する信頼が再建されます。クリエイターは、AIイノベーションから自分たちと社会が利益を得ることができることを認識するにつれて、将来、同意を与える理由が増えるでしょう。

Oxylabsは、データ・スクレイピングとウェブ・インテリジェンスと関連付けられることが多いですが、この新しい倫理イニシアチブは、会社のより広いビジョンにどのようにフィットしていますか。

倫理的にソースされたYouTubeデータセットのリリースは、Oxylabsが業界の倫理的な慣行を確立し、推進するという使命を継続するものです。これは、エシカル・ウェブ・データ・コレクション・イニシアチブ(EWDCI)の共同創設や、プロキシ・ソーシングのための透明性のある階層構造の導入など、プロジェクトの一環です。また、研究者や学者が重要なパブリック・ウェブ・データの理解を高め、研究の影響を最大化できるようにすることを目的としたプロジェクト4βも立ち上げました。

将来、政府はトレーニング・データに対するデフォルトの同意を義務付けるべきでしょうか。あるいは、自主的な業界主導の取り組みにすべきでしょうか。

自由市場経済では、一般的に市場が自分で自分を修正することを許すことが最善です。市場のニーズに応じてイノベーションが発展することで、不断に繁栄を再発明し、更新することができます。強制的な立法は、最初の選択肢としては適切ではなく、正義を確保し、イノベーションを許可するための他のすべての方法が尽きた場合にのみにすべきです。

AIトレーニングの場合、まだそのような段階に達していないようです。YouTubeのクリエイター向けのライセンス・オプションや私たちのデータセットは、このエコシステムが新しい現実に適応する方法を模索していることを示しています。したがって、明確な規制は、当然必要です。すべての人が権利の範囲内で行動することを確実にするために、政府は慎重に進めるべきです。すべてのケースで明示的な同意を要求するのではなく、業界が現在の緊張を解消するためのメカニズムを開発する方法を検討し、立法を促進するためのヒントを得るべきです。

倫理的なデータの使用を優先しながらイノベーションを停滞させないために、スタートアップやAI開発者にアドバイスを与えることがあれば、何ですか。

スタートアップは、クリエイターの同意を得たり、クリエイターに価値をもたらしたりするプロセスを簡素化する技術ソリューションを開発することで、倫理的なデータの使用を促進できます。透明性の高いデータを取得するための選択肢が現れるにつれて、AI企業は速度を妥協する必要はありません。したがって、私はこうした提供を注意深く見つけることをアドバイスします。

 素晴らしいインタビュー、詳しく知りたい読者はOxylabsを訪問してください。

アントワーヌは、Unite.AIの創設パートナーであり、ビジョナリーなリーダーです。彼は、AIとロボティクスの未来を形作り、推進するという、揺るぎない情熱に突き動かされています。シリアルエントレプレナーである彼は、AIは電気と同じように社会に大きな変革をもたらすと信じており、破壊的な技術やAGIの潜在能力について熱く語ることがよくあります。

As a futurist、彼は、これらのイノベーションが私たちの世界をどのように形作るかを探求することに尽力しています。さらに、彼は、Securities.ioの創設者であり、未来を再定義し、全セクターを再構築する最先端技術への投資に焦点を当てたプラットフォームです。