ソートリーダー
欧州委員会の新しいGPAIテンプレート – これはAIトレーニングにとって何を意味するのか?

7月、欧州委員会(EC)は、新しい汎用人工知能(GPAI)テンプレートを発表しました。これは、AIプロバイダーがモデルをトレーニングするために入力されたコンテンツを公開することを意味します。これは、クリエイターが同意なしにコンテンツを使用してAIをトレーニングしたという報道が続いた後です。
この新しいテンプレートにより、EUはその立場を明確にしました。透明性は、交渉の余地がありません。ブラックボックストレーニング、どこかで何かが作成され、その内部メカニズムが公開されないことは、AI開発者にとって選択肢ではありません。これは、ヨーロッパでの運用がモデル入力とトレーニングデータの出典に関する完全な可視性を必要とすることを意味し、データ収集と使用を再評価する必要があります。
多くの人々は、最近発表されたUS AIアクションプランとの大きな違いを指摘しています。このプランは、規制緩和に重点を置いています。どのような新しい法律や規制でも、企業はGPAIテンプレートが運用にどのように影響するかを評価する必要があります。
地域を跨いで運用している場合、US AIアクションプランについても同様の評価を行う必要があり、状況をさらに複雑にします。これらの規制の複雑な性質と、AI開発をこのように規制することは未踏の領域であるという事実により、開発者の出力は大きく異なっています。
汎用人工知能モデルテンプレートの分析
今年7月、欧州委員会は、GPAIプロバイダーがモデルをトレーニングするために使用したデータの公開要約を公開するための義務付けテンプレートを発表しました。EU AI法の一環として、プロバイダーは、公開可能なデータセット、プライベートライセンスデータ、スクレイピングされたWebコンテンツ、ユーザーデータ、合成データなどのデータカテゴリを公開する必要があります。目標は、著作権者、ユーザー、ダウンストリーム開発者がEU法の下で法的権利を行使できるようにすることです。
GPTは大量のデータでトレーニングされます。しかし、現在の市場では、データの出典に関する情報は限られています。このテンプレートで定められた公開要約は、モデルをトレーニングするために使用されたデータの包括的な概要を提供し、主なデータコレクションをリストし、他の使用されたソースを説明します。
US AIアクションプランとの比較
対照的に、米国は、AIレースで勝利し、中国に対する競争上の優位性を維持することを目指しています。トランプ政権は、先月、AIアクションプランを発表しました。この新しいAIフレームワークは、環境規制を緩和することで、AIシステムを動かすエネルギー集約型データセンターの建設を加速します。同時に、世界的なアメリカのAIテクノロジーの輸出を増やすことを目指しています。90の勧告を含むこの計画は、米国が世界的な競争相手に対して優位性を維持するための成長する努力を反映しています。
この計画は、3つの核心的な柱で構成されています。イノベーションの加速、米国のAIインフラストラクチャーの構築、国際的なAI外交とセキュリティのリーダーシップ。
この計画の一環として、イノベーションとアクセシビリティの両方を促進するための「オープンソース」プッシュが強調されています。同様に、計画は、米国政府が「例を示して」AIの成長を牽引することを強調しています。トレーニング、才能の交流、業界全体での採用の拡大を通じてです。
この計画により、米国は、成長を妨げないように、すべての現在のテクノロジー規制、特に環境規制を簡素化することを目指しています。また、米国のAIソフトウェアとハードウェアの国際的な配布を促進することを目指しています。この「規制緩和」アプローチは、倫理、透明性、責任あるイノベーションに焦点を当てた以前のフレームワークとは明らかに異なり、より攻撃的な「イノベーション第一」のアクションプランへの移行を示しています。
欠けているピース
ここで、後退して、これらの行為が、開発者がこれに従うことの価値を見出せないという同じ欠点に苦しむ可能性があるかどうかを検討する価値があります。EUと米国のアプローチは、AIトレーニングデータセットの知的財産に関する重要なギャップを残しています。EU AI法は、トレーニングデータの要約と著作権コンプライアンスポリシーを義務付けますが、著作権作品の特定またはライセンスのためのスケーラブルなフレームワークを確立しません。
米国では、特定の規則は存在しません。AI企業は、裁判所の判決や権利者との継続的な紛争によって形成される進化する法的枠組みをナビゲートする必要があります。法的テキストを超えて、実用的側面が欠けています。どちらのアプローチも、保護されたコンテンツを大規模に検出するための実行可能な、業界全体の方法、合法的な使用の検証、またはライセンスの簡素化を定義しません。実行可能な解決策が定義されるまで、AIトレーニングにおける著作権の不確実性は、業界にとって重大な課題であり続けるでしょう。
AIの追跡可能性を省略するビジネスの隠れたコスト
これらの規制のいくつかの欠点にもかかわらず、AI開発者が法的観点からどうやって頭を上に保つかについて非常に集中することになるだろうと想定されます。しかし、常にそうではありません。実際、現在のAIにおける実際の分裂は、EUと米国の規制の間ではなく、今日トレース可能性に投資している会社と、将来トレース可能性が必要にならないと賭けている会社の間にあることです。これは、General Data Protection Regulation(GDPR)の実施を見たのと同じパターンです。プライバシーを設計から組み込んだ会社は、罰金を避けるだけでなく、消費者の信頼と他の市場へのスムーズなアクセスを獲得しました。
同様のパターンがAIでも出現している可能性があります。トレーニングデータとモデル決定の追跡可能性は、将来、世界的な基準になる可能性が高いです。遅れてシステムを再設計する会社は、将来、システムにドキュメンテーション、出典の追跡、監査機能を追加する必要があります。これは、会社が完了したい他のROI重点のビルドアウトから焦点をそらすことになります。
つまり、追跡可能性と透明性は、オプションの追加機能ではありません。AIシステムに組み込まれる必要があります。追跡可能性と透明性を後から考える会社は、イノベーションを停滞させ、規制の反発に直面し、レースに勝つことができないリスクがあります。
倫理的なAIには世界的な統一が必要
マクロ的な観点から、これらの対立するアプローチは、世界的なビジネスにとって実際の問題を生み出します。米国のような軽い規制の市場では、会社は短期的にはスケールアップできますが、EUに参入しようとすると、コンプライアンスの壁に直面します。AI法の追跡可能性とドキュメンテーションの規則は、会社が持っていない機能を必要とします。
既存のシステムに追跡可能性、ドキュメンテーション、監査機能を後から組み込むことは、高価で遅く、妨げるものです。特に、追跡可能性は、コンプライアンスの中で最もリソースを大量に消費する部分だからです。これは、GDPRと同じパターンです。プライバシーを設計から組み込んだ会社は、遅れた会社が苦労したように、高価な改修と市場への遅れたアクセスに苦労しませんでした。












