倫理

Google、AIトレーニングで公開Webデータを使用していることを明らかに

Published July 5, 2023

Updated April 28, 2026

Alex McFarland

Googleは最近、プライバシーポリシーの更新において、公開されているWeb情報をAIモデルをトレーニングするために使用していることを公に認めた。この開示は、Gizmodoによって発見され、BardやCloud AIなどのサービスが含まれる。Googleのスポークスパーソン、Christa Muldoonは、The Vergeに対して、この更新は、新しいサービスであるBardもこの慣行に含まれることを明確にし、GoogleはAI技術の開発においてプライバシーの原則と安全対策を組み込んでいることを述べた。

AIトレーニングの慣行に関する透明性は、正しい方向への一歩ではあるが、多くの疑問も生じる。Googleは、公開されているデータを使用する際に個人のプライバシーをどのように確保するのか。データの不正使用を防ぐための対策は何があるのか。

GoogleのAIトレーニング方法の影響

更新されたプライバシーポリシーは、Googleがサービスを改善し、ユーザーと一般大衆に利益をもたらす新しい製品、機能、技術を開発するために情報を使用することを示している。ポリシーは、Googleが公開されている情報を使用してGoogleのAIモデルをトレーニングし、Google Translate、Bard、Cloud AIなどの製品や機能を構築することも示している。

しかし、ポリシーは、著作権物のデータプールに含まれることを防ぐ方法については明確にしていない。多くの公開されているWebサイトでは、データ収集やWebスクレイピングを目的とした大規模な言語モデルやAIツールセットのトレーニングを禁止するポリシーがある。このアプローチは、GDPRなどのグローバル規制と衝突する可能性があり、これらの規制は、明示的な許可なしに個人データが不正使用されるのを防いでいる。

公開されているデータをAIトレーニングに使用することは、必ずしも問題ではないが、著作権法や個人のプライバシーを侵害する場合には問題となる。Googleのような企業は、このデリケートなバランスを慎重に乗り越えなければならない。

AIトレーニングの慣行のより広範な影響

公開されているデータをAIトレーニングに使用することは、論争の的となっている。OpenAIのGPT-4のような人気のある生成AIシステムは、データソースについて口を閉ざしており、ソーシャルメディアの投稿や人間のアーティストや著者による著作権作品が含まれているかどうかについては不明である。この慣行は現在、法的灰色地帯にあり、様々な訴訟を引き起こし、法制定者はAI企業がトレーニングデータを収集して使用する方法を規制するための厳格な法律を導入するようになった。

アメリカ最大の新聞出版者であるGannettは、Googleとその親会社Alphabetを訴え、AI技術の進歩がデジタル広告市場での独占を助長したと主張している。一方、TwitterやRedditなどのソーシャルプラットフォームは、他の企業が自由にデータを収集することを防ぐ措置を講じており、それぞれのコミュニティから反発を受けている。

これらの開発は、AIにおける堅固な倫理ガイドラインの必要性を強調している。AIが進化を続けるにつれて、企業は技術の進歩と倫理的配慮のバランスを取ることが重要である。これには、著作権法を尊重し、個人のプライバシーを保護し、AIが全社会に利益をもたらすことを保証することが含まれる。

Googleの最近のプライバシーポリシーの更新は、同社のAIトレーニングの慣行についての光を当てた。しかし、公開されているデータをAIトレーニングに使用することの倫理的影響、著作権法の潜在的な侵害、ユーザープライバシーへの影響についても疑問を生じさせている。私たちが前進するにつれて、この会話を続け、AIが責任を持って開発され使用される未来に向けて働くことが重要である。

Unite.AI

Google、AIトレーニングで公開Webデータを使用していることを明らかに

GoogleのAIトレーニング方法の影響

AIトレーニングの慣行のより広範な影響

You may like