ソートリーダー2 years ago
なぜデータプライバシーが2024年の決定的な技術課題となるのか
技術世界の注目の的として、ChatGPTのようなAI駆動のチャットボットが注目を集め、既存の産業を再構築しています。進歩のたびに、従来の役割は廃れつつあります——ライター、マーケティングの専門家、さらにはITエキスパートでさえ、その存続が危ぶまれています。2023年6月だけでも、驚くべきことに3,900人のアメリカ人がAIによって職を失いました。しかし、この混乱は、これから起こることのほんの序章に過ぎません。 AIが産業全体にその征服を続ける中、著作権侵害やプライバシー侵害に関する懸念の波が高まっています。大きな疑問が浮上しています:進歩とプライバシーの間の微妙なバランスをどのように確保できるのでしょうか? 懸念の火花 まず初めに、ChatGPTのようなAIモデルがどのように機能するかを説明させてください。それらは、学習期間中に学んだデータに基づいて結果を生成します。モデルが、シェイクスピアによって書かれたかのような、同じ古い英文学スタイルのテキストを作成できるならば、それは、そのモデルが公開前の準備期間中に、そのコンテンツを既に「見た」ことがあることを意味します。 実際、すべてのAIモデルの背後にある機械学習(ML)アルゴリズムは、優れた性能を発揮するために膨大な量のデータで訓練されています。例えば、医師の診断を支援するシステムがあります——それらはCTスキャンを分析し、肺がんなどの特定の疾患を示す可能性のある異常を発見します。それらは通常、何百万もの医療画像で訓練されています。それがなければ、スキャン上の所見を認識できなかったでしょう。 AIツールへの需要が指数関数的に増加するにつれ、テック大手は自社のモデルを訓練するために、ますます膨大な量のデータを収集しています。そして、そのデータには、個人や組織に関する機密情報が含まれることがあります。さらに、それは所有者からのいかなる合意もなく、何百万ものウェブページをスクレイピングすることで取得されることがしばしばです。 これは、インターネット上の個人情報に関するプライバシー、透明性、管理に対する公衆の懸念に火をつけています。2023年のDeloitte調査は明らかにしました、回答者の大多数が、自分のデータがどのように使用されるかについて、より多くの保護と管理を求めていることを。約10人中9人が収集されたデータを閲覧および削除したいと望み、80%が自分のデータから利益を得ている企業に対して補償を受けるに値すると感じていました。アメリカだけを見ても、市民は自身のデータの使用方法についてより懸念を強めており、アメリカ成人の約10人中7人(71%)がこれらの懸念を共有しており、2019年の64%から増加しています。 法的戦い さらに、いくつかの組織はこれらの問題を法廷に持ち込んでいます。Fortuneによれば、2023年11月の時点で、100件以上のAI関連訴訟が法制度を通じて進行中でした。これらのケースは、知的財産権紛争、有害なコンテンツの拡散、差別の事例など、さまざまな懸念をカバーしています。 これらのケースの中には、Stable DiffusionやMidjourneyなどの深層学習およびテキストから画像へのモデルの開発者を、同意なくAIトレーニングに彼らのデジタルアートを使用したと非難したアーティストたちによる訴訟が含まれていました。彼らは主張しました、これらの製品の背後にある企業が、インターネットから数十億の画像(彼らの作品を含む)を収集し、モデルに独自の画像を生成するように指示するために使用したと。 2023年12月、主要なアメリカの新聞社The New York Timesは、これらの法的戦いに参入し、急成長しているChatGPTの開発者であるOpenAIを著作権侵害で訴えました。この訴訟は強調しました、メディア組織によって公開された何百万もの記事が自動化されたチャットボットの訓練に利用され、それが今や信頼できる情報源としてのニュース媒体の競合相手となっていると。 将来の課題 これらの差し迫った懸念に対応して、世界中の政府は公衆の不安に立ち向かうために結束しています。例えば、世界中の12の規制機関の代表者は、2023年8月にデータスクレイピングとプライバシー保護に焦点を当てた共同声明を発表しました。この声明は、アルゼンチン、オーストラリア、カナダ、コロンビア、香港、ジャージー、メキシコ、モロッコ、ニュージーランド、ノルウェー、スイス、英国の当局からのものでした。一方、カリフォルニア州では、データブローカーを対象とし、個人データの収集と管理に関する追加規制を確立するDelete法が法律として署名されました。 一致した努力にもかかわらず、私はプライバシーとデータ所有権に関する懸念が、2024年以降も公の議論においてその重要性を維持し続けると予見しています。さらに、知的財産権訴訟の急増は、ほんの氷山の一角を示しているに過ぎません。私たちは、データの正確性と安全性、特にディープフェイクと誤情報の蔓延の中で、それに焦点を当てたケースの急増を目撃する可能性が高いです。 政府と企業の両セクターが努力を倍増しなければならない一方で、慎重なアプローチが不可欠です。懸念が高まっているにもかかわらず、オープンデータが研究開発を前進させる上で引き続き極めて重要な役割を果たしていることは注目に値します。例えば、COVID-19危機の間、医療記録への公共アクセスが果たした貴重な役割は、ModernaやPfizerが開拓したワクチンなどの命を救う医療の画期的な進歩の開発を加速させました。 オープンデータの重要性は、遺伝子データの公開共有が遺伝学研究を変革した米国ヒトゲノム計画の歴史的な例によって強調されています。同様に、データを分析し学習するAIは、遺伝子変異の分類から気候変動のような差し迫った課題への対応まで、社会に利益をもたらすことができます。 ビジネスにおいて、ウェブスクレイパーによって収集されたデータは、市場調査、競合他社の追跡、主流のトレンドの認識にとって貴重です。もしウェブスクレイピングがより制限されるようになれば、企業は情報に基づいた意思決定を行うための重要なデータへのアクセスが制限され、競争と価格設定の透明性の低下、イノベーションの妨げ、データ更新の遅さと不正確さによる劣悪なユーザー体験につながる可能性があります。 しかし、これらの増大する課題の中にも、それらに正面から立ち向かう道は存在します。私は、これらの荒波を乗り切るためのプロキシの力に信頼を置いています。これらの革新的な技術は、ユーザーの元のIPアドレスを隠し、彼らのオンライン活動を代替サーバーを通じて送信します。それらはデータセキュリティを強化するだけでなく、技術的進歩と個人の自由の保護を調和させるための不可欠なツールとして登場しています。