ソートリーダー

データがAIの鍵である

Published October 7, 2025

Updated May 17, 2026

Manasi Vartak, Chief AI Architect, Cloudera

人工知能（AI）は、企業のほぼすべての業務に深く根付いており、AIを利用した業務はどの様なものでも、ある程度影響を受けています。特に、AIの利用について見てみると、新しい形態のAIを利用して既存のシステムを革新し、改良しようとする企業が増えています。実際、最近の調査によると、ITリーダーの98％が、既にエージェントAIを利用してGenAIのユースケースをオーケストレートしているか、近い将来利用する予定です。

過去数年で登場したAIツールやテクノロジーの中で、AIエージェントは最も人気のあるものになっています。これらのエージェントは、企業が顧客体験やサポートを改善したり、内部プロセスを自動化したり、既存のGenAIモデルを最適化したりするのを助けます。しかし、AIエージェントやAI全体の利点を企業全体に拡大することは、容易ではありません。

多くの企業がAI、特にAIエージェントを拡大する際に直面する問題は、技術ではなく、信頼性です。AIエージェントは、多くのシステムを横断して動作します。そのシステムが存在する場所では、機密性の高いデータ、たとえば大量の顧客データ、医療情報、または銀行・金融データに依存している可能性が高いでしょう。この点に問題があります。適切なデータプライバシーとセキュリティインフラストラクチャーがなければ、AIモデルに大量のデータを取り込むと、企業は大きなリスクを負うことになります。

AIモデルの出力は、訓練に利用したデータが信頼できるものである場合にのみ有効です。しかし、データがセキュアであることを保証するだけでなく、さらに重要な点があります。特にAIエージェントの場合、モデルの動作には大きな自律性が伴います。データへのアクセス方法やタイミングをエージェントが理解できるようにすることは、信頼を構築する上で非常に重要です。

データプライバシーの問題を克服することは不可能ではありません。適切なデータポリシー、メタデータガバナンス、API、エンタープライズグレードの認可フレームワークを実装することで、企業のITリーダーは、AIを推進するデータがセキュアで信頼できるものであることを保証できます。

詳しく見てみましょう。

データプライバシーとAIの拡大の必要性をナビゲートする

企業がAIエージェントを統合しようとする際のより広範な目標の1つは、オペレーションやシステム全体のワークフローを合理化することです。しかし、ガードレールなしでこれを行うと、機密性の高いデータが途中で漏洩する可能性があります。現在、データ漏洩や悪意のある攻撃が不断に進化している状況では、許可されていないユーザーがデータにアクセスしたり、データが漏洩したりすると、AIイニシアチブのみならず、企業全体に災難をもたらす可能性があります。2025年のIBMの調査によると、データ漏洩の平均コストは400万ドルを超えています。AIの採用は急速に進んでいますが、イノベーション、洞察、成長の機会を求める企業リーダーがAIの採用を推進する一方で、ガバナンスやセキュリティは後れを取ることがあります。しかし、AIの採用が進むにつれて、規制政策や要件もデータのセキュリティを確保するために進化しています。

GDPRからCCPA、HIIPAのような従来の政策まで、規制上の複雑さは、AIエージェントの拡大に対する大きな課題を提起しています。大量のデータを必要とするAIツールは、チェックされていない場合、リスクを増大させます。AIモデルがこれらの内部システムに及ぶにつれて、機密性の高いデータが移動され、アクセスされることがよくあります。データについては、世界中の規制機関がプライバシー、ガバナンス、セキュリティの確保に重点を置いています。

最近の政策として、DORA（金融サービス企業のICTリスク管理に関するガイドライン）があります。これは、EUで運営する金融サービス企業に対するICTインシデントの分類と報告を明確に定めています。包括性、完全性、またはデータの可用性に影響を及ぼすものも含まれます。この政策は、主に運用上の回復力に重点を置いていますが、AIの採用にも影響を及ぼします。AIイニシアチブ、特にAIエージェントを利用したものが、企業規模でデータにアクセスするにつれて、許可されていないアクセスのリスクも増大します。AIプロジェクトがデータの喪失や漏洩につながる場合、規制のようなものがすぐに適用されます。

これだけのことがかかっている中で、企業組織がセキュリティ、ガバナンス、データアクセスがどれほど重要かを見失わないことが重要です。

AIエージェントを推進する基盤を構築する

企業は、効果的なガバナンスを根底に据えた基盤を構築する必要があります。そこには、エージェントが何ができるか、できないかを定義する厳格なルールとガイドラインがあります。この基盤の中心には、データガバナンスがあります。データガバナンスとは、組織全体でデータを責任を持って利用するためのポリシー、標準、構造のことです。これらのポリシーは、エージェントが制限されたデータセットにアクセスしたり、人間の管理なしにプロセスを開始したりしないようにします。

堅牢なデータガバナンスポリシーの実装は、いくつかの重要な点から始める必要があります。これには、責任と所有権、データの品質と一貫性、セキュリティとプライバシー、コンプライアンスと監査可能性、透明性と追跡可能性が含まれます。

これらの点をガバナンスの基盤として、企業のリーダーは意思決定の管理を強化し、データの信頼性を高め、データシロによって引き起こされる規制上のリスクを軽減することができます。これは、メタデータ管理、データ分類、データの系譜を利用して透明性と可視性を高めることで実現します。各メカニズムにより、企業はデータの起源、データフロー、データ変換を追跡することができます。

テクノロジーは重要ですが、信頼は最優先

新しいAIモデルやイノベーションが登場すると、採用が急速に進みます。しかし、どのAIイニシアチブでも、リスクが生じます。技術的な課題がAIの採用を妨げる原因ではありません。問題は、データにあります。特に、データへの信頼とプライバシーに関する懸念です。AIは非常に速く進化するため、データへのアクセス制御、データガバナンス、データの系譜、コンプライアンスがAIの進化に追いつかないことがあります。

ガバナンスは信頼の重要な要素ですが、効果的な評価も必要です。特にエージェントAIでは、標準化された評価に大きなギャップがありますが、これはシステムが信頼性と安全性を持って動作することを証明するために不可欠です。

内部システムのパフォーマンスを最適化したり、不正検知を改善したり、顧客体験をスムーズにしたりするには、信頼できるデータ、プライバシー、セキュリティの基盤を構築したAIエージェントとAIイニシアチブが最も効果的です。

Manasi Vartak, Chief AI Architect, Cloudera

Manasi VartakはClouderaのチーフAIアーキテクトです。彼女は、Menlo Park、Calif.に拠点を置くVerta Operational AI & LLMプラットフォームとVerta Model Catalogを提供するVertaの創設者兼CEOです。Vertaは最近、Clouderaに買収されました。Manasiは、MIT CSAIL在籍時にModelDBを作成したときに、実験管理と追跡を発明しました。ModelDBは、フォーチュン500企業に導入された最初のオープンソースモデル管理システムであり、MLflowの起源となりました。MITでのPh.D.を取得した後、Vartakは、コンテンツのレコメンデーションに深層学習を使用したTwitterや、ダイナミック広告ターゲティングに取り組んだGoogleでのデータサイエンスのポジションに進みました。

Unite.AI

データがAIの鍵である

データプライバシーとAIの拡大の必要性をナビゲートする

AIエージェントを推進する基盤を構築する

テクノロジーは重要ですが、信頼は最優先

You may like