Connect with us

AI戦略の無名のヒーローであるデータの理由

ソートリーダー

AI戦略の無名のヒーローであるデータの理由

mm

AIゴールドラッシュ – パイロットと実験からエンタープライズスケールと戦略へ

ムーアの法則は、AIの場合に真に当てはまる。AIは非常に需要が高く、すべてのエンタープライズがAIを採用している。イノベーションも、新しいAIモデル、AIエージェント、新しいテクノロジーがこの分野に登場することで、この需要を後押ししている。このため、エンタープライズにとって基本的な転換が起こっている。パイロットや実験、特にジェネレーティブAIのショーケースの段階はほとんど終わりに近づいている。エンタープライズは、AIをエンタープライズ戦略の一部として組み込む必要があることを認識し、スケーリングと真のビジネス差別化を創出している。AIはほとんどの取締役会で話し合われているトピックであり、戦略的イノベーションと予算につながっている。

AI戦略における第一のドミノであるデータ

AI戦略を考える上で、重要な考慮事項の一つはデータである。データは、AIモデルがコンテキストを理解し、知的で、ドメインやエンタープライズ固有のものとなるために不可欠である。AIモデルは、モデルがチューニングされた方法と、モデルに提示される入力の両方に基づいて結果を予測する。両方の要素は、データの品質、バラエティ、最新性、構造に依存する。

最近のIDCの予測によると、AIは2030年までに、モデルだけでなく、モデルを支える基盤となるデータとインフラストラクチャへの大量投資によって、世界経済を約20兆ドル増加させることが予想されている。

狭いサブセットのトレーニングデータは偏ったモデルにつながり、古いデータは無関係な結果をもたらし、質の悪いデータは質の悪いAI結果につながる。したがって、データはエンタープライズのデータ戦略における第一のドミノである。最良の人物と最先端のテクノロジーを持っていても、データのドミノが落ちると、全体のAI戦略はすぐに崩壊する。

Gartnerの2024年の報告によると、エンタープライズはAIをスケールする上でデータに依存しており、成功するリーダーはデータに信頼を確立し、戦略的にそれをリードするものである。

AI戦略のための重要な戦略的データ決定

ここでは、AI戦略のためのデータを準備するために、エンタープライズが考慮すべき5つの重要な点を示す。

1. データランドスケープの再利用 – 多くのエンタープライズは、AIのためにデータ管理、データガバナンス、データストレージ、分析のランドスケープを再利用していない。重要なレポートや分析に使用される多くのデータは、AIにも重要である。したがって、エンタープライズがすでに持っているデータアセットから始めることが重要である。当然、これには適切なデータ品質対策が必要である。

重要な質問 – 私たちのエンタープライズにはどのようなデータがあり、それらの状態はどうか。

2. メタデータとデータライナージ – すでにあるデータについて、メタデータ(データについてのデータ)は、AIにとって非常に重要である。たとえば、ビジネス用語をデータにタグ付けすると、RAGモデルなどのコンテキストを特定するのに役立つ。保険エンタープライズで、ユーザーが請求の状態を尋ねた場合、請求状態にタグ付けされたすべてのデータ属性を使用して、AIモデルがコンテキストを理解できる。データライナージも、データの流れを理解するのに役立ち、AIモデルが信頼できるデータソースを特定するのに役立つ。

最近のISASAのブログによると、AIガバナンスは重要であり、スケールするために適切なメタデータとデータライナージが必要である。

重要な質問 – 私たちのデータはビジネス用語や技術的メタデータで適切にタグ付けされているか。データの流れを理解するために、データライナージを収集しているか。

3. データガバナンスとコンプライアンス – データが適切に管理され、ガバナンスされており、コンプライアンスやプライバシー規制がデータに適用されることを確認する。AI戦略は、これらのガバナンスや規制を継承し、拡張するべきである。たとえば、顧客がGDPR規制に基づいてデータを匿名化したい場合、AIモデルは匿名化されたデータセットでトレーニングおよび運用されるべきである。

重要な質問 – データガバナンスとコンプライアンスプログラムがあるか。なければ、AI戦略のためにどのような重要な側面を整える必要があるか。

4. マスターデータをAIのクォーターバックとして扱う – エンタープライズの重要なエンティティに関するデータを含むマスターデータを、AI戦略の基盤として使用する。たとえば、顧客の360度ビューがある場合、顧客ドメインに関するAI戦略(顧客流失予測など)は、このマスターデータを使用して、データが欠けているまたは不完全なことを避ける。当然、これはより具体的なデータソースからの情報と組み合わせることができる。

重要な質問 – 私の重要なマスターデータドメインは、完全で、他のデータランドスケープと接続されているか。

5. データとその価値 – データはコストセンターとして扱われるのではなく、AIおよびビジネスへの価値が測られるべきである。これには、データがボードやCXOのトピックとして扱われる必要がある。

重要な質問 – 私のボードやCXOは、組織におけるデータの価値を理解しているか。なければ、特にエンタープライズのAI戦略の文脈で、どのようにしてそれを理解させることができるか。

モデルは来ては去りますが、データは残る。

AI戦略が進化するにつれて、新しいモデルやAIイノベーションが登場する。 この分野のイノベーションのスピードは目を見張るものである。 しかし、時間の経過とともに、AIモデルはコモディティ化する。 エンタープライズの真の差別化要因は、どのモデルを使用するかではなく、どのようにデータをコンテキスト化してモデルをトレーニング、ファインチューニング、動作させるかである。

AI戦略を策定する際は、モデルから始めるのではなく、データから始める。データがサポートできるかどうかを問う。

シッダールス(シッド)ラジャゴパールは、InformaticaのField CTO Organizationにおいてチーフアーキテクトを務めています。 彼の役割において、彼は企業のシニアエグゼクティブと関わって、データとデータ管理に関する洞察と学びを共有することで、リーダーシップを提供しています。