AI 101
データファブリックとは何か?

人工知能(AI)や機械学習(ML)とよく関連付けられるデータファブリックは、生データをビジネスインテリジェンスに変換するための主要なツールの1つです。
しかし、データファブリックとは何でしょうか。
データファブリックは、エンタープライズ内でデータ資産、データベース、データベースアーキテクチャを統一されたコレクションで提供するアーキテクチャとソフトウェアです。インテリジェントで自動化されたシステムを使用して、さまざまなデータパイプラインとクラウド環境のエンドツーエンド統合を容易にします。
ハイブリッドクラウド、IoT、AI、エッジコンピューティングの重要な進歩が続くなかで、データファブリックの重要性は増しています。これにより、ビッグデータが大量に増加し、組織が管理するデータも増えました。
このビッグデータに対処するために、企業はデータ環境の統一とガバナンスに焦点を当てる必要がありますが、これにはデータシロ、セキュリティリスク、意思決定のボトルネックなどの課題が伴います。これらの課題により、データ管理チームはデータファブリックソリューションを採用し、データシステムの統一、プライバシーとセキュリティの強化、ガバナンスの改善、ワーカーへのデータアクセスの改善を実現しています。
データ統合により、データ駆動型の意思決定が可能になり、企業は従来、ビジネスの特定の側面ごとに異なるデータプラットフォームを使用してきましたが、データファブリックにより、データをよりまとまりのある形で見ることができます。これにより、顧客ライフサイクルをより深く理解し、データ間のつながりを確立することができます。
データファブリックの目的は何か?
データファブリックは、関連するデータの統一されたビューを確立するために使用され、データの場所、データベースの関連付け、または構造に関係なく、情報にアクセスできるようにします。データファブリックはまた、AIと機械学習を使用した分析を簡素化します。
データファブリックのもう1つの目的は、アプリケーション開発を容易にすることです。データファブリックは、従来のアプリケーションとデータベースのシロを超えた情報へのアクセスを可能にする共通モデルを作成します。これらのモデルは、情報へのアクセスを改善するだけでなく、すべてのリソースでデータアクセスを管理できる単一のレイヤーを確立することで、効率性も向上させます。
データファブリックには単一のデータアーキテクチャはありませんが、一般的には、このようなデータフレームワークには6つの基本的なコンポーネントがあると言われています。
-
データ管理: データのガバナンスとセキュリティを担当します。
-
データインジェスト: クラウドデータをまとめ、構造化データと非構造化データ間のつながりを特定します。
-
データ処理: データを精製して、データ抽出のために関連するデータのみを表面化します。
-
データオーケストレーション: フレームワークの非常に重要なレイヤーであり、データを変換、統合、クリーンアップして、ビジネス全体で使用できるようにします。
-
データ発見: データソースを統合する新しい方法を表面化します。
-
データアクセス: データの消費を可能にし、規制に準拠するために特定のチームに適切なアクセス権を確保し、ダッシュボードやその他のデータ視覚化ツールを使用して関連するデータを表面化することを支援します。
データファブリックの利点
データファブリックには、以下のようなビジネスと技術的な利点があります。
-
データシロを解消する: 現代のビジネスでは、データシロが多く発生します。モダンダベースは、アプリケーションのグループに関連付けられており、新しいアプリケーションがエンタープライズに追加されるにつれて成長します。データシロには、さまざまな構造と形式のデータが含まれていますが、データファブリックは、エンタープライズ情報へのアクセスを改善し、収集されたデータを使用して運用効率を向上させることができます。
-
データベースを統合する: データファブリックはまた、広範囲にわたるデータベースを統合するのにも役立ちます。データファブリックは、場所の違いがアクセスの障壁にならないようにします。データファブリックは、アプリケーション開発を簡素化し、特定のアプリケーションデータの使用を最適化するために使用できますが、アプリケーション間でデータを不用意に公開することもできます。データファブリックは、すでにシロ化されたデータを統合することもできます。
-
情報へのアクセスの単一化: データファブリックは、アプリケーションの移植性を向上させ、クラウドとデータセンターの両方で情報へのアクセスを単一化する手段となります。
-
インサイトの生成を加速する: データファブリックソリューションは、複雑なデータセットを簡単に処理でき、インサイトの生成を加速します。データファブリックのアーキテクチャは、事前に構築された分析モデルと認知アルゴリズムを使用して、大規模なデータセットを高速に処理できるように設計されています。
-
技術者と非技術者の両方が使用する: データファブリックは、技術者だけを対象としたものではありません。データファブリックのアーキテクチャは柔軟性があり、幅広いユーザーインターフェイスで使用できます。ビジネスエグゼクティブが理解できるダッシュボードを構築したり、データサイエンティストがデータ探索に使用するための高度なツールを提供したりできます。
データファブリックの実装のベストプラクティス
世界のデータ市場は絶えず拡大しており、この分野では強い需要があります。多くの企業は、エンタープライズのデータを最適化するためにデータアーキテクチャを実装しようとし、一般的なベストプラクティスに従っています。
そのようなベストプラクティスの1つは、DataOpsプロセスモデルを採用することです。データファブリックとDataOpsは同一ではありませんが、DataOpsモデルによれば、データプロセス、ツール、ユーザー間には密接なつながりがあります。ユーザーがデータに頼るようにすることで、ツールを活用し、インサイトを適用できます。DataOpsモデルがなければ、ユーザーはデータファブリックから十分な情報を抽出するのに苦労する可能性があります。
もう1つのベストプラクティスは、データファブリックを単なるデータレイクに変えないことです。これはよく見られる現象です。たとえば、データソースや分析などのアーキテクチャコンポーネントがすべて揃っているとしても、APIやSDKがなければ、真のデータファブリックを実現することはできません。データファブリックとは、単一のテクノロジーではなく、アーキテクチャデザインを指します。アーキテクチャの特徴的な特性は、コンポーネント間の相互運用性と統合の準備完了です。
組織が、コンプライアンスと規制要件を理解することも非常に重要です。データファブリックアーキテクチャは、セキュリティ、ガバナンス、規制コンプライアンスを向上させることができます。
システム全体に散在しているデータがないため、機密データの公開のリスクも小さくなります。ただし、データファブリックを実装する前に、コンプライアンスと規制要件を理解することが重要です。さまざまなデータタイプは、さまざまな規制管轄区域に該当する場合があります。1つの解決策は、法令に準拠したデータ変換を保証する自動コンプライアンスポリシーを使用することです。
データファブリックのユースケース
データファブリックには、さまざまなユースケースがありますが、一般的なユースケースの1つは、分析とアクセスを容易にするために、地理的に分散したデータ資産の仮想/論理的なコレクションです。データファブリックは、通常、集中管理のために使用されます。この場合、分散型のラインオペレーションは、従来のアプリケーションとデータアクセス/クエリインターフェイスを介してサポートされます。地域や国によって活動が分散している組織は、中央管理と調整が必要です。
データファブリックのもう1つの重要なユースケースは、企業の合併や買収後に統一されたデータモデルを確立することです。合併や買収が発生すると、従来独立していた組織のデータベースとデータ管理ポリシーが変化し、組織の境界を越えて情報を収集することが困難になることがあります。データファブリックは、統一されたデータビューを作成することで、この問題を解決し、統合されたエンティティが単一のデータモデルに調和できるようにします。












