Connect with us

次のAIブレークスルーはバックアップの中に隠れている

ソートリーダー

次のAIブレークスルーはバックアップの中に隠れている

mm

保険会社が過去10年間で北西太平洋地域での火災関連の被害請求を瞬時に抽出できることを想像してみてください。あるいは、セールス部門が特定の感情を持つユーザーのフィードバックを収集して、リードを失う前に機能を改善できるようにしてください。歴史的なデータをAIに供給することで得られる可能性は無限大ですが、それはバックアップが単なるバックアップとして動作しない限りです。

数年間、保険からエンターテイメントまで、すべての 垂直方向の企業は古いデータを埃をかぶった保険証券のように扱ってきました。何かをする必要がある場合に使用することを希望するものとして、遠ざけておくものです。これらの企業は、データ レコード、ファイル、ビデオの山を生成し、保管していますが、それらはほとんどの場合、バックアップ ポリシーまたはコンプライアンスと規制上の必要性以外の目的ではほとんど価値がありません。

このデータが後ろのデジタルクローゼットに積み上げられていることに何の問題があるのでしょうか。多くの場合、それは棚に置かれる理由があったからです。

この「そんなに?」という考え方は、消費者の期待がAIとリアルタイムの洞察によって大幅に変化したAI時代の現実を無視しています。企業はAIによって動かされるリアルタイムの洞察とパーソナライズされた、コンテキストに豊かな体験を提供することが期待されている世界では、「休眠」状態のデータは、企業で最も過小評価されている戦略的資産の1つです。

バックアップは過去に留まっている

今日の急速なクラウドファーストの世界では、バックアップは静的な保険証券として扱われることがよくあります。会社はそれらを設定して、忘れて、触れることを希望しません。

現実ははるかに複雑で、はるかに高価です。

可視性が最初の弱点です。バックアップ エコシステムが断片化し、リソースが散在し、影の IT が存在し、タグが誤って設定されると、保護されているものを証明したり、保護されていない場合にそれを発見することが難しくなります。クラウドネイティブのバックアップツールは、この課題に加わります。簡単に有効にできるものの、真の検索機能や単一アイテムの復元機能が不足しています。サードパーティのツールはこれらのギャップを埋めようとしますが、独自の複雑さを導入し、エージェントや顧客環境に追加のマシンを配置する必要があり、バックアップ ポリシーの構成が複雑になり、ライセンスだけでなくデータの保存または転送ごとに会社が支払う隠れた価格モデルが導入されます。

データが必要な場合 – コンプライアンス、法的、または運用上の必要性の場合 – 伝統的なモデルの復元プロセスは期待を裏切りに終わります。ほとんどのツールでは、完全なスナップショットの復元が必要で、1 つのテーブルまたは行だけが関連する場合でも、完全なデータベースの復元がトリガーされます。結果として、時間、計算能力、コストが大量に必要になります。ほとんどの会社のバックアップ システムには、この冗長で無駄なプロセスを回避するためのグラニュラー復元機能が不足しています。

コンプライアンスの要求は別の痛みをもたらします。ほとんどのチームは、監査中にバックアップの成功をリアルタイムで証明したり、機密データの保有ポリシー、暗号化、またはアクセス制御が適切に適用されたことを示したりすることができません。ダイナミックでマルチクラウドの世界では、これにより、最善の場合、保有が広がり、ストレージが膨張し、最悪の場合、機密データが検査されず、セキュリティが確保されないギャップが生じます。

企業がバックアップを、LTO または Glacier などのパッシブ アーカイブと同じように扱う場合、クラウドの速度とバックアップの準備の間には、拡大するギャップが生じます。自動検出や分類がなければ、データは、非常にダイナミックな環境でさえも、隙間を埋めることができます。バックアップは不完全または一貫性がなくなる一方で、費用は増加し続けます。

バックアップからデータ レイクへ: AIの次のフロンティアの解放

単に「最新の」ストレージでは、次のデータ戦略の時代にはなりません。企業は、バックアップを完全に検索可能で、分析可能な データ レイク に変換する必要があります。コンプライアンスと復旧の必要性を満たすだけでなく、今日の AI モデルが効果的にスケーラブルに機能するために必要な大量の高品質のデータセットを供給する必要があります。

データ レイク モデルでは、バックアップは静的なスナップショットとして存在しません。代わりに、コンテキスト メタデータで豊富に装飾された、ダイナミックなリポジトリとなり、グラニュラー検索用にインデックス付けされ、分析ツールに接続されます。災害復旧とコンプライアンスの義務を満たすだけでなく、ビジネス インテリジェンス、製品の革新、カスタマー エンゲージメントに積極的に貢献します。

この移行を可能にする重要な要素は次のとおりです。

  • 自動的、コンテキストによるデータ抽出: AI ドリブンのタグ付けと自然言語処理により、歴史的なレコード、ドキュメント、画像、ビデオに豊富な検索可能な記述子を付けることができます。
  • グラニュラー復元機能: 企業は、データセット全体を隔離するのではなく、個々のファイル、トランザクション、テーブル、またはメディア クリップを秒単位で外科的に回復できます。
  • 分析パイプラインへのシームレスな統合: バックアップが検索可能でクエリ可能になると、AI トレーニング データセット、リアルタイム ダッシュボード、トレンド分析ワークフローに直接供給できます。

影響は変革的です。たとえば、銀行は、10 年間静止していた取引データで不正検出アルゴリズムをトレーニングできます。小さなサンプルでは見えない異常を検出できます。ヘルスケア提供者は、特定の遺伝子マーカーに一致するすべての患者ケースを回復して研究をサポートできます。あるいは、エンターテイメント会社は、コンテンツ制作を導くために歴史的なオーディエンスのセンチメント データを表面化できます。

「死んだデータ」が、常に成長する戦略的資産になります。コスト センターではなく、バックアップは革新を推進する競争上の優位性に進化します。

「死んだデータ」をビジネス ポテンシャルを抽出する

幸いなことに、現状は変化しています。最新のストレージ システムは、オブジェクト ベースとトピック ベースのストレージ、自動インデックス作成、コンテキスト メタデータ抽出を組み込むことができます。これにより、アーカイブは瞬時に検索可能でビジネスに適したものになります。

たとえば、Google Cloud は、歴史的に分離された資産を接続し、データを処理して標準化し、工場の床からクラウドまでの可視性を向上させるために、主要な製造業者や自動車会社の Ford や Kyocera と協力しています。金融機関は、取引データやクライアントとのやり取りのデータをペタバイト単位で蓄積しています。彼らはこれらの宝庫にアクセスして、金融特有の AI モデルをトレーニングしたいと考えています。これは、どれほど深い歴史的データが貴重になっているかを示しています。

メディアやエンターテイメントでも、ユースケースは驚くほどの潜在性を持っています。Netflix を考えてみましょう。オリジナル コンテンツとライセンス コンテンツの両方に対する支出は、今年 180 億ドルに達する予定です。つまり、Netflix は、バックアップ データ、メディア、メタデータ、ビデオ タグ情報など、膨大な量のデータを蓄積しています。これらは、複数の地域のコンプライアンス規制、複数のアクセシビリティ標準、複数のクラウド プロバイダーを通じて反映される必要があります。単一のバックアップ復元スナップショットでこのような大量のコンテンツを探すことは、実行可能ではありません。代わりに、グラニュラー復元機能と瞬時の検索可能性でデータを絞り込むことができるとどうでしょうか。

これが、データ レイク シフトによって可能になることです。

証拠は出力にあります。適切なツールと戦略的思考を持つと、バックアップ ストレージは、単なる保険証券ではなく、創造的で価値のあるエンジンになります。

バックアップの改善はビジネス成果の改善につながる

今日の企業は、データとスピードによって定義されます。レガシーのバックアップ システムは、両方の面でチームを妨げています。

バックアップは、金庫や最悪のケースのサバイバル メカニズムとして扱われるべきではありません。代わりに、成長、創造性、競争上の優位性のエンジンとなるべきです。新しいテクノロジー ソリューションは、この移行を可能にする準備ができています。バックアップ アーキテクチャを今日現代化する企業は、金融、ヘルスケア、メディアなど、明日のブレークスルーを推進する企業になるでしょう。

Assaf Natanzonは、EonのVPおよびチーフアーキテクトであり、ストレージ、データ管理、サイバー耐性アーキテクチャの革新を牽引しています。彼は以前、Huawei StorageのテクニカルVPおよびチーフアーキテクトとして、OceanProtectという数十億ドル規模のセカンダリストレージプラットフォームを作成しました。また、Dell/EMCのData Protection部門のCTOとして、35億ドルの製品ポートフォリオを監督しました。レプリケーション、デュプリケーション、圧縮、RAIDテクノロジーの先駆者であるAssafは、550以上の米国特許(250以上が保留中)を保持しており、エンタープライズストレージで最も多作の発明家の一人です。彼は、ベン・グリオン大学からコンピュータサイエンスの博士号を取得しており、災害復旧を専門としています。