Connect with us

ソートリーダー

スーパーボウル クラウド レジリエンシー プレイブック

mm

スーパーボウルの興奮の中で、舞台裏のインフラストラクチャを忘れてしまうことがあります。ボウルがハITCHなく進行するためには、放送自体だけでなく、イベントを取り巻く幅広いビジネス ネットワークも含め、数千のバックエンド システムが最大容量までストレッチしながら予定通りに動作する必要があります。

これは、クラウドでは特に真実です。AWS が Peacock ストリーミング をサポートしているか、シアトル シーホークス オペレーション をサポートしているか、または Google Cloud が 2028 年オリンピック をサポートしているか、または Microsoft Azure が プレミアリーグをパワリング しているか、クラウドは主要なスポーツ イベントを成功させるために重要です。

そのため、2026 年のスーパーボウルで会社が何らかの形で関与している場合、ゲーム デイのクラウド プラン (そして、まだしていない場合は、もう遅いです) を考慮する必要があります。しかし、2027 年のスーパーボウルで活動を検討している場合、またはクラウド ゲームを強化したい場合は、この記事はあなたのためにあります。

以下、クラウド プレイブックを提供します。クラウドのストレスが発生する 2 つの重要な領域、つまり前例のないデータ サージと AI への依存に焦点を当てます。

しかし、まずクラウド アウトエージの脅威を把握するためのクイック ハドルを実行しましょう。

ファースト ダウン ファンダメンタルズ: クラウドにどれだけ頼るべきか

始める前に、以下の点を明確にしたいと思います。リーグ、チーム、主要アプリケーションが顧客と運用をハイパースケーラーに信頼するには十分な理由があります。主要なクラウド プロバイダーは信頼性の評判を十分に獲得しています。また、証拠は、ダウンタイムの信頼性が 増加している ことを示しています。

しかし、同時に、どのコア インフラストラクチャも故障する可能性があることは明らかです。インフラストラクチャ プロバイダーが完璧なランタイムを確保するために多大な努力を払っている、という仮定ができるタイミングでさえもです。例えば、(クラウド関連ではない) コインベース クラッシュ (2022)スーパードーム ブラックアウト (2013) を思い出してください。あるいは、クラウド側に近いものとして、Azure のメジャー アウトエージが昨年、 四半期の収益発表の数時間前に発生 したことを思い出してください。

言い換えると、クラウド プロバイダーが今週末に問題なく動作するだろうと想定してください。しかし、常に最悪の事態に備えましょう。そして、その点を考慮して、クラウド チャレンジの大部分を引き起こす 2 つの主要な問題を見てみましょう。

データ ブリッツ: 前例のないボリュームを処理する

クラウドは、スーパーボウル オペレーションをサポートしていますが、ここではデータの需要が以前になかったレベルに達しています。たとえば、昨年 FOX は、ライブ配信をサポートするために、2025 年のスーパーボウルでストリーミング サービスが 1550 万のピーク同時視聴者にコンテンツを配信し、約 135 Tbps を必要とした と報告しています。これは、2020 年のピーク同時視聴者 340 万人と 15 Tbps から大幅に増加した数字です。

ここで重要なのは、データ使用量の増加が、 データ ボリュームが全体的に爆発的に増加 したためであることを理解することです。両方とも、ボリュームと、ピクチャーに取り込まれているデータの種類においてです。このトレンドは、データ管理の複雑さを高めます。さらに、 Uptime Institute が報告 したように、この複雑さは、新しいアウトエージの脅威をもたらします。

その新しい複雑さの 1 つの源は、当然、AI です。

セカンド クォーター サージ: AI 革命

過去数年で、クラウド ストレスの大部分は、明らかに新しい要素の出現によって生成され、管理されています。スーパーボウル固有の AI は簡単には利用できないかもしれませんが、NFL エコシステムのスキャンは、ゲームのほぼすべての側面に触れる AI アプリケーションの豊富さを示しています。例として、以下のサンプルを見てみましょう。AI の使用は、たった今の 1 年間で、以下のようなフットボール関連の開発を遂げてきました:

  • ゲーム プレイ – NFL の サイドライン ビューイング システム、コーチがプレイを追跡し、サイドラインのハドルを管理するために使用される Microsoft が開発したスマートボード タブレットは、GitHub Copilot アクセスで「プレイをダウンと距離、スコア プレイ、ペナルティに基づいてフィルタリングし、フォーメーションを分析し、カバーを解読し、よりデータ ドリブンで戦略的な決定を下すために」 NFL による発表 によると、アップグレードされています。

  • 放送 – ESPN は、NFL の Next Gen Stats と TruPlay AI のスポーツ分析および予測アプリケーション Adrenaline によって可能になった、インゲームのリアルタイム データとプレイ確率を 導入 しました。

  • ファンタジー リーグ – NFL は、AWS を使用した NFL Pro のファンタジー AI アシスタント を立ち上げました。これは、Next Gen Stats と NFL ファンタジーと提携しています。

  • ベッティング – ベッティング アプリの FanDuel は、NFL と NBA のベッターを誘導するスポーツ ベッティング チャット機能を備えた GenAI を 今年の 3 月に導入 しました。

さらに、ゲーム デイの前から、AI がゲームをどのように支えているかを見てみましょう。NFL の AWS AI パートナーシップは、 安全性からゲームのスケジューリング に至るまで、さまざまな問題に対処しています。また、 Microsoft Azure AI Foundry を使用 して、より賢いドラフト ピックをサポートしています。AI サポート ジャイアントが NFL と契約しているのは、シスコが 複数の NFL フランチャイズ、ニューエングランド パトリオッツを含む AI インフラストラクチャ パートナーシップを締結していることからも明らかです。

ゲーム デイ自体では、新しい AI は、上記で言及した新しい複雑さとデータ ボリュームをもたらします。長期的には、クラウドの不安定性を別の形でもたらします。これについては、次に説明します。

ブラインド サイド: AI のクラウド信頼性への隠れた脅威

特定のデータ管理を必要とするだけでなく、AI は、クラウドの脆弱性の次の波の潜在的な根本的な原因でもあります。昨年の 2 つの主要な AWS と Azure のアウトエージの後、Forrester Research の Lee Suster は、クラッシュは「孤立していない — これから来るものの先触れ」であると 警告 しました。さらに、AI は主要な危険加速要因であると Suster は書いています:

ハイパースケーラーは、AI ワークロードのために GPU セントリック データセンターに投資を優先し、レガシ x86 と ARM 環境から投資を遠ざけていますが、古くなったインフラストラクチャは、増大する複雑さの下で故障しています。私たちは、この戦略が、2026 年に少なくとも 2 つのメジャーなマルチデイ アウトエージの形で重大な影響を及ぼすと信じています。

AI は、ますます重要になり、ビジネス条件をクラウドが以前よりも信頼できるものではなくするものを作り出しています。これが、IT プレーヤーが防御に回る別の理由です。いくつかの重要な戦略は以下に示されています。

勝利の防御: 必須のクラウド保護プレイ

クラウド オペレーションを保護し、ビジネス継続性を維持するには、以下を確実に行ってください:

  • AI ドリブンの異常検出と継続的な回復力テストを展開します。問題をユーザーに影響を与える前に検出するために、機械学習を使用します。プロダクション環境と同等の環境で、障害をシミュレートします (リージョンの停止、サービス低下)。回復システムが実際に機能することを検証するために、定期的に障害をシミュレートします。

  • シングル ポイントの故障を排除するために、アクティブ – アクティブ マルチクラウド デプロイを実行します。各リージョンで同時にプロダクションを実行し、各リージョンがライブ トラフィックを処理します。リアルタイム トラフィック シフトと地理的冗長性を使用して、現在の状況に基づいてユーザーをルーティングし、どこで障害が発生しても、迅速にディザスター リカバリーを可能にします。

2 番目のポイントの重要な点は、システムを単一のプロバイダーに結び付けないことです。単に複数のクラウドで作業するのではなく、真のクラウド冗長性と流動性を構築するように努めます。以下の 3 つのステップを念頭に置いてください:

  • クラウド間で動作するツールを使用します。たとえば、プロバイダーのネイティブ コンテナ サービスではなく、Kubernetes を使用します。AWS Cognito ではなく、Okta または Keycloak を使用して認証を行います。AWS CloudFormation ではなく、Terraform を使用してインフラストラクチャとしてのコードを作成します。

  • 構成を厳密に管理します。すべてをバージョン管理して、実行中のものが何であるかを把握し、問題が発生したときに迅速にロールバックできるようにします。インフラストラクチャをコードで定義し、コンソールでクリックするのではなく、管理者アクセスをロックして、文書化されていない変更を防ぎます。

  • フェイルオーバー環境を必要とする前にセットアップします。アウトエージが発生したときに、2 次クラウド プロバイダーを開始することから始めることはできません。並列環境を構築し、フェイルオーバー自動化を定期的にテストします。つまり、実際のゲーム前にすべてのスクラミッジを実行して、ゲーム デイに備えるということです。

最終のホイッスル: 優勝インフラストラクチャの構築

スーパーボウルは、フィールド上のプレーヤーだけではなく、ゲームをサポートするすべてのシステム、クラウドを含む、をストレス 테스트します。IT プロフェッショナルにとって、教訓は明確です。信頼性の高いクラウド インフラストラクチャには、ゲーム デイの計画と同じ準備と戦略的思考が必要です。緊急事態に備えて、ロックインを避け、クラウドの危機時にすばやく移動できるように準備する必要があります。これを行うと、チャンピオンシップ レベルのクラウド戦略に向けて進んでいます。

Harshit Omarは、FluidCloudの共同創設者兼CTOであり、クラウドインフラストラクチャの未来を構築しています。企業がマルチクラウド環境全体でワークロードをシームレスに移行、複製、最適化できるようにしています。以前は、Accuricsの最初のエンジニアで、ポリシーエンジンとクラウドセキュリティプラットフォームのコア開発を主導していました。

Go、Kubernetes、Terraform、クラウドコンプライアンスに関する深い専門知識を持つHarshitは、過去10年以上にわたって、AWS、Azure、GCPを跨ぐ堅牢なシステムを設計してきました。

現在の彼の使命は、クラウドロックインを排除し、インフラストラクチャをコードと同じくらい移植可能で堅牢なものにすることです。