Connect with us

ソートリーダー

AIインフラストラクチャーの変化: シリコンを超えたプログラム可能性

mm

世界中がAIとそのすべての応用にますます魅了されている一方で、AIの完全な成功を妨げる非常にリアルな障壁があります。例えば、AIデータセンターインフラストラクチャは、重大な信頼性の課題、パフォーマンスのボトルネック、および電力消費の制約に直面しています。これらの制約は、AIシステムが実際にどれだけスケールできるかを制限しています。実際、AIの不断に変化するワークロードは、OCS開発の次の段階、つまりプログラム可能なシリコンフォトニックベースのOCSsへの移行を必要とします。これにより、以前には見られなかったレベルのネットワークの柔軟性が可能になります。

ここまでの歴史: OCS開発の歴史

光回路スイッチ(OCSs)は、19世紀末/20世紀初頭の電話の歴史に根ざしています。当時、音声通信は回路スイッチングに依存しており、物理的にケーブルを切り替えて電話接続を確立していました。1960年代には、共有インフラストラクチャをより効率的に利用するためにパケットスイッチングが導入されました。これには、データを小さな「パケット」に分割して、ネットワーク上の任意のルートで複数の送信を可能にしました。1970年代には、これらのパケットは、ヘテロジニアスシステム全体でアドレス指定、ルーティング、配信方法がさらに定義されました。1980年代には、この定義 — Transmission Control Protocol/Internet Protocol、またはTCP/IP — が、以前は相互に非互換だったネットワークが共通のフレームワークの下で通信できるようにするためのインターネット標準となりました。1990年代には、ネットワークとスケーラビリティの需要が増加し、電気パケットスイッチ(EPSs)が導入されました。TCP/IPと組み合わせて、EPSsはインターネットの成長を支え、世界中の数百万のユーザーを接続しました。同時に、ファイバーはグローバルネットワークで銅線に代わり、より高い容量、より長いリーチ、そしてマルチテラビットの速度をサポートする能力を提供しました。

ダイナミックなAI環境

しかし、21世紀初頭には、AIワークロードが現在の電子ベースのネットワークに巨大な負担を与え、最初の商用MEMSベースの光回路スイッチ(OCS)データセンター・アーキテクチャの開発を促しました。光MEMSスイッチは、電気への変換せずに入力ファイバと出力ファイバの間で光を転送するために使用されるマイクロミラーを使用するオール光スイッチングデバイスです。これらのMEMSベースのOCSsは、大規模なポート数をサポートしており、銅線の制限を克服して光でサーバーを接続するために理想的です。ただし、再構成速度、ポートあたりのコスト、フォームファクタに関する限界が明らかになっています。これらの限界は、MEMSベースのOCSsがデータセンターの計算エンジンの中心であるスケールアップネットワーク、特にAIワークロードの需要に応えることができないことを意味します。

実際、今日、MEMSベースのOCSsとAIデータセンターへの需要は、毎年、または6か月ごと、または4半期ごとに導入される巨大で非線形で予測不可能な変化により、さらに顕著になっています。AIデータセンターのエコシステムのアクターは、急速に適応し、常に変化するAIの風景に応じることが求められています。ネットワーク設計者は、ネットワーク内の問題を回避するために、または最適化されたパフォーマンスが必要な新しいレベルのAIワークロードを管理するために、必要に応じてAIデータセンターのネットワークを再構成または再プログラムすることが求められています。

プログラム可能なシリコンフォトニクス: 「凍結」されたネットワークを超えて

プログラム可能なシリコンフォトニック(SiPh) OCSsは、OCS開発の次のステップです。低コスト、非常にコンパクトで、ソフトウェアによって駆動されるこれらのフォトニックチップは、ネットワークを再構成するために瞬時に再プログラムできます。MEMSと比較して、プログラム可能なSiPh OCSは固体状態の技術であり、移動部品がないため信頼性のリスクが大幅に軽減されます。固体状態、CMOS互換の技術は、GPUクラスタの最適なコストである100ドル/ラディックスに一致することも意味します。

プログラム可能なSiPh OCSsは、2つの重要な点でAIデータセンター・アーキテクチャをさらに強化します。まず、GPUインターコネクトの迅速な再構成を可能にし、ワークロードをより効率的に実行し、より迅速に完了できるようにします。AIトレーニングが進化するにつれて、通信トポロジはパケットロスなしで動的に変更されなければなりません — これには、MEMSベースのアプローチよりもはるかに高速な再構成時間が必要です。SiPh OCSのスケーラビリティはこの分野で基本的に優れています。2つ目に、SiPh OCSのプログラム可能性により、フォームファクタをスケールアップせずにスイッチングファブリックに追加の機能を直接統合できます。実時間のテレスコピー、SiGe統合フォトディテクタ、リンク増幅などの機能が組み込まれて、観察可能性と故障耐性が向上します。MEMSベースのOCSsは通常、2〜3 dBの光損失を導入しますが、SiPh OCSの実装は、基本的に損失のないように設計できます。全体的なシステムの柔軟性と効率が向上します。

今後の展望

歴史的なデータセンター・ネットワークは硬直的であり、AIデータセンターの変化する需要に追いつくことができないため、プログラム可能なSiPh技術の市場は、数十億ドル規模の機会を提供します。この大きなブームとともに、この新しいテクノロジーの中心にある企業間の協力と協調の必要性が生じます。そのためには、OCP標準化団体 — Google、Microsoft、Lumentum、およびその他のイノベーターが含まれる — があります。これは、OCSを使用するネットワークマネージャーのソフトウェアインターフェイスをできるだけ標準化し、使いやすくすることを目的としています。これらの企業は、視点を共有し、標準を策定してテクノロジーの進歩を促進し、採用を促進したいと考えています。

AIが私たちの世界を進化させると、AIデータセンター・ネットワークも進化し、将来に備える必要があります。プログラム可能なSiPh OCSsにより、企業は革新の最先端で創造し、新しい機会を実現できます。

クリスチャン・デュポンは、iPronicsのCEOであり、AIデータセンターの光スイッチ用に会社を拡大するために数千万ドルを調達している。EPFLエンジニアであり、テクノロジー業界での著名なキャリアを持つデュポン氏は、テキサス・インスツルメンツでのエグゼクティブ役割を務め、光メムスドメインでのVariopticとPoLightのCEOを務め、その後CEO-CF、Dolphin Integration、RiberのCEOを務めた。