インタビュー

ルマイのCEO兼共同創設者ドクター・シェンシン・グォー – インタビュー・シリーズ

mm

ドクター・シェンシン・グォー、ルマイのCEO兼共同創設者は、物理学者であり、深層テクノロジー起業家で、光コンピューティングとAIハードウェアを専門とし、香港科技大学から量子物理学と非線形光学の博士号を取得しています。彼は以前、カルガリー大学でのポスドク研究員やオックスフォード大学での1851年研究フェローシップなどの研究役職を務め、光子工学とAIアクセラレーションの分野で進歩に貢献しました。ルマイでの研究責任者からCEOに昇進し、会社のコアテクノロジーの主な発明者であり、物理学、機械学習、先端コンピューティングシステムの交差点で10年以上の経験を持っています。

ルマイは、オックスフォード大学のスピンアウト企業で、3D光コンピューティングを使用した次世代AIプロセッサを開発しています。光を使用して、電気を使用するのではなく、AI計算の重要な部分を実行します。光コンピューティングは、現代のAIモデルを支える行列演算を加速するように設計されており、従来のシリコンベースのGPUと比較して、処理速度が大幅に高速化され、エネルギー消費が削減されます。ルマイは、既存のデータセンター環境に光コンピューティングを統合することで、よりスケーラブルでコスト効率の高いAI展開を可能にし、コンピューティング能力とエネルギー使用量の制限を解決することを目指しています。

あなたは量子物理学と非線形光学でキャリアを始め、オックスフォード大学で1851年研究フェローシップを経て、ルマイを共同創設しました。光コンピューティングが学術的な理論から商業的に実現可能な会社になるという決定的瞬間はいつでしたか?

オックスフォード大学での私の研究では、自由空間での光の特性を使用して、機械学習を支える行列演算を解く方法を探究していました。同時に、AIのための従来のハードウェアの限界が重要性を増してきました。私たちが解決した課題と、より効率的なコンピューティングの必要性が一致したことで、私たちはアイデアを実世界の問題に適用できるという自信を得ました。

私たちはその初期の研究から大きな進歩を遂げました。ルマイでは、現在、実時間で10億パラメータのLLMを実行できる世界初の光コンピューティングシステムを構築しました。

ルマイは、シリコンベースのコンピューティングのエネルギーとスケーラビリティの限界という、AIにおける最大のボトルネックに取り組んでいます。従来のアーキテクチャの具体的な限界は何でしたか? それがあなたを光を使用する根本的に異なるアプローチに向かわせたのですか?

私たちを押したのは、シリコンソリューションの限られたトラジェクトリーでした。シリコンでは、漸進的な改善は見られますが、それは力ずくで電力と複雑さを増やします。シリコンのスケーラビリティの限界は主に物理的なものです。周波数は増加しておらず、熱による制限で切り替えられるトランジスターの数も限られています。漏れ電流も問題です。シリコンは年間25%のパフォーマンス向上にしか貢献していないと推定されています。

その時点で、別の物理メディアがそれらの操作をより自然に処理できるのではないかと問うことが意味があります。電子をより強く押すのではなく、別のアプローチを模索するのです。

あなたの研究は光コンピューティングと機械学習に焦点を当てています。光子を電子の代わりに使用することで、ハードウェアレベルでの計算が根本的にどのように変化するのか?

電子では、計算は本質的に順序的であり、損失が発生します。トランジスターを切り替え、電荷を移動し、熱を発生させます。各操作には熱的なコストがかかり、それが蓄積されます。

光子は非常に異なります。光は同じ抵抗的な損失なしで移動し、重要なのは、光の特性を使用して、光のビームが物理メディアを通じてどのように相互作用するかを構造化することで、膨大な数の行列演算を並列に実行できることです。計算は光そのものの伝播の中で行われ、数十億のゲートの切り替えの中ではありません。

ルマイのテクノロジーは3D光処理と大量の空間並列性を利用しています。このアーキテクチャは、GPUと比較して、スループットと効率性の改善をどのように実現しますか?

目標は、1サイクルで可能な限り効率的に、高速に密な行列乗算を実行することです。ルマイのアプローチは、3Dボリューム内の光を使用して、同時に数百万の操作を実行することでこれを実現します。

2D構造では、データの移動が必要な数百のコアをまたいで操作が処理されるため、このレベルの並列性を達成することはできません。光ドメインに入ったら、操作は電力を消費せずに実行できるという事実と、光を使用することで並列性が達成されるという事実が、スループットの改善とエネルギー消費の削減を促進します。

多くのAIインフラストラクチャ企業はまだトレーニングに焦点を当てていますが、ルマイは推論に注力しています。推論が次のAIの段階の定義的な課題であるとあなたはどうして考えていますか?

推論は、AIが実際に何かを実行するところです。毎に回答された質問、完了した毎のタスク、生成された毎のドキュメントです。私たちはすでに推論の時代に入っていますが、需要はトレーニングに焦点を当てたハードウェアが吸収することができなかったレートで成長しています。

経済的側面も異なります。推論は継続的に実行され、数百万のユーザーをまたいで実行されます。トークンあたりのコストが決定的な指標となります。これは、光コンピューティングが特に適している分野です。事前充填段階は、応答を生成する前に完全なコンテキストを処理するために、計算に大きく依存しています。この段階は、私たちの光エンジンとほぼ完全に一致しています。私たちはここに最初に焦点を当てました。

光コンピューティングにおける長年の課題は安定性とスケーラビリティでした。ルマイがこれらの障壁を克服するために達成した主な技術的ブレークスルーは何でしたか?

課題は、光コンピューティングが計算を実行できることを示すことではありませんでした。研究者たちはこれを実証してきました。課題は、実験室の外でこれを実現することでした。

2つのことが最も重要でした。第一に、現在データセンターで使用されているのと同じコンポーネントを使用します。珍しい材料はありません。供給チェーンのスペキュレーションもありません。第二に、光テンソルエンジンとシステム制御およびソフトウェアのためのデジタル処理を組み合わせたハイブリッド設計を意図的に選択しました。

あなたのシステムは光とデジタルコンポーネントのハイブリッドアプローチを使用しています。光コンピューティングを実用的で現実世界のデータセンター展開に適したものにするためのバランスはどれくらい重要ですか?

これは基本的なものです。光コンピューティングは、すべてを光で置き換えることを意味しません。デジタルシステムは、制御、シーケンシング、ソフトウェアエコシステムとのインターフェースにおいて非常に優れています。私たちの光エンジンは、推論コンピューティングを支える核心的な数学演算に優れています。ハイブリッドアーキテクチャにより、各コンポーネントが最も適したことを実行できます。

展開の観点から、これは非常に重要です。ルマイのアイリスは、既存のデータセンターインフラストラクチャに統合され、標準インターフェースを使用し、現在Llama 8Bおよび70Bなどの実際のモデルを実行しています。

ルマイのアイリスファミリー、特にアイリスノヴァサーバーの発表により、実時間で10億パラメータモデルの推論を実現することは、AIインフラストラクチャの将来にどのような影響を与えますか?

これは、光コンピューティングが研究から現実に移行したことを示しています。実時間で10億パラメータモデルの実行は、業界が必要としていた証明点でした。ルマイのアイリスサーバーファミリーは3つのサーバーで構成されます。ノヴァ、オーラ、テトラです。ルマイのアイリスノヴァは、最初のサーバーであり、現在評価のために利用可能であり、既にパートナーと協力して、実際の推論ワークロードに対してこれを使用することを検討しています。

より広範な意味では、これはAIインフラストラクチャのトラジェクトリーが変化することを示しています。AIのスケーラビリティは、より多くのGPUを購入し、より多くの電力を消費し、大規模なデータセンターを構築することを意味するという仮定がされてきました。ルマイのアイリスノヴァは、別の道を示しています。1キロワットあたりのパフォーマンスが劇的に向上し、トークンあたりのコスト構造が根本的に異なります。ルマイのアイリスサーバーファミリーが開発されるにつれて、ハイパースケーラーと企業がコンピューティングの調達について考える方法に重大な影響が及ぶでしょう。

プレスリリースでは、従来のシステムと比較して最大90%のエネルギー消費量の削減が強調されています。これは、グローバルデータセンターが直面している成長するエネルギー制約の文脈でどれくらい重要なブレークスルーですか?

エネルギー制約はAI時代のインフラストラクチャの課題です。電力容量はすでに展開計画の制限要因となっています。

この背景において、90%のエネルギー消費量の削減は、AIのスケーラビリティと経済性の基本的な経済と実現可能性を変えます。単一のルマイシステムは、電力消費の多い数十のGPUを置き換えることができ、これは与えられた電力エンベロープ内で何が可能かという点で重大な変化をもたらします。

コストの側面もあります。データセンターの構築コストは、電力容量を反映しています。低電力のデータセンターは、構築するコストが低くなります。エネルギー消費量を削減することは、トークンあたりのコストを直接削減することにもなります。これは、業界が目指しているスケールでAIを経済的に実行可能にする上で重要です。

今後10年を見通して、光コンピューティングがどのように進化すると思いますか? ルマイはこの移行を形作る上でどのような役割を果たすと思いますか?

ポストシリコン時代はすでに始まっています。これは、推論の時代への移行と、トークンあたりの低コストでのより高いパフォーマンスの需要と同時に起こっています。シリコンは当然役割を果たし続けるでしょうが、コンピューティングの改善がシリコンノードの進歩のみに依存するという仮定は、AIが要求する速度で信頼できるものではありません。私たちは、光コンピューティングが、並列性とスループットが必要なスタックの重要な部分で使用される未来を予見しています。

ルマイにとって、ロードマップは、光コンピューティングの密度、効率、能力をさらに推進し、データセンターに展開することです。ビジョンは、エネルギーコストの低い知能の世界であり、メガワットスケールのデータセンターが、現在のギガワットスケールの施設と同じトークン量を生成できる世界です。

その未来は、遠い将来の推測ではありません。私たちは、光コンピューティングが大規模で実用的なものであることを証明する最初のシステムを構築しました。ここから先は、エンジニアリングの問題です。

素晴らしいインタビュー、詳しく知りたい読者はルマイを訪問してください。

アントワーヌは、Unite.AIの創設パートナーであり、ビジョナリーなリーダーです。彼は、AIとロボティクスの未来を形作り、推進するという、揺るぎない情熱に突き動かされています。シリアルエントレプレナーである彼は、AIは電気と同じように社会に大きな変革をもたらすと信じており、破壊的な技術やAGIの潜在能力について熱く語ることがよくあります。

As a futurist、彼は、これらのイノベーションが私たちの世界をどのように形作るかを探求することに尽力しています。さらに、彼は、Securities.ioの創設者であり、未来を再定義し、全セクターを再構築する最先端技術への投資に焦点を当てたプラットフォームです。