Leaders d’opinion
Le prochain changement dans l’infrastructure d’IA : la programmabilité au-delà du silicium

Alors que le monde entier est de plus en plus épris d’IA et de toutes ses applications, il existe des barrières très réelles qui entravent son succès complet. Prenez, par exemple, l’infrastructure des centres de données d’IA, qui fait face à des défis de fiabilité importants, à des goulets d’étranglement de performances et à des contraintes de consommation d’énergie de plus en plus grandes qui limitent la façon dont les systèmes d’IA peuvent être mis à l’échelle dans la pratique. En effet, les charges de travail d’IA en constante évolution exigent un passage à la prochaine étape du développement de l’OCS — les OCS photonic-silicium programmables — qui permet des niveaux de flexibilité du réseau jamais vus auparavant.
Comment nous sommes arrivés là : l’histoire derrière le développement de l’OCS
Les commutateurs de circuit optique (OCS) ont une longue histoire de téléphonie, qui remonte à la fin du 19e/début du 20e siècle, lorsque la communication vocale reposait sur le commutateur de circuit — en commutant physiquement les câbles pour établir une connexion téléphonique entre deux parties. Le commutateur de paquets a été introduit dans les années 60 comme un moyen de mieux utiliser les infrastructures partagées. Il s’agissait de diviser les données en petits « paquets » pour permettre à plusieurs transmissions de voyager sur un réseau par n’importe quel itinéraire. Dans les années 70, ces paquets ont été davantage définis en termes d’adressage, de routage et de livraison sur des systèmes hétérogènes, et dans les années 80, cette définition — le protocole de contrôle de transmission/Internet ou TCP/IP — est devenue la norme Internet pour permettre à des réseaux précédemment incompatibles de communiquer dans un cadre commun. Alors que les demandes de réseau et de mise à l’échelle ont augmenté dans les années 90, les commutateurs de paquets électriques (EPS) ont été introduits. Combinés avec TCP/IP, les EPS ont sous-tendu la croissance de l’Internet et ont connecté des millions d’utilisateurs dans le monde. Au même moment, la fibre a remplacé le cuivre dans les réseaux mondiaux, offrant une capacité plus élevée et une portée plus longue, ainsi que la possibilité de supporter des vitesses de données multi-téraoctets.
L’environnement dynamique de l’IA
Mais au début du 21e siècle, les charges de travail d’IA ont mis une énorme pression sur les réseaux électroniques actuels, ce qui a conduit au développement des premières architectures de commutateurs de circuit optique (OCS) de centre de données basées sur MEMS. Les commutateurs optiques MEMS sont des dispositifs de commutation tout optique qui utilisent des miroirs mobiles microscopiques pour rediriger la lumière entre les fibres d’entrée et de sortie sans convertir le signal en électricité. Ces OCS basés sur MEMS prennent en charge des comptes de ports importants, qui sont idéaux pour connecter optiquement des serveurs distants et surmonter les limitations du cuivre dans les centres de données. Cependant, les limites de la vitesse de reconfiguration, du coût par port et de la forme ont become évidentes. Ces limites empêchent les OCS basés sur MEMS de répondre au besoin de reconfiguration du réseau en temps réel au cœur du moteur de calcul du centre de données, le réseau de mise à l’échelle — en particulier face aux charges de travail d’IA.
En effet, aujourd’hui, les limites des OCS basés sur MEMS et les exigences du centre de données d’IA ne font que devenir plus prononcées, grâce aux changements massifs, non linéaires et imprévisibles introduits par l’IA chaque année ou tous les six mois — sinon tous les trimestres. Les acteurs de l’écosystème du centre de données d’IA sont maintenant invités à s’adapter rapidement et à répondre au paysage d’IA en constante évolution. Et les concepteurs de réseaux sont pressés de reconfigurer ou de reprogrammer leurs réseaux de centre de données d’IA selon les besoins pour contourner les problèmes dans le réseau, ou gérer le nouveau niveau de charges de travail d’IA nécessitant des performances optimisées.
La photonique silicium programmable : aller au-delà d’un réseau « gelé »
Les OCS de photonique silicium (SiPh) programmables sont l’étape suivante dans le développement de l’OCS. À faible coût, très compact et piloté par logiciel, ces puces photoniques peuvent être reprogrammées instantanément pour s’adapter en temps réel à la façon dont la lumière fonctionne et donc reconfigurer le réseau. Par rapport aux MEMS, l’OCS SiPh programmable est une technologie à l’état solide, qui élimine de nombreux risques de fiabilité car il n’y a pas de pièces mobiles. La technologie à l’état solide, compatible CMOS, implique également qu’elle peut correspondre au coût cible optimal du cluster GPU de 100 $ par radix.
Les OCS SiPh programmables renforcent encore les architectures de centre de données d’IA de deux manières critiques. Premièrement, ils permettent une reconfiguration rapide des interconnects GPU afin que les charges de travail puissent être exécutées plus efficacement et plus rapidement. Alors que la formation d’IA évolue, les topologies de communication doivent changer dynamiquement — même au sein du travail de formation — sans perte de paquets. Cela nécessite des temps de reconfiguration extrêmement rapides, un domaine où la scalabilité de l’OCS SiPh est fondamentalement supérieure aux approches basées sur MEMS, en soutenant des temps de reconfiguration et de transduction plusieurs ordres de grandeur plus rapides que les technologies MEMS.
Deuxièmement, la programmabilité de l’OCS SiPh permet d’intégrer des fonctions supplémentaires directement dans le tissu de commutation sans mettre à l’échelle la forme. Des capacités telles que la télémétrie en temps réel via des photodétecteurs SiGe intégrés et l’amplification de liaison peuvent être intégrées pour améliorer l’observabilité et renforcer la résilience aux défaillances. Alors que les OCS basés sur MEMS introduisent généralement 2-3 dB de perte optique, les implémentations de l’OCS SiPh peuvent être conçues pour être effectivement sans perte, améliorant ainsi la flexibilité et l’efficacité globales du système.
Regarder vers l’avenir
Puisque les réseaux de centre de données historiques sont rigides et ne peuvent pas suivre les besoins changeants des centres de données d’IA, le marché pour la technologie SiPh programmable présente une opportunité de plusieurs milliards de dollars. Avec ce boom énorme vient le besoin de collaboration et de coopération entre les entreprises qui sont au cœur de cette nouvelle technologie. À cette fin, il existe un organisme de normalisation OCP — qui comprend Google, Microsoft, Lumentum et d’autres innovateurs — qui vise à rendre l’interface logicielle pour le gestionnaire de réseau utilisant l’OCS aussi standard et facile à utiliser que possible. Ensemble, ces sociétés aiment partager leurs perspectives et créer des normes pour faire progresser la technologie et accélérer l’adoption.
Alors que l’IA conduit l’évolution dans notre monde, les réseaux de centre de données d’IA doivent également évoluer et être prêts pour l’avenir pour les soutenir. Les OCS SiPh programmables permettent aux entreprises de créer à la pointe de l’innovation et de réaliser de nouvelles et passionnantes opportunités pour tous.












