Connect with us

Tankeledere

Den kommende skift i AI-infrastruktur: Programmabilitet ud over silicium

mm

Mens hele verden er mere og mere forelsket i AI og alle dets anvendelser, findes der nogle meget reelle barrierer, der hindrer dets fulde succes. Tag for eksempel AI-datacenter-infrastruktur, som står over for betydelige pålidelighedsudfordringer, ydelseflaskehalse og stigende strømforbrugsbegrænsninger, der begrænser, hvor langt AI-systemer kan skala i praksis. Faktisk kræver AI’s konstant skiftende arbejdsbyrde en overgang til det næste trin i OCS-udvikling — programmable silicium-fotonic-baserede OCS’er — som muliggør niveauer af netværksflexibilitet, der aldrig er set før.

Hvordan vi kom hertil: Historien bag OCS-udvikling

Optical Circuit Switches (OCS’er) har rod i en lang historie af telefoni, der begyndte i slutningen af 19. / begyndelsen af 20. århundrede, da stemmekommunikation afhængig af kredsskift — fysisk skiftning af kabler for at etablere en telefonforbindelse mellem to parter. Pakkeskiftning blev introduceret i 1960’erne som en måde at gøre bedre brug af delt infrastruktur. Det indebar at bryde data op i små “pakker” for at tillade multiple transmissioner at rejse over et netværk på enhver rute. I 1970’erne blev disse pakker yderligere defineret i, hvordan de blev adresseret, ruteret og leveret over heterogene systemer, og i 1980’erne blev denne definition — Transmission Control Protocol / Internet Protocol, eller TCP / IP — den internetstandard, der tillod tidligere inkompatible netværk at kommunikere under en fælles ramme. Da netværks- og skala-krav voksede i 1990’erne, blev Electrical Packet Switches (EPS’er) introduceret. Kombineret med TCP / IP understøttede EPS’er internettets vækst og forbinder millioner af brugere globalt. Samtidig begyndte fiber at erstatte kobber i globale netværk, og tilbød højere kapacitet og længere rækkevidde og evnen til at understøtte multi-terabit-hastigheder.

Det dynamiske AI-miljø

Men i begyndelsen af det 21. århundrede påførte AI-arbejdsbyrden en enorm belastning på nuværende elektroniske netværk, hvilket førte til udviklingen af de første kommercielle MEMS-baserede Optical Circuit Switch (OCS) datacenter-arkitekturer. Optiske MEMS-skifter er alle-optiske skiftende enheder, der bruger mikroskopiske flytbare spejle til at omdirigere lys mellem indgangs- og udgangsfibere uden at konvertere signalet til elektricitet. Disse MEMS-baserede OCS’er understøtter store portantal, der er ideelle for at optisk forbinde fjerne servere og overvinde kobberbegrænsninger i datacentre. Men begrænsninger i omkonfigurationshastighed, omkostningspris og formfaktor er blevet tydelige. Disse begrænsninger forhindrer MEMS-baserede OCS’er i at imødekomme behovet for netværks-omkonfiguration i hjertet af datacenter-computermotoren, skala-op-netværket — især i lyset af AI-arbejdsbyrde.

Faktisk, i dag, er begrænsningerne for MEMS-baserede OCS’er og kravene til AI-datacenteret bliver kun mere udtalt, takket være de massive, ikke-lineære, uforudsigelige ændringer, der introduceres af AI hver år eller hver sjette måned — hvis ikke hver kvartal. AI-datacenter-økosystem-aktører bliver nu bedt om at tilpasse sig hurtigt og reagere på det konstant skiftende AI-landskab. Og netværksdesignere er under pres for at omkonfigurere eller omprogrammere deres AI-datacenter-netværk efter behov for at undgå problemer inden for netværket eller håndtere det nye niveau af AI-arbejdsbyrde, der kræver optimeret ydelse.

Programmable silicium-fotonik: Bevægelse ud over et ‘frosset’ netværk

Programmable silicium-fotonik (SiPh) OCS’er er det næste trin i OCS-udvikling. Lav omkostning, meget kompakt og drevet af software, kan disse fotoniske chippenes være omgående omprogrammeret for at tilpasse sig i realtid måden, lys og derfor omkonfigurere netværket på. I sammenligning med MEMS, fjerner programmable SiPh OCS en masse pålidelighedsrisiko, da der ikke er nogen flytbare dele. Fast-statisk, CMOS-kompatibel teknologi indebærer også, at det kan matche det optimale GPU-cluster-mål på 100 $ per radix.

Programmable SiPh OCS’er styrker yderligere AI-datacenter-arkitekturer på to kritiske måder. Først, de muliggør hurtig omkonfiguration af GPU-interconnects, så arbejdsbyrden kan udføres mere effektivt og afsluttes hurtigere. Da AI-træning udvikler sig, skal kommunikationstopologier ændres dynamisk — selv inden for træningsjobbet — uden pakketab. Dette kræver ekstremt hurtige omkonfigurationsgange, et område, hvor SiPh OCS-skala er fundamentalt overlegen for MEMS-baserede tilgange, og understøtter omkonfiguration og transduktionstider, der er flere størrelsesordener hurtigere end MEMS-teknologier.

Anden, SiPh OCS-programmering tillader yderligere funktioner at blive integreret direkte i skiftestykket uden at skalere på formfaktor. Funktioner som realtids-telemetri via SiGe-integrerede fotodetektorer og link-forstærkning kan blive inkorporeret for at forbedre iagttagelighed og forbedre fejlresilien. Mens MEMS-baserede OCS’er typisk introducerer 2-3 dB optisk tab, kan SiPh OCS-implementationer blive designet til at være effektivt tabfrie, og forbedre den samlede systemflexibilitet og effektivitet.

Udsigt

Fordi historiske datacenter-netværk er stive og ikke kan følge med de skiftende behov i AI-datacentre, præsenterer markedet for programmable SiPh-teknologi en multi-milliard-dollar-mulighed. Sammen med denne enorme vækst kommer behovet for samarbejde og samarbejde mellem virksomheder, der er i hjertet af denne nye teknologi. Til den ende findes der en OCP-standardiseringsorgan — som inkluderer Google, Microsoft, Lumentum og andre innovatører — der har til formål at gøre softwaregrænsefladen for netværksmanageren, der bruger OCS, så standard og let at bruge som muligt. Sammen deler disse virksomheder deres perspektiver og skaber standarder for at fremme teknologien og accelerere adoption.

Da AI driver evolution i vores verden, skal AI-datacenter-netværk også udvikle sig og være fremtidssikre for at understøtte det. Programmable SiPh OCS’er muliggør, at virksomheder kan skabe på toppen af innovation og realisere nye og spændende muligheder for alle.

Christian Dupont er CEO af iPronics, hvor han har samlet titals millioner for at skala virksomheden i optiske switch til AI-datacentre. En EPFL-ingeniør med en fremragende karriere i tech-industrien, har hr. Dupont haft ledende roller i Texas Instruments, fungeret som CEO i Varioptic og PoLight i det optiske MEMS-domæne, og senere som CEO af CEO-CF, Dolphin Integration og Riber.