Connect with us

Lideri de opinie

Schimbarea iminentă în infrastructura IA: Programabilitate dincolo de siliciu

mm

În timp ce întreaga lume este tot mai îndrăgostită de IA și de toate aplicațiile sale, există unele bariere foarte reale care împiedică succesul său deplin. Luați, de exemplu, infrastructura de centre de date IA, care se confruntă cu provocări semnificative de fiabilitate, blocaje de performanță și constrângeri de consum de energie din ce în ce mai mari care limitează cât de mult sistemele IA pot fi extinse în practică. Într-adevăr, sarcinile de lucru în schimbare ale IA cer o mutare în următoarea etapă a dezvoltării OCS — OCS-uri fotonică programabilă pe siliciu — care permite niveluri de flexibilitate a rețelei niciodată văzute anterior.

Cum am ajuns aici: Istoria din spatele dezvoltării OCS

Comutatoarele de circuit optic (OCS) au o istorie lungă în telefonia din secolul al XIX-lea / începutul secolului al XX-lea, când comunicarea vocală se baza pe comutarea circuitelor — comutarea fizică a cablurilor pentru a stabili o conexiune telefonică între două părți. Comutarea pachetelor a fost introdusă în anii 1960 ca o modalitate de a utiliza mai bine infrastructura partajată. A implicat divizarea datelor în pachete mici pentru a permite multiple transmisii să călătorească prin rețea pe orice rută. În anii 1970, aceste pachete au fost definite mai bine în ceea ce privește modul în care au fost adresate, rutate și livrate prin sisteme eterogene, iar în anii 1980, această definiție — Protocolul de control al transmisiei / Internet Protocol, sau TCP / IP — a devenit standardul Internet pentru a permite rețelelor anterior incompatibile să comunice sub un cadru comun. Pe măsură ce cerințele de rețea și scalabilitate au crescut în anii 1990, au fost introduse comutatoarele de pachete electrice (EPS). În combinație cu TCP / IP, EPS au susținut creșterea Internetului și au conectat milioane de utilizatori la nivel global. În același timp, fibra a început să înlocuiască cuprul în rețelele globale, oferind o capacitate mai mare și o rază de acțiune mai lungă și o capacitate de a susține viteze de date de multi-terabiți.

Mediul dinamic AI

Dar la începutul secolului al XXI-lea, sarcinile de lucru ale IA au pus o presiune enormă asupra rețelelor electronice actuale, ceea ce a condus la dezvoltarea primei arhitecturi comerciale de comutare a circuitului optic (OCS) cu tehnologie MEMS pentru centre de date. Comutatoarele optice MEMS sunt dispozitive de comutare cu lumină care utilizează oglinzi mobile microscopice pentru a redirecționa lumina între fibrele de intrare și de ieșire fără a converti semnalul în electricitate. Aceste OCS-uri bazate pe MEMS susțin numărul mare de porturi, care sunt ideale pentru conectarea optică a serverelor îndepărtate, depășind limitările cuprului în centrele de date. Cu toate acestea, limitele în ceea ce privește viteza de reconfigurare, costul pe port și factorul de formă au devenit evidente. Aceste limite împiedică OCS-urile bazate pe MEMS să abordeze nevoia de reconfigurare în timp real a rețelei în inima motorului de calcul al centrelor de date, rețeaua de extindere — în special în fața sarcinilor de lucru ale IA.

Într-adevăr, astăzi, limitele OCS-urilor bazate pe MEMS și cererile asupra centrelor de date IA devin tot mai pronunțate, datorită schimbărilor masive, neliniare și imprevizibile introduse de IA în fiecare an sau la fiecare șase luni — dacă nu la fiecare trimestru. Actorii din ecosistemul centrelor de date IA sunt acum solicitați să se adapteze rapid și să răspundă la peisajul în schimbare al IA. Și designerii de rețele sunt presați să reconfigureze sau să reprogrameze rețelele centrelor de date IA după cum este necesar pentru a ocoli problemele din rețea sau pentru a gestiona nivelul nou de sarcini de lucru ale IA care necesită o performanță optimizată.

Fotonică programabilă pe siliciu: Depășirea unei rețele “înghețate”

OCS-urile programabile siliciu fotonic (SiPh) sunt următorul pas în dezvoltarea OCS. Cu costuri reduse, foarte compacte și conduse de software, aceste cipuri fotonică pot fi reprogramate instantaneu pentru a se adapta în timp real modului în care lumina și, prin urmare, reconfigurează rețeaua. În comparație cu MEMS, OCS-ul programabil SiPh este o tehnologie solidă, care elimină multe riscuri de fiabilitate, deoarece nu există părți mobile. Tehnologia solidă, compatibilă cu CMOS, implică, de asemenea, faptul că poate corespunde costului țintă optim al clusterului GPU de 100 de dolari pe radix.

OCS-urile programabile SiPh consolidează, de asemenea, arhitecturile centrelor de date IA în două moduri critice. În primul rând, permit reconfigurarea rapidă a interconexiunilor GPU, astfel încât sarcinile de lucru să poată fi executate mai eficient și să fie finalizate mai repede. Pe măsură ce antrenamentul IA evoluează, topologiile de comunicare trebuie să se schimbe dinamic, chiar și în cadrul sarcinii de antrenament, fără pierderea pachetelor. Acest lucru necesită timp de reconfigurare extrem de rapid, o zonă în care scalabilitatea OCS SiPh este fundamental superioară abordărilor bazate pe MEMS, susținând timp de reconfigurare și transducție de ordine de magnitudine mai rapide decât tehnologiile MEMS.

În al doilea rând, programabilitatea OCS SiPh permite integrarea funcțiilor suplimentare direct în țesătura de comutare fără a scala factorul de formă. Capabilitățile, cum ar fi telemetria în timp real prin fotodetectoare integrate SiGe și amplificarea legăturii, pot fi incorporate pentru a îmbunătăți observabilitatea și a spori reziliența la eșec. În timp ce OCS-urile bazate pe MEMS introduc, de obicei, 2–3 dB de pierdere optică, implementările OCS SiPh pot fi proiectate pentru a fi efectiv lipsite de pierderi, îmbunătățind flexibilitatea și eficiența sistemului în ansamblu.

Privind spre viitor

Deoarece rețelele istorice de centre de date sunt rigide și nu pot ține pasul cu nevoile în schimbare ale centrelor de date IA, piața pentru tehnologia SiPh programabilă prezintă o oportunitate de miliarde de dolari. Împreună cu această creștere uriașă vine nevoia de colaborare și cooperare între companiile care sunt în inima acestei noi tehnologii. În acest scop, există un organism de standardizare OCP — care include Google, Microsoft, Lumentum și alți inovatori — care își propune să facă interfața software pentru managerul de rețea care utilizează OCS standard și ușor de utilizat. Împreună, aceste companii doresc să împărtășească perspectivele lor și să creeze standarde pentru a face progrese în tehnologie și a accelera adoptarea.

Pe măsură ce IA conduce evoluția în lumea noastră, rețelele centrelor de date IA trebuie, de asemenea, să evolueze și să fie viitoare pentru a le susține. OCS-urile programabile SiPh permit companiilor să creeze la nivelul de vârf al inovației și să realizeze oportunități noi și interesante pentru toată lumea.

Christian Dupont este CEO al iPronics, unde a strâns zeci de milioane pentru a scala compania în comutatoare optice pentru centre de date AI. Un inginer EPFL cu o carieră distinsă în industria tehnologică, domnul Dupont a ocupat funcții executive la Texas Instruments, a servit ca CEO la Varioptic și PoLight în domeniul optical MEMS și, ulterior, ca CEO al CEO-CF, Dolphin Integration și Riber.