Pemimpin pemikiran
Perubahan Besar dalam Infrastruktur AI: Programmability Beyond Silicon

Sementara seluruh dunia semakin jatuh cinta dengan AI dan semua aplikasinya, ada beberapa hambatan yang sangat nyata yang menghalangi keberhasilan penuhnya. Ambil, misalnya, infrastruktur pusat data AI, yang menghadapi tantangan keandalan yang signifikan, bottleneck kinerja, dan batasan konsumsi daya yang semakin meningkat yang membatasi seberapa jauh sistem AI dapat diskalakan dalam prakteknya. Memang, beban kerja AI yang terus berubah menuntut langkah ke tahap berikutnya dari pengembangan OCS — OCS berbasis fotonic silikon yang dapat diprogram — yang memungkinkan tingkat fleksibilitas jaringan yang belum pernah terlihat sebelumnya.
Bagaimana kita sampai di sini: Sejarah di balik pengembangan OCS
Optical Circuit Switches (OCSs) berakar pada sejarah panjang teleponi, dimulai pada akhir abad ke-19/awal abad ke-20 ketika komunikasi suara bergantung pada circuit switching — secara fisik beralih kabel untuk membangun koneksi telepon antara dua pihak. Packet switching diperkenalkan pada 1960-an sebagai cara untuk menggunakan infrastruktur bersama dengan lebih baik. Ini melibatkan memecah data menjadi paket kecil untuk memungkinkan beberapa transmisi melakukan perjalanan melintasi jaringan pada rute apa pun. Pada 1970-an, paket-paket ini didefinisikan lebih lanjut dalam cara mereka ditujukan, diarahkan, dan disampaikan melintasi sistem heterogen, dan pada 1980-an, definisi ini — Transmission Control Protocol/Internet Protocol, atau TCP/IP — menjadi standar Internet untuk memungkinkan jaringan yang sebelumnya tidak kompatibel untuk berkomunikasi di bawah kerangka umum. Ketika tuntutan jaringan dan skalabilitas tumbuh pada 1990-an, Electrical Packet Switches (EPSs) diperkenalkan. Dikombinasikan dengan TCP/IP, EPSs mendukung pertumbuhan Internet dan menghubungkan jutaan pengguna secara global. Pada saat yang sama, serat mulai menggantikan tembaga dalam jaringan global, menawarkan kapasitas yang lebih tinggi dan jangkauan yang lebih panjang serta kemampuan untuk mendukung kecepatan data multi-terabit.
Lingkungan AI dinamis
Tapi pada awal abad ke-21, beban kerja AI menempatkan tekanan besar pada jaringan berbasis elektronik saat ini, memicu pengembangan arsitektur pusat data OCS berbasis MEMS komersial pertama. Optical MEMS switches adalah perangkat switching all-optical yang menggunakan cermin yang dapat dipindahkan secara mikroskopis untuk mengalihkan cahaya antara serat input dan output tanpa mengubah sinyal menjadi listrik. OCS berbasis MEMS ini mendukung jumlah port yang besar, yang ideal untuk menghubungkan server yang jauh dengan mengatasi keterbatasan tembaga di pusat data. Namun, batasan dalam kecepatan rekonfigurasi, biaya per port, dan faktor bentuk telah menjadi jelas. Batasan-batasan ini mencegah OCS berbasis MEMS untuk memenuhi kebutuhan akan rekonfigurasi jaringan waktu nyata di jantung mesin komputasi pusat data, jaringan scale-up — terutama dalam menghadapi beban kerja AI.
Memang, hari ini, batasan-batasan OCS berbasis MEMS dan tuntutan pada pusat data AI hanya menjadi lebih jelas, berkat perubahan besar, non-linier, dan tidak terduga yang diperkenalkan oleh AI setiap tahun atau setiap enam bulan — jika tidak setiap kuartal. Aktor ekosistem pusat data AI sekarang diminta untuk beradaptasi dengan cepat dan merespons lanskap AI yang terus berubah. Dan desainer jaringan dipaksa untuk merekonfigurasi atau memprogram ulang jaringan pusat data AI mereka sesuai kebutuhan untuk menghindari masalah dalam jaringan, atau mengelola tingkat beban kerja AI yang memerlukan kinerja yang dioptimalkan.
Fotonic silikon yang dapat diprogram: Melampaui jaringan ‘beku’
Fotonic silikon (SiPh) OCS yang dapat diprogram adalah langkah berikutnya dalam pengembangan OCS. Biaya rendah, sangat kompak, dan didorong oleh perangkat lunak, chip fotonic ini dapat diprogram ulang secara instan untuk menyesuaikan cara cahaya bergerak dan dengan demikian merekonfigurasi jaringan. Dibandingkan dengan MEMS, OCS SiPh yang dapat diprogram adalah teknologi solid-state, yang menghilangkan banyak risiko keandalan karena tidak ada bagian yang bergerak. Teknologi solid-state, kompatibel CMOS juga berarti bahwa itu dapat mencocokkan target biaya klaster GPU optimum sebesar $100 per radix.
OCS SiPh yang dapat diprogram lebih lanjut memperkuat arsitektur pusat data AI dengan dua cara kritis. Pertama, mereka memungkinkan rekonfigurasi cepat dari interkoneksi GPU sehingga beban kerja dapat dieksekusi lebih efisien dan selesai lebih cepat. Ketika pelatihan AI berkembang, topologi komunikasi harus berubah secara dinamis — bahkan dalam pelatihan — tanpa kehilangan paket. Ini memerlukan waktu rekonfigurasi yang sangat cepat, area di mana skalabilitas OCS SiPh secara fundamental lebih unggul dari pendekatan berbasis MEMS, mendukung waktu rekonfigurasi dan transduksi yang beberapa tingkat lebih cepat dari teknologi MEMS.
Kedua, kemampuan pemrograman OCS SiPh memungkinkan fungsi tambahan untuk diintegrasikan langsung ke dalam kain switching tanpa mempengaruhi faktor bentuk. Kemampuan seperti telemetri waktu nyata melalui fotodetektor SiGe-integrasi dan amplifikasi tautan dapat dimasukkan untuk meningkatkan kemampuan pengamatan dan meningkatkan ketahanan kegagalan. Sementara OCS berbasis MEMS biasanya memperkenalkan 2–3 dB kerugian optik, implementasi OCS SiPh dapat dirancang untuk efektif tanpa kerugian, meningkatkan fleksibilitas dan efisiensi sistem secara keseluruhan.
Menghadap ke depan
Karena jaringan pusat data sejarah kaku dan tidak dapat mengikuti kebutuhan yang berubah dari pusat data AI, pasar untuk teknologi SiPh yang dapat diprogram menyajikan kesempatan sebesar miliaran dolar. Bersama dengan booming besar ini datang kebutuhan untuk kolaborasi dan kerja sama di antara bisnis yang berada di jantung teknologi baru ini. Untuk itu, ada badan standarisasi OCP — yang mencakup Google, Microsoft, Lumentum, dan inovator lainnya — yang bertujuan untuk membuat antarmuka perangkat lunak untuk manajer jaringan menggunakan OCS sebagai standar dan mudah digunakan. Bersama, perusahaan-perusahaan ini ingin berbagi perspektif dan membuat standar untuk mendorong teknologi maju dan mempercepat adopsi.
Ketika AI mengarahkan evolusi di dunia kita, jaringan pusat data AI juga harus berkembang dan tahan di masa depan untuk mendukungnya. OCS SiPh yang dapat diprogram memungkinkan perusahaan untuk menciptakan di puncak inovasi dan mewujudkan peluang baru dan menarik untuk semua.












