Connect with us

AI ์ธํ”„๋ผ์˜ ๋ณ€ํ™”: ์‹ค๋ฆฌ์ฝ˜์„ ๋„˜์–ด์„œ๋Š” ํ”„๋กœ๊ทธ๋ž˜๋ฐ ๊ฐ€๋Šฅ์„ฑ

์‚ฌ์ƒ ๋ฆฌ๋”

AI ์ธํ”„๋ผ์˜ ๋ณ€ํ™”: ์‹ค๋ฆฌ์ฝ˜์„ ๋„˜์–ด์„œ๋Š” ํ”„๋กœ๊ทธ๋ž˜๋ฐ ๊ฐ€๋Šฅ์„ฑ

mm

전 세계가 AI와 모든 응용 프로그램에 점점 더 매료되는 동안, 완전한 성공을 방해하는 매우 실제적인 장벽들이 존재한다. 예를 들어, AI 데이터 센터 인프라는 상당한 신뢰성 문제, 성능 병목 현상, 그리고 점점 더 많은 전력 소비 제약으로 인해 AI 시스템이 실제로 얼마나 확장할 수 있는지 제한된다. 실제로, AI의不断变化하는 워크로드는 다음 단계의 OCS 개발로의 이동을 요구한다. 즉, 프로그래밍 가능한 실리콘 광학 기반 OCS를 통해 이전에 보지 못한 수준의 네트워크 유연성을 제공한다.

우리가 여기까지 오게 된 이유: OCS 개발의 역사

광학 회로 스위치(OCSs)는 19세기 말/20세기 초에 telefon 통신이 회로 스위칭에 의존했을 때부터 시작된 오랜 전화의 역사에 뿌리를 두고 있다. 패킷 스위칭은 1960년대에 공유 인프라를 더 잘 활용하는 방법으로 도입되었다. 이는 데이터를 작은 “패킷”으로 분할하여 네트워크에서任意의 경로로 여러 전송을 허용하는 것을 포함했다. 1970년대에는 이러한 패킷이异なる 시스템에서 주소 지정, 라우팅 및 전달되는 방식으로さらに 정의되었으며, 1980년대에는 이러한 정의 — 전송 제어 프로토콜/인터넷 프로토콜, 또는 TCP/IP — 가 이전에 호환되지 않는 네트워크가 공통 프레임워크에서 통신할 수 있도록 하는 인터넷 표준이 되었다. 네트워크 및 확장성 요구가 1990년대에 증가함에 따라 전기 패킷 스위치(EPSs)가 도입되었다. TCP/IP와 결합된 EPS는 인터넷의 성장과 전 세계 수백만 명의 사용자를 연결하는 데 기여했다. 同時に, 광섬유는 전역 네트워크에서 구리를 대체하여 더 높은 용량과 더 긴 거리, 그리고 멀티 테라비트 속도를 지원할 수 있게 되었다.

동적 AI 환경

그러나 21세기 초반에, AI 워크로드는 현재의 전자 기반 네트워크에 엄청난 부담을 가해, 최초의 상업적 MEMS 기반 광학 회로 스위치(OCS) 데이터 센터 아키텍처의 개발을 촉발했다. 광학 MEMS 스위치는 빛을 입력 및 출력 광섬유 사이에서 재방향시키기 위해 미세하게 이동 가능한 미러를 사용하는 모든 광학 스위칭 장치이다. 이러한 MEMS 기반 OCS는 대규모 포트 수를 지원하며, 데이터 센터에서 구리 제한을 극복하여 광학적으로 연결된 서버를 이상적으로 지원한다. 그러나 재구성 속도, 포트당 비용, 형태 인자의 제한이 명백해졌다. 이러한 제한은 MEMS 기반 OCS가 데이터 센터 컴퓨팅 엔진의 핵심인 스케일 업 네트워크에서 실시간 네트워크 재구성을 요구하는 필요를 충족하는 것을 방해한다. 특히 AI 워크로드의 경우에도 마찬가지이다.

실제로, 오늘날 MEMS 기반 OCS와 AI 데이터 센터에 대한 요구는 점점 더 두드러지게되고 있다. 매년, 또는 6개월마다, 아니면 4분기에 한번씩 AI는 엄청난 비선형적인 예측할 수 없는 변화를 도입하기 때문이다. AI 데이터 센터 생태계의 배우들은 이제 빠르게 적응하고 변하는 AI 풍경에 대응하도록 요청받고 있다. 또한 네트워크 설계자는 네트워크 내의 문제를 피하거나 최적의 성능을 필요로하는 새로운 수준의 AI 워크로드를 관리하기 위해 필요한 경우에 AI 데이터 센터 네트워크를 재구성 또는 재프로그래밍하도록 압력을 받고 있다.

프로그래밍 가능한 실리콘 광학: ‘동결’된 네트워크를 넘어서

프로그래밍 가능한 실리콘 광학(SiPh) OCS는 OCS 개발의 다음 단계이다. 저렴하고 매우 컴팩트하며 소프트웨어에 의해 구동되는 이러한 광학 칩은 즉시 재프로그래밍되어 빛의 방식을 실시간으로 적응시키고 네트워크를 재구성할 수 있다. MEMS와 비교하여 프로그래밍 가능한 SiPh OCS는 고체 상태 기술로서 이동 部品이 없기 때문에 많은 신뢰성 위험을 제거한다. 고체 상태, CMOS 호환 기술은 또한 최적의 GPU 클러스터 목표 비용인 $100/라디کس를 일치시킬 수 있음을 의미한다.

프로그래밍 가능한 SiPh OCS는 두 가지 중요한 방식으로 AI 데이터 센터 아키텍처를 강화한다. 첫째, GPU 인터커넥트의 빠른 재구성을 가능하게 하여 워크로드를 더 효율적으로 실행하고 완료할 수 있다. AI 훈련이 진화함에 따라 통신 토폴로지는 패킷 손실 없이 동적으로 변경되어야 한다. 이는 MEMS 기반 접근 방식보다 몇 가지 더 빠른 재구성 시간을 요구하는 영역으로, SiPh OCS 확장성이 본질적으로 우수하다. MEMS 기술보다 몇 가지 더 빠른 재구성 및 전도 시간을 지원한다.

둘째, SiPh OCS의 프로그래밍 가능성은 스위칭 패브릭에 추가 기능을 직접 통합할 수 있다. 실시간 원격 분석을 위한 SiGe 통합 광검출기 및 링크 증폭과 같은 기능이 관찰 가능성과 장애 내성을 개선하기 위해 통합될 수 있다. MEMS 기반 OCS는 일반적으로 2-3 dB의 광 손실을 도입하는 반면, SiPh OCS 구현은 본질적으로 무손실로 설계될 수 있어 전체 시스템의 유연성과 효율성을 개선할 수 있다.

미래를 향하여

역사적인 데이터 센터 네트워크는igid하여 AI 데이터 센터의 변경하는需求에 따라 따라가지 못하므로, 프로그래밍 가능한 SiPh 기술의 시장은 수십억 달러의 기회를 제공한다. 이 거대한 붐과 함께 이 새로운 기술의 핵심에 있는 비즈니스가 협력하고 협력해야 하는 필요성이 있다. 이를 위해 OCP 표준화 본부 — Google, Microsoft, Lumentum 및 기타 혁신가들이 포함되어 있으며 — 네트워크 관리자가 사용하는 OCS의 소프트웨어 인터페이스를 표준화하고 사용하기 쉽게 만드는 것을 목표로 한다. 함께, 이러한 회사들은 관점을 공유하고 표준을 만들어서 기술을 앞으로 나아가고 채택을 가속화하기를 원한다.

AI가 우리의 세계를 발전시키는 동안, AI 데이터 센터 네트워크도 진화하고 미래에 대비해야 한다. 프로그래밍 가능한 SiPh OCS는 회사들이 최고의 혁신을 창조하고 모든 사람에게 새로운 기회를 실현할 수 있게 한다.

Christian Dupont๋Š” iPronics์˜ CEO๋กœ, AI ๋ฐ์ดํ„ฐ ์„ผํ„ฐ๋ฅผ ์œ„ํ•œ ๊ด‘ ์Šค์œ„์น˜์—์„œ ํšŒ์‚ฌ๋ฅผ ํ™•์žฅํ•˜๊ธฐ ์œ„ํ•ด ์ˆ˜์ฒœ๋งŒ ๋‹ฌ๋Ÿฌ๋ฅผ ์กฐ๋‹ฌํ–ˆ์Šต๋‹ˆ๋‹ค. EPFL ์—”์ง€๋‹ˆ์–ด๋กœ์„œ ๊ธฐ์ˆ  ์‚ฐ์—…์—์„œๆฐๅ‡บใ—ใŸ ๊ฒฝ๋ ฅ์„ ๊ฐ€์ง€๊ณ  ์žˆ๋Š” Dupont ์”จ๋Š” Texas Instruments์—์„œ ์ž„์› ์—ญํ• ์„ ์ˆ˜ํ–‰ํ–ˆ์œผ๋ฉฐ, ๊ด‘ MEMS ๋„๋ฉ”์ธ์—์„œ Varioptic ๋ฐ PoLight์˜ CEO๋ฅผ ์—ญ์ž„ํ–ˆ์œผ๋ฉฐ, ์ดํ›„ CEO-CF, Dolphin Integration ๋ฐ Riber์˜ CEO๋ฅผ ์—ญ์ž„ํ–ˆ์Šต๋‹ˆ๋‹ค.