์ธ๊ณต์ง๋ฅ
๋ฃจ๋ง์ด, ์ฐจ์ธ๋ ์ถ๋ก ์ ์ํ ๊ดํ AI ์๋ฒ ๊ณต๊ฐ

루마이는 AI 인프라에서 주요한 발전이라고 설명하는 광학 컴퓨팅 시스템을 발표했습니다. 이 시스템은 실시간으로 억 개의 매개변수를 가진 대규모 언어 모델을 실행할 수 있습니다. 새로운 시스템인 아이리스 노바는 전통적인 실리콘 기반 처리에서 빛을 기반으로 하는 근본적으로 다른 접근 방식으로의 전환을 나타냅니다.
이 발표는 AI 산업이 모델 훈련에서 대규모 배포로 빠르게 전환하면서 기존 컴퓨팅 인프라에 전례 없는 압력을 가하고 있는 시기에 이루어졌습니다.
실리콘 제약을 넘어서
수년 동안 AI의 발전은 실리콘 칩, 특히 GPU의 발전에 크게 의존해 왔습니다. 그러나 이러한 모델은 напря격으로 나타나기 시작했습니다. 전력 소비는 급격히 증가하고 있으며, 비용과 에너지 요구 사항을 크게 증가시키지 않고 성능 개선을 얻는 것이 점점 더 어려워지고 있습니다.
루마이의 접근 방식은 전자를 광자로 대체합니다. 전기 신호를 통해 연산을 수행하는 대신, 시스템은 데이터를 처리하기 위해 빛을 사용합니다. 이것은 대규모 병렬성을 가능하게 해줍니다. 여기서 수백만 개의 연산이 3차원 공간에서 동시에 발생할 수 있으며, 평면 실리콘 표면에 걸쳐 발생하는 것이 아닙니다.
회사의 설명에 따르면, 이 아키텍처는 기존 시스템과 비교하여 에너지 소비를 최대 90%까지 줄이면서 훨씬 더 높은 처리량을 제공할 수 있습니다.
데이터 센터의 증가하는 압력
이 런치의 시점은 더 넓은 산업의 도전을 반영합니다. AI 워크로드, 특히 추론이 빠르게 확장하고 있습니다. 추론은 훈련된 모델을 실제 애플리케이션에서 실행하는 것을 포함합니다.
데이터 센터는 전력 가용성으로 인해 점점 더 제약을 받고 있습니다. 데이터 센터 에너지에 대한 세계적인 수요는 10년 말까지 두 배가 될 것으로 예상되며, 이는 운영자를 비정상적인 솔루션으로 강제합니다. 예를 들어, 전용 전력 생성 및 대체 에너지 소스를 사용합니다.
동시에 전통적인 하드웨어를 확장하는 것이 점점 더 비효율적이 됩니다. 실리콘의 각 새로운 世代는 점진적인 개선을 제공하지만 종종 불균형하게 더 많은 에너지와 냉각이 필요합니다.
루마이는 광학 컴퓨팅을 이러한 제한을 완전히 우회하는 방법으로 пози션합니다. 즉, 점진적으로 개선하는 것이 아니라 완전히 새로운 접근 방식을 제공합니다.
아이리스 노바의 작동 방식
아이리스 노바 시스템은 광학 엔진과 디지털 구성 요소를 결합한 하이브리드 아키텍처를 사용합니다. 광학 엔진은 AI 모델을 구동하는 핵심 수학 연산을 처리하며, 전통적인 디지털 시스템은 소프트웨어 및 제어 기능을 관리합니다.
이 디자인은 시스템을 기존 데이터 센터 환경에 통합할 수 있게 해주며, 인프라를 완전히 재구성할 필요는 없습니다.
시스템이 특히 최적화된 영역은 추론의 “prefill” 단계입니다. 여기서 모델은 응답을 생성하기 전에大量의 입력 데이터를 처리합니다. 이 단계를 가속화함으로써, 시스템은 전체 처리량과 효율성을 개선하려고 합니다.
루마이는 아이리스 노바가 실시간으로 Llama 8B 및 70B와 같은 모델을 실행할 수 있다고 보고하며, 이는 실험적인 사용 사례가 아니라 생산 규모의 워크로드를 처리할 수 있음을 시사합니다.
추론 시대로의 전환
이 런치는 AI의 우선순위에 대한 더 넓은 전환을 반영합니다. 모델 훈련이 점점 더 큰 모델을 훈련하는 것이 헤드라인을 지배해 왔지만, AI의 실제 세계적인 영향은 이제 효율적으로 이러한 모델을 배포하고 확장하는 방식에 의해 정의되고 있습니다.
이 전환은 훈련 단계에서 덜 뚜렷했던 병목 현상을 노출하고 있습니다. 추론 워크로드는 연속적이며, 지연에 민감하며, 에너지 집약적이므로, 효율성이 중요한 요소입니다.
루마이의 시스템은 특히 이 단계에针对되어 있으며, 순수한 컴퓨팅 파워만이 아니라 와트당 처리량에 중점을 둡니다.
초기 접근 및 산업적 영향
아이리스 노바 서버는 현재 초대형 스케일러, 기업, 연구 기관에서 평가를 위해 사용할 수 있습니다. 아이리스 제품군의 추가 시스템, 즉 오라와 테트라,는 향후 성능과 배포 옵션을 확장할 예정입니다.
광학 컴퓨팅이 규모에서 약속을 지킬 수 있다면, 이는 AI 인프라의 경제학을 재정의할 수 있습니다. 에너지 소비의 감소와 효율성의 향상은 운영 비용을 줄일 뿐만 아니라 AI의 환경적 영향에 대한 증가하는 우려를 해결할 것입니다.
기술이 얼마나 빠르게 채택될지 여부는まだ 보이지 않지만, 루마이의 발표는 명확한 방향을 강조합니다. AI 컴퓨팅의 미래는 실리콘만으로 구축되지 않을 수 있습니다.












