Лидеры мнений
Грядущая смена в инфраструктуре ИИ: Программируемость за пределами кремния

Пока весь мир все больше и больше увлечен ИИ и всеми его применениями, существуют очень реальные барьеры, препятствующие его полному успеху. Возьмем, например, инфраструктуру центров обработки данных ИИ, которая сталкивается с существенными проблемами надежности, узкими местами производительности и все более ограничениями потребления энергии, которые ограничивают, насколько далеко системы ИИ могут масштабироваться на практике. Действительно, постоянно меняющиеся рабочие нагрузки ИИ требуют перехода на следующий этап разработки ОСС — программируемых оптических схем на основе кремния, которые обеспечивают уровни гибкости сети, никогда ранее не виданные.
Как мы сюда добрались: История разработки ОСС
Оптические коммутаторы цепей (ОСС) имеют длинную историю, начиная с конца 19-го/начала 20-го века, когда связь по голосу зависела от коммутации цепей — физического переключения кабелей для установления телефонной связи между двумя сторонами. Коммутация пакетов была введена в 1960-х годах как способ более эффективного использования общей инфраструктуры. Это включало разбиение данных на небольшие “пакеты”, чтобы разрешить несколько передач проходить через сеть по любому маршруту. В 1970-х годах эти пакеты были дополнительно определены в том, как они были адресованы, маршрутизированы и доставлены через гетерогенные системы, и в 1980-х годах это определение — протокол управления передачей/протокол интернета, или TCP/IP — стало стандартом интернета, чтобы разрешить ранее несовместимым сетям общаться в рамках единой структуры. Когда требования к сетям и масштабируемости выросли в 1990-х годах, электронные пакетные коммутаторы (ЭПК) были введены. В сочетании с TCP/IP ЭПК обеспечили рост интернета и соединили миллионы пользователей во всем мире. В то же время волокно начало заменять медь в глобальных сетях, предлагая более высокую емкость и более длинный диапазон и способность поддерживать скорости, измеряемые терабитами.
Динамическая среда ИИ
Но к началу 21-го века рабочие нагрузки ИИ оказывали огромное давление на современные электронные сети, что привело к разработке первых коммерческих архитектур центров обработки данных на основе оптических схем с микроэлектромеханическими системами (МОС). Оптические коммутаторы МОС — это устройства коммутации света, которые используют микроскопические подвижные зеркала для перенаправления света между входными и выходными волокнами без преобразования сигнала в электричество. Эти коммутаторы ОСС на основе МОС поддерживают большие количества портов, что идеально подходит для оптического подключения удаленных серверов, преодолевая ограничения меди в центрах обработки данных. Однако ограничения в скорости переконфигурации, стоимости за порт и факторе формы стали очевидными. Эти ограничения не позволяют коммутаторам ОСС на основе МОС удовлетворять потребность в реальной переконфигурации сети в сердце вычислительного двига центра обработки данных — сети масштабирования — особенно в условиях рабочих нагрузок ИИ.
Действительно, сегодня ограничения коммутаторов ОСС на основе МОС и требования к центрам обработки данных ИИ становятся только более выраженными благодаря огромным, нелинейным, непредсказуемым изменениям, введенным ИИ каждый год или каждые шесть месяцев — если не каждый квартал. Акторы экосистемы центров обработки данных ИИ теперь должны быстро адаптироваться и реагировать на постоянно меняющийся ландшафт ИИ. И проектировщики сетей подвергаются давлению, чтобы переконфигурировать или перепрограммировать свои сети центров обработки данных ИИ по мере необходимости, чтобы обойти проблемы внутри сети или управлять новым уровнем рабочих нагрузок ИИ, требующих оптимизированной производительности.
Программируемая кремниевая фотоника: Переход за пределы «замороженной» сети
Программируемые кремниевые фотонные (КФ) ОСС являются следующим шагом в разработке ОСС. Низкая стоимость, очень компактные и управляемые программно, эти фотонные чипы могут быть мгновенно перепрограммированы, чтобы адаптироваться в реальном времени к пути света и, следовательно, переконфигурировать сеть. По сравнению с МОС, программируемый КФ ОСС представляет собой твердотельную технологию, которая удаляет много рисков надежности, поскольку в ней нет движущихся частей. Твердотельная, совместимая с CMOS технология также означает, что она может соответствовать оптимальной цели стоимости кластера GPU в 100 долларов за radix.
Программируемые КФ ОСС еще больше укрепляют архитектуры центров обработки данных ИИ двумя критическими способами. Во-первых, они обеспечивают быструю переконфигурацию интерконнектов GPU, чтобы рабочие нагрузки могли быть выполнены более эффективно и завершены быстрее. Когда обучение ИИ эволюционирует, топологии связи должны меняться динамически — даже внутри задания обучения — без потери пакетов. Это требует чрезвычайно быстрых времен переконфигурации, область, в которой масштабируемость КФ ОСС фундаментально превосходит подходы на основе МОС, поддерживая переконфигурацию и времени транзакции на несколько порядков быстрее, чем технологии МОС.
Во-вторых, программируемость КФ ОСС позволяет интегрировать дополнительные функции непосредственно в коммутационную ткань без масштабирования форм-фактора. Возможности, такие как реальное телескопирование через интегрированные фотодетекторы SiGe и усиление связи, могут быть включены для улучшения наблюдаемости и повышения устойчивости к сбоям. Хотя коммутаторы ОСС на основе МОС обычно вводят 2–3 дБ оптических потерь, реализации КФ ОСС могут быть спроектированы так, чтобы быть эффективно без потерь, улучшая общую гибкость и эффективность системы.
Взгляд в будущее
Поскольку исторические сети центров обработки данных жесткие и не могут идти в ногу с меняющимися потребностями центров обработки данных ИИ, рынок программируемой технологии КФ представляет собой многомиллиардную возможность. Вместе с этим огромным бумом появляется необходимость сотрудничества и кооперации среди бизнесов, которые находятся в сердце этой новой технологии. С этой целью существует организация стандартизации ОСП — которая включает Google, Microsoft, Lumentum и других инноваторов — целью которой является сделать программный интерфейс для сетевого менеджера, использующего ОСС, таким стандартным и простым в использовании, как только возможно. Вместе эти компании хотят поделиться своими перспективами и создать стандарты, чтобы продвинуть технологию вперед и ускорить принятие.
Когда ИИ стимулирует эволюцию в нашем мире, сети центров обработки данных ИИ также должны эволюционировать и быть готовыми к будущему, чтобы поддерживать его. Программируемые КФ ОСС позволяют компаниям создавать на пике инноваций и осознавать новые и интересные возможности для всех.












