Компания Broadcom работает над новой технологией, которая позволи подключать оптоволкно прямо к графическим процессорам (GPU) и другим мощным специализированным чипам. Такой подход может значительно увеличить пропускную способность и снизить энергопотребление системы.
Оптические соединения, известные как "co-packaged optics" (CPO), интегрируются непосредственно в GPU, обеспечивая более высокую скорость передачи данных. Broadcom продемонстрировала свои последние достижения в этой области на конференции Hot Chips, где компания представила "оптический движок" с общей пропускной способностью 1,6 ТБ/с.
Эта новая технология может обеспечить передачу данных без ошибок на один чиплет, достигая уровня производительности, сопоставимого с Nvidia NVLink и другими специализированными решениями для дата-центров. Однако Broadcom еще не интегрировала свои оптические соединения в коммерчески доступный GPU, такой как A100 или MI250X. Вместо этого компания использовала тестовый чип, имитирующий реальный GPU, для демонстрационных целей.
По словам Маниша Мехты, вице-президента Broadcom по оптическим системам, медные соединения начинают деградировать всего через пять метров. Оптические коммуникации давно рассматриваются как решение этой проблемы, но они традиционно требуют гораздо больше энергии, чем медные технологии. Например, Nvidia оценивает, что система NVL72, работающая на оптике, потребует дополнительных 20 киловатт на стойку, помимо 120 киловатт, которые уже потребляет система.
Broadcom удалось снизить энергопотребление с помощью технологии co-packaged optics, которая размещает отдельные трансиверы в непосредственном контакте с GPU. Компания использовала технологию упаковки TSMC "chip-on-wafer-on-substrate" (CoWoS), чтобы соединить пару высокопроизводительных стеков памяти с вычислительным ядром. Логические и запоминающие компоненты чипа находятся на кремниевом интерпозере, а оптический движок Broadcom расположен на подложке.
Мехта объяснил, что технология CPO может соединить до 512 отдельных GPU в восьми стойках, позволяя всей установке функционировать как единая система. Для сравнения, NVL72 от Nvidia может достичь аналогичных возможностей унифицированных вычислений с "всего" 72 GPU, что позволяет предположить, что решение Broadcom может в конечном итоге обеспечить конкурентное преимущество для будущих задач искусственного интеллекта.