Intel и AMD впервые за долгое время совместно представили новое расширение архитектуры x86 — Advanced Compute Extensions (ACE). Цель — сделать центральные процессоры значительно эффективнее при выполнении задач искусственного интеллекта, особенно там, где использование видеокарты нецелесообразно или невозможно.

Новое расширение не претендует на замену GPU в крупных задачах обучения моделей. Вместо этого оно нацелено на вывод (inference), edge-устройства, задачи с жёсткими требованиями к задержкам и сценарии, где пересылка данных между CPU и GPU становится узким местом.
Большинство современных ИИ-нагрузок завязано на матричных операциях (прежде всего умножении матриц). Традиционные процессоры x86 справлялись с этим через расширения AVX, но они изначально не были оптимизированы под тяжёлые матричные вычисления. В результате для многих задач приходилось использовать GPU, даже когда это было неэффективно с точки зрения энергопотребления и задержек.
ACE решает эту проблему напрямую на уровне процессора. Теперь CPU сможет выполнять определённые ИИ-операции значительно эффективнее, без необходимости постоянно гонять данные туда-обратно между центральным процессором и видеокартой.
Что предлагает ACE
Advanced Compute Extensions добавляют в x86 выделенное оборудование для матричных операций, сохраняя при этом существующую структуру регистров AVX10. Это важное решение: разработчикам не придётся полностью переписывать код или переходить на новые форматы данных.
Ключевые особенности:
- Поддержка широкого набора типов данных, используемых в машинном обучении (INT8, INT32, FP8, FP16, FP32, BF16).
- Нативная поддержка форматов MX с блочным масштабированием от Open Compute Project (чего нет в AVX10).
- Использование 512-битных входов для максимальной совместимости.
- Реализация, не зависящая от конкретного производителя (implementation-agnostic), что упрощает поддержку в фреймворках вроде PyTorch и TensorFlow.
На уровне отдельных инструкций ACE может выполнять до 16 раз больше операций, чем AVX10. Это не означает, что программы в целом станут в 16 раз быстрее, но позволяет значительно повысить эффективность использования инструкций, снизить энергопотребление и уменьшить нагрузку на память.
Где это будет полезно
ACE особенно актуально для:
- Edge-устройств и embedded-систем, где нет места или энергии для мощной GPU.
- Задач с низкой задержкой (latency-sensitive), где пересылка данных между CPU и GPU критична.
- Гетерогенных вычислений, когда NPU (нейронный процессор) либо недоступен, либо его использование усложняет разработку.
- Небольших и средних моделей, где GPU может быть избыточным.
При этом крупные задачи обучения моделей по-прежнему будут оставаться за специализированными ускорителями.
Совместная работа Intel и AMD над общим расширением x86 — редкое и важное событие. Оно показывает, что обе компании видят будущее центральных процессоров не только как универсальных вычислителей, но и как более активных участников в мире ИИ.
ACE не сделает GPU ненужными, но даст разработчикам и производителям оборудования больше гибкости. В некоторых сценариях CPU сможет выполнять работу чище, экономичнее и с меньшими задержками, чем при использовании дискретной видеокарты.
Спецификация ACE версии 1 уже опубликована (июнь 2026). Теперь дело за производителями процессоров и разработчиками ПО — насколько быстро и широко новое расширение будет реализовано и поддержано.
