Intel и AMD хотят сделать так, чтобы ИИ лучше работал на обычных процессорах

23 июня 2026, 18:00 902

Intel и AMD впервые за долгое время совместно представили новое расширение архитектуры x86 — Advanced Compute Extensions (ACE). Цель — сделать центральные процессоры значительно эффективнее при выполнении задач искусственного интеллекта, особенно там, где использование видеокарты нецелесообразно или невозможно.

Новое расширение не претендует на замену GPU в крупных задачах обучения моделей. Вместо этого оно нацелено на вывод (inference), edge-устройства, задачи с жёсткими требованиями к задержкам и сценарии, где пересылка данных между CPU и GPU становится узким местом.

Большинство современных ИИ-нагрузок завязано на матричных операциях (прежде всего умножении матриц). Традиционные процессоры x86 справлялись с этим через расширения AVX, но они изначально не были оптимизированы под тяжёлые матричные вычисления. В результате для многих задач приходилось использовать GPU, даже когда это было неэффективно с точки зрения энергопотребления и задержек.

ACE решает эту проблему напрямую на уровне процессора. Теперь CPU сможет выполнять определённые ИИ-операции значительно эффективнее, без необходимости постоянно гонять данные туда-обратно между центральным процессором и видеокартой.

Что предлагает ACE

Advanced Compute Extensions добавляют в x86 выделенное оборудование для матричных операций, сохраняя при этом существующую структуру регистров AVX10. Это важное решение: разработчикам не придётся полностью переписывать код или переходить на новые форматы данных.

Ключевые особенности:

Поддержка широкого набора типов данных, используемых в машинном обучении (INT8, INT32, FP8, FP16, FP32, BF16).
Нативная поддержка форматов MX с блочным масштабированием от Open Compute Project (чего нет в AVX10).
Использование 512-битных входов для максимальной совместимости.
Реализация, не зависящая от конкретного производителя (implementation-agnostic), что упрощает поддержку в фреймворках вроде PyTorch и TensorFlow.

На уровне отдельных инструкций ACE может выполнять до 16 раз больше операций, чем AVX10. Это не означает, что программы в целом станут в 16 раз быстрее, но позволяет значительно повысить эффективность использования инструкций, снизить энергопотребление и уменьшить нагрузку на память.

Где это будет полезно

ACE особенно актуально для:

Edge-устройств и embedded-систем, где нет места или энергии для мощной GPU.
Задач с низкой задержкой (latency-sensitive), где пересылка данных между CPU и GPU критична.
Гетерогенных вычислений, когда NPU (нейронный процессор) либо недоступен, либо его использование усложняет разработку.
Небольших и средних моделей, где GPU может быть избыточным.

При этом крупные задачи обучения моделей по-прежнему будут оставаться за специализированными ускорителями.

Совместная работа Intel и AMD над общим расширением x86 — редкое и важное событие. Оно показывает, что обе компании видят будущее центральных процессоров не только как универсальных вычислителей, но и как более активных участников в мире ИИ.

ACE не сделает GPU ненужными, но даст разработчикам и производителям оборудования больше гибкости. В некоторых сценариях CPU сможет выполнять работу чище, экономичнее и с меньшими задержками, чем при использовании дискретной видеокарты.

Читайте также: Microsoft наконец убивает заикание шейдеров в играх Xbox на ПК — но пока только для AMD

Спецификация ACE версии 1 уже опубликована (июнь 2026). Теперь дело за производителями процессоров и разработчиками ПО — насколько быстро и широко новое расширение будет реализовано и поддержано.