Учёные из Австралии обнаружили новую и почти невидимую угрозу приватности в онлайн-рекламе. Оказывается, по одному только потоку рекламных объявлений, которые показывает вам интернет, искусственный интеллект способен с высокой точностью определить ваш пол, возраст, уровень образования, политические взгляды, социальный статус и даже финансовое положение. И для этого ему не нужны ни история браузера, ни ваши личные данные.

Исследование провели специалисты ARC Centre of Excellence for Automated Decision-Making and Society при Университете Нового Южного Уэльса (UNSW Sydney) и Технологическом университете Квинсленда (QUT). Они проанализировали более 435 000 рекламных объявлений, которые увидели 891 австралийский пользователь в рамках проекта Australian Ad Observatory.
Как ИИ «читает» рекламу
Используя современные большие языковые модели, исследователи показали, что ИИ может строить подробный профиль человека, опираясь только на паттерны рекламных показов. Рекламные системы сами подбирают объявления под предполагаемые интересы и характеристики пользователя, поэтому последовательность баннеров становится своеобразным «цифровым отпечатком».
Результаты впечатляют: ИИ не только справлялся с задачей, но в ряде случаев превосходил людей по точности, при этом работал в 50 раз быстрее и в 200 раз дешевле. Профили можно составлять даже по коротким сессиям просмотра — длительное слежение не требуется.
«Реклама, которую видит человек, — это не случайный набор, — объясняет ведущий автор исследования Байю Чен (Baiyu Chen) из UNSW. — Системы таргетинга оптимизируют показы на основе inferred профилей. Мы впервые эмпирически доказали, что поток рекламы сам по себе является высокоточным цифровым следом, который позволяет реконструировать приватные атрибуты человека».
Как это можно использовать во вред
Авторы предупреждают: такая технология открывает новый вектор атаки на приватность. Злоумышленнику не нужно взламывать аккаунты или устанавливать вредоносное ПО. Достаточно незаметно собирать показываемую рекламу — например, через обычные браузерные расширения (блокировщики рекламы, купонные сервисы, переводчики страниц), которые имеют легитимный доступ к содержимому страницы.
«Это крайне опасный сценарий из-за своей скрытности и масштабируемости, — отмечают исследователи. — Вместо специализированного malware можно просто использовать уже установленные миллионами людей безобидные расширения».
Платформы запрещают прямой таргетинг по чувствительным категориям, но алгоритмы всё равно косвенно кодируют эти признаки в потоке рекламы. Теперь ИИ может легко «расшифровывать» эту информацию. Это создаёт серьёзную брешь в существующих механизмах защиты приватности.
Учёные подчёркивают: текущие регуляции сосредоточены на сборе данных, но почти не учитывают, что можно вывести из контента, который человек просто видит. Нужны новые подходы к управлению веб-АИ в эпоху генеративного интеллекта.
