Опросы под угрозой: ИИ-агенты ставят под сомнение результаты социологических исследований / Все новости / Главная

Социальный дата-сайентист Лорен Лик считает, что опросы по-прежнему остаются важным инструментом исследования, но предупреждает: они сталкиваются с серьёзными вызовами. Причина — резкое снижение участия реальных людей и всё более активное внедрение искусственного интеллекта, заменяющего живых респондентов. 

Несмотря на тревожную ситуацию, Лик отмечает, что ведущие исследовательские компании уже работают над инновационными решениями, чтобы сохранить ценность опросов. "Если мы хотим, чтобы опросы выжили перед лицом этих угроз, нужно максимально сосредоточиться на повышении качества данных", — подчёркивает она.

ИИ-агенты вместо людей

Ещё недавно опросы были краеугольным камнем политических прогнозов, маркетинговых стратегий и выработки государственной политики. Однако сегодня они переживают скрытый, но глубокий кризис. По словам Лик, он вызван двумя взаимосвязанными тенденциями: резким снижением участия людей и растущим числом ИИ-агентов, заполняющих анкеты вместо настоящих пользователей.

Если в 1970–1980-х годах участие в опросах составляло 30–50%, то сегодня этот показатель упал до 5%. При этом снижение вовлечённости людей — лишь половина проблемы. Лик демонстрирует, насколько легко автоматизировать прохождение опросов: ей удалось создать на Python простую программу, позволившую ИИ-агенту отвечать на вопросы за неё.

Для этого, по её словам, достаточно доступа к мощной языковой модели (в данном случае — API от OpenAI), простого парсера опросов (например, .txt-файла или формата JSON от Qualtrics или Typeform) и генератора "персон", переключающегося между типами респондентов вроде "городской левый", "сельский центрист" или "пессимист по климату". Самое трудоёмкое — настроить взаимодействие с интерфейсом опроса. По её словам, при желании систему можно масштабировать до сотен ботов. Хотя Лик не использовала своего агента в реальных условиях, она утверждает, что другие уже это делают.

Почему это плохо?

Последствия подобных изменений серьёзны. В политике, где часто применяют статистическую корректировку для учёта недопредставленных групп, ИИ-ответы нарушают базовые допущения этих методов. Синтетические агенты, как правило, имитируют усреднённое мнение, заимствованное из популярных онлайн-источников. Это приводит к устойчивым, но систематически искажённым результатам, исключающим крайние или уникальные точки зрения.

Аналогичная проблема наблюдается в маркетинге. Ответы ИИ выглядят логично и последовательно, но не отражают реального поведения потребителей. "Синтетические пользователи никогда не возненавидят ваш продукт иррационально, не запутаются в интерфейсе и не поймут неправильно ваш слоган", — отмечает Лик. Это приводит к созданию товаров, ориентированных на усреднённого потребителя, игнорируя реальные, особенно маргинальные или сложные сегменты аудитории.

В зоне риска и государственная политика. Опросы помогают государствам планировать услуги и распределять ресурсы. Если результаты будут формироваться преимущественно ИИ-ответами, уязвимые группы могут стать "статистически невидимыми", а значит, недополучат жизненно важные услуги.

Хуже всего, по словам Лик, — возможный замкнутый цикл: "Когда агентства 'подтверждают' спрос на основе искажённых данных, будущие выборки и распределение ресурсов становятся всё менее точными".

Что с этим делать?

Лик предлагает несколько решений. Во-первых, опросы должны стать более интересными и удобными: мобильная адаптация, сокращённое время прохождения, элементы сторителлинга. Во-вторых, необходимо активнее использовать технологии для выявления ИИ-ответов — анализ стиля текста, энтропии, метаданных и добавление элементов, с которыми ИИ не справится (например, получение призов лично).

Однако она подчёркивает, что даже самые распространённые меры — от капч до анализа IP — можно легко обойти. "Поверьте, на это нужно гораздо меньше кода, чем вы думаете", — говорит исследователь.

Третье направление — умные и адресные поощрения, особенно для представителей недопредставленных групп. "Если вы предлагаете 50 центов за 10 минут умственной активности, не удивляйтесь, что получаете ответы от ботов и переутомлённых фрилансеров", — иронизирует Лик.

Наконец, она призывает шире взглянуть на способы получения данных о людях. Опросы — не единственный источник. Цифровые следы, поведенческие данные и административные записи могут дать более объёмную, пусть и менее структурированную, картину. "Думайте об этом как о переходе от одного снимка к панораме. Да, будет грязнее. Но и честнее", — заключает Лик.

 

Похожие новости
Комментарии

comments powered by Disqus
Мы в социальных сетях: