Парадокс интернета: Анонимность не гарантирует приватности / Все новости / Главная

Считаете, что можно безопасно передавать свои данные ресурсам, которые гарантируют анонимность? Напрасно. Согласно новому исследованию, опубликованному в журнале Nature Communications, анонимизации данных недостаточно для защиты приватности пользователей.

На первый взгляд, такая идея звучит парадоксально, ведь многие пользователи привыкли считать понятия «анонимность» и «приватность» абсолютно тождественными. Но, по словам исследователей, даже анонимизированную базу данных можно «вскрыть», отследив реальные личности пользователей.

Когда вы соглашаетесь с тем, что какое-либо приложение или сайт будут собирать информацию о вас, вам, как правило, обещают, что собранные данные будут анонимизированными. То есть, вместо имени, фамилии и точного адреса ресурс собирает самую общую информацию - пол, возраст, регион проживания и прочие данные без конкретики. Предполагается, что в таком виде данные не нуждаются в особой защите, так как они не позволяют выйти конкретную личность. Потому базы данных могут свободно передаваться сторонним компаниям - рекламным сетям, аналитикам, брокерам данных. 

Тем не менее, исследователям удалось на практике разобрать такую базу, используя технологию машинного обучения. В качестве эксперимента ученые проанализировали анонимизированную базу с неполным набором данных, которая содержала всего 15 параметров, включая возраст, пол и семейное положение пользователей. Этого хватило, чтобы установить реальные личности 99,98% американских пользователей. 

«Хотя тридцатилетних людей мужского пола, проживающих в Нью-Йорке, может быть очень много, гораздо меньшее их количество родилось 5 января, водит красный спортивный автомобиль и живет с двумя дочерьми и собакой», - говорит один из авторов исследования, доктор Люк Роше из Лувенского католического университета в Бельгии. 

Конечно, в деанонимизации личности по ряду параметров нет ничего принципиально нового. С этим мог бы справиться и живой человек. Вот только человеку для этого потребуется в сотни раз больше времени, к тому же в работе человека существует вероятность ошибки. Нейросеть работает быстро и не ошибается. А значит, в современном мире любая «анонимизированная» база данных может считаться скомпрометированной. Чем больше «анонимных» параметров собирает ресурс или приложение, тем проще по ним восстановить личности пользователей. А зная личности людей, владелец базы сможет работать уже не с абстрактными профилями, а формировать индивидуальные досье на каждого конкретного пользователя.

По мнению ученых, теперь всем следует гораздо внимательнее относиться к проблеме сбора данных. «Компании и правительства преуменьшают риск идентификации, утверждая, что наборы данных, которые они продают, являются неполными. Наши результаты опровергают это», - говорит ведущий автор исследования доктор Ив-Александр де Монжуа из Имперского колледжа Лондона. 

«Нас часто уверяют, что анонимизация сохранит нашу личную информацию в безопасности. Наша статья доказывает, что ее недостаточно для защиты частной жизни людей», - говорит соавтор исследования, доктор Жюльен Эндрикк из Лувенского католического университета в Бельгии. 

Комментарии

comments powered by Disqus
Мы в социальных сетях: