Краулер для формирования датасета пользовательских соглашений на использование персональных данных

Сбор и использование персональных данных для удовлетворения цифровых потребностей пользователей сегодня являются крайне распространенными сценариями. Пользователи активно предоставляют свои персональные данные для улучшения качества цифровых сервисов. В то же время, пользовательские соглашения – единственный инструмент информирования о том, какие персональные данные и как используются. Существуют разные подходы к повышению прозрачности пользовательских соглашений, однако для большинства этих подходов требуются данные для проведения экспериментов и для обучения моделей искусственного интеллекта. В настоящее время датасетов для исследования пользовательских соглашений немного, а те, которые имеются, не покрывают рынок умных устройств. Умные устройства генерируют огромный трафик, состоящий из персональных данных, поэтому их пользовательские соглашения заслуживают не меньшего внимания. В данной работе авторы предлагают новый способ формирования датасета пользовательских соглашений, а также представляют соответствующий инструмент, обладающий помимо основных функций рядом улучшений для обхода блокировок и captcha.

Авторы: М. Д. Кузнецов, Е. С. Новикова

Направление: Информатика, вычислительная техника и управление

Ключевые слова: соглашения об использовании персональных данных, краулер, датасет, сбор данных, очистка данных


Открыть полный текст статьи