Краулер для формирования датасета пользовательских соглашений на использование персональных данных
Сбор и использование персональных данных для удовлетворения цифровых потребностей пользователей сегодня являются крайне распространенными сценариями. Пользователи активно предоставляют свои персональные данные для улучшения качества цифровых сервисов. В то же время, пользовательские соглашения – единственный инструмент информирования о том, какие персональные данные и как используются. Существуют разные подходы к повышению прозрачности пользовательских соглашений, однако для большинства этих подходов требуются данные для проведения экспериментов и для обучения моделей искусственного интеллекта. В настоящее время датасетов для исследования пользовательских соглашений немного, а те, которые имеются, не покрывают рынок умных устройств. Умные устройства генерируют огромный трафик, состоящий из персональных данных, поэтому их пользовательские соглашения заслуживают не меньшего внимания. В данной работе авторы предлагают новый способ формирования датасета пользовательских соглашений, а также представляют соответствующий инструмент, обладающий помимо основных функций рядом улучшений для обхода блокировок и captcha.
Авторы: М. Д. Кузнецов, Е. С. Новикова
Направление: Информатика, вычислительная техника и управление
Ключевые слова: соглашения об использовании персональных данных, краулер, датасет, сбор данных, очистка данных
Открыть полный текст статьи