Использование технологии TextMining для выявления скрытых угроз в сообщениях, распространяемых по социальным сетям
Предложено решение задачи анализа текста с применением технологии TextMining для обнаружения угроз, скрытых в сообщениях, которыми обмениваются пользователи в социальных сетях. Обсуждаются возможности технологии TextMining в задачах выявления знаний в неструктурированных информационных массивов. Последовательность анализа текста представлена в виде методики. Раскрыто содержание этапов методики и рассмотрены основные приемы, используемые на каждом этапе. Выделены способы вычисления функций взвешивания, на основе которых формируется список ключевых слов и словосочетаний. Рассмотрены способы построения семантических сетей на основе множества ключевых слов. Для автоматизации анализа текста разработан программный комплекс, реализующий технологию TextMining. В функции программного комплекса входит выявление ключевых слов, связей, эмоционального портрета пользователя, что позволяет перейти от данных к их смыслу и сделать выводы об информационной безопасности текста.
Авторы: Б. Я. Советов, Т. М. Татарникова, Яшин А. И.
Направление: Информатика, вычислительная техника и управление
Ключевые слова: TextMining, семантическая сеть, ключевые слова, частота появления слов, смысл текста, тема, классификация текста, словарь, тональность текста, программный комплекс
Открыть полный текст статьи