Формирование наборов данных при проведении секвенциального анализа событий

Представлена разработка и реализация адаптации алгоритма обнаружения и прогнозирования нарушений на основе частых наборов событий. Особенностью данной адаптации является формирование транзакций по времени событий, использование собственных скриптов, а также принятие минимальной границы для показателя достоверности, равной 80 %, что позволяет уменьшить количество ложных срабатываний. Обучающий набор данных, на котором модель создается и обучается, а затем тестируется и используется для предсказания значений в других наборах данных, представляет собой отметки о передвижении персонала по реальному предприятию через систему контроля доступа. На примере исследования данного набора показано, что благодаря предложенной адаптации можно выявлять нарушения и нетипичное поведение, проявляющиеся в невыполнении ассоциативных правил, которые создаются на основе частых наборов событий, полученных в результате работы алгоритма Frequent Pattern-Growth. Применимость предложенной адаптации подтверждена программным прототипом, разработанным на основе программной платформы для обработки данных RapidMiner и скриптов на языке программирования Groovy.

Авторы: И. Ю. Трубицын, Я. А. Бекенёва

Направление: Информатика, вычислительная техника и управление

Ключевые слова: Интеллектуальный анализ данных, секвенциальный анализ событий, выявление нарушений, ассоциативные правила


Открыть полный текст статьи