Прогнозирование временных рядов. Прогнозирование платежей физических клиентов энергосбытовой компании

Решается задача прогнозирования временного ряда, описывающего платежи за электроэнергию физических клиентов энергосбытовой компании. Временной ряд сложен и нестационарен, в нем выражены сезонность и тренд, что указывает на невозможность выбора простых методов прогнозирования – таких, как экстраполяция или метод наивного прогнозирования. В связи с этим для решения задачи были выбраны различные методы машинного обучения и нейронные сети, которые способны находить сложные зависимости в данных и учиться их прогнозировать. Для решения задачи были выбраны несколько регрессионных моделей машинного обучения, часто используемых в решении задач прогнозирования временных рядов: XGBoost, SVM, LSSVM, LGBM и GradientBoosting, а также нейронные сети – LSTM, RNN, CNN и т. д. Лучший результат был получен при помощи машины опорных векторов регрессии (SVR). Реализация этой модели была интегрирована в веб-приложение для прогнозирования временных рядов. Рассматривается также алгоритм определения стационарности ряда при помощи теста Дики–Фуллера и приведения временного ряда к стационарному при помощи дифференцирования временного ряда. Кроме этого, в статье рассматривается проблема прогнозирования выбросов (пиков). Большинство методов прогнозирования не решают проблему прогнозирования пиков, поскольку они считают их статистическими выбросами. В статье эта проблема решается выделением пиков в отдельный временной ряд и прогнозированием их отдельно от основного ряда с дальнейшим соединением двух прогнозов.

Авторы: А. В. Ерошкин, М. А. Потапова, А. Е. Лончина

Направление: Информатика, вычислительная техника и управление

Ключевые слова: временные ряды, прогнозирование, машина опорных векторов, сезонность, декомпозиция, регрессия, LSTM, прогнозирование пиков (выбросов)


Открыть полный текст статьи