Влияние способов восстановления пропущенных данных на точность прогнозирования электропотребления алгоритмом градиентного бустинга
https://doi.org/10.37493/2307-907X.2025.6.5
Аннотация
Введение. В низковольтных сетях активно внедряют интеллектуальные системы учета электроэнергии (ИСУЭ), данные которых могут использоваться для прогнозирования потребления. Однако наличие пропусков в данных увеличивает погрешность результатов прогноза. Цель. Сравнительная оценка влияния различных методов восстановления пропущенных значений в данных ИСУЭ на точность прогнозирования электропотребления. Материалы и методы. Исследование проведено на основе реального набора данных, содержащего почасовые значения активной энергии 132 однофазных бытовых потребителей одного из регионов Северного Кавказа за 25-месячный период. Применены четыре способа восстановления пропусков в данных: средним значением, медианным значением, интерполяцией и медианой по каждому часу суток. Для прогнозирования часовых графиков электропотребления на месяц, неделю и сутки вперед использована модель машинного обучения XGBoost, оценка качества прогноза выполнялась по метрике RMSE. Результаты и обсуждение. На основе анализа средних значений показателя RMSE сделан вывод о том, что выбор способа усреднения оказывает некоторое влияние на месячный интервал прогноза, для которого медианные способы заполнения недостающих данных дают меньшее на 0,066 кВт·ч, или 12,6 %, значение RMSE по сравнению со способом заполнения отсутствующих данных средними значениями и на 0,053 кВт·ч, или 10,2 %, по сравнению со способом заполнения отсутствующих данных интерполяцией. При недельном горизонте прогнозирования лучший результат дает медианный по часам с преимуществом RMSE над остальным способами 0,013–0,021 кВт·ч, а для суточного прогноза наибольшую эффективность показывает медианный способ c RMSE 0,012–0,023 кВт·ч. Заключение. На месячном горизонте прогноза целесообразно применять медианные способы заполнения недостающих данных. При прогнозе на неделю и сутки все рассмотренные способы практически равноценны.
Об авторах
А. Г. ШидовРоссия
Арсен Гумарович Шидов – аспирант кафедры АЭСиЭ, факультет нефтегазовой инженерии
Ю. Г. Кононов
Россия
Юрий Григорьевич Кононов – доктор технических наук, профессор, заведующий кафедрой автоматизированных электроэнергетических систем и электроснабжения, факультет нефтегазовой инженерии
Д. А. Костюков
Россия
Дмитрий Александрович Костюков – кандидат технических наук, доцент кафедры автоматизированных электроэнергетических систем и электроснабжения, факультет нефтегазовой инженерии
М. Р. Куршев
Россия
Мурат Рустемович Куршев – аспирант кафедры автоматизированных электроэнергетических систем и электроснабжения, факультет нефтегазовой инженерии
Б. Г. Шидов
Россия
Беслан Гумарович Шидов – магистр кафедры АЭСиЭ, факультет нефтегазовой инженерии
Список литературы
1. Концепция «Цифровая трансформация 2030» / ПАО «Россети». М., 2018. 31 с. URL: https://rosseti.ru/investment/Kontseptsiya_Tsifrovaya_transformatsiya_2030.pdf.
2. О порядке предоставления доступа к минимальному набору функций интеллектуальных систем учета электрической энергии (мощности): постановление Правительства РФ от 19 июня 2020 г. № 890 (в ред. от 29 марта 2024 г.) // Официальный интернет-портал правовой информации. URL: http://publication.pravo.gov.ru/Document/View/0001202006230034.
3. О внесении изменений в отдельные законодательные акты Российской Федерации в связи с развитием систем учета электрической энергии (мощности) в Российской Федерации: федеральный закон РФ от 27 дек. 2018 г. № 522-ФЗ : принят Гос. Думой Федер. Собр. РФ 19 дек. 2018 г.: одобр. Советом Федерации Федер. Собр. РФ 21 дек. 2018 г. // Рос. газ. 2018. 29 дек. № 295; Собр. законодательства Рос. Федерации. 2018. 31 дек. № 53 (ч. I). Ст. 8448. URL: http://publication.pravo.gov.ru/Document/View/0001201812290002
4. Shimmari M. Al. and Wallom D. Short-term load forecasting using UK non-domestic businesses to enable demand response aggregators’ participation in electricity markets // IEEE PES Grid Edge Technologies Conference & Exposition (Grid Edge), San Diego, CA, USA. 2023. pp. 1-5, https://doi.org/10.1109/GridEdge54130.2023.10102712.
5. Gao H.-X., S. Kuenzel and X.-Y. Zhang. A Hybrid ConvLSTM-Based Anomaly Detection Approach for Combating Energy Theft // IEEE Transactions on Instrumentation and Measurement. 2022. Vol. 71. P. 2517110. https://doi.org/10.1109/TIM.2022.3201569.
6. Mark Ryan, Luca Massaron. Machine Learning for Tabular Data: XGBoost, Deep Learning, and AI. Manning, 2025. 504 p.
7. Sobrino E. M., Santiago A. V., González A. M. Forecasting the Electricity Hourly Consumption of Residential Consumers with Smart Meters using Machine Learning Algorithms // IEEE Milan PowerTech: proceedings. Milan, Italy, 2019. P. 1–6. https://doi.org/10.1109/PTC.2019.8810902.
8. Munawar S. Novel FDIs-based data manipulation and its detection in smart meters' electricity theft scenarios / S. Munawar, Z. A. Khan, N. I. Chaudhary, N. Javaid, M. A. Z. Raja, A. H. Milyani, A. A. Azhari // Frontiers in Energy Research. 2022. Vol. 10, article 1043593. https://doi.org/10.3389/fenrg.2022.1043593.
9. Chen Z. Electricity Theft Detection Using Deep Bidirectional Recurrent Neural Network / Z. Chen, D. Meng, Y. Zhang, T. Xin, D. Xiao // 22nd International Conference on Advanced Communication Technology (ICACT). Phoenix Park, Korea (South), 2020. P. 401-406. https://doi.org/10.23919/ICACT48636.2020.9061565.
10. Маниковский А. С., Мухопад А. Ю. Методы восстановления пропущенных измерений во временных рядах в системе прогнозирования электропотребления // Инженерный вестник Дона. 2022. № 7. URL: http://cyberleninka.ru/article/n/metody-vosstanovleniya-propuschennyh-znacheniy-vo-vremennyh-ryadah-v-sisteme-prognozirovaniya-elektropotrebleniya.
11. Raviprabhakaran V. P. Pusuluri, B. Nendralla [et al.] Household Power Consumption Analysis using Machine Learning // IEEE 4th International Conference on Sustainable Energy and Future Electric Transportation (SEFET): proceedings. 2024. https://doi.org/10.1109/SEFET61574.2024.10718254.
12. Asghar, Ehtisham & Hill, Martin & Şengör, Ibrahim & Lynch, Conor & Quang An, Phan. Validation of a 24-hourahead Prediction model for a Residential Electrical Load under diverse climate. 2025. https://doi.org/10.48550/arXiv.2505.00348.
Рецензия
Для цитирования:
Шидов А.Г., Кононов Ю.Г., Костюков Д.А., Куршев М.Р., Шидов Б.Г. Влияние способов восстановления пропущенных данных на точность прогнозирования электропотребления алгоритмом градиентного бустинга. Вестник Северо-Кавказского федерального университета. 2025;(6):46-55. https://doi.org/10.37493/2307-907X.2025.6.5
For citation:
Shidov A.G., Kononov Yu.G., Kostyukov D.A., Kurshev M.R., Shidov B.G. Impact of missing data recovery methods on the accuracy of electricity consumption forecasting by gradient boosting algorithm. Newsletter of North-Caucasus Federal University. 2025;(6):46-55. (In Russ.) https://doi.org/10.37493/2307-907X.2025.6.5
JATS XML























