Tổng quan nghiên cứu
Trong bối cảnh phát triển kinh tế xã hội nhanh chóng, nhu cầu sử dụng điện năng tại Việt Nam, đặc biệt là khu vực miền Nam, đã tăng trưởng mạnh mẽ. Theo báo cáo của Tổng cục Thống kê, GDP Việt Nam năm 2023 tăng 5,05% so với năm trước, trong đó khu vực dịch vụ đóng góp tới 62,29%. Tương ứng, tổng công suất nguồn điện đạt khoảng 80.555 MW, với tỷ trọng năng lượng tái tạo chiếm 55,3%. Tổng điện năng thương phẩm năm 2023 đạt 251,25 tỷ kWh, tăng 3,52% so với năm 2022. Riêng Tổng Công ty Điện lực Miền Nam (EVNSPC) cung ứng 85,167 tỷ kWh, tăng 2,54% so với năm trước, trong đó nhóm khách hàng có sản lượng tiêu thụ trên 1 triệu kWh/năm chiếm gần 49% điện năng thương phẩm toàn EVNSPC.
Nhu cầu điện năng ngày càng tăng và phức tạp đặt ra thách thức lớn trong công tác dự báo để đảm bảo cân đối cung cầu, vận hành hiệu quả và phát triển bền vững hệ thống điện. Mục tiêu nghiên cứu của luận văn là xây dựng và so sánh các mô hình dự báo nhu cầu điện năng trung hạn cho các nhóm khách hàng sinh hoạt và thương mại của EVNSPC trong giai đoạn 2018-2023. Nghiên cứu tập trung vào việc áp dụng các mô hình chuỗi thời gian truyền thống (ARIMA, SARIMA) và mạng nơ-ron nhân tạo (NARX, MLFF) sử dụng ngôn ngữ Python và phần mềm PyCharm để lựa chọn mô hình dự báo phù hợp nhất.
Phạm vi nghiên cứu bao gồm dữ liệu điện năng tiêu thụ và nhiệt độ tại các tỉnh miền Nam như Bình Dương, Đồng Nai, Bà Rịa Vũng Tàu, Vĩnh Long, Cần Thơ, Kiên Giang. Ý nghĩa nghiên cứu thể hiện qua việc nâng cao độ chính xác dự báo, hỗ trợ EVNSPC trong quản lý nguồn điện, tối ưu hóa vận hành và hoạch định chiến lược phát triển hệ thống điện trong trung hạn.
Cơ sở lý thuyết và phương pháp nghiên cứu
Khung lý thuyết áp dụng
Luận văn dựa trên các lý thuyết và mô hình dự báo chuỗi thời gian và mạng nơ-ron nhân tạo, bao gồm:
Mô hình ARIMA (AutoRegressive Integrated Moving Average): Mô hình tuyến tính kết hợp thành phần tự hồi quy (AR), tích phân (I) để làm dừng chuỗi, và trung bình trượt (MA). ARIMA phù hợp với chuỗi thời gian có xu hướng và biến động tự nhiên.
Mô hình SARIMA (Seasonal ARIMA): Mở rộng ARIMA để xử lý yếu tố mùa vụ với các tham số mùa vụ (P, D, Q, m), giúp mô hình hóa các chu kỳ lặp lại theo mùa.
Mô hình NARX (Nonlinear AutoRegressive with Exogenous inputs): Mạng nơ-ron hồi quy phi tuyến có khả năng sử dụng các biến đầu vào ngoại sinh, phù hợp với dữ liệu có tính phi tuyến và ảnh hưởng từ các yếu tố bên ngoài như nhiệt độ.
Mô hình MLFF (Multilayer Feedforward Neural Network): Mạng nơ-ron truyền thẳng nhiều lớp, có khả năng học các hàm phi tuyến phức tạp, được thiết kế với một hoặc hai lớp ẩn để tránh hiện tượng quá khớp hoặc thiếu khớp.
Các khái niệm chính bao gồm dự báo phụ tải trung hạn (1 tháng đến 3 năm), sai số dự báo MAPE (Mean Absolute Percentage Error) và RMSE (Root Mean Squared Error) dùng để đánh giá hiệu quả mô hình.
Phương pháp nghiên cứu
Nguồn dữ liệu chính gồm dữ liệu điện năng thương phẩm hàng tháng của EVNSPC từ 2018 đến 2023 và dữ liệu nhiệt độ tương ứng thu thập từ trang web rp5.ru. Dữ liệu được xử lý, làm sạch và chuẩn hóa bằng phương pháp MinMaxScaler để đưa về thang đo [0,1], giúp tăng hiệu quả huấn luyện mô hình.
Phương pháp phân tích bao gồm:
Phân tích tương quan Pearson để xác định mối quan hệ giữa điện năng tiêu thụ và nhiệt độ tại các tỉnh.
Phân chia dữ liệu thành tập huấn luyện (80%, từ tháng 01/2018 đến tháng 08/2022) và tập kiểm tra (20%, từ tháng 09/2022 đến tháng 10/2023).
Xây dựng và huấn luyện các mô hình ARIMA, SARIMA, NARX, MLFF sử dụng Python với các thư viện như pandas, numpy, scikit-learn, Keras, TensorFlow.
Đánh giá mô hình dựa trên sai số MAPE và RMSE, trong đó MAPE được ưu tiên làm chỉ số chính.
Timeline nghiên cứu kéo dài từ tháng 11/2023 đến tháng 6/2024, bao gồm các bước thu thập dữ liệu, xây dựng mô hình, đánh giá và đề xuất giải pháp.
Kết quả nghiên cứu và thảo luận
Những phát hiện chính
Hiệu quả mô hình ARIMA:
- MAPE dự báo điện năng khách hàng sinh hoạt tại Bình Dương đạt 2,5%, Vĩnh Long 1,9%, Bà Rịa Vũng Tàu 3,1%.
- MAPE khách hàng thương mại tại Bình Dương là 3,4%, Vĩnh Long 3,7%, Cần Thơ 2,9%, Kiên Giang 3,8%, Đồng Nai 4,1%.
- RMSE dao động từ 0,19 đến 0,35, cho thấy độ chính xác khá cao với dữ liệu tuyến tính.
Hiệu quả mô hình SARIMA:
- MAPE khách hàng sinh hoạt tại Bình Dương 2,1%, Vĩnh Long 2,8%, Bà Rịa Vũng Tàu 3,3%.
- MAPE khách hàng thương mại tại Bình Dương 3,1%, Vĩnh Long 2,9%, Cần Thơ 2,3%, Kiên Giang 3,1%, Đồng Nai 3,2%.
- SARIMA cải thiện độ chính xác dự báo nhờ xử lý tốt yếu tố mùa vụ.
Mối tương quan nhiệt độ và điện năng:
- Khách hàng sinh hoạt tại Bà Rịa Vũng Tàu có hệ số tương quan nhiệt độ và điện năng là 0,362, mức tương quan dương trung bình khá.
- Khách hàng thương mại tại Bình Dương có hệ số tương quan âm rất yếu (-0,016), gần như không ảnh hưởng.
So sánh mô hình mạng nơ-ron (NARX, MLFF):
- Mạng NARX và MLFF cho kết quả dự báo có sai số MAPE thấp hơn so với ARIMA và SARIMA, đặc biệt với dữ liệu phi tuyến và có ảnh hưởng từ biến ngoại sinh như nhiệt độ.
- Mô hình MLFF với cấu trúc một lớp ẩn và số lượng nơ-ron được tối ưu hóa qua phương pháp thử-sai cho hiệu suất dự báo tốt nhất.
Thảo luận kết quả
Nguyên nhân chính của sự khác biệt hiệu quả giữa các mô hình là khả năng xử lý các đặc tính dữ liệu khác nhau. ARIMA và SARIMA phù hợp với chuỗi thời gian có tính tuyến tính và yếu tố mùa vụ rõ ràng, trong khi NARX và MLFF có ưu thế trong việc mô hình hóa các quan hệ phi tuyến và tác động của các biến ngoại sinh như nhiệt độ.
Kết quả tương quan nhiệt độ và điện năng cho thấy yếu tố khí hậu có ảnh hưởng khác nhau theo vùng và nhóm khách hàng, điều này giải thích tại sao mô hình mạng nơ-ron có thể cải thiện độ chính xác dự báo khi tích hợp biến ngoại sinh.
So sánh với các nghiên cứu gần đây cho thấy việc kết hợp mạng nơ-ron với các thuật toán học sâu như LSTM hoặc CNN có thể nâng cao hơn nữa độ chính xác, tuy nhiên trong phạm vi nghiên cứu này, các mô hình NARX và MLFF đã đáp ứng tốt yêu cầu dự báo trung hạn cho EVNSPC.
Dữ liệu có thể được trình bày qua biểu đồ so sánh sai số MAPE và RMSE giữa các mô hình cho từng nhóm khách hàng, giúp trực quan hóa hiệu quả và lựa chọn mô hình phù hợp.
Đề xuất và khuyến nghị
Triển khai mô hình MLFF cho dự báo trung hạn:
- Áp dụng mô hình MLFF đã được tối ưu để dự báo nhu cầu điện năng cho các nhóm khách hàng sinh hoạt và thương mại.
- Mục tiêu giảm sai số MAPE xuống dưới 2,5% trong vòng 1 năm tới.
- Chủ thể thực hiện: Bộ phận phân tích dữ liệu và công nghệ thông tin của EVNSPC.
Tích hợp biến ngoại sinh vào mô hình dự báo:
- Bổ sung dữ liệu thời tiết, đặc biệt là nhiệt độ, vào mô hình dự báo để nâng cao độ chính xác.
- Thời gian thực hiện: 6 tháng.
- Chủ thể: Phòng nghiên cứu và phát triển EVNSPC phối hợp với các đơn vị khí tượng thủy văn.
Xây dựng hệ thống tự động cập nhật và đánh giá mô hình:
- Phát triển hệ thống tự động thu thập dữ liệu, huấn luyện lại mô hình và đánh giá hiệu quả định kỳ.
- Mục tiêu đảm bảo mô hình luôn phù hợp với biến động thực tế.
- Thời gian: 12 tháng.
- Chủ thể: Ban công nghệ thông tin EVNSPC.
Đào tạo và nâng cao năng lực nhân sự:
- Tổ chức các khóa đào tạo về kỹ thuật dự báo và ứng dụng mạng nơ-ron cho cán bộ EVNSPC.
- Mục tiêu nâng cao khả năng vận hành và phát triển mô hình nội bộ.
- Thời gian: liên tục hàng năm.
- Chủ thể: Phòng nhân sự và đào tạo EVNSPC.
Đối tượng nên tham khảo luận văn
Các nhà quản lý và hoạch định chính sách ngành điện:
- Lợi ích: Hiểu rõ các phương pháp dự báo nhu cầu điện năng trung hạn, hỗ trợ ra quyết định chiến lược phát triển hệ thống điện.
Chuyên gia kỹ thuật và phân tích dữ liệu trong ngành năng lượng:
- Lợi ích: Áp dụng các mô hình dự báo hiện đại, nâng cao hiệu quả phân tích và dự báo phụ tải.
Các nhà nghiên cứu và sinh viên chuyên ngành kỹ thuật điện, công nghệ thông tin:
- Lợi ích: Tham khảo phương pháp nghiên cứu, ứng dụng mạng nơ-ron và phân tích chuỗi thời gian trong lĩnh vực năng lượng.
Doanh nghiệp cung cấp giải pháp công nghệ cho ngành điện:
- Lợi ích: Phát triển sản phẩm dự báo điện năng phù hợp với yêu cầu thực tế của EVNSPC và các đơn vị tương tự.
Câu hỏi thường gặp
Tại sao cần dự báo nhu cầu điện năng trung hạn?
Dự báo trung hạn giúp các đơn vị điện lực lập kế hoạch phát triển nguồn và lưới điện, đảm bảo cung cấp điện ổn định, tránh thiếu hụt hoặc dư thừa, đồng thời tối ưu chi phí vận hành.Mô hình nào cho kết quả dự báo chính xác nhất trong nghiên cứu?
Mô hình MLFF cho kết quả dự báo có sai số MAPE thấp nhất, đặc biệt khi tích hợp biến ngoại sinh như nhiệt độ, phù hợp với dữ liệu phi tuyến và biến động phức tạp.Dữ liệu nào được sử dụng để xây dựng mô hình?
Dữ liệu điện năng thương phẩm hàng tháng của EVNSPC từ 2018 đến 2023 và dữ liệu nhiệt độ tương ứng được thu thập từ trang web rp5.ru, đã được xử lý và chuẩn hóa.Sai số MAPE và RMSE có ý nghĩa gì trong đánh giá mô hình?
MAPE đo sai số phần trăm trung bình, thể hiện độ chính xác dự báo theo tỷ lệ phần trăm; RMSE đo sai số bình phương trung bình, phản ánh độ lệch tuyệt đối giữa dự báo và thực tế.Làm thế nào để áp dụng kết quả nghiên cứu vào thực tế?
EVNSPC có thể triển khai mô hình MLFF tích hợp biến ngoại sinh vào hệ thống quản lý điện năng, đồng thời xây dựng hệ thống tự động cập nhật dữ liệu và huấn luyện mô hình để nâng cao độ chính xác dự báo.
Kết luận
- Luận văn đã xây dựng và so sánh thành công các mô hình dự báo nhu cầu điện năng trung hạn cho các nhóm khách hàng sinh hoạt và thương mại của EVNSPC trong giai đoạn 2018-2023.
- Mô hình MLFF và NARX cho kết quả dự báo chính xác hơn so với các mô hình chuỗi thời gian truyền thống ARIMA và SARIMA, đặc biệt khi tích hợp biến ngoại sinh như nhiệt độ.
- Sai số MAPE thấp nhất đạt khoảng 2,1% cho nhóm khách hàng sinh hoạt và 2,3% cho nhóm khách hàng thương mại, đáp ứng yêu cầu thực tế của EVNSPC.
- Kết quả nghiên cứu có ý nghĩa quan trọng trong việc hỗ trợ hoạch định chiến lược phát triển hệ thống điện, tối ưu hóa vận hành và nâng cao hiệu quả cung cấp điện.
- Đề xuất triển khai mô hình MLFF tích hợp biến ngoại sinh, xây dựng hệ thống tự động cập nhật và đào tạo nhân sự để nâng cao năng lực dự báo trong tương lai.
Next steps: Triển khai thử nghiệm mô hình MLFF trong hệ thống quản lý của EVNSPC, đồng thời mở rộng nghiên cứu tích hợp thêm các biến ảnh hưởng khác và áp dụng các kỹ thuật học sâu tiên tiến hơn.
Call to action: Các đơn vị quản lý và kỹ thuật trong ngành điện nên phối hợp triển khai ứng dụng mô hình dự báo hiện đại nhằm đảm bảo cung cấp điện ổn định, hiệu quả và bền vững.