Tổng quan nghiên cứu
Dự báo nhu cầu điện năng ngắn hạn đóng vai trò then chốt trong việc quản lý và vận hành hệ thống điện, đặc biệt tại các đô thị lớn như Thành phố Hồ Chí Minh. Theo số liệu thu thập từ Tổng Công ty Điện lực Thành phố Hồ Chí Minh (EVNHCMC), dữ liệu sản lượng điện nhận đầu nguồn được ghi nhận theo chu kỳ 30 phút từ năm 2018 đến tháng 3 năm 2024, cho thấy sự biến động phức tạp của phụ tải điện do ảnh hưởng của nhiều yếu tố như thời tiết, đặc tính ngày trong tuần và các ngày lễ. Mục tiêu nghiên cứu là xây dựng và ứng dụng mô hình mạng nơ-ron nhân tạo (Artificial Neural Network - ANN) nhằm dự báo chính xác nhu cầu điện năng ngắn hạn cho khu vực này, từ đó hỗ trợ công tác lập kế hoạch sản xuất kinh doanh và đầu tư xây dựng của ngành điện.
Phạm vi nghiên cứu tập trung vào dữ liệu điện nhận đầu nguồn của EVNHCMC, loại trừ năm 2021 do ảnh hưởng đặc biệt của đại dịch COVID-19, với các bộ dữ liệu phân chia theo năm, tháng, ngày trong tuần và cuối tuần. Ý nghĩa của nghiên cứu được thể hiện qua việc nâng cao độ chính xác dự báo, giảm sai số dự báo (MAPE và RMSE), giúp các đơn vị điện lực ứng phó linh hoạt với biến động phụ tải, tối ưu hóa lợi nhuận và đảm bảo phát triển bền vững trong bối cảnh thị trường điện cạnh tranh.
Cơ sở lý thuyết và phương pháp nghiên cứu
Khung lý thuyết áp dụng
Luận văn dựa trên các lý thuyết và mô hình mạng nơ-ron nhân tạo trong dự báo điện năng ngắn hạn, bao gồm:
Mạng nơ-ron truyền thẳng (Feedforward Neural Network - FNN): Mạng có cấu trúc đơn giản, truyền tín hiệu một chiều từ lớp đầu vào đến lớp đầu ra, phù hợp với các bài toán phân loại và hồi quy cơ bản.
Mạng nơ-ron hồi quy (Recurrent Neural Network - RNN): Mạng có khả năng xử lý dữ liệu chuỗi thời gian nhờ các liên kết ngược, tuy nhiên gặp vấn đề tiêu biến gradient.
Mạng LSTM (Long Short-Term Memory): Một biến thể của RNN với các cổng điều khiển thông tin (input gate, forget gate, output gate), giúp ghi nhớ và quên thông tin hiệu quả, phù hợp với dữ liệu chuỗi dài hạn.
Mạng GRU (Gated Recurrent Unit): Biến thể đơn giản hơn LSTM, kết hợp các cổng quên và cập nhật, giảm độ phức tạp mô hình nhưng vẫn giữ hiệu quả cao.
Mạng MLP (Multilayer Perceptron): Mạng nhiều lớp với khả năng học các đặc trưng phi tuyến phức tạp, sử dụng hàm kích hoạt ReLU.
Mô hình kết hợp MLP-LSTM: Đề xuất mô hình kết hợp hai mạng MLP và LSTM nhằm tận dụng ưu điểm của cả hai, tối ưu hóa độ chính xác dự báo thông qua tham số trọng số Alpha được xác định bằng phương pháp Grid Search trên tập kiểm chứng.
Các khái niệm chính bao gồm: dự báo phụ tải ngắn hạn (STLF), sai số dự báo (MAPE, RMSE), hiện tượng overfitting và underfitting trong huấn luyện mạng nơ-ron.
Phương pháp nghiên cứu
Nguồn dữ liệu chính là sản lượng điện nhận đầu nguồn của EVNHCMC từ 01/01/2018 đến 31/03/2024, loại trừ năm 2021 do ảnh hưởng COVID-19. Dữ liệu được thu thập theo chu kỳ 30 phút, xử lý loại bỏ dữ liệu lỗi và điểm ngoại lệ bằng phương pháp khoảng tứ phân vị (IQR). Dữ liệu được phân chia thành 5 bộ con: toàn bộ dữ liệu, dữ liệu một năm gần nhất, một tháng gần nhất, ngày trong tuần và ngày cuối tuần. Mỗi bộ dữ liệu được chia thành tập huấn luyện (80%), tập kiểm chứng (10%) và tập kiểm tra (20%).
Phương pháp phân tích sử dụng các mô hình mạng nơ-ron nhân tạo LSTM, MLP, GRU và mô hình kết hợp MLP-LSTM được xây dựng và huấn luyện trên ngôn ngữ lập trình Python với các thư viện chuyên dụng như Numpy, Pandas, TensorFlow và Keras. Các thông số huấn luyện gồm thuật toán Adam, hàm kích hoạt ReLU, số lớp ẩn 1, số vòng lặp tối đa 50 epochs, kích thước miniBatch 32 và bước thời gian 7. Sai số dự báo được đánh giá bằng RMSE và MAPE trên tập kiểm tra để so sánh hiệu quả các mô hình.
Kết quả nghiên cứu và thảo luận
Những phát hiện chính
Mô hình kết hợp MLP-LSTM đạt độ chính xác cao nhất: Với sai số MAPE thấp hơn 1% và RMSE giảm khoảng 15% so với các mô hình đơn lẻ LSTM, MLP và GRU trên toàn bộ dữ liệu. Ví dụ, trên bộ dữ liệu một năm gần nhất, MLP-LSTM đạt MAPE khoảng 0.85%, trong khi LSTM và MLP lần lượt là 1.1% và 1.3%.
Hiệu quả mô hình trên các bộ dữ liệu đặc thù: Mô hình MLP-LSTM duy trì hiệu suất tốt trên dữ liệu ngày trong tuần và cuối tuần, với sai số MAPE lần lượt là 0.9% và 1.05%, phản ánh khả năng thích ứng với đặc tính phụ tải khác nhau theo ngày.
Mô hình GRU có thời gian huấn luyện nhanh hơn nhưng sai số cao hơn: GRU cho kết quả sai số MAPE khoảng 1.2% trên toàn bộ dữ liệu, thấp hơn MLP nhưng cao hơn mô hình kết hợp, phù hợp với các ứng dụng cần xử lý nhanh.
Ảnh hưởng của việc loại trừ dữ liệu năm 2021: Việc không sử dụng dữ liệu năm 2021 do đại dịch giúp giảm sai số dự báo, tránh các biến động đột biến không đại diện cho xu hướng tiêu thụ điện bình thường.
Thảo luận kết quả
Nguyên nhân chính giúp mô hình kết hợp MLP-LSTM vượt trội là do sự kết hợp giữa khả năng học các đặc trưng phi tuyến của MLP và khả năng ghi nhớ dài hạn của LSTM, giúp mô hình nắm bắt tốt hơn các mối quan hệ phức tạp trong dữ liệu chuỗi thời gian. So với các nghiên cứu trước đây sử dụng mạng nơ-ron đơn lẻ hoặc các phương pháp truyền thống, kết quả này cho thấy sự cải thiện rõ rệt về độ chính xác dự báo.
Các biểu đồ so sánh sai số MAPE và RMSE giữa các mô hình trên các bộ dữ liệu khác nhau minh họa rõ sự ưu việt của mô hình kết hợp. Bảng tổng hợp sai số cũng cho thấy sự ổn định của mô hình trong các điều kiện dữ liệu khác nhau, từ đó khẳng định tính ứng dụng thực tiễn cao.
Kết quả nghiên cứu góp phần giải quyết các thách thức hiện tại trong công tác dự báo điện năng tại EVNHCMC, đặc biệt trong bối cảnh biến động phụ tải do các yếu tố khách quan như thời tiết và đặc tính ngày trong tuần. Việc áp dụng mô hình này sẽ giúp nâng cao hiệu quả quản lý và vận hành hệ thống điện, giảm thiểu rủi ro tài chính và tăng cường khả năng cạnh tranh trên thị trường điện.
Đề xuất và khuyến nghị
Triển khai áp dụng mô hình kết hợp MLP-LSTM trong công tác dự báo tại EVNHCMC: Động tác này nhằm giảm sai số dự báo MAPE xuống dưới 1%, nâng cao độ tin cậy trong kế hoạch sản xuất kinh doanh. Thời gian thực hiện dự kiến trong 6 tháng, do phòng nghiên cứu và phát triển EVNHCMC chủ trì.
Xây dựng hệ thống tự động thu thập và xử lý dữ liệu thời tiết và đặc tính ngày: Tăng cường dữ liệu đầu vào cho mô hình dự báo, giúp cải thiện độ chính xác. Thời gian triển khai 3-4 tháng, phối hợp giữa phòng CNTT và phòng kỹ thuật.
Đào tạo nhân sự vận hành và bảo trì mô hình dự báo: Đảm bảo nhân viên có kỹ năng sử dụng và điều chỉnh mô hình phù hợp với biến động thực tế. Khóa đào tạo kéo dài 2 tháng, do đơn vị đào tạo nội bộ tổ chức.
Nghiên cứu mở rộng mô hình dự báo trung hạn và dài hạn: Áp dụng các kỹ thuật học sâu nâng cao để dự báo nhu cầu điện trong các khoảng thời gian dài hơn, hỗ trợ quy hoạch phát triển hệ thống điện. Thời gian nghiên cứu dự kiến 12 tháng, phối hợp với các viện nghiên cứu và trường đại học.
Đối tượng nên tham khảo luận văn
Các nhà quản lý và kỹ sư tại Tổng Công ty Điện lực Thành phố Hồ Chí Minh: Hỗ trợ trong việc lập kế hoạch sản xuất, kinh doanh và điều hành hệ thống điện dựa trên dự báo chính xác.
Các nhà nghiên cứu và sinh viên chuyên ngành Quản lý năng lượng, Khoa học dữ liệu và Trí tuệ nhân tạo: Cung cấp nền tảng lý thuyết và thực nghiệm về ứng dụng mạng nơ-ron nhân tạo trong dự báo điện năng.
Các đơn vị phát triển phần mềm và công nghệ trong lĩnh vực năng lượng: Tham khảo mô hình và phương pháp xây dựng hệ thống dự báo điện năng ngắn hạn hiệu quả.
Các cơ quan quản lý nhà nước về năng lượng và thị trường điện: Sử dụng kết quả nghiên cứu để xây dựng chính sách và quy định phù hợp nhằm nâng cao hiệu quả vận hành thị trường điện cạnh tranh.
Câu hỏi thường gặp
Mô hình mạng nơ-ron nhân tạo có ưu điểm gì so với phương pháp truyền thống trong dự báo điện năng?
Mạng nơ-ron nhân tạo có khả năng xử lý dữ liệu phi tuyến phức tạp, học được các đặc trưng ẩn trong dữ liệu, từ đó nâng cao độ chính xác dự báo so với các phương pháp thống kê truyền thống như hồi quy hay ARIMA.Tại sao dữ liệu năm 2021 không được sử dụng trong nghiên cứu?
Năm 2021 chịu ảnh hưởng đặc biệt của đại dịch COVID-19, gây biến động đột biến trong tiêu thụ điện, không phản ánh xu hướng tiêu thụ bình thường nên được loại trừ để tránh làm sai lệch kết quả dự báo.Làm thế nào để xác định tham số Alpha trong mô hình kết hợp MLP-LSTM?
Tham số Alpha được xác định bằng phương pháp tối ưu Grid Search trên tập kiểm chứng, chọn giá trị Alpha sao cho sai số RMSE của mô hình kết hợp là thấp nhất.Sai số MAPE và RMSE có ý nghĩa như thế nào trong đánh giá mô hình?
MAPE thể hiện phần trăm sai số tuyệt đối trung bình, giúp đánh giá độ chính xác dự báo theo tỷ lệ phần trăm; RMSE đo sai số bình phương trung bình gốc, phản ánh mức độ chênh lệch tuyệt đối giữa giá trị dự báo và thực tế.Mô hình kết hợp MLP-LSTM có thể áp dụng cho các khu vực khác ngoài Thành phố Hồ Chí Minh không?
Có thể áp dụng, tuy nhiên cần thu thập và xử lý dữ liệu đặc thù của từng khu vực để huấn luyện lại mô hình nhằm đảm bảo độ chính xác phù hợp với đặc điểm phụ tải địa phương.
Kết luận
- Luận văn đã xây dựng thành công mô hình kết hợp mạng nơ-ron MLP-LSTM dự báo nhu cầu điện năng ngắn hạn cho khu vực Thành phố Hồ Chí Minh với sai số MAPE dưới 1%, vượt trội so với các mô hình đơn lẻ.
- Dữ liệu đầu vào được xử lý kỹ lưỡng từ năm 2018 đến 2024, loại trừ năm 2021 để đảm bảo tính đại diện và chính xác của mô hình.
- Phương pháp huấn luyện và đánh giá mô hình sử dụng ngôn ngữ Python với các thư viện chuyên sâu, đảm bảo tính khả thi và hiệu quả ứng dụng thực tế.
- Kết quả nghiên cứu có ý nghĩa khoa học và thực tiễn lớn, hỗ trợ công tác quản lý, vận hành và phát triển hệ thống điện tại EVNHCMC.
- Đề xuất các giải pháp triển khai, đào tạo và nghiên cứu mở rộng nhằm nâng cao hiệu quả dự báo và ứng dụng trong tương lai.
Hành động tiếp theo: Các đơn vị liên quan nên phối hợp triển khai áp dụng mô hình kết hợp MLP-LSTM trong công tác dự báo, đồng thời tiếp tục nghiên cứu mở rộng để đáp ứng nhu cầu phát triển năng lượng bền vững.