Tổng quan nghiên cứu

Việt Nam đang chứng kiến sự tăng trưởng nhanh chóng trong lĩnh vực năng lượng tái tạo, đặc biệt là điện mặt trời (ĐMT). Từ mức sản lượng khoảng 99 tỷ kWh năm 2010, đến năm 2022, sản lượng điện đã tăng lên 271 tỷ kWh, tương đương tốc độ tăng trưởng bình quân gần 10% mỗi năm. Công suất đặt của hệ thống điện cũng tăng từ 21,5 GW năm 2010 lên khoảng 80 GW vào cuối năm 2022. Dự kiến đến năm 2030, sản lượng điện sẽ đạt 567 tỷ kWh và công suất đặt khoảng 150 GW, trong đó năng lượng tái tạo chiếm tỷ trọng 30,9%-39,2%. Riêng điện mặt trời dự kiến đạt công suất đặt khoảng 20 GW vào năm 2030 và tăng lên 168-189 GW vào năm 2050.

Tuy nhiên, đặc tính biến động mạnh của công suất phát điện mặt trời do phụ thuộc vào các yếu tố khí tượng như bức xạ mặt trời, nhiệt độ, độ ẩm và tốc độ gió gây ra nhiều thách thức trong vận hành hệ thống điện. Công suất phát không ổn định, biến động nhanh trong ngày và giữa các ngày liên tiếp có thể lên đến hàng nghìn MW, ảnh hưởng đến an toàn và ổn định của hệ thống điện quốc gia. Do đó, việc dự báo ngắn hạn công suất phát của các nhà máy ĐMT là yêu cầu cấp thiết để đảm bảo cân bằng cung cầu, tối ưu hóa vận hành và nâng cao hiệu quả quản lý hệ thống điện.

Mục tiêu nghiên cứu của luận văn là xây dựng mô hình dự báo ngắn hạn công suất phát của nhà máy điện mặt trời quy mô công nghiệp tại Việt Nam sử dụng mạng nơ-ron hồi quy dài hạn (LSTM). Nghiên cứu tập trung vào phân tích các yếu tố ảnh hưởng, thu thập và xử lý dữ liệu khí tượng và công suất thực tế, xây dựng mô hình dự báo chính xác, đồng thời đề xuất các giải pháp cải tiến nhằm nâng cao hiệu quả dự báo. Phạm vi nghiên cứu bao gồm dữ liệu vận hành và khí tượng của một nhà máy ĐMT công suất 48 MW tại khu vực Nam Bộ trong khoảng thời gian 13 tháng (từ tháng 5/2019 đến tháng 6/2020).

Kết quả nghiên cứu có ý nghĩa quan trọng trong việc hỗ trợ các đơn vị vận hành và điều độ hệ thống điện trong việc lập kế hoạch, điều chỉnh công suất và đảm bảo an toàn vận hành hệ thống điện có tỷ trọng năng lượng tái tạo ngày càng cao.

Cơ sở lý thuyết và phương pháp nghiên cứu

Khung lý thuyết áp dụng

Luận văn dựa trên các lý thuyết và mô hình sau:

  • Mạng nơ-ron hồi quy dài hạn (LSTM): Là biến thể của mạng nơ-ron hồi quy (RNN), được thiết kế để xử lý dữ liệu chuỗi thời gian có tính phụ thuộc dài hạn. LSTM sử dụng các cổng (gate) để kiểm soát luồng thông tin, khắc phục vấn đề biến mất gradient trong RNN truyền thống, giúp mô hình ghi nhớ thông tin quan trọng trong khoảng thời gian dài.

  • Mô hình chuỗi thời gian ARIMA: Mô hình tự hồi quy tích hợp trung bình trượt, dùng để dự báo các chuỗi thời gian có tính dừng hoặc có thể biến đổi thành chuỗi dừng sau khi lấy sai phân. ARIMA được sử dụng làm phương pháp tham chiếu trong đánh giá hiệu quả mô hình LSTM.

  • Các chỉ số đánh giá sai số dự báo: MAE, MAPE, RMSE, nRMSE được sử dụng để đánh giá độ chính xác của mô hình dự báo, giúp so sánh hiệu quả giữa các mô hình khác nhau.

  • Các yếu tố ảnh hưởng đến công suất phát ĐMT: Bức xạ mặt trời (GHI), nhiệt độ tấm pin, độ ẩm, tốc độ gió, góc nghiêng tấm pin, các yếu tố khí tượng khác được xem xét là đầu vào quan trọng trong mô hình dự báo.

Phương pháp nghiên cứu

  • Nguồn dữ liệu: Dữ liệu thu thập từ một nhà máy điện mặt trời công suất 48 MW tại khu vực Nam Bộ Việt Nam, bao gồm dữ liệu vận hành công suất phát và dữ liệu khí tượng (GHI, nhiệt độ, độ ẩm, tốc độ gió) với độ phân giải 5 phút trong khoảng 13 tháng (5/2019 - 6/2020).

  • Tiền xử lý dữ liệu: Loại bỏ điểm ngoại lai bằng phương pháp IQR, xử lý dữ liệu thiếu, chuẩn hóa dữ liệu đầu vào, kết hợp dữ liệu khí tượng dự báo và thực đo.

  • Phương pháp phân tích: Xây dựng mô hình dự báo ngắn hạn công suất phát sử dụng mạng nơ-ron hồi quy dài hạn (LSTM) với các cấu hình khác nhau về số lớp ẩn và số nút ẩn. So sánh hiệu quả với các mô hình truyền thống như ARIMA, mô hình quán tính (persistence), mạng nơ-ron đa lớp (MLP).

  • Timeline nghiên cứu: Thu thập và xử lý dữ liệu (3 tháng), xây dựng và huấn luyện mô hình (4 tháng), đánh giá và so sánh mô hình (2 tháng), đề xuất giải pháp cải tiến và xây dựng quy trình triển khai (3 tháng).

  • Cỡ mẫu và chọn mẫu: Dữ liệu toàn bộ vận hành của nhà máy trong 13 tháng, chia thành tập huấn luyện (80%) và tập kiểm tra (20%) theo phương pháp phân chia ngẫu nhiên có kiểm soát để đảm bảo tính đại diện.

Kết quả nghiên cứu và thảo luận

Những phát hiện chính

  1. Hiệu quả mô hình LSTM vượt trội: Mô hình LSTM với cấu hình 4 lớp ẩn, 100 nút ẩn cho kết quả dự báo công suất phát với sai số MAPE khoảng 4,8% và nRMSE khoảng 9,0% trên tập kiểm tra. So với mô hình ARIMA có MAPE khoảng 12% và nRMSE trên 20%, LSTM cải thiện độ chính xác dự báo đáng kể.

  2. Ảnh hưởng của các yếu tố khí tượng: Hệ số tương quan Pearson giữa GHI và công suất phát đạt khoảng 98%, cho thấy bức xạ mặt trời là yếu tố ảnh hưởng chính. Nhiệt độ tấm pin có ảnh hưởng tiêu cực đến công suất phát, với hệ số suy giảm công suất khoảng -0,42%/°C. Tác động của độ ẩm và tốc độ gió có hệ số tương quan thấp hơn, khoảng 0,2-0,4, nhưng vẫn đóng vai trò hỗ trợ trong mô hình.

  3. Tác động của tiền xử lý dữ liệu: Việc áp dụng kỹ thuật loại bỏ điểm ngoại lai và chuẩn hóa dữ liệu đầu vào giúp giảm sai số dự báo trung bình khoảng 15% so với mô hình không xử lý dữ liệu.

  4. So sánh các cấu hình mô hình: Mô hình LSTM nhiều lớp ẩn và nhiều nút ẩn cho kết quả tốt hơn mô hình LSTM đơn lớp hoặc mạng nơ-ron đa lớp (MLP). Tuy nhiên, tăng quá nhiều lớp ẩn không cải thiện đáng kể hiệu quả mà làm tăng thời gian huấn luyện.

Thảo luận kết quả

Kết quả cho thấy mô hình LSTM là công cụ hiệu quả trong dự báo ngắn hạn công suất phát của nhà máy ĐMT, nhờ khả năng xử lý dữ liệu chuỗi thời gian có tính biến động và phụ thuộc dài hạn. Việc kết hợp dữ liệu khí tượng thực tế và vận hành giúp mô hình phản ánh chính xác hơn các điều kiện thực tế.

So với các nghiên cứu quốc tế, sai số MAPE và nRMSE của mô hình trong luận văn tương đương hoặc tốt hơn, minh chứng cho tính khả thi và hiệu quả của phương pháp áp dụng tại Việt Nam. Việc xử lý dữ liệu đầu vào kỹ càng là yếu tố then chốt giúp nâng cao chất lượng dự báo.

Biểu đồ phân bố sai số dự báo cho thấy phần lớn sai số tập trung quanh 0%, với tỷ lệ sai số lớn hơn 10% chiếm dưới 5%, thể hiện tính ổn định của mô hình. Bảng so sánh sai số giữa các mô hình cũng minh chứng rõ ràng ưu thế của LSTM.

Tuy nhiên, mô hình vẫn còn hạn chế khi dự báo trong các điều kiện thời tiết bất thường như mưa lớn hoặc mây dày, do dữ liệu khí tượng chưa đầy đủ hoặc chưa được tích hợp các mô hình dự báo thời tiết nâng cao. Đây là hướng nghiên cứu tiếp theo cần được phát triển.

Đề xuất và khuyến nghị

  1. Triển khai hệ thống dự báo LSTM tích hợp trong vận hành nhà máy: Áp dụng mô hình LSTM đã xây dựng vào hệ thống điều khiển và quản lý nhà máy ĐMT để dự báo công suất phát trong khoảng thời gian 5-60 phút tới, giúp tối ưu hóa điều độ và giảm thiểu rủi ro vận hành. Thời gian thực hiện: 6 tháng; Chủ thể: Ban kỹ thuật vận hành nhà máy.

  2. Nâng cao chất lượng dữ liệu đầu vào: Đầu tư bổ sung các trạm đo khí tượng tại nhiều vị trí trong khu vực nhà máy để thu thập dữ liệu chính xác và đa dạng hơn, đặc biệt là các thông số như bức xạ mặt trời, nhiệt độ tấm pin, độ ẩm và tốc độ gió. Thời gian thực hiện: 12 tháng; Chủ thể: Ban quản lý dự án và đơn vị cung cấp thiết bị.

  3. Phát triển mô hình dự báo kết hợp dữ liệu dự báo thời tiết số (NWP): Kết hợp dữ liệu dự báo thời tiết số với dữ liệu thực đo để cải thiện khả năng dự báo trong điều kiện thời tiết phức tạp, giảm sai số dự báo trong các ngày mưa hoặc nhiều mây. Thời gian thực hiện: 9 tháng; Chủ thể: Trung tâm nghiên cứu và phát triển công nghệ năng lượng.

  4. Xây dựng phần mềm hỗ trợ dự báo và cảnh báo sớm: Phát triển phần mềm dự báo công suất phát ĐMT tích hợp mô hình LSTM, cung cấp giao diện trực quan, cảnh báo biến động công suất lớn và hỗ trợ ra quyết định vận hành. Thời gian thực hiện: 6 tháng; Chủ thể: Đơn vị phát triển phần mềm và ban kỹ thuật vận hành.

  5. Đào tạo và nâng cao năng lực nhân sự: Tổ chức các khóa đào tạo về kỹ thuật dự báo, xử lý dữ liệu và vận hành mô hình LSTM cho đội ngũ kỹ thuật viên và quản lý nhà máy để đảm bảo vận hành hiệu quả hệ thống dự báo. Thời gian thực hiện: liên tục; Chủ thể: Ban nhân sự và đào tạo.

Đối tượng nên tham khảo luận văn

  1. Các nhà quản lý và vận hành nhà máy điện mặt trời: Giúp hiểu rõ về phương pháp dự báo công suất, áp dụng mô hình LSTM để nâng cao hiệu quả vận hành, giảm thiểu rủi ro do biến động công suất.

  2. Các nhà nghiên cứu và phát triển công nghệ năng lượng tái tạo: Cung cấp cơ sở lý thuyết, phương pháp và kết quả thực nghiệm để phát triển các mô hình dự báo công suất ĐMT phù hợp với điều kiện Việt Nam.

  3. Các đơn vị điều độ hệ thống điện và quản lý lưới điện: Hỗ trợ trong việc lập kế hoạch điều độ, cân bằng cung cầu và đảm bảo an toàn vận hành hệ thống điện có tỷ trọng năng lượng tái tạo ngày càng cao.

  4. Các nhà phát triển phần mềm và công nghệ thông tin trong lĩnh vực năng lượng: Tham khảo quy trình xây dựng mô hình, xử lý dữ liệu và phát triển phần mềm dự báo công suất ĐMT ứng dụng mạng nơ-ron hồi quy dài hạn.

Câu hỏi thường gặp

  1. Mô hình LSTM có ưu điểm gì so với các mô hình dự báo truyền thống?
    Mô hình LSTM có khả năng ghi nhớ thông tin dài hạn trong chuỗi thời gian, xử lý tốt các dữ liệu biến động phi tuyến và phụ thuộc phức tạp, giúp nâng cao độ chính xác dự báo so với các mô hình như ARIMA hay mạng nơ-ron đa lớp.

  2. Dữ liệu khí tượng nào ảnh hưởng nhiều nhất đến công suất phát điện mặt trời?
    Bức xạ mặt trời toàn phần (GHI) có hệ số tương quan lên đến 98% với công suất phát, là yếu tố quan trọng nhất. Nhiệt độ tấm pin cũng ảnh hưởng tiêu cực, trong khi độ ẩm và tốc độ gió có ảnh hưởng gián tiếp và mức độ thấp hơn.

  3. Làm thế nào để xử lý dữ liệu ngoại lai trong bộ dữ liệu vận hành?
    Phương pháp loại bỏ điểm ngoại lai dựa trên khoảng tứ phân vị (IQR) được áp dụng để loại bỏ các giá trị bất thường, giúp cải thiện chất lượng dữ liệu đầu vào và nâng cao hiệu quả mô hình dự báo.

  4. Sai số dự báo được đánh giá bằng những chỉ số nào?
    Các chỉ số phổ biến gồm MAE (sai số tuyệt đối trung bình), MAPE (sai số phần trăm trung bình), RMSE (sai số bình phương trung bình căn bậc hai) và nRMSE (RMSE chuẩn hóa theo công suất đặt), giúp đánh giá độ chính xác và ổn định của mô hình.

  5. Mô hình dự báo có thể áp dụng cho các nhà máy ĐMT quy mô lớn không?
    Có thể áp dụng, tuy nhiên cần điều chỉnh và huấn luyện mô hình với dữ liệu đặc thù của từng nhà máy quy mô lớn, đồng thời bổ sung dữ liệu khí tượng đa điểm để phản ánh chính xác điều kiện vận hành thực tế.

Kết luận

  • Luận văn đã xây dựng thành công mô hình dự báo ngắn hạn công suất phát nhà máy điện mặt trời quy mô công nghiệp tại Việt Nam sử dụng mạng nơ-ron hồi quy dài hạn (LSTM) với độ chính xác cao, sai số MAPE khoảng 4,8% và nRMSE khoảng 9%.

  • Phân tích các yếu tố khí tượng cho thấy bức xạ mặt trời và nhiệt độ tấm pin là những biến đầu vào quan trọng nhất ảnh hưởng đến công suất phát.

  • Việc tiền xử lý dữ liệu kỹ càng, loại bỏ điểm ngoại lai và chuẩn hóa giúp nâng cao hiệu quả dự báo.

  • Mô hình LSTM vượt trội so với các mô hình truyền thống như ARIMA, mô hình quán tính và mạng nơ-ron đa lớp.

  • Đề xuất các giải pháp triển khai mô hình trong vận hành thực tế, nâng cao chất lượng dữ liệu và phát triển phần mềm hỗ trợ dự báo.

Next steps: Triển khai thử nghiệm mô hình tại các nhà máy ĐMT khác, tích hợp dữ liệu dự báo thời tiết số, phát triển phần mềm dự báo và đào tạo nhân sự vận hành.

Call to action: Các đơn vị quản lý và vận hành nhà máy ĐMT nên áp dụng mô hình LSTM để nâng cao hiệu quả dự báo, đồng thời phối hợp nghiên cứu phát triển các giải pháp tích hợp nhằm đảm bảo vận hành an toàn, ổn định hệ thống điện trong bối cảnh năng lượng tái tạo ngày càng phát triển mạnh mẽ.