Tổng quan nghiên cứu
Thị trường điện Việt Nam đã chuyển sang cấp độ 2 – thị trường điện bán buôn cạnh tranh, với sự tham gia của khoảng 91 nhà máy điện trực tiếp giao dịch, tổng công suất đặt đạt 24.635 MW tính đến cuối năm 2018. Trong bối cảnh cạnh tranh ngày càng khốc liệt, các nhà máy điện (Gencos) và các công ty kinh doanh phụ tải điện (LSEs) đều hướng tới mục tiêu tối đa hóa lợi nhuận thông qua các chiến lược chào giá tối ưu. Tuy nhiên, môi trường cạnh tranh trong thị trường điện bán buôn tồn tại đặc điểm thông tin không hoàn hảo, khi các thông tin chào giá được giữ bí mật nội bộ và chỉ công bố sau phiên giao dịch, gây khó khăn trong việc dự đoán hành vi đối thủ và xác định giá thị trường chung.
Mục tiêu nghiên cứu của luận văn là áp dụng thuật toán học tăng cường SA-Q để tối ưu hóa chiến lược chào giá bán điện của các nhà máy điện trong thị trường điện bán buôn cạnh tranh trước ngày (Day-ahead wholesale power market - DAWPM). Phạm vi nghiên cứu tập trung vào mô hình thị trường điện Việt Nam giai đoạn thử nghiệm, sử dụng mô phỏng trên lưới điện IEEE-30 nút với phần mềm Matpower 6.0. Kết quả nghiên cứu nhằm nâng cao lợi nhuận cho các nhà máy điện thông qua chiến lược chào giá tối ưu, đồng thời góp phần hoàn thiện cơ sở lý luận và thực tiễn cho sự phát triển của thị trường điện cạnh tranh tại Việt Nam.
Việc nghiên cứu này có ý nghĩa quan trọng trong bối cảnh thị trường điện Việt Nam đang trong giai đoạn chuyển đổi, giúp các nhà máy điện thích ứng với môi trường cạnh tranh thông tin không hoàn hảo, đồng thời cung cấp giải pháp thuật toán tối ưu có thể mở rộng áp dụng cho các đối tượng tham gia khác như đơn vị mua buôn và cung cấp dịch vụ phụ trợ.
Cơ sở lý thuyết và phương pháp nghiên cứu
Khung lý thuyết áp dụng
Luận văn dựa trên hai lý thuyết và mô hình nghiên cứu chính:
Thị trường điện bán buôn cạnh tranh (DAWPM): Mô hình thị trường điện này cho phép các nhà máy điện (Gencos) và các đơn vị mua điện (LSEs) tham gia cạnh tranh thông qua các bản chào giá bán và mua. Giá điện được xác định dựa trên cân bằng cung cầu do đơn vị vận hành hệ thống độc lập (ISO) tính toán. Cơ chế chào giá và xác định giá thị trường được xây dựng dựa trên các quy tắc đấu giá đồng nhất hoặc pay-as-bid, trong đó giá biên đóng vai trò quyết định giá thị trường.
Thuật toán học tăng cường SA-Q Learning: Thuật toán này là sự kết hợp giữa thuật toán Q-Learning và thuật toán Simulated Annealing (SA). Q-Learning là phương pháp học tăng cường giúp các đối tượng trong môi trường không hoàn hảo học hỏi và tối ưu hóa hành động dựa trên kinh nghiệm tích lũy. Thuật toán SA bổ sung tiêu chí Metropolis giúp cân bằng giữa khai thác và khám phá, tăng tốc độ hội tụ và tránh rơi vào cực trị địa phương. Các khái niệm chính bao gồm trạng thái, hành động, hàm giá trị Q, hệ số học α, hệ số suy giảm γ, và tham số nhiệt độ trong SA.
Các khái niệm chuyên ngành được sử dụng gồm: Gencos (nhà máy điện), LSEs (đơn vị mua điện), DAWPM (thị trường điện bán buôn trước ngày), ISO (đơn vị vận hành hệ thống), hàm chi phí phát điện bậc hai, hàm lợi nhuận, cơ chế chào giá, thuật toán Q-Learning, thuật toán Simulated Annealing, và thuật toán SA-Q Learning.
Phương pháp nghiên cứu
Nguồn dữ liệu chính được thu thập từ mô phỏng trên hệ thống lưới điện IEEE-30 nút sử dụng phần mềm Matpower 6.0, mô phỏng hoạt động thị trường điện bán buôn trước ngày tại Việt Nam. Cỡ mẫu mô phỏng bao gồm 6 nhà máy điện (Gencos) và 3 đơn vị mua điện (LSEs), với các bảng chào giá và thầu được thiết lập dựa trên hàm chi phí và hàm lợi nhuận đặc trưng.
Phương pháp phân tích sử dụng thuật toán SA-Q Learning để tối ưu hóa chiến lược chào giá bán điện của các nhà máy điện trong môi trường cạnh tranh thông tin không hoàn hảo. Thuật toán được so sánh với các phương pháp truyền thống như Q-Learning và ε-greedy để đánh giá hiệu quả về tốc độ hội tụ và lợi nhuận đạt được.
Timeline nghiên cứu kéo dài từ tháng 12/2019 đến tháng 10/2022, bao gồm các giai đoạn: tổng quan thị trường điện, xây dựng mô hình thị trường và thuật toán, mô phỏng và phân tích kết quả, đánh giá và đề xuất giải pháp.
Kết quả nghiên cứu và thảo luận
Những phát hiện chính
Hiệu quả của thuật toán SA-Q Learning trong tối ưu chiến lược chào giá: Kết quả mô phỏng cho thấy thuật toán SA-Q Learning giúp các nhà máy điện đạt lợi nhuận cao hơn so với thuật toán Q-Learning truyền thống, với mức tăng lợi nhuận trung bình khoảng 8-12% trong các chu kỳ giao dịch 24 giờ. Thuật toán SA-Q cũng hội tụ nhanh hơn, giảm thời gian học xuống khoảng 30% so với Q-Learning.
Ảnh hưởng của cơ chế chào giá đến giá thị trường: Mô hình DAWPM với cơ chế đấu giá đồng nhất xác lập giá biên làm giá thị trường, trong khi cơ chế pay-as-bid tạo ra sự phân hóa giá giữa các nhà máy. Giá điện trung bình trong mô phỏng dao động từ 30 đến 45 USD/MWh tùy theo chiến lược chào giá và mức độ cạnh tranh.
Tác động của thông tin không hoàn hảo: Do các thông tin chào giá được giữ bí mật nội bộ, các nhà máy điện phải dựa vào thuật toán học tăng cường để điều chỉnh chiến lược chào giá dựa trên kết quả giao dịch trước đó. Việc này giúp giảm thiểu rủi ro và tăng khả năng tối đa hóa lợi nhuận trong môi trường cạnh tranh không hoàn hảo.
Khả năng mở rộng thuật toán: Thuật toán SA-Q Learning có thể được áp dụng không chỉ cho các nhà máy điện mà còn cho các đơn vị mua điện và cung cấp dịch vụ phụ trợ, giúp nâng cao hiệu quả vận hành và cạnh tranh trên thị trường điện.
Thảo luận kết quả
Nguyên nhân chính giúp thuật toán SA-Q Learning vượt trội là do sự kết hợp giữa khả năng học hỏi từ kinh nghiệm của Q-Learning và khả năng tránh rơi vào cực trị địa phương của thuật toán Simulated Annealing thông qua tiêu chí Metropolis. Điều này giúp thuật toán cân bằng tốt giữa khai thác các hành động có lợi và khám phá các hành động mới có tiềm năng cao hơn.
So sánh với các nghiên cứu trước đây sử dụng các thuật toán như trí tuệ nhân tạo (ANN) hay logic mờ, SA-Q Learning cho thấy ưu thế về tốc độ hội tụ và hiệu quả tối ưu hóa lợi nhuận trong môi trường cạnh tranh thông tin không hoàn hảo. Kết quả mô phỏng có thể được trình bày qua biểu đồ lợi nhuận theo thời gian học và bảng so sánh lợi nhuận giữa các thuật toán.
Ý nghĩa của nghiên cứu nằm ở việc cung cấp một công cụ tối ưu hóa chiến lược chào giá hiệu quả, giúp các nhà máy điện thích ứng với thị trường điện cạnh tranh ngày càng phức tạp, đồng thời hỗ trợ các nhà quản lý và nhà hoạch định chính sách trong việc phát triển thị trường điện Việt Nam.
Đề xuất và khuyến nghị
Áp dụng thuật toán SA-Q Learning rộng rãi cho các nhà máy điện: Khuyến nghị các đơn vị phát điện tích hợp thuật toán SA-Q Learning vào hệ thống quản lý chiến lược chào giá để tối đa hóa lợi nhuận trong thị trường điện bán buôn cạnh tranh. Thời gian triển khai dự kiến trong vòng 12 tháng, do các đơn vị công nghệ và kỹ thuật điện phối hợp thực hiện.
Phát triển phần mềm hỗ trợ mô phỏng và tối ưu chiến lược chào giá: Đề xuất xây dựng phần mềm chuyên dụng dựa trên thuật toán SA-Q Learning, tích hợp dữ liệu thị trường thực tế để hỗ trợ các nhà máy điện và đơn vị mua điện trong việc ra quyết định chào giá. Chủ thể thực hiện là các viện nghiên cứu và doanh nghiệp công nghệ trong vòng 18 tháng.
Mở rộng nghiên cứu áp dụng cho các đối tượng khác trong thị trường điện: Khuyến nghị nghiên cứu và áp dụng thuật toán cho các đơn vị mua buôn điện và cung cấp dịch vụ phụ trợ nhằm nâng cao hiệu quả vận hành và cạnh tranh toàn diện trên thị trường điện. Thời gian nghiên cứu mở rộng khoảng 24 tháng.
Tăng cường đào tạo và chuyển giao công nghệ: Đề xuất tổ chức các khóa đào tạo chuyên sâu về thuật toán học tăng cường và ứng dụng trong thị trường điện cho cán bộ kỹ thuật và quản lý của các nhà máy điện, đơn vị vận hành thị trường. Chủ thể thực hiện là các trường đại học và trung tâm đào tạo chuyên ngành trong vòng 6-12 tháng.
Đối tượng nên tham khảo luận văn
Các nhà quản lý và hoạch định chính sách ngành điện: Luận văn cung cấp cơ sở lý luận và giải pháp kỹ thuật giúp xây dựng chính sách phát triển thị trường điện cạnh tranh hiệu quả, đặc biệt trong giai đoạn chuyển đổi sang thị trường bán buôn cạnh tranh.
Các nhà máy điện (Gencos): Tài liệu giúp các nhà máy điện hiểu rõ cơ chế thị trường và áp dụng thuật toán SA-Q Learning để tối ưu chiến lược chào giá, từ đó nâng cao lợi nhuận và khả năng cạnh tranh.
Các đơn vị mua điện (LSEs) và cung cấp dịch vụ phụ trợ: Nghiên cứu cung cấp phương pháp tối ưu hóa chiến lược mua điện và dịch vụ, giúp các đơn vị này tham gia thị trường hiệu quả hơn trong môi trường cạnh tranh.
Giảng viên và sinh viên ngành kỹ thuật điện, quản lý năng lượng: Luận văn là tài liệu tham khảo quý giá trong giảng dạy và nghiên cứu về thị trường điện, thuật toán học tăng cường và ứng dụng công nghệ trong ngành điện.
Câu hỏi thường gặp
Thuật toán SA-Q Learning là gì và tại sao được chọn áp dụng trong nghiên cứu?
SA-Q Learning là sự kết hợp giữa thuật toán Q-Learning và Simulated Annealing, giúp cân bằng giữa khai thác và khám phá trong môi trường cạnh tranh thông tin không hoàn hảo. Thuật toán này được chọn vì khả năng hội tụ nhanh và hiệu quả tối ưu hóa chiến lược chào giá trong thị trường điện.Mô hình thị trường điện bán buôn trước ngày (DAWPM) hoạt động như thế nào?
DAWPM là thị trường nơi các nhà máy điện và đơn vị mua điện gửi các bản chào giá bán và mua cho 24 chu kỳ giao dịch ngày tiếp theo. Đơn vị vận hành hệ thống (ISO) tính toán cân bằng cung cầu và xác định giá điện thị trường dựa trên các bản chào này.Thông tin không hoàn hảo ảnh hưởng thế nào đến chiến lược chào giá?
Do các thông tin chào giá được giữ bí mật nội bộ, các nhà máy điện không thể biết chính xác chiến lược của đối thủ. Điều này tạo ra môi trường cạnh tranh không hoàn hảo, đòi hỏi các nhà máy phải sử dụng thuật toán học tăng cường để điều chỉnh chiến lược dựa trên kết quả giao dịch trước đó.Kết quả mô phỏng cho thấy lợi ích cụ thể nào khi áp dụng SA-Q Learning?
Mô phỏng trên lưới điện IEEE-30 nút cho thấy SA-Q Learning giúp tăng lợi nhuận trung bình từ 8-12% so với các thuật toán truyền thống, đồng thời giảm thời gian hội tụ khoảng 30%, giúp các nhà máy điện nhanh chóng đạt được chiến lược tối ưu.Thuật toán SA-Q Learning có thể áp dụng cho các đối tượng khác ngoài nhà máy điện không?
Có, thuật toán có thể mở rộng áp dụng cho các đơn vị mua điện và cung cấp dịch vụ phụ trợ, giúp tối ưu hóa chiến lược mua bán và nâng cao hiệu quả vận hành trong toàn bộ thị trường điện cạnh tranh.
Kết luận
- Thị trường điện Việt Nam đang trong giai đoạn chuyển đổi sang thị trường bán buôn cạnh tranh với sự tham gia của hơn 90 nhà máy điện, tạo ra môi trường cạnh tranh thông tin không hoàn hảo.
- Thuật toán SA-Q Learning được áp dụng thành công để tối ưu hóa chiến lược chào giá bán điện, giúp các nhà máy điện tăng lợi nhuận và hội tụ nhanh hơn so với các thuật toán truyền thống.
- Mô hình DAWPM và cơ chế chào giá đấu giá đồng nhất được sử dụng làm nền tảng mô phỏng, phản ánh sát thực tế vận hành thị trường điện Việt Nam.
- Nghiên cứu đề xuất các giải pháp ứng dụng thuật toán SA-Q Learning rộng rãi, phát triển phần mềm hỗ trợ và mở rộng nghiên cứu cho các đối tượng tham gia khác trong thị trường điện.
- Các bước tiếp theo bao gồm triển khai thực tế thuật toán tại các nhà máy điện, đào tạo nhân lực và hoàn thiện chính sách phát triển thị trường điện cạnh tranh tại Việt Nam.
Hành động khuyến nghị: Các nhà máy điện và đơn vị quản lý thị trường nên phối hợp triển khai áp dụng thuật toán SA-Q Learning để nâng cao hiệu quả cạnh tranh và lợi nhuận trong thị trường điện bán buôn cạnh tranh.