Tổng quan nghiên cứu

Lượng bức xạ mặt trời là yếu tố khí tượng quan trọng ảnh hưởng trực tiếp đến sản xuất và đời sống, đặc biệt trong lĩnh vực năng lượng tái tạo. Tại trạm khí tượng Nhà Bè, Thành phố Hồ Chí Minh, dữ liệu đo đạc từ năm 2013 đến 2016 cho thấy tổng lượng bức xạ mặt trời ngày trung bình đạt khoảng 4546 W/m² với độ lệch chuẩn 1196,5 W/m², phản ánh sự biến động theo mùa và điều kiện khí hậu địa phương. Nghiên cứu tập trung vào việc xây dựng mô hình mô phỏng lượng bức xạ mặt trời dựa trên các yếu tố khí tượng như độ ẩm, nhiệt độ, tốc độ gió và lượng bốc hơi, nhằm phục vụ công tác bổ sung số liệu khuyết thiếu và dự báo cho các trạm không đo bức xạ.

Mục tiêu cụ thể của luận văn là phát triển mô hình hồi quy tuyến tính đa biến và mạng nơron nhân tạo (ANN) để mô phỏng lượng bức xạ mặt trời, đồng thời so sánh hiệu quả giữa hai phương pháp này. Nghiên cứu cũng đánh giá mức độ ảnh hưởng của từng biến độc lập đến độ chính xác mô phỏng và kiểm định mô hình trên chuỗi số liệu độc lập năm 2016. Phạm vi nghiên cứu giới hạn tại trạm khí tượng Nhà Bè, Thành phố Hồ Chí Minh, trong giai đoạn 2013-2016. Kết quả nghiên cứu có ý nghĩa quan trọng trong việc nâng cao độ chính xác dự báo bức xạ mặt trời, góp phần phát triển các phương pháp mô phỏng khí tượng ứng dụng trong quản lý tài nguyên và môi trường.

Cơ sở lý thuyết và phương pháp nghiên cứu

Khung lý thuyết áp dụng

Luận văn dựa trên hai lý thuyết chính: mô hình hồi quy tuyến tính đa biến và mạng nơron nhân tạo (ANN). Hồi quy tuyến tính đa biến là phương pháp thống kê dùng để mô hình hóa mối quan hệ tuyến tính giữa một biến phụ thuộc và nhiều biến độc lập, cho phép định lượng ảnh hưởng của từng biến đến biến mục tiêu. Trong nghiên cứu này, biến phụ thuộc là tổng lượng bức xạ mặt trời ngày, các biến độc lập gồm ngày trong năm, độ ẩm cao nhất và thấp nhất, tốc độ gió trung bình, lượng bốc hơi, nhiệt độ thấp nhất và cao nhất.

Mạng nơron nhân tạo (ANN) là mô hình tính toán mô phỏng hoạt động của hệ thần kinh sinh học, có khả năng học và dự đoán các quan hệ phi tuyến phức tạp trong dữ liệu. Cấu trúc ANN được sử dụng gồm 7 biến đầu vào, một lớp ẩn với 6 neuron và một biến đầu ra, với các hàm truyền như Purelin, Tansig và Logsig. ANN được huấn luyện bằng thuật toán lan truyền ngược để tối ưu trọng số kết nối, nhằm giảm thiểu sai số giữa giá trị dự đoán và thực tế.

Các khái niệm chuyên ngành quan trọng bao gồm:

  • MAE (Mean Absolute Error): Sai số tuyệt đối trung bình, dùng để đánh giá độ chính xác mô hình.
  • RMSE (Root Mean Square Error): Sai số trung bình gốc, phản ánh mức độ phân tán sai số.
  • Hệ số tương quan (R): Đánh giá mức độ phù hợp giữa giá trị dự đoán và thực tế.
  • Ngày trong năm: Đại lượng đặc trưng chu kỳ thời gian, thể hiện sự biến đổi theo mùa.

Phương pháp nghiên cứu

Nguồn dữ liệu chính là số liệu khí tượng đo đạc tại trạm khí tượng Nhà Bè trong giai đoạn 2013-2016, bao gồm các thông số: độ ẩm tương đối, lượng bốc hơi, nhiệt độ, tốc độ gió và tổng lượng bức xạ mặt trời. Tổng số mẫu là 1459 ngày, trong đó dữ liệu từ 2013 đến 2015 được dùng để xây dựng và huấn luyện mô hình, dữ liệu năm 2016 dùng để kiểm định mô hình độc lập.

Phương pháp phân tích bao gồm:

  • Kiểm tra chất lượng dữ liệu: Loại bỏ các ngày có số liệu khuyết hoặc không hợp lệ nhằm đảm bảo tính chính xác.
  • Phân tích tương quan Pearson: Xác định mối quan hệ tuyến tính giữa các biến độc lập và biến phụ thuộc.
  • Xây dựng mô hình hồi quy tuyến tính đa biến: Sử dụng phần mềm SPSS để lựa chọn biến đầu vào tối ưu, xây dựng phương trình hồi quy và đánh giá độ phù hợp qua hệ số R và sai số.
  • Mô phỏng bằng mạng nơron nhân tạo (ANN): Sử dụng phần mềm MATLAB, dữ liệu được chuẩn hóa về khoảng [0,1] để huấn luyện mạng với cấu trúc 7-6-1, thử nghiệm các hàm truyền khác nhau nhằm tìm cấu trúc tối ưu.
  • Đánh giá mô hình: So sánh kết quả mô phỏng giữa hai phương pháp qua các chỉ số R, MAE, RMSE trên cả tập huấn luyện và tập kiểm định độc lập.
  • Phân tích ảnh hưởng biến đầu vào: Áp dụng phương pháp rút dần từng biến đầu vào để đánh giá mức độ ảnh hưởng đến độ chính xác mô hình ANN.

Timeline nghiên cứu kéo dài từ tháng 1/2022 đến tháng 7/2022, bao gồm các giai đoạn thu thập dữ liệu, xây dựng mô hình, huấn luyện và đánh giá kết quả.

Kết quả nghiên cứu và thảo luận

Những phát hiện chính

  1. Hiệu quả mô phỏng của mạng nơron nhân tạo vượt trội hơn hồi quy tuyến tính đa biến: Mạng ANN đạt hệ số tương quan R = 0.7637 và sai số MAE thấp hơn so với mô hình hồi quy tuyến tính đa biến (R thấp hơn, cụ thể khoảng 0.6). Điều này cho thấy ANN có khả năng mô phỏng các quan hệ phi tuyến phức tạp giữa các yếu tố khí tượng và lượng bức xạ mặt trời tốt hơn.

  2. Cấu trúc mạng ANN 7-6-1 được chứng minh phù hợp nhất: Với 7 biến đầu vào gồm ngày trong năm, độ ẩm cao nhất, độ ẩm thấp nhất, tốc độ gió trung bình, lượng bốc hơi, nhiệt độ thấp nhất và nhiệt độ cao nhất, mô hình cho kết quả mô phỏng chính xác. Trong đó, ngày trong năm là biến ảnh hưởng lớn nhất, khi loại bỏ biến này, sai số MAE tăng lên 15.9%. Ngược lại, tốc độ gió trung bình có ảnh hưởng nhỏ nhất, chỉ làm tăng sai số MAE 0.6% khi bị loại bỏ.

  3. Đánh giá trên chuỗi số liệu độc lập năm 2016 cho thấy độ chính xác cao: Kết quả mô phỏng lượng bức xạ mặt trời gần giống với số liệu thực đo, khẳng định khả năng dự báo và ứng dụng thực tiễn của mô hình ANN và hồi quy tuyến tính đa biến.

  4. Phân tích tương quan cho thấy các biến khí tượng có mối liên hệ chặt chẽ với lượng bức xạ mặt trời: Hệ số tương quan Pearson giữa các biến độc lập và biến phụ thuộc đều đạt mức ý nghĩa thống kê, hỗ trợ cho việc lựa chọn biến đầu vào trong mô hình.

Thảo luận kết quả

Nguyên nhân mạng nơron nhân tạo cho kết quả mô phỏng tốt hơn là do khả năng xử lý các mối quan hệ phi tuyến và tương tác phức tạp giữa các yếu tố khí tượng, điều mà mô hình hồi quy tuyến tính đa biến không thể nắm bắt đầy đủ. Kết quả này phù hợp với các nghiên cứu quốc tế và trong nước đã ứng dụng ANN trong dự báo khí tượng, như nghiên cứu tại Thái Lan và Iran.

Việc ngày trong năm là biến quan trọng nhất phản ánh tính chu kỳ và mùa vụ trong biến đổi khí hậu tại khu vực Thành phố Hồ Chí Minh, ảnh hưởng trực tiếp đến lượng bức xạ mặt trời. Tốc độ gió trung bình ít ảnh hưởng hơn có thể do đặc điểm địa hình và khí hậu vùng nghiên cứu.

Dữ liệu kiểm định độc lập cho thấy mô hình có khả năng tổng quát hóa tốt, có thể ứng dụng để dự báo và bổ sung số liệu cho các trạm không đo bức xạ. Biểu đồ so sánh giá trị mô phỏng và thực đo có thể minh họa rõ sự phù hợp của mô hình ANN, với các điểm dữ liệu tập trung gần đường y = x.

Tuy nhiên, nghiên cứu còn hạn chế về phạm vi địa lý và thời gian, cũng như chưa khai thác sâu các thuật toán ANN phức tạp hơn. Do đó, cần tiếp tục mở rộng dữ liệu và thử nghiệm các mô hình khác để nâng cao độ chính xác.

Đề xuất và khuyến nghị

  1. Triển khai ứng dụng mô hình ANN trong hệ thống dự báo khí tượng tại các trạm khí tượng khu vực Nam Bộ: Tập trung vào việc tích hợp mô hình vào phần mềm quản lý dữ liệu khí tượng, nhằm nâng cao độ chính xác dự báo lượng bức xạ mặt trời trong vòng 1-2 năm tới.

  2. Mở rộng thu thập và cập nhật dữ liệu khí tượng đa dạng hơn: Bao gồm các yếu tố như áp suất khí quyển, độ che phủ mây để cải thiện mô hình, thực hiện trong 3 năm tiếp theo bởi các cơ quan khí tượng thủy văn.

  3. Đào tạo và nâng cao năng lực cho cán bộ kỹ thuật về công nghệ mạng nơron nhân tạo và phân tích dữ liệu: Tổ chức các khóa đào tạo chuyên sâu nhằm đảm bảo vận hành và phát triển mô hình hiệu quả, dự kiến trong 12 tháng tới.

  4. Nghiên cứu phát triển các mô hình ANN phức tạp hơn và kết hợp với các thuật toán học máy khác: Nhằm tăng cường khả năng dự báo và xử lý dữ liệu lớn, thực hiện trong giai đoạn 2-3 năm tới bởi các viện nghiên cứu và trường đại học.

Đối tượng nên tham khảo luận văn

  1. Các nhà nghiên cứu và sinh viên ngành Quản lý Tài nguyên và Môi trường, Khí tượng Thủy văn: Có thể ứng dụng kết quả nghiên cứu để phát triển các mô hình dự báo khí tượng chính xác hơn, phục vụ công tác nghiên cứu và giảng dạy.

  2. Cơ quan khí tượng thủy văn và quản lý tài nguyên nước: Sử dụng mô hình để bổ sung số liệu khuyết thiếu, nâng cao hiệu quả dự báo và quản lý tài nguyên năng lượng mặt trời.

  3. Doanh nghiệp và tổ chức hoạt động trong lĩnh vực năng lượng tái tạo: Áp dụng mô hình để dự báo nguồn năng lượng mặt trời, hỗ trợ trong việc lập kế hoạch và vận hành hệ thống năng lượng sạch.

  4. Các nhà hoạch định chính sách và quản lý môi trường đô thị: Tham khảo để xây dựng các chính sách phát triển bền vững, ứng phó với biến đổi khí hậu dựa trên dữ liệu dự báo chính xác về bức xạ mặt trời.

Câu hỏi thường gặp

  1. Mạng nơron nhân tạo (ANN) là gì và tại sao lại được sử dụng trong mô phỏng bức xạ mặt trời?
    ANN là mô hình tính toán mô phỏng hoạt động của hệ thần kinh sinh học, có khả năng học và dự đoán các quan hệ phi tuyến phức tạp trong dữ liệu. Trong mô phỏng bức xạ mặt trời, ANN giúp xử lý các mối quan hệ phức tạp giữa các yếu tố khí tượng, cho kết quả chính xác hơn so với mô hình hồi quy tuyến tính.

  2. Phương pháp hồi quy tuyến tính đa biến có ưu điểm gì trong nghiên cứu này?
    Hồi quy tuyến tính đa biến cho phép định lượng ảnh hưởng của từng biến độc lập đến biến phụ thuộc, dễ dàng xây dựng và giải thích. Đây là phương pháp phổ biến, có độ chính xác tương đối cao và được sử dụng làm cơ sở so sánh với các mô hình phức tạp hơn như ANN.

  3. Tại sao ngày trong năm lại là biến quan trọng nhất trong mô hình?
    Ngày trong năm phản ánh chu kỳ mùa vụ và sự biến đổi khí hậu theo thời gian, ảnh hưởng trực tiếp đến lượng bức xạ mặt trời. Việc loại bỏ biến này làm tăng sai số mô hình lên đến 15.9%, cho thấy vai trò thiết yếu của biến này trong dự báo.

  4. Làm thế nào để đánh giá độ chính xác của mô hình mô phỏng?
    Độ chính xác được đánh giá qua các chỉ số như hệ số tương quan (R), sai số tuyệt đối trung bình (MAE) và sai số trung bình gốc (RMSE). Các chỉ số này so sánh giá trị mô phỏng với số liệu thực đo, giúp xác định mức độ phù hợp và khả năng dự báo của mô hình.

  5. Mô hình có thể áp dụng cho các khu vực khác ngoài Thành phố Hồ Chí Minh không?
    Mô hình được xây dựng dựa trên dữ liệu đặc thù của khu vực Nhà Bè, Thành phố Hồ Chí Minh. Để áp dụng cho khu vực khác cần thu thập dữ liệu tương ứng và hiệu chỉnh mô hình phù hợp với điều kiện khí hậu và địa hình địa phương.

Kết luận

  • Luận văn đã xây dựng thành công mô hình hồi quy tuyến tính đa biến và mạng nơron nhân tạo để mô phỏng lượng bức xạ mặt trời tại trạm khí tượng Nhà Bè, với dữ liệu từ 2013 đến 2016.
  • Mạng nơron nhân tạo cho kết quả mô phỏng chính xác hơn, với hệ số tương quan R = 0.7637 và sai số MAE thấp hơn so với mô hình hồi quy tuyến tính đa biến.
  • Ngày trong năm là biến ảnh hưởng lớn nhất đến độ chính xác mô hình, trong khi tốc độ gió trung bình có ảnh hưởng nhỏ nhất.
  • Mô hình được kiểm định trên chuỗi số liệu độc lập năm 2016 cho thấy khả năng dự báo tốt, phù hợp ứng dụng thực tế trong công tác dự báo và bổ sung số liệu khí tượng.
  • Đề xuất tiếp tục mở rộng nghiên cứu, ứng dụng mô hình trong hệ thống dự báo khí tượng và đào tạo nhân lực chuyên môn để nâng cao hiệu quả quản lý tài nguyên và môi trường.

Hành động tiếp theo: Các cơ quan khí tượng và nghiên cứu nên phối hợp triển khai ứng dụng mô hình ANN trong dự báo khí tượng khu vực, đồng thời mở rộng nghiên cứu để nâng cao độ chính xác và phạm vi áp dụng.