Tổng quan nghiên cứu

Khu vực Tây Bắc Việt Nam với địa hình đồi núi phức tạp thường xuyên chịu ảnh hưởng của các đợt mưa lớn, gây ra lũ quét và sạt lở đất nghiêm trọng. Theo ước tính, mưa phân tầng chiếm khoảng 87% diện tích mưa trong khu vực, trong khi mưa đối lưu chiếm tỷ lệ nhỏ hơn nhưng lại có cường độ mạnh và gây thiệt hại lớn. Việc phân loại đặc điểm mưa và ước tính lượng mưa chính xác là nhiệm vụ cấp thiết nhằm nâng cao hiệu quả dự báo, cảnh báo thiên tai và giảm thiểu thiệt hại kinh tế - xã hội. Luận văn tập trung nghiên cứu phân loại đặc điểm mưa và xây dựng công thức ước tính lượng mưa dựa trên số liệu quan trắc từ Ra đa thời tiết phân cực kép tại trạm Pha Đin, tỉnh Điện Biên, trong khoảng thời gian từ tháng 2 đến tháng 8 các năm 2021 và 2022. Mục tiêu cụ thể là phát triển phương pháp phân loại mưa đối lưu và phân tầng bằng thuật toán Máy Véc tơ hỗ trợ (SVM) và xây dựng các công thức ước tính lượng mưa định lượng dựa trên các biến phân cực Ra đa. Nghiên cứu có ý nghĩa quan trọng trong việc nâng cao độ chính xác của dự báo mưa, hỗ trợ công tác phòng chống thiên tai tại khu vực Tây Bắc, đồng thời góp phần phát triển ứng dụng công nghệ Ra đa phân cực trong khí tượng thủy văn Việt Nam.

Cơ sở lý thuyết và phương pháp nghiên cứu

Khung lý thuyết áp dụng

Luận văn dựa trên các lý thuyết và mô hình nghiên cứu về Ra đa thời tiết phân cực và phân loại đặc điểm mưa. Ra đa phân cực kép cung cấp các biến phân cực như Phản hồi vô tuyến (Z), Độ lệch phản hồi vô tuyến (ZDR), Độ lệch pha riêng (KDP) và Hệ số tương quan (CC), giúp nhận biết hình dạng, kích thước và pha của các hạt mưa trong khí quyển. Mưa được phân thành hai loại chính: mưa phân tầng với cường độ nhỏ, diện tích rộng và mưa đối lưu với cường độ lớn, quy mô nhỏ. Phương pháp phân loại mưa tham khảo SHY95 dựa trên ngưỡng Z và bán kính ảnh hưởng biến đổi được sử dụng để so sánh. Thuật toán Máy Véc tơ hỗ trợ (SVM) được áp dụng để xây dựng mô hình phân loại nhị phân giữa mưa đối lưu và phân tầng dựa trên các biến phân cực. Các khái niệm chính bao gồm: siêu phẳng tối ưu trong SVM, các biến phân cực Ra đa (Z, ZDR, KDP, CC), và các chỉ số đánh giá chất lượng ước tính mưa như Tỉ lệ phát hiện (RD), Hệ số tương quan (r), Sai số quân phương (RMSE) và Sai số hệ thống (ME).

Phương pháp nghiên cứu

Nguồn dữ liệu chính là số liệu quan trắc Ra đa phân cực kép từ trạm Pha Đin trong 68 đợt mưa từ tháng 2 đến tháng 8 năm 2021 và 2022, cùng với số liệu lượng mưa tích lũy 10 phút từ 55 máy đo mưa tự động trong khu vực. Số liệu Ra đa được xử lý qua hai bước: kiểm soát chất lượng (lọc nhiễu, loại bỏ phản hồi không mưa) và nội suy trên lưới Đề-các 3 chiều với độ phân giải ngang 2 km, độ cao 3 km được sử dụng làm đầu vào cho phân loại. Thuật toán SVM được huấn luyện trên tập dữ liệu gồm 236.442 bộ số liệu (226.156 mưa phân tầng, 10.285 mưa đối lưu) được xác định nhãn phân loại dựa trên phương pháp SHY95. Các biến Z và ZDR được lựa chọn làm đặc trưng chính cho phân loại. Công thức ước tính mưa được xây dựng bằng phương pháp bình phương tối thiểu trên dạng logarit tuyến tính của các biến Z, ZDR, KDP, kết hợp với kết quả phân loại mưa từ SVM. Quá trình phân tích và đánh giá được thực hiện bằng ngôn ngữ Python với thư viện Scikit-learn và các công cụ thống kê tiêu chuẩn. Thời gian nghiên cứu tập trung vào các tháng mưa chính trong năm 2021-2022, phạm vi địa lý bao gồm 6 tỉnh Tây Bắc Việt Nam.

Kết quả nghiên cứu và thảo luận

Những phát hiện chính

  1. Phân loại đặc điểm mưa: Phương pháp SVM phân loại mưa phân tầng chiếm trung bình 87.2% diện tích, cao hơn so với 87% của phương pháp SHY95. Mưa đối lưu được SVM phân loại chiếm tỷ lệ thấp hơn (khoảng 0.5-13% theo SHY95), cho thấy SVM thận trọng hơn trong xác định mưa đối lưu. Tỉ lệ phân loại sai mưa đối lưu (nhầm với mưa phân tầng) của SVM chỉ dao động từ 0-10%, thấp hơn đáng kể so với 2-25% của SHY95, giảm hơn một nửa sai số phân loại.

  2. Đánh giá các trường hợp mưa đặc trưng: Trong trường hợp đường tố ngày 5/5/2021, SVM phân loại chính xác khu vực mưa đối lưu dải cánh cung và phân tầng phía sau đường tố, trong khi SHY95 mở rộng phân loại đối lưu không chính xác vào khu vực mưa phân tầng. Trường hợp mưa phân tầng diện rộng ngày 8/2/2021, cả hai phương pháp đều nhận diện chính xác vùng mưa phân tầng với sự xuất hiện dải sáng đặc trưng. Trường hợp mưa đối lưu trong khu vực phân tầng cũng cho thấy SVM hạn chế phân loại sai các ổ đối lưu nhỏ lẻ.

  3. Ước tính lượng mưa: Các công thức ước tính mưa sử dụng biến phân cực Z, ZDR, KDP kết hợp với kết quả phân loại SVM cho hệ số tương quan r đạt khoảng 0.85-0.9, sai số quân phương RMSE giảm 10-15% so với công thức truyền thống chỉ dùng Z. Tỉ lệ phát hiện mưa RD đạt trên 0.9, thể hiện khả năng phát hiện mưa chính xác và ổn định.

Thảo luận kết quả

Kết quả cho thấy thuật toán SVM với các biến phân cực Z và ZDR có khả năng phân biệt đặc điểm mưa đối lưu và phân tầng hiệu quả hơn phương pháp SHY95 truyền thống, đặc biệt trong việc giảm thiểu phân loại sai khu vực mưa phân tầng thành mưa đối lưu. Điều này có thể giải thích bởi SVM tận dụng đa chiều thông tin phân cực, không chỉ dựa vào ngưỡng cố định của Z. Việc sử dụng KDP trong công thức ước tính mưa giúp giảm ảnh hưởng của suy giảm tín hiệu và nhiễu, nâng cao độ chính xác lượng mưa ước tính. So sánh với các nghiên cứu quốc tế, kết quả phù hợp với xu hướng ứng dụng máy học trong phân loại mưa và ước tính lượng mưa từ Ra đa phân cực. Các biểu đồ phân bố tần suất biến phân cực và biểu đồ so sánh tỉ lệ phân loại sai minh họa rõ sự khác biệt và ưu thế của phương pháp SVM. Tuy nhiên, việc phân loại mưa đối lưu có thể bị hạn chế do số lượng mẫu mưa đối lưu trong tập huấn luyện thấp hơn nhiều so với mưa phân tầng, cần bổ sung dữ liệu trong tương lai để cải thiện mô hình.

Đề xuất và khuyến nghị

  1. Triển khai ứng dụng thuật toán SVM trong hệ thống dự báo mưa: Cơ quan khí tượng thủy văn khu vực Tây Bắc nên tích hợp phương pháp phân loại đặc điểm mưa dựa trên SVM vào quy trình xử lý số liệu Ra đa phân cực nhằm nâng cao độ chính xác dự báo mưa và cảnh báo lũ quét. Thời gian thực hiện trong vòng 1 năm.

  2. Mở rộng mạng lưới quan trắc và thu thập dữ liệu: Tăng cường lắp đặt thêm máy đo mưa tự động và nâng cấp hệ thống Ra đa phân cực để thu thập dữ liệu đa dạng hơn, đặc biệt là các đợt mưa đối lưu, nhằm cải thiện chất lượng tập huấn luyện và hiệu quả mô hình phân loại. Chủ thể thực hiện là các đơn vị quản lý khí tượng thủy văn trong 2-3 năm tới.

  3. Phát triển công thức ước tính mưa đa biến: Nghiên cứu tiếp tục mở rộng sử dụng thêm các biến phân cực mới và các thuật toán máy học khác để xây dựng công thức ước tính lượng mưa chính xác hơn, giảm sai số RMSE và ME, phục vụ công tác dự báo và cảnh báo thiên tai. Thời gian nghiên cứu 1-2 năm.

  4. Đào tạo và nâng cao năng lực chuyên môn: Tổ chức các khóa đào tạo về công nghệ Ra đa phân cực và ứng dụng trí tuệ nhân tạo trong khí tượng cho cán bộ kỹ thuật và nhà khoa học nhằm đảm bảo vận hành và phát triển bền vững các phương pháp mới. Chủ thể là các viện nghiên cứu và trường đại học trong 6-12 tháng.

Đối tượng nên tham khảo luận văn

  1. Các nhà khí tượng thủy văn và dự báo thời tiết: Luận văn cung cấp phương pháp phân loại mưa và ước tính lượng mưa mới, giúp nâng cao độ chính xác dự báo và cảnh báo mưa lớn, lũ quét tại khu vực Tây Bắc.

  2. Các nhà nghiên cứu và sinh viên chuyên ngành khí tượng học: Tài liệu chi tiết về ứng dụng Ra đa phân cực và thuật toán máy học trong phân loại mưa, phù hợp làm tài liệu tham khảo và phát triển nghiên cứu tiếp theo.

  3. Cơ quan quản lý thiên tai và phòng chống lũ lụt: Kết quả nghiên cứu hỗ trợ xây dựng hệ thống cảnh báo sớm, giảm thiểu thiệt hại do mưa lớn và lũ quét gây ra, đặc biệt trong vùng địa hình phức tạp.

  4. Các đơn vị phát triển công nghệ và phần mềm khí tượng: Cung cấp cơ sở khoa học và thuật toán để phát triển các sản phẩm phần mềm phân tích dữ liệu Ra đa phân cực, ứng dụng trí tuệ nhân tạo trong khí tượng thủy văn.

Câu hỏi thường gặp

  1. Phương pháp SVM có ưu điểm gì so với phương pháp SHY95 trong phân loại mưa?
    SVM sử dụng đa chiều thông tin từ các biến phân cực (Z, ZDR) để xây dựng siêu phẳng phân loại tối ưu, giảm thiểu phân loại sai khu vực mưa phân tầng thành mưa đối lưu, trong khi SHY95 dựa chủ yếu vào ngưỡng cố định của Z nên dễ gây sai lệch.

  2. Tại sao lại chọn mực độ cao 3 km để phân loại và ước tính mưa?
    Mực 3 km nằm trong khoảng độ cao xuất hiện dải sáng đặc trưng của mưa phân tầng, đồng thời đảm bảo độ phân giải không gian và giảm ảnh hưởng của nhiễu tín hiệu, phù hợp với phạm vi quan trắc của Ra đa phân cực.

  3. Các biến phân cực ZDR và KDP đóng vai trò thế nào trong ước tính lượng mưa?
    ZDR phản ánh hình dạng và kích thước hạt mưa, giúp phân biệt mưa đối lưu và phân tầng; KDP đo sự khác biệt pha sóng điện từ, ít bị ảnh hưởng bởi suy giảm tín hiệu, giúp cải thiện độ chính xác ước tính lượng mưa.

  4. Làm thế nào để giảm sai số trong ước tính lượng mưa từ Ra đa?
    Kết hợp sử dụng các biến phân cực đa dạng, áp dụng thuật toán máy học để phân loại đặc điểm mưa trước khi ước tính, đồng thời tăng cường mạng lưới quan trắc mặt đất để hiệu chỉnh và đánh giá mô hình.

  5. Phương pháp này có thể áp dụng cho các khu vực khác ngoài Tây Bắc không?
    Có thể áp dụng nhưng cần hiệu chỉnh lại mô hình và công thức ước tính dựa trên đặc điểm khí hậu, địa hình và dữ liệu quan trắc của từng khu vực để đảm bảo độ chính xác.

Kết luận

  • Phương pháp phân loại đặc điểm mưa sử dụng thuật toán SVM dựa trên các biến phân cực Ra đa (Z, ZDR) cho kết quả phân loại chính xác hơn phương pháp SHY95 truyền thống, giảm hơn một nửa tỷ lệ phân loại sai.
  • Các công thức ước tính lượng mưa kết hợp biến phân cực và kết quả phân loại SVM nâng cao độ chính xác với hệ số tương quan r đạt khoảng 0.9, giảm sai số RMSE và ME đáng kể.
  • Nghiên cứu đã chứng minh hiệu quả ứng dụng Ra đa phân cực kép và trí tuệ nhân tạo trong phân loại và ước tính mưa tại khu vực Tây Bắc, góp phần cải thiện công tác dự báo và cảnh báo thiên tai.
  • Cần mở rộng thu thập dữ liệu, nâng cao mạng lưới quan trắc và phát triển thêm các thuật toán để hoàn thiện mô hình trong tương lai.
  • Khuyến nghị triển khai ứng dụng phương pháp trong hệ thống dự báo khí tượng thủy văn khu vực, đồng thời đào tạo cán bộ kỹ thuật để vận hành và phát triển bền vững.

Hành động tiếp theo là phối hợp với các cơ quan khí tượng thủy văn để thử nghiệm và tích hợp phương pháp vào quy trình dự báo, đồng thời mở rộng nghiên cứu ứng dụng cho các vùng miền khác.