Tổng quan nghiên cứu

Xoáy thuận nhiệt đới (XTNĐ) là hiện tượng thời tiết nguy hiểm, gây thiệt hại nghiêm trọng về người và tài sản do mưa lớn, gió mạnh và nước biển dâng. Việt Nam nằm trong vùng nhiệt đới với bờ biển dài, thuộc khu vực Tây Bắc Thái Bình Dương – một trong những ổ bão hoạt động mạnh nhất thế giới. Theo thống kê, từ năm 2015 đến 2019, số lượng XTNĐ hoạt động trên khu vực này dao động hàng trăm cơn mỗi năm, trong đó có nhiều cơn bão mạnh và rất mạnh. Việc nhận dạng chính xác vị trí và cường độ XTNĐ là nhiệm vụ cấp thiết nhằm nâng cao hiệu quả dự báo, giảm thiểu thiệt hại thiên tai.

Mục tiêu nghiên cứu của luận văn là phát triển phương pháp nhận dạng vị trí và cường độ XTNĐ hoạt động trên khu vực Biển Đông bằng công nghệ trí tuệ nhân tạo (AI), sử dụng dữ liệu vệ tinh địa tĩnh Himawari-8,9 và dữ liệu vectơ chuyển động khí quyển (AMV). Phạm vi nghiên cứu tập trung vào giai đoạn 2015-2019 với dữ liệu vệ tinh và quỹ đạo bão chuẩn từ Cục Khí tượng Nhật Bản (JMA). Nghiên cứu nhằm cải thiện độ chính xác trong nhận dạng tâm bão và phân loại cường độ, khắc phục những hạn chế của phương pháp truyền thống như kỹ thuật Dvorak và ADT vốn còn nhiều sai số và phụ thuộc vào kinh nghiệm phân tích viên.

Kết quả nghiên cứu có ý nghĩa quan trọng trong việc nâng cao năng lực dự báo khí tượng thủy văn, hỗ trợ công tác phòng chống thiên tai tại Việt Nam và khu vực Biển Đông, đồng thời góp phần thúc đẩy ứng dụng công nghệ AI trong lĩnh vực khí tượng học.

Cơ sở lý thuyết và phương pháp nghiên cứu

Khung lý thuyết áp dụng

Luận văn dựa trên hai nền tảng lý thuyết chính: khí tượng học về XTNĐ và công nghệ trí tuệ nhân tạo (AI) trong nhận dạng đối tượng.

  1. Lý thuyết về XTNĐ: XTNĐ là hệ thống áp thấp quy mô synop, hình thành trên vùng biển có nhiệt độ bề mặt ≥ 26.5°C, với hoàn lưu gió bề mặt rõ ràng. Tổ chức Khí tượng Thế giới (WMO) phân loại XTNĐ theo tốc độ gió cực đại thành các cấp: Áp thấp nhiệt đới, Bão nhiệt đới, Bão mạnh và Bão rất mạnh. Phương pháp truyền thống như kỹ thuật Dvorak và ADT được sử dụng để xác định tâm và cường độ bão dựa trên ảnh vệ tinh, nhưng còn nhiều hạn chế về độ chính xác và tính khách quan.

  2. Lý thuyết về trí tuệ nhân tạo và học sâu (DL): AI, đặc biệt là các mô hình học sâu như mạng nơ-ron tích chập (CNN), mạng ResNet và RetinaNet, được ứng dụng để nhận dạng đối tượng trong ảnh vệ tinh. ResNet giúp trích xuất đặc trưng không gian và thời gian của ảnh vệ tinh và dữ liệu AMV, giải quyết vấn đề biến mất đạo hàm trong mạng sâu. RetinaNet là mô hình nhận dạng đối tượng hiệu quả, xử lý tốt bài toán mất cân bằng lớp và cho phép xác định vị trí (bounding box) và phân loại cường độ XTNĐ.

Các khái niệm chính bao gồm:

  • Quỹ đạo bão chuẩn (QĐBC): dữ liệu vị trí và cường độ bão chuẩn từ JMA.
  • Ảnh vệ tinh địa tĩnh Himawari-8,9: cung cấp ảnh mây đa phổ với độ phân giải không gian 0.5-2 km, thời gian 10 phút/lần.
  • Dữ liệu vectơ chuyển động khí quyển (AMV): thể hiện hướng và tốc độ gió qua các ảnh vệ tinh liên tục.
  • Mạng ResNet-50: mạng CNN sâu 50 lớp dùng để trích xuất đặc trưng ảnh.
  • Mạng RetinaNet: mô hình nhận dạng đối tượng với khả năng phân loại và định vị XTNĐ theo cường độ.
  • Chỉ số mAP và IoU: dùng để đánh giá độ chính xác nhận dạng vị trí và phân loại.

Phương pháp nghiên cứu

Nguồn dữ liệu chính gồm:

  • Quỹ đạo bão chuẩn (QĐBC) của JMA từ 2015 đến 2019, bao gồm thông tin vị trí tâm, cường độ, bán kính gió.
  • Ảnh vệ tinh Himawari-8,9 kênh hồng ngoại IR1, độ phân giải 1-2 km, thời gian 10 phút/lần, phạm vi toàn bộ Tây Bắc Thái Bình Dương.
  • Dữ liệu AMV trích xuất từ ảnh vệ tinh, thể hiện chuyển động khí quyển với độ phân giải lưới 7x7 pixels (500m) và 28x28 pixels (2km).

Quá trình nghiên cứu gồm các bước:

  1. Xây dựng cơ sở dữ liệu gán nhãn: Dữ liệu ảnh vệ tinh và AMV được gán nhãn dựa trên vị trí và cường độ XTNĐ từ QĐBC, phân loại thành 4 nhóm: Áp thấp nhiệt đới, Bão nhiệt đới, Bão mạnh, Bão rất mạnh.
  2. Huấn luyện mô hình DL: Sử dụng mạng ResNet-50 để trích xuất đặc trưng không gian-thời gian từ ảnh vệ tinh và AMV, sau đó đưa vào mô hình RetinaNet để nhận dạng vị trí và phân loại cường độ XTNĐ.
  3. Đánh giá mô hình: Sử dụng chỉ số mAP (mean Average Precision) và IoU (Intersection over Union) để đánh giá độ chính xác nhận dạng vị trí và phân loại.
  4. Timeline nghiên cứu: Thu thập dữ liệu từ 2015-2019, huấn luyện và thử nghiệm mô hình trong năm 2023-2024.

Phương pháp chọn mẫu là sử dụng toàn bộ dữ liệu XTNĐ trong khu vực Tây Bắc Thái Bình Dương, tập trung thử nghiệm trên khu vực Biển Đông. Phương pháp phân tích dựa trên học sâu, tận dụng khả năng trích xuất đặc trưng và nhận dạng đối tượng của mạng CNN và RetinaNet, phù hợp với dữ liệu ảnh vệ tinh đa chiều và chuỗi thời gian.

Kết quả nghiên cứu và thảo luận

Những phát hiện chính

  1. Hiệu quả nhận dạng vị trí XTNĐ: Mô hình DL đạt sai số vị trí tâm XTNĐ trung bình khoảng 20-30 km so với dữ liệu quỹ đạo bão chuẩn, thấp hơn đáng kể so với phương pháp ADT truyền thống có sai số lên đến 50-60 km. Ví dụ, với cơn bão Nakri (2019), sai số vị trí trung bình của mô hình DL là 22 km, trong khi ADT là 55 km.

  2. Độ chính xác phân loại cường độ XTNĐ: Mô hình RetinaNet nhận dạng chính xác các cấp độ XTNĐ với độ chính xác (accuracy) đạt khoảng 85-89%, vượt trội so với phương pháp truyền thống. Tỉ lệ nhận dạng đúng các cấp bão rất mạnh đạt trên 88%, trong khi các cấp thấp hơn cũng đạt trên 80%.

  3. Khả năng nhận dạng mẫu mây phức tạp: Mô hình DL xử lý tốt các trường hợp mẫu mây không điển hình hoặc có tương tác với các hệ thống thời tiết khác, vốn là điểm yếu của kỹ thuật Dvorak và ADT. Điều này giúp giảm sai số trong giai đoạn hình thành và suy yếu của XTNĐ.

  4. Tác động của dữ liệu AMV: Việc kết hợp dữ liệu vectơ chuyển động khí quyển AMV với ảnh vệ tinh giúp mô hình nắm bắt được đặc trưng chuyển động không gian-thời gian của XTNĐ, cải thiện độ chính xác nhận dạng vị trí và cường độ lên khoảng 5-7% so với chỉ sử dụng ảnh vệ tinh.

Thảo luận kết quả

Nguyên nhân chính của sự cải thiện là do mô hình DL tận dụng được khả năng học các đặc trưng phức tạp từ dữ liệu đa chiều và chuỗi thời gian, không bị giới hạn bởi các giả định vật lý như phương pháp truyền thống. Việc sử dụng mạng ResNet giúp trích xuất hiệu quả các đặc trưng không gian và thời gian từ ảnh vệ tinh và AMV, trong khi RetinaNet xử lý tốt bài toán mất cân bằng lớp và nhận dạng đa tỷ lệ đối tượng.

So sánh với các nghiên cứu quốc tế, kết quả của luận văn tương đồng với các mô hình CNN và ConvLSTM được áp dụng trên dữ liệu mô phỏng khí quyển và vệ tinh, với sai số vị trí trung bình dưới 30 km và độ chính xác phân loại trên 80%. Điều này khẳng định tính khả thi và hiệu quả của phương pháp AI trong giám sát XTNĐ trên khu vực Biển Đông.

Dữ liệu có thể được trình bày qua biểu đồ sai số vị trí trung bình so sánh giữa phương pháp AI và ADT, biểu đồ độ chính xác phân loại cường độ theo từng cấp bão, cũng như bảng thống kê số lượng mẫu và kết quả nhận dạng theo từng năm.

Đề xuất và khuyến nghị

  1. Triển khai hệ thống nhận dạng tự động XTNĐ dựa trên AI: Áp dụng mô hình DL đã phát triển vào hệ thống dự báo khí tượng thủy văn quốc gia, nhằm tự động nhận dạng vị trí và cường độ XTNĐ trong thời gian thực, nâng cao độ chính xác và giảm thiểu sai số do con người. Thời gian thực hiện: 1-2 năm; chủ thể: Trung tâm Dự báo Khí tượng Thủy văn Quốc gia.

  2. Mở rộng dữ liệu huấn luyện và cập nhật mô hình liên tục: Thu thập thêm dữ liệu vệ tinh và AMV mới, mở rộng phạm vi khu vực và thời gian, đồng thời cập nhật mô hình DL để cải thiện khả năng nhận dạng các dạng XTNĐ hiếm gặp hoặc phức tạp. Thời gian: liên tục; chủ thể: các viện nghiên cứu khí tượng và công nghệ thông tin.

  3. Phát triển giao diện trực quan hỗ trợ dự báo viên: Xây dựng phần mềm trực quan hóa kết quả nhận dạng XTNĐ, giúp dự báo viên dễ dàng theo dõi, kiểm tra và ra quyết định dự báo chính xác hơn. Thời gian: 1 năm; chủ thể: Trung tâm Dự báo và các đơn vị công nghệ.

  4. Tăng cường đào tạo và hợp tác quốc tế: Đào tạo chuyên sâu về AI và khí tượng cho cán bộ dự báo, đồng thời hợp tác với các trung tâm quốc tế để trao đổi dữ liệu, phương pháp và nâng cao năng lực nghiên cứu. Thời gian: 2-3 năm; chủ thể: Bộ Khoa học và Công nghệ, Đại học Khoa học Tự nhiên.

Đối tượng nên tham khảo luận văn

  1. Các nhà nghiên cứu khí tượng và khí hậu: Luận văn cung cấp phương pháp mới ứng dụng AI trong nhận dạng XTNĐ, giúp nâng cao chất lượng nghiên cứu và phát triển các mô hình dự báo hiện đại.

  2. Cán bộ dự báo khí tượng thủy văn: Hỗ trợ cải thiện độ chính xác trong công tác dự báo, giảm thiểu sai số và tăng tính khách quan trong nhận dạng vị trí và cường độ bão.

  3. Chuyên gia công nghệ thông tin và AI: Cung cấp ví dụ ứng dụng thực tiễn của mạng DL trong lĩnh vực khí tượng, mở rộng phạm vi ứng dụng AI trong các ngành khoa học tự nhiên.

  4. Các cơ quan quản lý thiên tai và phòng chống bão lụt: Giúp nâng cao năng lực dự báo, từ đó xây dựng các kế hoạch ứng phó kịp thời, giảm thiểu thiệt hại do thiên tai gây ra.

Câu hỏi thường gặp

  1. Phương pháp AI có thể thay thế hoàn toàn phương pháp truyền thống không?
    Phương pháp AI bổ sung và nâng cao độ chính xác nhận dạng, nhưng vẫn cần kết hợp với kinh nghiệm dự báo viên và các phương pháp truyền thống để đảm bảo tính toàn diện và độ tin cậy.

  2. Dữ liệu vệ tinh Himawari-8,9 có ưu điểm gì trong nghiên cứu này?
    Himawari-8,9 cung cấp ảnh đa phổ với độ phân giải không gian cao (0.5-2 km) và thời gian quét nhanh (10 phút/lần), giúp theo dõi chi tiết sự phát triển và chuyển động của XTNĐ.

  3. Mô hình DL có thể áp dụng cho các khu vực khác ngoài Biển Đông không?
    Có thể, với điều kiện có dữ liệu huấn luyện phù hợp. Mô hình có khả năng học các đặc trưng chung của XTNĐ, nhưng cần hiệu chỉnh để phù hợp với đặc điểm khí hậu từng khu vực.

  4. Sai số vị trí tâm XTNĐ của mô hình DL là bao nhiêu?
    Sai số trung bình khoảng 20-30 km, thấp hơn nhiều so với phương pháp ADT truyền thống có sai số 50-60 km, giúp nâng cao độ chính xác dự báo.

  5. Làm thế nào để cải thiện thêm độ chính xác của mô hình?
    Có thể mở rộng dữ liệu huấn luyện, kết hợp thêm các nguồn dữ liệu khác như radar, mô hình số, và áp dụng các kỹ thuật học sâu tiên tiến hơn như học chuyển giao (transfer learning).

Kết luận

  • Luận văn đã phát triển thành công mô hình học sâu kết hợp mạng ResNet và RetinaNet để nhận dạng vị trí và cường độ XTNĐ trên khu vực Biển Đông với độ chính xác cao.
  • Mô hình giảm thiểu sai số vị trí tâm XTNĐ xuống còn khoảng 20-30 km, cải thiện đáng kể so với phương pháp truyền thống.
  • Phân loại cường độ XTNĐ đạt độ chính xác trên 85%, xử lý tốt các mẫu mây phức tạp và tương tác thời tiết.
  • Việc kết hợp dữ liệu ảnh vệ tinh Himawari-8,9 và vectơ chuyển động khí quyển AMV giúp nâng cao hiệu quả nhận dạng.
  • Đề xuất triển khai hệ thống nhận dạng tự động, mở rộng dữ liệu và đào tạo chuyên sâu nhằm nâng cao năng lực dự báo khí tượng thủy văn tại Việt Nam.

Tiếp theo, cần tiến hành thử nghiệm mô hình trong môi trường thực tế, tích hợp vào hệ thống dự báo quốc gia và mở rộng nghiên cứu ứng dụng AI trong các lĩnh vực khí tượng khác. Đề nghị các cơ quan liên quan phối hợp triển khai để phát huy tối đa hiệu quả nghiên cứu.