## Tổng quan nghiên cứu

Ô nhiễm không khí tại các đô thị lớn đang là vấn đề nghiêm trọng ảnh hưởng trực tiếp đến sức khỏe cộng đồng và môi trường sống. Tại Việt Nam, đặc biệt là thành phố Hồ Chí Minh, chất lượng không khí ngày càng suy giảm do các hoạt động công nghiệp, giao thông và sinh hoạt đô thị. Theo dữ liệu thu thập từ vệ tinh Sentinel-5P và trạm quan trắc tại Lãnh sự quán Hoa Kỳ, nồng độ các chất ô nhiễm như NO₂, SO₂, CO, HCHO, O₃ và bụi mịn PM2.5 có xu hướng biến động phức tạp theo thời gian và không gian. Mục tiêu nghiên cứu của luận văn là xây dựng một ứng dụng dự báo chất lượng không khí đô thị dựa trên các thuật toán máy học hiện đại, nhằm cung cấp công cụ hỗ trợ quản lý môi trường và bảo vệ sức khỏe người dân. Phạm vi nghiên cứu tập trung trên địa bàn 24 quận/huyện của thành phố Hồ Chí Minh, với dữ liệu thu thập từ năm 2016 đến 2021. Việc dự báo chính xác chất lượng không khí sẽ giúp giảm thiểu tác động tiêu cực của ô nhiễm, nâng cao hiệu quả quản lý và hoạch định chính sách môi trường.

## Cơ sở lý thuyết và phương pháp nghiên cứu

### Khung lý thuyết áp dụng

Luận văn áp dụng các lý thuyết và mô hình sau:

- **Máy học (Machine Learning)**: Phương pháp học có giám sát và học sâu được sử dụng để xây dựng mô hình dự báo dựa trên dữ liệu chuỗi thời gian.
- **Mạng nơ-ron hồi quy (RNN)**: Bao gồm các biến thể LSTM và GRU, giúp xử lý dữ liệu chuỗi thời gian với khả năng ghi nhớ thông tin dài hạn.
- **Mạng thần kinh tích chập (CNN)**: Được sử dụng để trích xuất đặc trưng từ dữ liệu không gian-thời gian.
- **Chỉ số chất lượng không khí (AQI)**: Là thước đo tổng hợp các chất ô nhiễm chính như NO₂, SO₂, CO, PM2.5, PM10, O₃, giúp đánh giá mức độ ô nhiễm và ảnh hưởng đến sức khỏe.

Các khái niệm chính bao gồm: ô nhiễm không khí, bụi mịn PM2.5, chỉ số AQI, mạng nơ-ron hồi quy, và học sâu.

### Phương pháp nghiên cứu

Nguồn dữ liệu chính gồm:

- Dữ liệu vệ tinh Sentinel-5P cung cấp nồng độ các chất NO₂, SO₂, CO, HCHO, O₃ với độ phân giải không gian khoảng 5,5km x 3,5km, thu thập từ tháng 4/2018 đến tháng 12/2021.
- Dữ liệu bụi mịn PM2.5 từ trạm quan trắc Lãnh sự quán Hoa Kỳ tại TP. Hồ Chí Minh, thu thập từ tháng 2/2016 đến tháng 12/2021.

Phương pháp phân tích sử dụng các thuật toán máy học gồm CNN, RNN-LSTM và RNN-GRU để xây dựng mô hình dự báo chất lượng không khí. Bộ dữ liệu được chia thành 70% dùng để huấn luyện và 30% để kiểm thử. Quá trình nghiên cứu kéo dài từ năm 2020 đến 2022, bao gồm thu thập, xử lý dữ liệu, xây dựng mô hình và triển khai ứng dụng dự báo.

## Kết quả nghiên cứu và thảo luận

### Những phát hiện chính

- Mô hình RNN-LSTM đạt hiệu quả dự báo cao nhất với sai số RMSE thấp hơn 15% so với mô hình CNN và RNN-GRU trên bộ dữ liệu các chất NO₂, SO₂, CO, HCHO, O₃ và PM2.5.
- Dữ liệu chất lượng không khí có tính tuần hoàn theo chu kỳ ngày và tháng, thể hiện qua biểu đồ biến thiên nồng độ các chất trong 31 ngày liên tục và thống kê theo tháng.
- Ứng dụng dự báo chất lượng không khí đô thị được xây dựng với giao diện trực quan, cho phép người dùng theo dõi nồng độ các chất ô nhiễm theo khu vực địa lý và thời gian thực.
- Việc tích hợp dữ liệu vệ tinh và trạm quan trắc mặt đất giúp nâng cao độ chính xác và tính khả dụng của mô hình dự báo.

### Thảo luận kết quả

Nguyên nhân mô hình RNN-LSTM vượt trội là do khả năng ghi nhớ thông tin dài hạn và xử lý chuỗi thời gian hiệu quả, phù hợp với đặc tính dữ liệu chất lượng không khí. Kết quả này tương đồng với các nghiên cứu quốc tế về dự báo ô nhiễm không khí sử dụng mạng nơ-ron hồi quy. Việc sử dụng dữ liệu vệ tinh Sentinel-5P kết hợp với dữ liệu mặt đất giúp khắc phục hạn chế về độ phân giải không gian và thời gian của từng nguồn dữ liệu riêng lẻ. Biểu đồ và bảng số liệu minh họa sự biến động nồng độ các chất ô nhiễm theo ngày và tháng giúp trực quan hóa hiệu quả mô hình. Kết quả nghiên cứu có ý nghĩa quan trọng trong việc hỗ trợ các cơ quan quản lý môi trường xây dựng các chiến lược giảm thiểu ô nhiễm và bảo vệ sức khỏe cộng đồng.

## Đề xuất và khuyến nghị

- **Phát triển hệ thống giám sát chất lượng không khí liên tục**: Tăng cường lắp đặt các trạm quan trắc và tích hợp dữ liệu vệ tinh để nâng cao độ chính xác dự báo, thực hiện trong vòng 1-2 năm, do Sở Tài nguyên và Môi trường TP.HCM chủ trì.
- **Ứng dụng công nghệ AI trong quản lý môi trường**: Đẩy mạnh nghiên cứu và ứng dụng các thuật toán máy học tiên tiến để dự báo và cảnh báo ô nhiễm không khí, hướng tới mục tiêu giảm 10% mức độ ô nhiễm trong 3 năm tới.
- **Tăng cường truyền thông và nâng cao nhận thức cộng đồng**: Sử dụng ứng dụng dự báo để cung cấp thông tin kịp thời, giúp người dân chủ động phòng tránh tác hại ô nhiễm, triển khai ngay trong năm 2023 bởi các tổ chức xã hội và truyền thông.
- **Hợp tác liên ngành trong nghiên cứu và phát triển**: Kết nối các viện nghiên cứu, trường đại học và doanh nghiệp công nghệ để phát triển các giải pháp dự báo và quản lý chất lượng không khí hiệu quả, xây dựng kế hoạch dài hạn 5 năm.
- **Cải tiến và mở rộng ứng dụng dự báo**: Nâng cấp giao diện, bổ sung tính năng dự báo đa dạng và mở rộng phạm vi địa lý, nhằm phục vụ tốt hơn nhu cầu người dùng và các nhà quản lý.

## Đối tượng nên tham khảo luận văn

- **Nhà quản lý môi trường đô thị**: Hỗ trợ xây dựng chính sách và chiến lược quản lý ô nhiễm không khí dựa trên dữ liệu dự báo chính xác.
- **Nhà nghiên cứu và học thuật**: Cung cấp cơ sở dữ liệu và mô hình máy học ứng dụng trong lĩnh vực môi trường và công nghệ thông tin.
- **Doanh nghiệp công nghệ và phát triển phần mềm**: Tham khảo để phát triển các sản phẩm ứng dụng dự báo chất lượng không khí và các giải pháp AI trong môi trường.
- **Cộng đồng và người dân đô thị**: Sử dụng ứng dụng dự báo để chủ động phòng tránh tác hại ô nhiễm, nâng cao nhận thức về bảo vệ sức khỏe.

## Câu hỏi thường gặp

1. **Ứng dụng dự báo chất lượng không khí hoạt động như thế nào?**  
Ứng dụng sử dụng dữ liệu vệ tinh và trạm quan trắc mặt đất, áp dụng các thuật toán máy học như RNN-LSTM để dự báo nồng độ các chất ô nhiễm theo thời gian và không gian, cung cấp thông tin trực quan qua giao diện web.

2. **Dữ liệu sử dụng trong nghiên cứu có độ tin cậy ra sao?**  
Dữ liệu được thu thập từ vệ tinh Sentinel-5P và trạm quan trắc Lãnh sự quán Hoa Kỳ, có độ phân giải cao và được chuẩn hóa theo chu kỳ 24 giờ, đảm bảo tính chính xác và liên tục.

3. **Mô hình nào cho kết quả dự báo tốt nhất?**  
Mô hình RNN-LSTM cho kết quả dự báo chính xác nhất với sai số RMSE thấp hơn 15% so với các mô hình CNN và RNN-GRU trên cùng bộ dữ liệu.

4. **Ứng dụng có thể mở rộng ra các khu vực khác không?**  
Có thể mở rộng ứng dụng sang các đô thị khác bằng cách thu thập dữ liệu tương tự và điều chỉnh mô hình phù hợp với đặc điểm địa phương.

5. **Lợi ích của việc dự báo chất lượng không khí là gì?**  
Giúp các cơ quan quản lý có cơ sở khoa học để xây dựng chính sách, người dân chủ động phòng tránh, giảm thiểu tác động tiêu cực đến sức khỏe và môi trường.

## Kết luận

- Đã xây dựng thành công mô hình dự báo chất lượng không khí đô thị sử dụng các thuật toán máy học hiện đại, đặc biệt là RNN-LSTM.
- Thu thập và chuẩn hóa dữ liệu chất lượng không khí từ vệ tinh Sentinel-5P và trạm quan trắc mặt đất với chu kỳ 24 giờ.
- Ứng dụng dự báo được triển khai với giao diện trực quan, hỗ trợ người dùng theo dõi và quản lý chất lượng không khí hiệu quả.
- Kết quả nghiên cứu góp phần nâng cao hiệu quả quản lý môi trường và bảo vệ sức khỏe cộng đồng tại TP. Hồ Chí Minh.
- Đề xuất các giải pháp phát triển và mở rộng ứng dụng trong tương lai, hướng tới xây dựng đô thị xanh, sạch, bền vững.

**Hành động tiếp theo:** Khuyến khích các cơ quan chức năng và nhà nghiên cứu tiếp tục phát triển, ứng dụng công nghệ AI trong quản lý môi trường, đồng thời phổ biến rộng rãi ứng dụng dự báo đến cộng đồng người dân.