## Tổng quan nghiên cứu

Ô nhiễm môi trường đang là vấn đề cấp bách toàn cầu, đặc biệt tại Việt Nam, nơi các ngành công nghiệp nặng như luyện kim, khai thác than, sản xuất phân bón và công nghiệp năng lượng phát triển mạnh mẽ. Theo báo cáo, các sự cố ô nhiễm nghiêm trọng như vụ xả thải của Công ty Formosa Hà Tĩnh năm 2016 đã gây ra thảm họa môi trường biển, ảnh hưởng nghiêm trọng đến sinh kế và sức khỏe cộng đồng. Trong bối cảnh đó, việc quan trắc môi trường trở thành công cụ thiết yếu để theo dõi, đánh giá và dự báo chất lượng môi trường nhằm giảm thiểu tác động tiêu cực. Mục tiêu nghiên cứu của luận văn là xây dựng mô hình dự báo chỉ số môi trường ứng dụng công nghệ trí tuệ nhân tạo (AI), học máy (ML) và công nghệ Business Intelligence (Power BI), đồng thời phát triển cổng quan trắc môi trường trên nền tảng web app. Phạm vi nghiên cứu tập trung vào 5 chỉ số ô nhiễm nguồn nước gồm BOD, TSS, COD, pH, NH4-NO3 tại các nhà máy, doanh nghiệp và khu công nghiệp ở tỉnh Thanh Hóa trong giai đoạn hiện tại. Nghiên cứu có ý nghĩa quan trọng trong việc hỗ trợ quản lý môi trường, cảnh báo sớm và ra quyết định chính sách bảo vệ môi trường, góp phần thúc đẩy phát triển bền vững và công nghiệp hóa tại khu vực.

## Cơ sở lý thuyết và phương pháp nghiên cứu

### Khung lý thuyết áp dụng

Luận văn dựa trên các lý thuyết và mô hình nghiên cứu sau:

- **Trí tuệ nhân tạo (AI)**: Khả năng máy tính tự học và xử lý thông tin để thực hiện các tác vụ thông minh như con người, bao gồm phân tích và dự báo dữ liệu môi trường.
- **Học máy (Machine Learning - ML)**: Phương pháp con của AI, sử dụng thuật toán để học từ dữ liệu lịch sử và dự đoán các giá trị tương lai mà không cần lập trình cụ thể.
- **Mạng nơ-ron sâu (Deep Learning - DL)**: Mô hình học máy nâng cao, đặc biệt là mạng BI-LSTM và CNN-LSTM, được áp dụng để xử lý dữ liệu chuỗi thời gian và dữ liệu không gian trong dự báo chỉ số môi trường.
- **Chỉ số chất lượng không khí (AQI) và chỉ số chất lượng nước (WQI)**: Các chỉ số chuẩn để đánh giá mức độ ô nhiễm và ảnh hưởng đến sức khỏe con người, được sử dụng làm tham chiếu trong phân tích.
- **Phân tích dữ liệu và trực quan hóa (Power BI)**: Công cụ BI giúp tổng hợp, phân tích và trình bày dữ liệu môi trường một cách trực quan, hỗ trợ ra quyết định.

### Phương pháp nghiên cứu

Nghiên cứu sử dụng hai phương pháp chính:

- **Phương pháp nghiên cứu lý thuyết**: Thu thập, tổng hợp và phân tích các tài liệu, mô hình dự báo chỉ số môi trường dựa trên AI, ML và công nghệ BI. Nghiên cứu các chỉ số môi trường trọng tâm và khung pháp lý liên quan.
- **Phương pháp nghiên cứu thực nghiệm**: Thu thập dữ liệu quan trắc môi trường thực tế tại các địa điểm trong tỉnh Thanh Hóa, xây dựng bộ dữ liệu huấn luyện với cỡ mẫu khoảng 1 năm dữ liệu thời gian thực. Áp dụng các mô hình hồi quy tuyến tính, BI-LSTM, CNN-LSTM để huấn luyện và đánh giá mô hình dự báo. So sánh kết quả với các mô hình truyền thống và các hệ thống hiện có. Thời gian nghiên cứu kéo dài trong năm 2022 với các giai đoạn chuẩn bị dữ liệu, xây dựng mô hình, phát triển ứng dụng và đánh giá.

## Kết quả nghiên cứu và thảo luận

### Những phát hiện chính

- **Hiệu quả mô hình dự báo AI và ML**: Mô hình BI-LSTM và CNN-LSTM cho kết quả dự báo chỉ số PM2.5 với độ chính xác cao, giá trị R-squared đạt khoảng 0,975 - 0,976, vượt trội so với các mô hình hồi quy truyền thống. Mô hình hồi quy tuyến tính cũng cho thấy tham số PM10 ngoài trời có hệ số hồi quy β khoảng 0,4 - 0,5, đóng vai trò quan trọng trong dự báo chỉ số trong nhà.
- **Ứng dụng Power BI trong trực quan hóa dữ liệu**: Power BI hỗ trợ trực quan hóa dữ liệu môi trường đa chiều, cho phép người dùng truy vấn, phân tích và dự báo dữ liệu theo thời gian thực, với khả năng kết nối đa dạng nguồn dữ liệu và tạo dashboard linh hoạt.
- **Phân tích dữ liệu phân cụm**: Thuật toán Fuzzy c-Means và Possibilistic Fuzzy c-Means được áp dụng để phân tích các chỉ số môi trường như SO2, PM10, giúp phân loại mức độ ô nhiễm và cảnh báo kịp thời. Thuật toán K-means cải tiến cho độ chính xác cao hơn và thời gian xử lý nhanh hơn.
- **Khung pháp lý và tiêu chuẩn**: Thông tư số 10/2021/TT-BTNMT của Bộ Tài nguyên và Môi trường quy định kỹ thuật quan trắc môi trường và quản lý dữ liệu, tạo cơ sở pháp lý vững chắc cho việc triển khai hệ thống quan trắc và dự báo.

### Thảo luận kết quả

Kết quả nghiên cứu cho thấy sự kết hợp giữa công nghệ AI, ML và BI là giải pháp hiệu quả để nâng cao chất lượng dự báo chỉ số môi trường, giúp các cơ quan quản lý có thể chủ động trong việc giám sát và xử lý ô nhiễm. So với các nghiên cứu trước đây, mô hình BI-LSTM và CNN-LSTM thể hiện ưu thế vượt trội trong việc xử lý dữ liệu chuỗi thời gian và dữ liệu không gian, phù hợp với đặc thù dữ liệu môi trường phức tạp. Việc ứng dụng Power BI không chỉ giúp trực quan hóa dữ liệu mà còn hỗ trợ phân tích sâu, tạo điều kiện thuận lợi cho việc ra quyết định nhanh chóng và chính xác. Các thuật toán phân cụm giúp phân loại mức độ ô nhiễm một cách hiệu quả, hỗ trợ cảnh báo sớm. Kết quả này phù hợp với xu hướng ứng dụng công nghệ số trong quản lý môi trường hiện đại, đồng thời đáp ứng yêu cầu pháp lý mới nhất của Việt Nam. Dữ liệu có thể được trình bày qua các biểu đồ thời gian thực, bảng so sánh chỉ số AQI và WQI, cũng như dashboard tổng hợp các chỉ số môi trường theo khu vực và thời gian.

## Đề xuất và khuyến nghị

- **Triển khai hệ thống quan trắc môi trường tự động**: Xây dựng và vận hành hệ thống cổng quan trắc môi trường tích hợp công nghệ AI và BI để thu thập, phân tích và dự báo chỉ số môi trường theo thời gian thực, nhằm nâng cao hiệu quả giám sát và cảnh báo. Thời gian thực hiện trong 1-2 năm, chủ thể là Sở Tài nguyên và Môi trường tỉnh Thanh Hóa.
- **Đào tạo và nâng cao năng lực chuyên môn**: Tổ chức các khóa đào tạo về AI, ML và BI cho cán bộ quản lý và kỹ thuật viên môi trường để đảm bảo vận hành và phát triển hệ thống hiệu quả. Thời gian đào tạo định kỳ hàng năm, chủ thể là các trường đại học và trung tâm đào tạo chuyên ngành.
- **Phát triển mô hình dự báo đa chỉ số**: Mở rộng nghiên cứu và ứng dụng các mô hình dự báo cho nhiều chỉ số môi trường khác nhau, bao gồm không khí, nước và đất, nhằm cung cấp cái nhìn toàn diện về chất lượng môi trường. Thời gian nghiên cứu 2-3 năm, chủ thể là các viện nghiên cứu và trường đại học.
- **Tăng cường hợp tác liên ngành và chia sẻ dữ liệu**: Xây dựng cơ chế phối hợp giữa các cơ quan quản lý, doanh nghiệp và cộng đồng trong việc chia sẻ dữ liệu quan trắc môi trường, nâng cao tính minh bạch và hiệu quả quản lý. Chủ thể là các cơ quan nhà nước và tổ chức xã hội, thực hiện liên tục.
- **Cập nhật và tuân thủ quy định pháp lý**: Đảm bảo hệ thống và hoạt động quan trắc môi trường tuân thủ các quy định mới nhất của Bộ Tài nguyên và Môi trường, đặc biệt Thông tư số 10/2021/TT-BTNMT, nhằm nâng cao tính pháp lý và hiệu quả quản lý.

## Đối tượng nên tham khảo luận văn

- **Cơ quan quản lý nhà nước về môi trường**: Hỗ trợ xây dựng chính sách, giám sát và quản lý chất lượng môi trường dựa trên dữ liệu dự báo chính xác và kịp thời.
- **Các doanh nghiệp và khu công nghiệp**: Áp dụng mô hình dự báo để kiểm soát và giảm thiểu ô nhiễm, đảm bảo tuân thủ quy định pháp luật và nâng cao trách nhiệm xã hội.
- **Các nhà nghiên cứu và học viên ngành khoa học máy tính, môi trường**: Tham khảo phương pháp ứng dụng AI, ML và BI trong lĩnh vực quan trắc và dự báo môi trường, phát triển nghiên cứu sâu hơn.
- **Cộng đồng và tổ chức xã hội**: Sử dụng thông tin dự báo để nâng cao nhận thức, tham gia bảo vệ môi trường và đề xuất các biện pháp phòng tránh ô nhiễm.

## Câu hỏi thường gặp

1. **Tại sao cần xây dựng mô hình dự báo chỉ số môi trường?**  
Mô hình dự báo giúp dự đoán xu hướng ô nhiễm trong tương lai, hỗ trợ các cơ quan quản lý và cộng đồng có biện pháp phòng ngừa kịp thời, giảm thiểu tác động tiêu cực đến sức khỏe và môi trường.

2. **Công nghệ AI và ML được áp dụng như thế nào trong nghiên cứu này?**  
AI và ML được sử dụng để phân tích dữ liệu lớn, xây dựng các mô hình dự báo chính xác như BI-LSTM và CNN-LSTM, giúp dự đoán các chỉ số môi trường dựa trên dữ liệu lịch sử và hiện tại.

3. **Power BI có vai trò gì trong hệ thống quan trắc môi trường?**  
Power BI hỗ trợ trực quan hóa dữ liệu, tạo dashboard phân tích đa chiều, giúp người dùng dễ dàng theo dõi, đánh giá và ra quyết định dựa trên dữ liệu môi trường một cách hiệu quả.

4. **Phạm vi nghiên cứu của luận văn bao gồm những gì?**  
Nghiên cứu tập trung vào 5 chỉ số ô nhiễm nguồn nước (BOD, TSS, COD, pH, NH4-NO3) tại các nhà máy, doanh nghiệp và khu công nghiệp ở tỉnh Thanh Hóa, xây dựng mô hình dự báo và phát triển cổng quan trắc môi trường trên nền web.

5. **Luận văn có những đóng góp chính nào?**  
Luận văn xây dựng thành công mô hình dự báo chỉ số môi trường ứng dụng AI và ML, phát triển hệ thống cổng quan trắc môi trường tích hợp Power BI, đồng thời đề xuất các giải pháp quản lý và cảnh báo ô nhiễm hiệu quả, phù hợp với yêu cầu thực tiễn và pháp lý hiện hành.

## Kết luận

- Đề tài đã xây dựng thành công mô hình dự báo chỉ số môi trường sử dụng công nghệ AI, ML và BI với độ chính xác cao, đặc biệt trong dự báo các chỉ số ô nhiễm nguồn nước.  
- Hệ thống cổng quan trắc môi trường trên nền web app giúp giám sát và dự báo chỉ số môi trường theo thời gian thực, hỗ trợ quản lý và ra quyết định.  
- Nghiên cứu áp dụng các thuật toán phân cụm và mô hình mạng nơ-ron sâu, nâng cao hiệu quả phân tích và dự báo so với các phương pháp truyền thống.  
- Kết quả nghiên cứu phù hợp với quy định pháp lý mới nhất của Bộ Tài nguyên và Môi trường, góp phần thúc đẩy công nghiệp hóa và phát triển bền vững tại tỉnh Thanh Hóa.  
- Đề xuất các giải pháp triển khai hệ thống, đào tạo nhân lực và mở rộng nghiên cứu nhằm nâng cao hiệu quả quản lý môi trường trong tương lai.  

Hành động tiếp theo là triển khai thực tế hệ thống cổng quan trắc môi trường, đồng thời mở rộng nghiên cứu ứng dụng công nghệ AI và BI trong các lĩnh vực môi trường khác để nâng cao chất lượng sống và bảo vệ hệ sinh thái bền vững.