Nghiên Cứu Phương Pháp Nội Suy và Dự Đoán Ô Nhiễm Không Khí Tại TP. Hồ Chí Minh

Luận văn thạc sĩ kỹ thuật nghiên cứu công nghệ thông tin nghiên cứu một số phương pháp nội suy và tiên đoán trên dữ liệu cảm biến di, khảo sát thực trạng, phân tích nguyên nhân,

Trường đại học

Đại học Quốc gia TP. Hồ Chí Minh

Chuyên ngành

Công nghệ thông tin

Người đăng

Ẩn danh

Thể loại

luận văn thạc sĩ

2021

104

Phí lưu trữ

35 Point

Mục lục chi tiết

LỜI CAM ĐOAN

LỜI CẢM ƠN

1. CHƯƠNG 1: GIỚI THIỆU TỔNG QUAN

1.1. Giới thiệu bài toán

1.2. Công bố kết quả nghiên cứu

1.3. Các nghiên cứu liên quan về nội suy và tiên đoán giá trị AQI

1.4. Hệ thống thu thập dữ liệu

1.4.1. Mô tả hệ thống thu thập dữ liệu

1.4.2. Mô hình thiết kế hệ thống

2. CHƯƠNG 2

2.1. Các đề xuất giải pháp

2.2. Phương pháp dự đoán giá trị bị thiếu

2.3. Phương pháp đo lường chỉ số chất lượng không khí cá nhân

2.4. Kết quả thực nghiệm và thảo luận

3. CHƯƠNG 3: ÁP DỤNG CHO TP. HỒ CHÍ MINH

3.1. Phân tích vấn đề

3.2. Phương pháp đề xuất

3.2.1. Trích xuất đặc trưng

3.2.2. Xây dựng model

3.2.2.1. Phương pháp Stacking

3.2.3. Đánh giá hiệu suất

3.2.3.1. Tập dữ liệu

3.2.3.2. Cài đặt model

3.2.4. Kết quả và thảo luận

3.2.5. Kết luận và hướng phát triển

4. CHƯƠNG 4: KẾT LUẬN

DANH MỤC CÔNG BỐ KHOA HỌC

TÀI LIỆU THAM KHẢO

Tóm tắt

I. Tổng Quan Về Nghiên Cứu Ô Nhiễm Không Khí TP

Ô nhiễm không khí là một vấn đề cấp bách, đặc biệt tại các thành phố lớn như TP.HCM. Sự gia tăng dân số, công nghiệp hóa và mật độ giao thông cao đã tạo ra áp lực lớn lên chất lượng không khí. TP.HCM đang đối mặt với những thách thức lớn về môi trường, ảnh hưởng trực tiếp đến sức khỏe người dân. Cần có những giải pháp hiệu quả để giám sát, dự đoán và giảm thiểu ô nhiễm không khí TP.HCM. Các nghiên cứu về chất lượng không khí TP.HCM tập trung vào việc đo lường chỉ số chất lượng không khí bằng cách sử dụng dữ liệu từ các cảm biến và trạm đo ô nhiễm không khí. Tuy nhiên, việc tiếp cận nguồn dữ liệu ô nhiễm không khí tốt vẫn còn hạn chế, dẫn đến độ chi tiết của bản đồ ô nhiễm chưa cao. Luận văn này mong muốn tìm ra một phương pháp tạo ra bản đồ ô nhiễm với độ chi tiết cao, vừa nội suy ra các giá trị ô nhiễm không khí ở các vùng không được phủ sóng bởi các trạm thu thập dữ liệu, vừa tiên đoán giá trị chỉ số AQI trong thời gian ngắn.

1.1. Tầm Quan Trọng Của Việc Nghiên Cứu Ô Nhiễm Không Khí

Việc nghiên cứu ô nhiễm không khí có vai trò quan trọng trong việc bảo vệ sức khỏe cộng đồng và môi trường. Các nghiên cứu chỉ ra rằng ô nhiễm không khí có thể gây ra các bệnh về tim mạch, hô hấp và thậm chí là ung thư. Việc hiểu rõ về nguồn gốc, diễn biến và tác động của ô nhiễm không khí là cơ sở để xây dựng các chính sách và biện pháp can thiệp hiệu quả. Theo nghiên cứu của các tác giả [1], bụi mịn PM2.5 có thể gây ra bệnh viêm xoang. Do đó, việc đo lường và dự đoán AQI TP.HCM là vô cùng cần thiết để người dân có thể chủ động bảo vệ sức khỏe.

1.2. Giới Thiệu Về Dữ Liệu Quan Trắc Ô Nhiễm Không Khí Hiện Có

Hiện nay, có nhiều nguồn dữ liệu về ô nhiễm không khí tại TP.HCM, bao gồm dữ liệu từ các trạm quan trắc cố định và dữ liệu từ các nguồn mở như AirVisual và Envisoft. Tuy nhiên, các trạm quan trắc thường đặt cách xa nhau, dẫn đến việc khó khăn trong việc có được thông tin chi tiết về biến động ô nhiễm không khí ở các khu vực khác nhau. Bộ dữ liệu MNR-HCM và MNR-Air được thu thập bằng các hộp cảm biến môi trường giá thành thấp gắn trên các xe gắn máy chạy xung quanh thành phố.

II. Thách Thức Trong Nội Suy Dự Đoán Ô Nhiễm Không Khí HCM

Việc nội suy ô nhiễm không khí và dự đoán ô nhiễm không khí tại TP.HCM đối mặt với nhiều thách thức. Mật độ trạm quan trắc còn hạn chế, phân bố không đều, và dữ liệu thường xuyên bị thiếu do lỗi thiết bị hoặc điều kiện thời tiết. Biến động ô nhiễm không khí phức tạp, chịu ảnh hưởng bởi nhiều yếu tố như giao thông, khí tượng và hoạt động công nghiệp. Việc áp dụng các phương pháp nội suy và mô hình dự đoán ô nhiễm truyền thống có thể không mang lại kết quả chính xác và tin cậy. Cần có những phương pháp tiên tiến hơn để xử lý dữ liệu không đầy đủ, tích hợp nhiều nguồn thông tin và mô phỏng các quá trình vật lý, hóa học phức tạp liên quan đến ô nhiễm không khí.

2.1. Khó Khăn Về Dữ Liệu Đầu Vào Cho Nội Suy và Dự Đoán

Sự thiếu hụt dữ liệu quan trắc không khí TP.HCM là một trong những trở ngại lớn nhất. Số lượng trạm quan trắc còn ít, đặc biệt ở các khu vực ngoại thành và khu công nghiệp. Dữ liệu thu thập được có thể không đầy đủ, không chính xác hoặc không được cập nhật thường xuyên. Các yếu tố khí tượng như gió, nhiệt độ, độ ẩm cũng ảnh hưởng đến sự phân tán và biến đổi của các chất ô nhiễm, gây khó khăn cho việc dự đoán ô nhiễm không khí.

2.2. Phức Tạp Trong Mô Hình Hóa Biến Động Ô Nhiễm Không Khí

Biến động ô nhiễm không khí là một quá trình phức tạp, chịu tác động bởi nhiều yếu tố. Các nguồn phát thải, điều kiện khí tượng, địa hình và các phản ứng hóa học trong không khí đều đóng vai trò quan trọng. Việc mô hình hóa các quá trình này đòi hỏi kiến thức chuyên sâu về khí tượng học, hóa học môi trường và kỹ thuật mô phỏng. Cần có những thuật toán dự đoán mạnh mẽ để xử lý sự phức tạp và phi tuyến tính của hệ thống ô nhiễm không khí.

III. Phương Pháp Nội Suy Kriging Cải Thiện Chất Lượng Bản Đồ AQI

Phương pháp nội suy Kriging là một kỹ thuật thống kê không gian tiên tiến, được sử dụng rộng rãi trong việc ước tính giá trị của một biến tại các vị trí không có dữ liệu quan trắc. So với các phương pháp nội suy truyền thống như IDW, Kriging có khả năng tận dụng cấu trúc không gian của dữ liệu, tính toán trọng số dựa trên mối tương quan giữa các điểm đo và đưa ra ước tính không thiên lệch với sai số nhỏ nhất. Việc áp dụng phương pháp nội suy Kriging có thể giúp cải thiện đáng kể chất lượng bản đồ AQI TP.HCM, cung cấp thông tin chi tiết và chính xác hơn về phân tích không gian.

3.1. Ưu Điểm Của Phương Pháp Nội Suy Kriging So Với IDW

Phương pháp nội suy Kriging vượt trội so với phương pháp nội suy IDW (Inverse Distance Weighting) ở khả năng mô hình hóa sự tương quan không gian giữa các điểm dữ liệu. Kriging sử dụng variogram để mô tả sự thay đổi của biến theo khoảng cách và hướng, từ đó xác định trọng số tối ưu cho từng điểm đo. Trong khi đó, IDW chỉ dựa trên khoảng cách mà không xét đến cấu trúc không gian của dữ liệu. Điều này giúp Kriging tạo ra bản đồ ô nhiễm không khí chính xác hơn.

3.2. Các Bước Triển Khai Phương Pháp Nội Suy Kriging

Việc triển khai phương pháp nội suy Kriging bao gồm các bước sau: (1) Thu thập và tiền xử lý dữ liệu quan trắc không khí TP.HCM; (2) Xây dựng variogram để mô tả sự tương quan không gian của dữ liệu; (3) Chọn mô hình Kriging phù hợp (ví dụ: Ordinary Kriging, Universal Kriging); (4) Ước tính giá trị AQI tại các vị trí không có dữ liệu; (5) Đánh giá và kiểm tra độ chính xác của kết quả nội suy.

IV. Ứng Dụng Machine Learning Dự Đoán Ô Nhiễm Không Khí Tương Lai

Machine learning đang trở thành một công cụ mạnh mẽ trong việc dự đoán ô nhiễm không khí. Các mô hình machine learning có khả năng học từ dữ liệu lịch sử, nhận diện các yếu tố ảnh hưởng đến ô nhiễm không khí và đưa ra dự báo chính xác về AQI trong tương lai. Việc kết hợp machine learning với các phương pháp nội suy truyền thống có thể tạo ra hệ thống dự báo ô nhiễm không khí hiệu quả, giúp người dân và chính quyền chủ động ứng phó với các tình huống ô nhiễm.

4.1. Các Thuật Toán Machine Learning Phù Hợp Cho Dự Đoán AQI

Nhiều thuật toán dự đoán machine learning có thể được áp dụng cho bài toán dự đoán AQI, bao gồm: (1) Regression (Linear Regression, Support Vector Regression); (2) Tree-based models (Random Forest, Gradient Boosting); (3) Neural Networks (Multilayer Perceptron, Recurrent Neural Networks). Việc lựa chọn thuật toán dự đoán phù hợp phụ thuộc vào đặc điểm của dữ liệu và mục tiêu của dự báo.

4.2. Tích Hợp Dữ Liệu Khí Tượng Vào Mô Hình Dự Đoán Machine Learning

Dữ liệu khí tượng đóng vai trò quan trọng trong việc dự đoán ô nhiễm không khí. Các yếu tố như nhiệt độ, độ ẩm, gió và lượng mưa có ảnh hưởng trực tiếp đến sự phân tán và biến đổi của các chất ô nhiễm. Việc tích hợp dữ liệu khí tượng vào mô hình dự đoán ô nhiễm machine learning có thể cải thiện đáng kể độ chính xác của dự báo.

V. Phân Tích Kết Quả Nghiên Cứu Ô Nhiễm Không Khí Thực Tế Tại HCM

Nghiên cứu này đã được công bố tại các hội nghị trong và ngoài nước, bao gồm FAIR 2020, ICDAR 2020 và MMM 2021. Các công trình này giới thiệu về hệ thống UrbanEgoAQI, phương pháp phân tích dữ liệu đa phương thức để dự đoán dữ liệu bị thiếu, và bộ dữ liệu MNR-HCM và MNR-Air. Các kết quả thực nghiệm cho thấy hệ thống hoạt động tốt với độ chính xác cao, đặc biệt là trong việc nội suy ô nhiễm không khí và dự đoán ô nhiễm không khí ngắn hạn.

5.1. So Sánh Kết Quả Với Các Nghiên Cứu Về Chất Lượng Không Khí

Để đánh giá hiệu quả của các phương pháp đề xuất, cần so sánh kết quả dự đoán ô nhiễm không khí với các nghiên cứu khác về chất lượng không khí TP.HCM. Các chỉ số như RMSE, MAE và R-squared có thể được sử dụng để định lượng độ chính xác của dự báo. Việc so sánh với các phương pháp nội suy và dự đoán truyền thống cũng giúp làm nổi bật ưu điểm của các phương pháp tiên tiến hơn.

5.2. Đánh Giá Độ Tin Cậy Của Bản Đồ Ô Nhiễm Không Khí

Bản đồ ô nhiễm không khí được tạo ra cần được đánh giá về độ tin cậy và khả năng ứng dụng thực tế. Việc kiểm tra chéo với dữ liệu quan trắc không khí TP.HCM từ các trạm cố định và di động có thể giúp xác định độ chính xác của bản đồ. Ngoài ra, cần đánh giá khả năng đáp ứng của bản đồ đối với các nhu cầu thông tin của người dùng và các nhà hoạch định chính sách.

VI. Giải Pháp Chính Sách Giảm Ô Nhiễm Không Khí TP

Nghiên cứu về ô nhiễm không khí TP.HCM cần hướng tới việc đề xuất các giải pháp giảm ô nhiễm không khí TP.HCM hiệu quả và khả thi. Các giải pháp này có thể bao gồm việc kiểm soát nguồn phát thải, khuyến khích sử dụng phương tiện giao thông công cộng và xe điện, tăng cường cây xanh đô thị và nâng cao nhận thức cộng đồng về bảo vệ môi trường. Chính sách môi trường đóng vai trò quan trọng trong việc thực hiện các giải pháp này.

6.1. Đề Xuất Chính Sách Kiểm Soát Ô Nhiễm Từ Giao Thông

Giao thông là một trong những nguồn phát thải lớn nhất gây ô nhiễm không khí TP.HCM. Cần có các chính sách môi trường nhằm kiểm soát khí thải từ xe cộ, như: (1) Hạn chế xe cũ, xe không đạt tiêu chuẩn khí thải; (2) Khuyến khích sử dụng phương tiện giao thông công cộng và xe điện; (3) Phát triển hệ thống giao thông thông minh để giảm ùn tắc.

6.2. Nâng Cao Nhận Thức Cộng Đồng Về Ảnh Hưởng Ô Nhiễm Không Khí

Nâng cao nhận thức cộng đồng về ảnh hưởng của ô nhiễm không khí đến sức khỏe là một yếu tố quan trọng trong việc giảm thiểu ô nhiễm không khí TP.HCM. Cần tăng cường tuyên truyền, giáo dục về các biện pháp bảo vệ sức khỏe cá nhân và khuyến khích người dân tham gia vào các hoạt động bảo vệ môi trường.

28/05/2025

Bạn đang xem trước tài liệu:

Luận văn thạc sĩ công nghệ thông tin nghiên cứu một số phương pháp nội suy và tiên đoán trên dữ liệu cảm biến di động nhằm tạo ra bản đồ ô nhiễm môi trường thời gian thực

Tải đầy đủ

Nội dung chính

Tổng quan nghiên cứu

Ô nhiễm không khí là một trong những vấn đề môi trường nghiêm trọng nhất hiện nay, ảnh hưởng trực tiếp đến sức khỏe cộng đồng trên toàn thế giới. Theo ước tính, khoảng 91% dân số toàn cầu đang sống trong các khu vực có chất lượng không khí vượt quá giới hạn cảnh báo của Tổ chức Y tế Thế giới (WHO). Thành phố Hồ Chí Minh, với mật độ dân số cao, nhiều khu công nghiệp và giao thông đông đúc, đang phải đối mặt với thách thức lớn về ô nhiễm không khí. Việc đo lường và dự báo chỉ số chất lượng không khí (AQI) cục bộ với độ phân giải cao là rất cần thiết để bảo vệ sức khỏe người dân và hỗ trợ các chính sách quản lý môi trường hiệu quả.

Mục tiêu nghiên cứu của luận văn là phát triển các phương pháp nội suy và tiên đoán giá trị AQI dựa trên dữ liệu cảm biến di động nhằm tạo ra bản đồ ô nhiễm môi trường thời gian thực có độ chi tiết cao cho Thành phố Hồ Chí Minh. Nghiên cứu tập trung vào việc khai thác dữ liệu từ các cảm biến di động gắn trên xe máy tình nguyện viên, kết hợp với dữ liệu từ các trạm cố định và nguồn dữ liệu mở công cộng. Phạm vi nghiên cứu bao gồm dữ liệu thu thập từ tháng 7 đến tháng 8 năm 2020 tại nhiều tuyến đường trong thành phố, với các chỉ số ô nhiễm như PM2.5, NO2, SO2, CO, O3 và các yếu tố thời tiết đi kèm.

Ý nghĩa của nghiên cứu thể hiện qua việc cung cấp một công cụ dự báo và nội suy AQI chính xác, giúp người dân và các cơ quan quản lý có thể theo dõi chất lượng không khí theo thời gian thực, từ đó đưa ra các biện pháp phòng ngừa và ứng phó kịp thời. Ngoài ra, nghiên cứu còn góp phần nâng cao hiểu biết về mối quan hệ giữa ô nhiễm không khí, giao thông và sức khỏe cá nhân trong môi trường đô thị.

Cơ sở lý thuyết và phương pháp nghiên cứu

Khung lý thuyết áp dụng

Luận văn dựa trên các lý thuyết và mô hình nghiên cứu về chất lượng không khí và ứng dụng máy học trong dự báo môi trường. Hai lý thuyết chính được áp dụng gồm:

Lý thuyết chỉ số chất lượng không khí (AQI): AQI là chỉ số tổng hợp phản ánh mức độ ô nhiễm không khí dựa trên nồng độ của các chất ô nhiễm chính như PM2.5, PM10, NO2, SO2, CO và O3. AQI được tính toán theo các tiêu chuẩn quốc gia và quốc tế, trong đó giá trị AQI càng cao thì mức độ ô nhiễm càng nghiêm trọng và nguy cơ ảnh hưởng đến sức khỏe càng lớn.
Mô hình máy học dự báo và nội suy dữ liệu không gian-thời gian: Sử dụng các thuật toán như Random Forest, XGBoost, CatBoost và kỹ thuật Stacking Generalization để xây dựng mô hình hồi quy dự đoán giá trị AQI tại các vị trí và thời điểm không có dữ liệu đo trực tiếp. Các khái niệm chính bao gồm:
- Nội suy dữ liệu (Interpolation): Ước lượng giá trị AQI tại các điểm không có cảm biến dựa trên dữ liệu từ các điểm lân cận.
- Tiên đoán dữ liệu (Prediction): Dự báo giá trị AQI trong tương lai dựa trên dữ liệu lịch sử và các đặc trưng môi trường.
- Đặc trưng thời gian và không gian: Bao gồm dấu thời gian (Part-Of-Day, giờ cao điểm), vị trí địa lý (khoảng cách đến sân bay, mật độ giao thông), và dữ liệu thời tiết (nhiệt độ, độ ẩm, áp suất).

Phương pháp nghiên cứu

Nguồn dữ liệu chính được sử dụng là bộ dữ liệu MNR-Air thu thập từ tháng 7 đến tháng 8 năm 2020 tại Thành phố Hồ Chí Minh. Dữ liệu bao gồm:

Dữ liệu cảm biến di động đo các chất ô nhiễm PM2.5, PM10, NO2, SO2, CO, O3.
Dữ liệu vị trí GPS và thời gian thu thập.
Dữ liệu thời tiết công cộng cập nhật 30 phút một lần.
Dữ liệu cảm xúc cá nhân và hình ảnh lifelog từ người thu thập.

Cỡ mẫu gồm nhiều tình nguyện viên sử dụng xe máy gắn cảm biến di động, thu thập dữ liệu trên các tuyến đường dài khoảng 30 km, đi qua 6 quận của thành phố. Dữ liệu được xử lý tiền xử lý để loại bỏ nhiễu, nội suy các giá trị bị thiếu và chuẩn hóa theo phút.

Phương pháp phân tích sử dụng các thuật toán máy học hồi quy như Linear Regression, Support Vector Machine (SVM), Random Forest, Extra Trees, XGBoost, CatBoost và kỹ thuật Stacking Generalization. Quá trình huấn luyện và đánh giá mô hình được thực hiện bằng kỹ thuật 5-fold cross-validation, chia dữ liệu thành 80% để huấn luyện và 20% để kiểm tra. Các chỉ số đánh giá hiệu suất gồm Root Mean Square Error (RMSE), Mean Absolute Error (MAE), hệ số xác định (R²), Accuracy và F1-score.

Kết quả nghiên cứu và thảo luận

Những phát hiện chính

Hiệu quả của phương pháp nội suy và tiên đoán dữ liệu bị thiếu: Phương pháp lọc thời gian và bán kính quét tăng dần cho phép dự đoán giá trị PM2.5 bị thiếu với độ chính xác cao. Trên bộ dữ liệu Testing, phương pháp đạt điểm số Euclidean distance (L2) thấp nhất khoảng 0.00046, vượt trội hơn so với một số nhóm nghiên cứu khác.
Đo lường chỉ số chất lượng không khí cá nhân (PAQI): Phương pháp điều chỉnh PAQI dựa trên AQI, user’s tag (đánh giá cảm xúc), mật độ giao thông và mật độ cây xanh cho kết quả chính xác hơn so với phương pháp sử dụng giá trị trung bình user’s tag và đặc trưng tuyến đường. Trên bộ dữ liệu Training, phương pháp đạt điểm số đánh giá khoảng 0.8, thể hiện độ tin cậy cao.
Hiệu suất các mô hình máy học trong dự đoán AQI cục bộ: Khi chỉ sử dụng dữ liệu cảm biến thô, mô hình Extra Trees đạt RMSE khoảng 45 và R² tương ứng. Khi kết hợp thêm đặc trưng thời gian và vị trí, CatBoost đạt RMSE giảm xuống còn 36.79 và R² tăng lên đáng kể. Kịch bản kết hợp đầy đủ dữ liệu cảm biến, thời gian, vị trí và dữ liệu thời tiết công cộng, kỹ thuật Stacking đạt hiệu suất tốt nhất với RMSE khoảng 17 và R² cao nhất.
So sánh với các nhóm nghiên cứu khác: Phương pháp dự đoán dữ liệu bị thiếu của luận văn đạt điểm số cao hơn nhóm DCU và chỉ thấp hơn nhóm Healthism sử dụng LightGBM. Trong đo lường PAQI, phương pháp đạt điểm số tốt hơn nhóm DCU nhưng thấp hơn nhóm Healthism, cho thấy tiềm năng cải tiến.

Thảo luận kết quả

Nguyên nhân của hiệu quả cao trong dự đoán dữ liệu bị thiếu và đo lường PAQI là do việc kết hợp đa dạng các nguồn dữ liệu không đồng nhất, bao gồm dữ liệu cảm biến di động, dữ liệu cảm xúc cá nhân và đặc trưng môi trường. Việc sử dụng thuật toán lọc thời gian và bán kính quét tăng dần giúp tận dụng tối đa dữ liệu gần kề về không gian và thời gian, giảm thiểu sai số nội suy.

So sánh với các nghiên cứu khác, phương pháp sử dụng kỹ thuật Stacking kết hợp nhiều mô hình máy học đã nâng cao độ chính xác dự báo AQI cục bộ, phù hợp với đặc thù dữ liệu đô thị phức tạp của Thành phố Hồ Chí Minh. Kết quả này cũng cho thấy việc bổ sung dữ liệu thời tiết công cộng và đặc trưng vị trí có tác động tích cực đến hiệu suất mô hình.

Dữ liệu có thể được trình bày qua các biểu đồ so sánh RMSE, MAE và R² giữa các mô hình và kịch bản khác nhau, cũng như bảng so sánh điểm số dự đoán với các nhóm nghiên cứu khác để minh họa rõ ràng hiệu quả của phương pháp đề xuất.

Đề xuất và khuyến nghị

Triển khai mạng lưới cảm biến di động quy mô lớn: Hành động gắn các hộp cảm biến cá nhân trên xe máy của người dân, như xe GrabBike, để thu thập dữ liệu AQI liên tục trên toàn thành phố. Mục tiêu tăng độ phủ sóng dữ liệu, cải thiện độ chi tiết bản đồ ô nhiễm trong vòng 12 tháng. Chủ thể thực hiện: Sở Tài nguyên và Môi trường phối hợp với các doanh nghiệp vận tải công nghệ.
Phát triển ứng dụng cảnh báo chất lượng không khí cá nhân: Xây dựng ứng dụng di động cung cấp thông tin AQI cá nhân dựa trên vị trí và cảm xúc người dùng, giúp người dân chủ động phòng tránh tác động ô nhiễm. Mục tiêu nâng cao nhận thức và bảo vệ sức khỏe cộng đồng trong 6 tháng. Chủ thể thực hiện: Các công ty công nghệ và tổ chức y tế.
Tích hợp dữ liệu cảm biến với hệ thống quản lý đô thị thông minh: Kết nối dữ liệu AQI với hệ thống GIS và quản lý giao thông để hỗ trợ ra quyết định giảm thiểu ô nhiễm, như điều chỉnh luồng giao thông và quy hoạch cây xanh. Mục tiêu giảm mức độ ô nhiễm tại các điểm nóng trong 18 tháng. Chủ thể thực hiện: UBND thành phố và các đơn vị quản lý đô thị.
Nâng cao năng lực nghiên cứu và đào tạo chuyên sâu về công nghệ cảm biến và phân tích dữ liệu môi trường: Tổ chức các khóa đào tạo, hội thảo chuyên ngành nhằm phát triển nguồn nhân lực chất lượng cao phục vụ nghiên cứu và ứng dụng công nghệ trong quản lý môi trường. Mục tiêu trong 24 tháng. Chủ thể thực hiện: Các trường đại học và viện nghiên cứu.

Đối tượng nên tham khảo luận văn

Các nhà quản lý môi trường đô thị: Luận văn cung cấp phương pháp và công cụ dự báo AQI cục bộ giúp họ ra quyết định chính sách, quy hoạch và kiểm soát ô nhiễm hiệu quả.
Các nhà nghiên cứu và sinh viên ngành Công nghệ Thông tin, Môi trường: Tài liệu chi tiết về ứng dụng máy học trong xử lý dữ liệu cảm biến di động, mô hình dự báo và nội suy dữ liệu không gian-thời gian.
Doanh nghiệp công nghệ phát triển giải pháp IoT và cảm biến môi trường: Tham khảo để phát triển các thiết bị cảm biến di động và hệ thống thu thập dữ liệu thông minh, nâng cao độ chính xác và hiệu quả thu thập.
Cơ quan y tế và tổ chức bảo vệ sức khỏe cộng đồng: Sử dụng kết quả nghiên cứu để đánh giá tác động ô nhiễm không khí đến sức khỏe cá nhân, xây dựng các chương trình phòng ngừa và cảnh báo kịp thời.

Câu hỏi thường gặp

Phương pháp nội suy dữ liệu bị thiếu trong nghiên cứu này có gì đặc biệt?
Phương pháp sử dụng thuật toán lọc thời gian kết hợp bán kính quét tăng dần để chọn dữ liệu gần nhất về không gian và thời gian, từ đó dự đoán giá trị PM2.5 bị thiếu với độ chính xác cao. Ví dụ, bán kính quét tối ưu là 20m giúp giảm nhiễu và tăng độ tin cậy.
Dữ liệu cảm biến di động được thu thập như thế nào?
Dữ liệu được thu thập từ các hộp cảm biến gắn trên xe máy của tình nguyện viên, đo các chất ô nhiễm và yếu tố môi trường theo chu kỳ 2-3 giây, đồng thời ghi lại vị trí GPS và thời gian. Quá trình thu thập diễn ra trên nhiều tuyến đường dài khoảng 30 km.
Tại sao cần kết hợp dữ liệu cảm xúc cá nhân trong đo lường PAQI?
Cảm xúc cá nhân phản ánh nhận thức và tác động thực tế của ô nhiễm không khí đến sức khỏe và tâm trạng người dân. Việc kết hợp user’s tag giúp điều chỉnh chỉ số PAQI phù hợp hơn với trải nghiệm thực tế, nâng cao tính ứng dụng của bản đồ ô nhiễm.
Các mô hình máy học nào được sử dụng và ưu điểm của kỹ thuật Stacking?
Các mô hình gồm Linear Regression, SVM, Random Forest, Extra Trees, XGBoost, CatBoost. Kỹ thuật Stacking kết hợp dự đoán của nhiều mô hình cơ bản để tạo ra mô hình meta-level, giúp cải thiện độ chính xác và khả năng tổng quát hóa so với từng mô hình đơn lẻ.
Ứng dụng thực tế của bản đồ AQI cục bộ trong quản lý đô thị là gì?
Bản đồ AQI cục bộ giúp xác định các điểm nóng ô nhiễm, hỗ trợ điều chỉnh luồng giao thông, quy hoạch cây xanh, cảnh báo người dân và các nhóm nhạy cảm, từ đó giảm thiểu tác động tiêu cực đến sức khỏe và nâng cao chất lượng cuộc sống đô thị.

Kết luận

Phương pháp nội suy và tiên đoán dựa trên dữ liệu cảm biến di động và máy học cho kết quả chính xác trong việc xây dựng bản đồ ô nhiễm không khí cục bộ tại Thành phố Hồ Chí Minh.
Kỹ thuật Stacking kết hợp nhiều mô hình máy học vượt trội hơn so với các mô hình đơn lẻ về RMSE, MAE và hệ số xác định R².
Việc tích hợp dữ liệu cảm xúc cá nhân và đặc trưng môi trường giúp đo lường chỉ số chất lượng không khí cá nhân (PAQI) sát thực tế hơn.
Nghiên cứu đã được công bố trên nhiều hội nghị quốc tế, góp phần nâng cao hiểu biết về ứng dụng công nghệ thông tin trong quản lý môi trường đô thị.
Hướng phát triển tiếp theo là mở rộng mạng lưới cảm biến di động quy mô lớn, tích hợp dữ liệu hình ảnh và âm thanh để nâng cao độ chính xác và tính ứng dụng của bản đồ AQI.

Khuyến khích các cơ quan quản lý và doanh nghiệp công nghệ phối hợp triển khai hệ thống cảm biến di động và phát triển ứng dụng cảnh báo chất lượng không khí cá nhân nhằm bảo vệ sức khỏe cộng đồng.

Trích đoạn nội dung tài liệu

Chương 1. GIỚI THIỆU TONG QUAN với Module Wifi ESP8266 va module này cùng lúc được kết nối với module xác định vị trí GPS và màn hình LCD 2 được kết nối đến Module Wifi nhằm đề hiển thị thêm thông tin về NO›, CO, SO›, Os. Các thông tin thu thập được sẽ được đưa lên cloud server và thiết bị đọc thẻ nhớ SD để lưu trữ và xử lý dữ liệu thu được. Về tổng quan, tại một thời êm T, chỉ có 1 hoặc 2 thiết bị cảm ứng di động hoạt động.

Do đó, trên bản đồ chỉ có 2 vị trí đo được giá trị AQI. Mở rộng ra với N thiết bị di động, thì tại thời điểm T, chỉ có tổng cộng N vị trí đo được giá trị AQI. Hơn nữa, các vị trí này là động, rất khó có thé có lại một bản đồ ở thời điểm T+delta giống như một bản đồ tại thời điểm T. Điều này nói lên độ khó của bài toán nội suy và tiên đoán dé liệu dựa trên các điểm quan trắc di động này.

Đây là thách thức chủ yếu của đề tài. Trang 11 Chương 2. GIẢI PHÁP Trong chương này, các phương pháp tiên đoán AQI doc theo các tuyến đường mà các điểm quan trắc di động di chuyển được trình bày.1 Tổng quan Dựa vào những dữ liệu về thời tiết (nhiệt độ, độ ẩm), chỉ số chất lượng không khí, dữ liệu về nhật ký lifelog, các cảm biến về khí hậu được thu thập từ các trạm cố định và di động, chúng tôi đã tiến hành phân tích và đưa ra hệ thống có thể dự đoán và nội suy được các giá trị AQI tại các điểm không có giá trị AQI, bằng cách sử dụng các giá trị về chỉ số AQI và thời tiết đã thu thập được trong cùng khu vực với thuật toán lọc thời gian và bán kính quét tăng dan. Bên cạnh đó, hệ thống này còn có thé đo lường chỉ số AQI với cảm xúc của con người tại nơi xảy ra ô nhiễm không khí dựa vào những hình ảnh và bảng đánh giá cảm xúc (user’s tag) và dữ liệu cảm biến đô thị (ví dụ như là dữ liệu về thời tiết, chỉ số chất lượng không khí toàn khu vực, các chỉ số chất lượng không khí từ các nguồn cung cấp miễn phí) được thu thập.

Bằng cách áp dụng các giá trị trung bình của các bảng đánh giá cảm xúc của người dùng và các đặc trưng được trích xuất từ hình ảnh được thu thập từ các tuyến đường (đữ liệu này được thu thập từ các thiết bị đi động trong suốt quá trình di chuyền thu được những đi chuyển lặp đi lặp lại của mọi người). Hệ thống được đánh giá bằng cách sử dụng bộ dữ liệu của MediaEval 2019 [2]. Bộ dữ liệu này, về bản chat, khá giống với bộ dữ liệu MNR-HCM [8] và MNR Air [9], do đều được thu thập bằng các trạm quan trắc di động. MediaEval2019 (Insight for wellbeing) đưa ra thử thách cho việc tiên đoán và nội suy giá trị AQI dựa vào các đữ liệu được thu thập bằng các trạm quan trắc di động kết hợp với các nguồn dữ liệu mở khác.

MediaEval2019 tạo ra thử thách nhằm vào hai vấn đề: - Vấn đề thứ nhất (Nội suy): là yêu cầu người tham gia phát triển một giả thuyết về mối liên hệ giữa các dữ liệu không đồng nhất từ nguồn dữ liệu thu thập được và các nguồn dữ liệu mở nhằm tìm kiếm và điều chỉnh một cách chính xác những đoạn mà dữ liệu AQI bị thiếu. - Vấn dé thứ hai (Tiên đoán): yêu cầu người tham gia dự đoán được chi số chất lượng không khí cá nhân tại vị trí và thời gian xác định bằng cách sử dụng các Trang 12 Chương 2. dữ liệu từ các nguồn thu thập được (ví dụ như là hình ảnh lifelog, nhịp tim, bước. chân, cảm xúc của con người trong khu vực khảo sát) và dữ liệu môi trường xung quanh (ví dụ như dữ liệu ô nhiễm không khí, thời tiết) nhằm mục đích đo lường sức khoẻ và cảm xúc cá nhân dựa trên chất lượng không khí tại khu vực.

Hệ thống UrbanEgoAQI được thiết kế đặc biệt dé đáp ứng hai thách thức nêu trên, với hệ thống đã giải quyết thử thách đầu tiên bằng cách nội suy các giá trị AQI cục bộ bị thiếu bằng cách sử các giá trị AQI toàn cục và thời tiết cũng như thuật toán lọc thời gian với bán kính quét tăng dần. Với thử thách thứ hai, hệ thông đã giải quyết được bằng cách áp dụng các giá trị trung bình của các tag cảm xúc của mọi người và những đặc trưng được trích xuất từ dữ liệu của các tuyến đường (dữ liệu được thu thập trong quá trình lặp đi lặp lại của mọi người). Hệ thống đã được so sánh kết quả với các nhóm khác cùng tham gia thử thách và kết quả thực nghiệm cho thay phương pháp được đề xuất có hiệu quả tốt và có thé dự đoán giá trị bị thiếu với độ chính xác cao. Các đề xuất giải pháp Nhu đề cập ở phần trên, mục đích chính của phương pháp được đề xuất là xây dựng một giả thuyết có thê thực hiện các liên kết giữa các dữ liệu không đồng nhất nhằm xây dựng một hệ thống có thê dự đoán giá trị bị thiểu trong tập dữ liệu được cung cấp [1].

Giả thuyết này chỉ ra mối liên quan chặt chẽ giữa việc thu thập dữ liệu không đồng nhất tại vị trí và thời gian gần nhau. Do đó, việc xây dựng thuật toán lọc thời gian và quét bán kính tăng dần dé thu thập thêm dữ liệu có giá trị ở những vị trí gần nhau, dé từ đó dựa vào dữ liệu này có thể dự đoán được những dữ liệu có giá trị bị thiếu. Theo tập cơ sở đữ liệu được cung cấp, tác động của các yếu tố môi trường, dữ liệu thời tiết, đô thị và giao thông lên con người đã được tìm thấy và phát hiện ra rằng các đường phố chính có nhiều xe cộ qua lại và ít cây xanh hơn nên chỉ số chất lượng không khí cá nhân cục bộ (PAQI) thấp và ngược lại. Dựa vào quan sát này, đã đưa ra một gợi ý dé có thé đề xuất ra giải pháp dé đo lường giá trị PAQI bằng cách sử dụng giá trị AQI, thẻ đánh giá cảm xúc của người dân quanh khu vực (user’s tag) và những đặc trưng trực quan.

Dau tiên là tính chi số chất lượng không khí bằng cách sử dụng Trang 13 Chương 2. dữ liệu cảm biến, sau đó là có hai cách tính được dé cập ở phần dưới dé có thé tiên đoán ra được chỉ số PAQI và những phương pháp này đã được giới thiệu và đánh giá trong MediaEval 2019. Cách tính thứ nhất của bước tiếp theo là sử dụng các thẻ cảm xúc và các đặc trưng trực quan của con người đề đo lường chỉ số PAQI một cách thích ứng. Cách tính thứ hai của bước tiếp theo là tận dụng các giá trị trung bình của các thẻ đánh giá cảm xúc của người dân quanh khu vực (user’s tag) và các đặc trưng của các tuyến đường đề xác định chỉ số PAQI.

Phương pháp dự đoán giá trị bị thiếu 2.1 Xứ lý dữ liệu a. Khoanh vùng thời gian Chức năng này là đê thu thập tất cả các dữ liệu theo thời gian. Đầu tiên là phân cụm tat cả các tập dự liệu đã cho thành các nhóm khác nhau dé có cùng ngày và giờ (tức là cùng ngày), sau đó, chỉ dữ liệu được thu thập trong thời gian bắt đầu và thời gian kết thúc được chọn. Cần lưu ý rằng thời gian bắt đầu và thời gian kết thúc biểu thị khoảng thời gian dir liệu bị thiếu.

Khoanh vùng vi trí Dé thu thập tat cả dữ liệu theo vị trí gần nhau thì công thức tính khoảng cách của hai toạ độ đã được định nghĩa và những toạ độ được thu thập trong khoảng cách được tính này đều được chọn và công thức tính khoảng cách này được tính như Sau: d= 2rsin"9( [sin® Œ )+ cos(ø,)cos(w,)sin?(fE=5)) (2.1) Trong đó: o dlà khoảng cách giữa hai điểm o r là bán kính của khu vực © @, @, lần lượt là vĩ độ của điểm 1 và điểm 2 (tính bằng radians). © By, Bz lần lượt là kinh độ của điểm 1 và điểm 2 (tính bằng radians). Trang 14 Chương 2. o Bán kính quét được đặt từ 1m đến 100m 2.

Dự đoán giá trị bị thiếu Sau khi khoanh vùng thời gian và khoanh vùng vi trí, giá trị PM2.s của một số vi trí gần tâm nhất sẽ được lấy. sau đó sẽ tính toán giá trị lớn nhất, giá trị nhỏ nhất và giá trị trung bình của những giá trị này từ vị trí cần dự đoán. Đề tối ưu hoá kết quả tính toán, tại thời điểm này thì bán kính vùng quét được tăng dan từ 1m đến 20m dé quét tất cả các vị trí. Theo kinh nghiệm thực tế thì chọn bán kính 20m là lý tưởng nhất vì trong bán kính này các giá trị PMas dự đoán có độ chính xác cao nhất.

Nếu trong bán kính này, không tìm được giá trị PM25 thì giá trị này sẽ được lấy ở một điểm gần nhất trong khoảng [21m, 100m]. Tuy nhiên, nếu trong khoảng [0m, 100m] mà không tìm được giá trị PM: thì giá trị PMas được gan giá trị là 0 và thuật toán được xây dựng như sau: Thuật toán: khôi phục giá trị PM:s từ những vi trí và thời gian gần nhất. DataA: đưa tất cả dữ liệu vào trong một nhóm; DataB: trong DataA, nhận tat cả dữ liệu trong khoảng Starttime đến endtime của dit liệu bị thiếu PM:s. DataC: Chứa danh sách toạ độ của dữ liệu bị thiếu PMas; for mỗi toạ độ trong DataC do - Khởi tạo mảng (PMas) chứa những giá trị PMzs; - Khởi tao mảng toa độ (coordinate) lưu trữ toa độ; 'While bán kính nhỏ hơn hoặc bằng 100 do for mỗi toạ độ trong DataB do đặt d là khoảng cách toạ độ trong DataC và DataB; if d nhỏ hơn bán kính và toa độ không nằm trong mảng chứa toạ độ then - Thêm giá trị PMas oftoa độ B vào mang(PM2:s); - Thém toa độ vào mang toa độ (coordianate); else không làm gì; end Trang 15 Chương 2.

Nội dung được bảo vệ bản quyền — Tải xuống đầy đủ

Tài liệu "Nghiên Cứu Phương Pháp Nội Suy và Dự Đoán Ô Nhiễm Không Khí Tại TP. Hồ Chí Minh" cung cấp cái nhìn sâu sắc về các phương pháp nội suy và dự đoán ô nhiễm không khí, đặc biệt là trong bối cảnh đô thị hóa nhanh chóng của TP. Hồ Chí Minh. Nghiên cứu này không chỉ giúp người đọc hiểu rõ hơn về các yếu tố ảnh hưởng đến chất lượng không khí mà còn đưa ra các giải pháp khả thi để cải thiện tình hình ô nhiễm.

Để mở rộng kiến thức về vấn đề này, bạn có thể tham khảo thêm tài liệu Luận văn ảnh hưởng của sự phát triển đô thị đến môi trường không khí thành phố Thái Nguyên giai đoạn 2008-2013, nơi phân tích tác động của đô thị hóa đến chất lượng không khí. Bên cạnh đó, tài liệu Luận văn sử dụng các công cụ quản lý môi trường nhằm hạn chế ô nhiễm không khí do xe máy gây ra trên địa bàn thành phố Hà Nội sẽ cung cấp thêm thông tin về các biện pháp quản lý ô nhiễm không khí. Cuối cùng, bạn cũng có thể tìm hiểu về Luận văn lượng giá thiệt hại sức khỏe cộng đồng do ô nhiễm không khí từ các cụm công nghiệp phía Bắc thành phố Thái Nguyên, giúp bạn nắm bắt được tác động của ô nhiễm không khí đến sức khỏe cộng đồng.

Mỗi tài liệu này là một cơ hội để bạn khám phá sâu hơn về các khía cạnh khác nhau của ô nhiễm không khí và các giải pháp liên quan.

#nghiên cứu ô nhiễm không khí

#phân tích dữ liệu ô nhiễm

#Dự đoán ô nhiễm không khí

#tác động của ô nhiễm không khí

#giải pháp cải thiện chất lượng không khí

#ô nhiễm không khí TP. Hồ Chí Minh

Chủ đề

ô nhiễm không khí và sức khỏe

chính sách môi trường tại TP. Hồ Chí Minh

các phương pháp nghiên cứu ô nhiễm

dự đoán và quản lý ô nhiễm