Tổng quan nghiên cứu
Theo thống kê toàn cầu năm 2016, lượng chất thải rắn sinh ra đạt khoảng 2,01 tỷ tấn và dự kiến tăng lên 3,4 tỷ tấn vào năm 2050. Trong đó, rác thải xây dựng chiếm tỷ lệ lớn, lên đến 36% tổng lượng chất thải rắn tại châu Âu và 60% tại Hoa Kỳ. Tại Việt Nam, mỗi ngày có khoảng 60 nghìn tấn rác thải rắn đô thị được sinh ra, trong đó rác thải xây dựng chiếm từ 10% đến 12%, thậm chí tại các đô thị lớn như Hà Nội và TP. Hồ Chí Minh, tỷ lệ này lên đến 25%. Tình trạng thu gom và xử lý rác thải xây dựng còn nhiều hạn chế, gây ảnh hưởng nghiêm trọng đến môi trường và sức khỏe cộng đồng.
Luận văn tập trung nghiên cứu ứng dụng thuật toán trí tuệ nhân tạo (AI), cụ thể là các mô hình máy học, để ước lượng chính xác khối lượng rác thải xây dựng phát sinh từ các công trình dân dụng tại TP. Hồ Chí Minh. Mục tiêu chính là xây dựng mô hình ước lượng có độ tin cậy cao, giúp các nhà thầu và cơ quan quản lý dự báo khối lượng rác thải, từ đó lập kế hoạch quản lý và xử lý hiệu quả, đồng thời kiểm soát chi phí xử lý rác thải. Phạm vi nghiên cứu tập trung vào các công trình dân dụng tại TP. Hồ Chí Minh, sử dụng dữ liệu thực tế về số tầng, tổng diện tích xây dựng và diện tích khu đất.
Việc phát triển công cụ ước lượng dựa trên AI không chỉ góp phần nâng cao hiệu quả quản lý rác thải xây dựng mà còn hỗ trợ phát triển đô thị thông minh, bảo vệ môi trường và thúc đẩy phát triển bền vững trong ngành xây dựng.
Cơ sở lý thuyết và phương pháp nghiên cứu
Khung lý thuyết áp dụng
Luận văn áp dụng các lý thuyết và mô hình máy học thuộc nhóm học có giám sát, nhằm dự đoán biến đầu ra (khối lượng rác thải xây dựng) dựa trên các biến đầu vào (số tầng, diện tích sàn, diện tích đất). Các mô hình chính bao gồm:
Mô hình K-lân cận gần nhất (KNN): Thuật toán dựa trên khoảng cách Euclidean để tìm k điểm dữ liệu gần nhất và dự đoán giá trị trung bình. KNN được đánh giá cao về độ chính xác trong bài toán ước lượng rác thải xây dựng.
Mô hình hồi quy tuyến tính (LR): Mô hình đơn giản, giả định mối quan hệ tuyến tính giữa biến đầu vào và đầu ra, được sử dụng để so sánh hiệu quả với các mô hình phức tạp hơn.
Mô hình hồi quy Lasso: Là hồi quy tuyến tính có thêm hạng phạt L1 nhằm chọn lọc biến và giảm thiểu đa cộng tuyến, giúp cải thiện độ chính xác dự đoán.
Mô hình hồi quy vectơ hỗ trợ (SVR): Mô hình hồi quy phi tuyến, tối ưu hóa vùng biên để khái quát hóa tốt hơn trên dữ liệu mới.
Mô hình cây quyết định (DT): Phân chia dữ liệu thành các nhánh dựa trên các điều kiện, dễ hiểu và áp dụng trong phân loại và hồi quy.
Mô hình rừng ngẫu nhiên (RF): Kết hợp nhiều cây quyết định để giảm phương sai và tăng độ chính xác.
Mô hình tăng cường gradient (GBR): Thuật toán kết hợp các mô hình yếu để tạo thành mô hình mạnh, cải thiện hiệu suất dự đoán.
Mô hình mạng nơ ron nhân tạo đa lớp (MLP): Mạng thần kinh nhiều tầng ẩn, xử lý các mối quan hệ phi tuyến phức tạp trong dữ liệu.
Phương pháp nghiên cứu
Nguồn dữ liệu sử dụng bao gồm dữ liệu khảo sát thực tế từ các công trình dân dụng tại TP. Hồ Chí Minh và dữ liệu từ các nghiên cứu trước đó có tính tương đồng. Các biến đầu vào chính gồm số tầng, tổng diện tích xây dựng, tổng diện tích khu đất, loại công trình và địa điểm xây dựng. Biến đầu ra là khối lượng rác thải xây dựng phát sinh.
Phương pháp phân tích sử dụng ngôn ngữ lập trình Python trên môi trường Google Colab, tận dụng các thư viện máy học như scikit-learn để xây dựng và huấn luyện các mô hình. Cỡ mẫu dữ liệu được lựa chọn đảm bảo tính đại diện và đủ lớn để huấn luyện mô hình, với quy trình gồm:
- Chuẩn bị và xử lý dữ liệu: làm sạch, chuẩn hóa và phân chia dữ liệu thành tập huấn luyện và tập kiểm tra.
- Huấn luyện các mô hình máy học: KNN, LR, Lasso, SVR, DT, RF, GBR, MLP.
- Đánh giá mô hình dựa trên các chỉ số MAER (tỉ lệ lỗi tuyệt đối trung bình) và hệ số xác định R2.
- So sánh hiệu quả các mô hình để lựa chọn mô hình tối ưu nhất.
- Áp dụng mô hình tối ưu vào trường hợp thực tế tại TP. Hồ Chí Minh để kiểm chứng.
Quá trình nghiên cứu được thực hiện trong khoảng thời gian từ tháng 9 đến tháng 12 năm 2023.
Kết quả nghiên cứu và thảo luận
Những phát hiện chính
Hiệu quả mô hình KNN vượt trội: Mô hình KNN đạt tỉ lệ lỗi tuyệt đối trung bình (MAER) là 10.8286 và hệ số xác định R2 đạt mức cao, cho thấy độ chính xác vượt trội so với các mô hình khác. Kết quả này được xác nhận trên cả dữ liệu thực tế và dữ liệu nghiên cứu trước đó.
Mô hình hồi quy tuyến tính và Lasso cho kết quả khả quan: Mô hình LR và Lasso cũng cho kết quả dự đoán tương đối chính xác với MAER lần lượt khoảng 15-20 và R2 ở mức trung bình, tuy nhiên thấp hơn KNN.
Mô hình kết hợp như RF và GBR cải thiện độ chính xác: Các mô hình rừng ngẫu nhiên và tăng cường gradient cho kết quả tốt hơn các mô hình hồi quy đơn lẻ, với MAER giảm khoảng 5-7% so với LR và Lasso.
Mô hình mạng nơ ron MLP có độ phức tạp cao nhưng không vượt trội: MLP cho kết quả tương đương hoặc thấp hơn KNN, đồng thời yêu cầu thời gian huấn luyện lâu hơn và cần điều chỉnh tham số phức tạp.
Thảo luận kết quả
Nguyên nhân mô hình KNN đạt hiệu quả cao là do khả năng tận dụng dữ liệu gần nhất để dự đoán, phù hợp với tính chất dữ liệu xây dựng có sự tương đồng cao giữa các công trình cùng loại. Các mô hình hồi quy tuyến tính và Lasso bị hạn chế bởi giả định tuyến tính, không thể nắm bắt các mối quan hệ phi tuyến phức tạp trong dữ liệu.
Mô hình kết hợp như RF và GBR tận dụng ưu điểm của nhiều cây quyết định, giảm thiểu sai số và tăng khả năng khái quát hóa, phù hợp với các bài toán có dữ liệu phức tạp. Tuy nhiên, độ phức tạp và yêu cầu tính toán cao hơn so với KNN.
Mô hình MLP mặc dù có khả năng học các mối quan hệ phi tuyến sâu, nhưng đòi hỏi dữ liệu lớn và thời gian huấn luyện dài, đồng thời dễ bị quá khớp nếu không được điều chỉnh kỹ.
Kết quả nghiên cứu phù hợp với các nghiên cứu quốc tế về ứng dụng AI trong ước lượng rác thải xây dựng, đồng thời khẳng định tính khả thi và hiệu quả của việc áp dụng mô hình máy học trong quản lý xây dựng tại Việt Nam.
Dữ liệu kết quả có thể được trình bày qua các biểu đồ so sánh MAER và R2 giữa các mô hình, cũng như bảng tổng hợp kết quả ước lượng trên các bộ dữ liệu thực tế.
Đề xuất và khuyến nghị
Triển khai rộng rãi mô hình KNN trong quản lý rác thải xây dựng: Các cơ quan quản lý và nhà thầu nên áp dụng mô hình KNN để ước lượng khối lượng rác thải xây dựng nhằm nâng cao độ chính xác và hiệu quả quản lý. Thời gian áp dụng trong vòng 6-12 tháng để tích hợp vào quy trình quản lý hiện hành.
Phát triển phần mềm công cụ ước lượng dựa trên AI: Xây dựng ứng dụng hoặc hệ thống trực tuyến sử dụng mô hình KNN và các mô hình kết hợp để hỗ trợ người dùng nhập liệu và nhận kết quả ước lượng nhanh chóng. Chủ thể thực hiện là các đơn vị công nghệ và cơ quan quản lý xây dựng.
Tăng cường thu thập và cập nhật dữ liệu thực tế: Để nâng cao chất lượng mô hình, cần xây dựng hệ thống thu thập dữ liệu rác thải xây dựng liên tục, đa dạng về loại công trình và địa điểm. Cơ quan quản lý địa phương phối hợp với các nhà thầu thực hiện trong vòng 1-2 năm.
Đào tạo và nâng cao nhận thức cho các bên liên quan: Tổ chức các khóa đào tạo về ứng dụng AI trong quản lý xây dựng cho cán bộ quản lý, nhà thầu và các bên liên quan nhằm thúc đẩy việc áp dụng công nghệ mới. Thời gian thực hiện trong 6 tháng đầu năm 2024.
Xây dựng chính sách hỗ trợ và khuyến khích ứng dụng công nghệ: Nhà nước cần ban hành các chính sách ưu đãi, hỗ trợ tài chính và kỹ thuật cho các dự án ứng dụng AI trong quản lý rác thải xây dựng, góp phần phát triển đô thị thông minh và bền vững.
Đối tượng nên tham khảo luận văn
Cơ quan quản lý nhà nước về xây dựng và môi trường: Giúp hoạch định chính sách, lập kế hoạch quản lý rác thải xây dựng hiệu quả dựa trên dữ liệu ước lượng chính xác.
Nhà thầu và chủ đầu tư công trình dân dụng: Hỗ trợ dự toán chi phí xử lý rác thải, lập kế hoạch thi công và kiểm soát ngân sách, nâng cao hiệu quả quản lý dự án.
Các nhà nghiên cứu và sinh viên ngành quản lý xây dựng, công nghệ thông tin: Cung cấp cơ sở lý thuyết và thực nghiệm về ứng dụng AI trong lĩnh vực xây dựng, mở rộng nghiên cứu về mô hình máy học.
Doanh nghiệp công nghệ phát triển phần mềm và giải pháp AI: Tham khảo để phát triển các công cụ, ứng dụng hỗ trợ quản lý xây dựng và môi trường, đáp ứng nhu cầu thực tiễn.
Câu hỏi thường gặp
Tại sao chọn mô hình KNN làm mô hình tối ưu?
Mô hình KNN cho kết quả ước lượng với MAER thấp nhất (10.8286) và hệ số xác định R2 cao, thể hiện độ chính xác và khả năng khái quát tốt trên dữ liệu thực tế. KNN tận dụng dữ liệu gần nhất, phù hợp với đặc điểm dữ liệu xây dựng.Dữ liệu đầu vào của mô hình gồm những yếu tố nào?
Các biến đầu vào chính gồm số tầng công trình, tổng diện tích xây dựng, tổng diện tích khu đất, loại công trình và địa điểm xây dựng. Những thông số này dễ thu thập và phản ánh đặc điểm công trình ảnh hưởng đến khối lượng rác thải.Mô hình có thể áp dụng cho các loại công trình khác ngoài dân dụng không?
Hiện nghiên cứu tập trung vào công trình dân dụng để đảm bảo độ chính xác và tính khả thi. Việc mở rộng sang công trình công nghiệp hoặc hạ tầng cần nghiên cứu thêm do đặc thù khác biệt về vật liệu và quy trình xây dựng.Làm thế nào để cập nhật mô hình khi có dữ liệu mới?
Mô hình có thể được huấn luyện lại định kỳ với dữ liệu mới thu thập để cải thiện độ chính xác và thích ứng với thay đổi trong đặc điểm công trình và quy trình xây dựng.Chi phí và thời gian triển khai mô hình trong thực tế như thế nào?
Chi phí chủ yếu liên quan đến thu thập dữ liệu và phát triển phần mềm hỗ trợ. Thời gian triển khai dự kiến từ 6 đến 12 tháng, tùy thuộc quy mô và mức độ tích hợp vào hệ thống quản lý hiện tại.
Kết luận
- Luận văn đã xây dựng thành công mô hình ước lượng rác thải xây dựng trong các công trình dân dụng tại TP. Hồ Chí Minh dựa trên các thuật toán máy học, trong đó mô hình KNN đạt hiệu quả cao nhất với MAER 10.8286 và hệ số R2 ấn tượng.
- Việc áp dụng AI giúp nâng cao độ chính xác trong dự báo khối lượng rác thải, hỗ trợ quản lý chi phí và kế hoạch xử lý rác thải hiệu quả.
- Nghiên cứu góp phần phát triển công cụ quản lý xây dựng hiện đại, phù hợp với xu hướng đô thị thông minh và phát triển bền vững.
- Đề xuất triển khai mô hình KNN rộng rãi, phát triển phần mềm hỗ trợ và tăng cường thu thập dữ liệu thực tế để nâng cao hiệu quả quản lý.
- Các bước tiếp theo bao gồm hoàn thiện công cụ ước lượng, đào tạo nhân lực và xây dựng chính sách hỗ trợ ứng dụng AI trong ngành xây dựng.
Hành động ngay: Các cơ quan quản lý và nhà thầu nên phối hợp triển khai thử nghiệm mô hình KNN trong các dự án xây dựng dân dụng để đánh giá và tối ưu hóa quy trình quản lý rác thải xây dựng.