Tổng quan nghiên cứu

Trong bối cảnh phát triển mạnh mẽ của ngành xây dựng tại Việt Nam, đặc biệt là lĩnh vực xây dựng nhà xưởng phục vụ công nghiệp, việc dự báo chính xác chi phí xây dựng trở thành một yêu cầu cấp thiết. Theo ước tính, nhu cầu xây dựng nhà xưởng tại các khu công nghiệp ở TP. Hồ Chí Minh và Bình Dương tăng trưởng khoảng 15-20% mỗi năm, kéo theo sự gia tăng áp lực trong việc quản lý chi phí hiệu quả. Truyền thống, các phương pháp ước lượng chi phí dựa trên kinh nghiệm và tính toán thủ công thường thiếu chính xác và không đáp ứng được yêu cầu ngày càng cao của thị trường.

Mục tiêu nghiên cứu của luận văn là phát triển các mô hình học máy tiên tiến nhằm dự báo chi phí xây dựng nhà xưởng và các hạng mục phụ trợ một cách chính xác và tin cậy. Nghiên cứu tập trung vào phân tích dữ liệu từ 150 công trình xây dựng nhà xưởng tại TP. Hồ Chí Minh và Bình Dương trong vòng 5 năm gần đây, với 10 yếu tố đầu vào quan trọng như diện tích, kết cấu khung, khoảng cách, loại hạng mục, chiều cao, tiến độ công trình, số tầng, giá thép tấm, cốt thép và bê tông.

Ý nghĩa của nghiên cứu được thể hiện qua việc cung cấp công cụ dự báo chi phí hiệu quả, giúp các chủ đầu tư và nhà thầu lập kế hoạch tài chính chính xác, giảm thiểu rủi ro tài chính và nâng cao hiệu quả quản lý dự án. Đồng thời, nghiên cứu mở ra hướng đi mới trong ứng dụng trí tuệ nhân tạo và học máy trong ngành xây dựng, góp phần thúc đẩy sự phát triển bền vững của lĩnh vực này.

Cơ sở lý thuyết và phương pháp nghiên cứu

Khung lý thuyết áp dụng

Luận văn áp dụng các lý thuyết và mô hình học máy hiện đại để dự báo chi phí xây dựng, bao gồm:

  • Support Vector Machine (SVM): Mô hình phân loại và hồi quy dựa trên việc tìm siêu phẳng tối ưu phân chia dữ liệu, tối đa hóa khoảng cách giữa các điểm dữ liệu gần nhất. SVM được sử dụng để dự báo chi phí với khả năng xử lý dữ liệu phức tạp và giảm thiểu sai số.

  • Random Forest (RF): Mô hình ensemble gồm nhiều cây quyết định được huấn luyện trên các tập con dữ liệu ngẫu nhiên, kết hợp dự đoán bằng phương pháp bỏ phiếu đa số. RF giúp giảm thiểu hiện tượng quá khớp và tăng độ chính xác dự báo.

  • XGBoost (Extreme Gradient Boosting): Thuật toán boosting tuần tự kết hợp nhiều mô hình yếu (cây quyết định) để tạo thành mô hình mạnh, tối ưu hóa gradient và áp dụng regularization nhằm kiểm soát overfitting, nâng cao hiệu suất dự báo.

  • Support Vector Regression (SVR): Phiên bản hồi quy của SVM, sử dụng để dự báo giá trị liên tục như chi phí xây dựng, với khả năng xử lý dữ liệu phi tuyến và độ chính xác cao.

Các khái niệm chính được sử dụng trong nghiên cứu gồm: hàm mất mát (MSE, Hinge Loss, Cross-Entropy), hàm kích hoạt (ReLU, Sigmoid, Softmax), thuật toán tối ưu hóa (Gradient Descent, Stochastic Gradient Descent, Adam), và kỹ thuật chuẩn hóa dữ liệu (Standardization, Min-Max Scaling).

Phương pháp nghiên cứu

Nguồn dữ liệu chính được thu thập từ 150 dự án xây dựng nhà xưởng và các hạng mục phụ trợ tại TP. Hồ Chí Minh và Bình Dương trong vòng 5 năm gần đây. Dữ liệu bao gồm các thông tin chi tiết về diện tích, kết cấu, vật liệu, tiến độ, giá nguyên vật liệu và chi phí thực tế.

Phương pháp chọn mẫu là phương pháp ngẫu nhiên có chủ đích (stratified random sampling) nhằm đảm bảo tính đại diện cho các loại công trình và quy mô khác nhau. Cỡ mẫu 150 được đánh giá đủ lớn để huấn luyện và kiểm tra các mô hình học máy.

Quy trình phân tích dữ liệu bao gồm: tiền xử lý dữ liệu (loại bỏ biến không phù hợp, chuẩn hóa), phân tích thống kê mô tả, xây dựng và huấn luyện các mô hình học máy (SVM, RF, XGBoost, SVR), đánh giá hiệu suất mô hình bằng các chỉ số RMSE, MAE, R2 trên tập huấn luyện và kiểm tra.

Thời gian nghiên cứu kéo dài 6 tháng, từ tháng 7 đến tháng 12 năm 2023, với các bước cụ thể: thu thập dữ liệu (1 tháng), xử lý và phân tích dữ liệu (1 tháng), xây dựng mô hình (2 tháng), đánh giá và so sánh mô hình (1 tháng), hoàn thiện báo cáo và đề xuất (1 tháng).

Kết quả nghiên cứu và thảo luận

Những phát hiện chính

  1. Xác định 10 yếu tố ảnh hưởng chính đến chi phí xây dựng: Qua phân tích dữ liệu, 10 biến đầu vào quan trọng gồm diện tích, kết cấu khung, khoảng cách, loại hạng mục, chiều cao, tiến độ công trình, số tầng, giá thép tấm, cốt thép và bê tông được xác định có ảnh hưởng lớn đến chi phí. Ví dụ, chi phí trung bình/m2 tăng 12% khi diện tích tăng 10%, và chi phí tăng 8% khi giá thép tấm tăng 5%.

  2. Hiệu suất mô hình SVR và XGBoost vượt trội: SVR và XGBoost đạt chỉ số RMSE lần lượt là 5.2 và 5.5 triệu đồng, thấp hơn đáng kể so với Decision Tree (7.8 triệu đồng) và Random Forest (6.1 triệu đồng). Độ chính xác R2 của SVR đạt 0.89, XGBoost đạt 0.87, cho thấy khả năng dự báo chính xác cao.

  3. Mô hình SVR có khả năng dự báo ổn định trên tập kiểm tra: Biểu đồ scatter giữa chi phí thực tế và dự đoán của SVR cho thấy sự phân bố gần đường chéo, với sai số trung bình tuyệt đối (MAE) khoảng 4.3 triệu đồng, thấp hơn 15% so với các mô hình còn lại.

  4. Ảnh hưởng của tiến độ và loại hạng mục đến chi phí: Phân tích biểu đồ scatter cho thấy tiến độ công trình ảnh hưởng trực tiếp đến chi phí, với chi phí tăng trung bình 10% khi tiến độ rút ngắn 1 tháng. Loại hạng mục phụ trợ cũng làm chi phí biến động từ 5-20% tùy thuộc vào tính chất công trình.

Thảo luận kết quả

Nguyên nhân chính khiến SVR và XGBoost đạt hiệu quả cao là do khả năng xử lý dữ liệu phi tuyến và điều chỉnh tham số tối ưu, giúp mô hình thích ứng tốt với các biến động phức tạp trong dữ liệu xây dựng. Kết quả này phù hợp với các nghiên cứu gần đây trong ngành xây dựng và học máy, khẳng định tính ứng dụng thực tiễn của các mô hình này.

So sánh với phương pháp truyền thống như phương pháp thể tích hay diện tích sàn, các mô hình học máy cung cấp dự báo chi phí chính xác hơn khoảng 20-30%, giảm thiểu sai số và rủi ro tài chính cho chủ đầu tư. Biểu đồ boxplot thể hiện sự phân bố sai số nhỏ hơn rõ rệt ở SVR và XGBoost so với các mô hình khác.

Ý nghĩa của kết quả nghiên cứu không chỉ giúp nâng cao hiệu quả quản lý chi phí xây dựng mà còn mở rộng khả năng ứng dụng công nghệ AI trong ngành xây dựng, góp phần thúc đẩy chuyển đổi số và phát triển bền vững.

Đề xuất và khuyến nghị

  1. Áp dụng mô hình SVR và XGBoost trong dự báo chi phí xây dựng nhà xưởng: Các công ty xây dựng nên triển khai các mô hình này để nâng cao độ chính xác dự báo, giảm thiểu sai số ngân sách. Thời gian áp dụng dự kiến trong vòng 6 tháng, do bộ phận quản lý dự án và phòng kỹ thuật thực hiện.

  2. Đầu tư vào hệ thống thu thập và quản lý dữ liệu xây dựng: Xây dựng cơ sở dữ liệu chi tiết về các dự án xây dựng, bao gồm thông tin về vật liệu, tiến độ, chi phí thực tế để phục vụ huấn luyện mô hình học máy. Chủ thể thực hiện là ban quản lý dự án và phòng CNTT, với timeline 12 tháng.

  3. Đào tạo chuyên môn về học máy cho cán bộ kỹ thuật và quản lý dự án: Tổ chức các khóa đào tạo về trí tuệ nhân tạo và học máy nhằm nâng cao năng lực áp dụng công nghệ mới trong quản lý chi phí. Thời gian đào tạo kéo dài 3 tháng, do phòng nhân sự phối hợp với các chuyên gia AI thực hiện.

  4. Phát triển phần mềm hỗ trợ dự báo chi phí tích hợp mô hình học máy: Thiết kế và triển khai phần mềm dự báo chi phí xây dựng dựa trên các mô hình SVR và XGBoost, giúp tự động hóa quá trình ước lượng và cập nhật dữ liệu. Chủ thể thực hiện là phòng CNTT và đối tác công nghệ, thời gian phát triển 9 tháng.

Đối tượng nên tham khảo luận văn

  1. Chủ đầu tư và nhà thầu xây dựng: Giúp họ có công cụ dự báo chi phí chính xác, hỗ trợ lập kế hoạch tài chính và quản lý dự án hiệu quả, giảm thiểu rủi ro vượt ngân sách.

  2. Chuyên gia quản lý dự án xây dựng: Cung cấp kiến thức về ứng dụng học máy trong dự báo chi phí, nâng cao năng lực phân tích và ra quyết định dựa trên dữ liệu.

  3. Nhà nghiên cứu và sinh viên ngành xây dựng, công nghệ thông tin: Là tài liệu tham khảo quý giá về phương pháp ứng dụng trí tuệ nhân tạo trong ngành xây dựng, mở rộng hiểu biết về mô hình học máy.

  4. Các công ty phát triển phần mềm quản lý xây dựng: Hỗ trợ phát triển các giải pháp công nghệ tích hợp mô hình học máy để nâng cao hiệu quả dự báo và quản lý chi phí xây dựng.

Câu hỏi thường gặp

  1. Mô hình học máy nào phù hợp nhất để dự báo chi phí xây dựng nhà xưởng?
    Nghiên cứu cho thấy SVR và XGBoost là hai mô hình có hiệu suất dự báo tốt nhất với RMSE lần lượt là 5.2 và 5.5 triệu đồng, giúp dự báo chính xác và ổn định hơn so với các mô hình khác.

  2. Các yếu tố nào ảnh hưởng lớn nhất đến chi phí xây dựng nhà xưởng?
    10 yếu tố chính gồm diện tích, kết cấu khung, khoảng cách, loại hạng mục, chiều cao, tiến độ công trình, số tầng, giá thép tấm, cốt thép và bê tông. Ví dụ, chi phí tăng 12% khi diện tích tăng 10%.

  3. Làm thế nào để thu thập dữ liệu phục vụ cho mô hình học máy?
    Dữ liệu được thu thập từ các dự án xây dựng thực tế, bao gồm thông tin kỹ thuật, vật liệu, tiến độ và chi phí thực tế. Việc chuẩn hóa và làm sạch dữ liệu là bước quan trọng để đảm bảo chất lượng mô hình.

  4. Mô hình học máy có thể thay thế hoàn toàn phương pháp truyền thống không?
    Mô hình học máy hỗ trợ nâng cao độ chính xác dự báo nhưng không thay thế hoàn toàn kinh nghiệm chuyên môn. Kết hợp cả hai sẽ mang lại hiệu quả tối ưu trong quản lý chi phí.

  5. Các doanh nghiệp nhỏ có thể áp dụng mô hình học máy này không?
    Các mô hình có thể được tùy chỉnh phù hợp với quy mô dự án. Doanh nghiệp nhỏ nên đầu tư vào hệ thống dữ liệu và đào tạo để tận dụng lợi ích từ công nghệ học máy.

Kết luận

  • Nghiên cứu đã xác định 10 yếu tố quan trọng ảnh hưởng đến chi phí xây dựng nhà xưởng và các hạng mục phụ trợ.
  • Mô hình SVR và XGBoost được chứng minh là hiệu quả nhất trong dự báo chi phí với độ chính xác cao và ổn định.
  • Việc áp dụng học máy giúp nâng cao hiệu quả quản lý chi phí, giảm thiểu rủi ro tài chính cho các dự án xây dựng.
  • Đề xuất các giải pháp thực tiễn bao gồm áp dụng mô hình, đầu tư dữ liệu, đào tạo nhân lực và phát triển phần mềm hỗ trợ.
  • Nghiên cứu mở ra hướng đi mới cho ứng dụng trí tuệ nhân tạo trong ngành xây dựng, góp phần thúc đẩy chuyển đổi số và phát triển bền vững.

Các bước tiếp theo bao gồm triển khai thử nghiệm mô hình trong thực tế, mở rộng phạm vi dữ liệu và phát triển công cụ hỗ trợ dự báo chi phí. Đề nghị các tổ chức, doanh nghiệp trong ngành xây dựng chủ động áp dụng và phối hợp nghiên cứu để nâng cao hiệu quả quản lý chi phí.