Tổng quan nghiên cứu
Trong bối cảnh phát triển đô thị và giao thông công cộng ngày càng phức tạp, việc dự đoán chính xác thời gian đến trạm của xe bus trở thành một bài toán quan trọng nhằm nâng cao trải nghiệm người dùng và tối ưu hóa hoạt động điều phối xe. Theo ước tính, hệ thống xe bus tại các đô thị lớn như TP. Hồ Chí Minh đang phải đối mặt với nhiều thách thức do mật độ giao thông cao và biến động không ổn định trong các khung giờ cao điểm. Luận văn này tập trung nghiên cứu và phát triển một hệ thống biên thu thập dữ liệu hành trình xe bus, đồng thời áp dụng các mô hình học sâu như LSTM và GRU để dự đoán thời gian đến trạm bus gần nhất trong thời gian thực.
Mục tiêu cụ thể của nghiên cứu là xây dựng một giải pháp thu thập dữ liệu GPS liên tục từ xe bus, xử lý và trích xuất đặc trưng để huấn luyện các mô hình dự đoán vận tốc trung bình, từ đó tính toán thời gian đến trạm tiếp theo. Phạm vi nghiên cứu tập trung trên tuyến xe bus số 150 từ Tân Vạn về Chợ Lớn, với dữ liệu thu thập trong 8 ngày khác nhau thuộc tháng 5 và tháng 6 năm 2023. Ý nghĩa của nghiên cứu thể hiện qua việc cải thiện độ chính xác dự đoán thời gian đến trạm, giúp người dùng sắp xếp lịch trình hiệu quả hơn và hỗ trợ trung tâm điều hành trong việc quản lý vận hành xe bus.
Cơ sở lý thuyết và phương pháp nghiên cứu
Khung lý thuyết áp dụng
Luận văn dựa trên các lý thuyết và mô hình sau:
- Mạng nơ-ron hồi quy (RNN): Mô hình cơ bản xử lý dữ liệu chuỗi thời gian, có khả năng ghi nhớ trạng thái ẩn để dự đoán giá trị tiếp theo dựa trên thông tin quá khứ.
- Long Short-Term Memory (LSTM): Biến thể của RNN với cấu trúc các “gate” (input, forget, output) giúp kiểm soát thông tin lưu giữ và loại bỏ, khắc phục vấn đề mất mát gradient trong dữ liệu dài hạn.
- Gated Recurrent Unit (GRU): Biến thể đơn giản hơn LSTM, sử dụng cổng cập nhật và cổng reset để điều khiển thông tin, có ít tham số hơn và hiệu quả tính toán cao hơn.
- Thuật toán Heavisine: Dùng để tính khoảng cách giữa hai điểm tọa độ GPS, từ đó tính vận tốc tức thời của xe bus.
- Các khái niệm chính: vận tốc tức thời, vận tốc trung bình, thời gian đến trạm, dữ liệu chuỗi thời gian, tiền xử lý dữ liệu, chuẩn hóa dữ liệu (normalization).
Phương pháp nghiên cứu
Nguồn dữ liệu chính được thu thập từ ứng dụng di động cài đặt trên xe bus tuyến 150, ghi nhận tọa độ GPS và timestamp mỗi 6 giây trong 8 ngày khác nhau. Dữ liệu thô được lưu trữ trên hệ thống Cloud AWS (S3) và xử lý trên máy tính cá nhân trước khi đưa lên kho dữ liệu (Data warehouse).
Phương pháp phân tích bao gồm:
- Tiền xử lý dữ liệu: tính toán vận tốc tức thời, khoảng cách đến trạm, phân loại khung giờ cao điểm và ngày trong tuần, chuẩn hóa dữ liệu về phạm vi [-1, 1].
- Huấn luyện mô hình: sử dụng các kiến trúc LSTM và GRU với các tham số timesteps và units được khảo sát kỹ lưỡng để tối ưu hóa độ chính xác dự đoán.
- Chia tập dữ liệu: 80% cho huấn luyện, 10% cho validation, 10% cho kiểm tra.
- Đánh giá mô hình dựa trên các chỉ số MSE (Mean Squared Error) và MAPE (Mean Absolute Percentage Error).
- Triển khai mô hình trên nền tảng AWS, đóng gói dưới dạng tệp .tflite để ứng dụng di động có thể dự đoán thời gian đến trạm trong thời gian thực.
Thời gian nghiên cứu kéo dài từ tháng 9/2022 đến tháng 6/2023, tập trung vào phát triển hệ thống thu thập dữ liệu, xử lý và huấn luyện mô hình dự đoán.
Kết quả nghiên cứu và thảo luận
Những phát hiện chính
- Hiệu quả mô hình GRU vượt trội hơn LSTM về tốc độ huấn luyện và độ chính xác: Mô hình GRU với 280 units, timesteps 11 đạt MSE thấp nhất khoảng 1.693 và MAPE 12.932%, trong khi LSTM với 270 units, timesteps 9 có MSE khoảng 1.791 và MAPE cao hơn.
- Tăng timesteps giúp giảm MSE nhưng gây overfitting nhanh hơn: Khi tăng timesteps từ 1 lên 9 (LSTM) hoặc 11 (GRU), giá trị MSE giảm đáng kể, tuy nhiên nếu tiếp tục tăng sẽ làm mô hình bị overfit sớm, ảnh hưởng đến khả năng tổng quát hóa.
- Phân loại khung giờ và ngày trong tuần cải thiện chất lượng dự đoán: Việc phân biệt giờ cao điểm (6-8h, 11-13h, 16-18h) và ngày làm việc, cuối tuần giúp mô hình nắm bắt đặc trưng giao thông thực tế, nâng cao độ chính xác dự đoán.
- Ứng dụng di động thu thập dữ liệu GPS liên tục với tần suất 6 giây là khả thi và hiệu quả: Dữ liệu thu thập từ tuyến xe bus 150 trong 8 ngày đã cung cấp đủ thông tin để huấn luyện mô hình với 3735 dòng dữ liệu, đảm bảo tính đại diện cho bài toán.
Thảo luận kết quả
Kết quả cho thấy mô hình GRU có ưu thế về tốc độ huấn luyện và khả năng dự đoán chính xác hơn LSTM trong bối cảnh dữ liệu hiện tại. Điều này phù hợp với các nghiên cứu trước đây cho thấy GRU có ít tham số hơn và thích hợp với các đoạn dữ liệu ngắn hơn. Tuy nhiên, LSTM vẫn có ưu điểm trong việc xử lý các chuỗi dài và phức tạp hơn, do đó với tập dữ liệu lớn hơn và đa dạng hơn, LSTM có thể phát huy hiệu quả tốt hơn.
Việc phân loại dữ liệu theo khung giờ và ngày trong tuần phản ánh đúng đặc điểm giao thông thực tế, giúp mô hình dự đoán vận tốc trung bình và thời gian đến trạm chính xác hơn. Các biểu đồ MSE và MAPE minh họa rõ sự cải thiện khi áp dụng các kỹ thuật tiền xử lý và lựa chọn tham số mô hình phù hợp.
So sánh với các nghiên cứu quốc tế, giá trị MAPE đạt được trong luận văn này (khoảng 12.9%) thấp hơn nhiều so với các mô hình DeepTTE (khoảng 29.4%), cho thấy hiệu quả của giải pháp đề xuất. Tuy nhiên, do sự khác biệt về dữ liệu và đặc trưng đầu vào, việc so sánh này mang tính tương đối.
Việc triển khai hệ thống thu thập dữ liệu qua ứng dụng di động giúp giảm chi phí phần cứng, dễ dàng mở rộng và bảo trì, đồng thời đảm bảo an toàn giao thông khi hạn chế thao tác phức tạp trên xe. Hệ thống lưu trữ và xử lý trên nền tảng Cloud AWS cũng tạo điều kiện thuận lợi cho việc mở rộng quy mô và tích hợp các mô hình dự đoán trong tương lai.
Đề xuất và khuyến nghị
Mở rộng thu thập dữ liệu trên nhiều tuyến xe và thời gian dài hơn: Tăng cường thu thập dữ liệu đa dạng để cải thiện tính tổng quát của mô hình, giảm thiểu hiện tượng overfitting và nâng cao độ chính xác dự đoán. Thời gian thực hiện: 6-12 tháng, chủ thể: trung tâm điều hành giao thông và nhóm phát triển ứng dụng.
Khảo sát và thử nghiệm các mô hình học sâu phức tạp hơn: Nghiên cứu các kiến trúc mạng nhiều lớp, kết hợp LSTM và GRU hoặc các mô hình Transformer để nâng cao hiệu suất dự đoán. Thời gian thực hiện: 3-6 tháng, chủ thể: nhóm nghiên cứu khoa học máy tính.
Triển khai hệ thống xử lý dữ liệu và huấn luyện mô hình trên Cloud hoàn chỉnh: Đưa toàn bộ pipeline tiền xử lý, huấn luyện và lưu trữ mô hình lên nền tảng Cloud để tăng khả năng mở rộng và hỗ trợ nhiều người dùng cùng lúc. Thời gian thực hiện: 3-4 tháng, chủ thể: đội ngũ kỹ thuật Cloud và phát triển phần mềm.
Phát triển giao diện người dùng và hệ thống phản hồi thời gian thực: Cải tiến ứng dụng di động và bảng điện tử tại các trạm để cung cấp thông tin dự đoán chính xác, đồng thời thu thập phản hồi người dùng để liên tục cải thiện mô hình. Thời gian thực hiện: 2-3 tháng, chủ thể: nhóm phát triển ứng dụng và trung tâm điều hành.
Đối tượng nên tham khảo luận văn
Nhà quản lý giao thông đô thị: Có thể áp dụng kết quả nghiên cứu để tối ưu hóa lịch trình xe bus, giảm ùn tắc và nâng cao chất lượng dịch vụ công cộng.
Nhà phát triển phần mềm và ứng dụng di động: Tham khảo kiến trúc hệ thống thu thập dữ liệu và triển khai mô hình dự đoán trên nền tảng di động và Cloud.
Nhà nghiên cứu khoa học máy tính và trí tuệ nhân tạo: Tìm hiểu về ứng dụng các mô hình LSTM, GRU trong dự đoán chuỗi thời gian thực tế, cũng như các kỹ thuật tiền xử lý dữ liệu GPS.
Các đơn vị vận hành xe bus và hợp tác xã giao thông: Áp dụng giải pháp để nâng cao hiệu quả vận hành, giảm chi phí và cải thiện trải nghiệm hành khách.
Câu hỏi thường gặp
Tại sao chọn LSTM và GRU để dự đoán thời gian đến trạm?
LSTM và GRU là các mô hình mạng nơ-ron hồi quy cải tiến, có khả năng xử lý dữ liệu chuỗi thời gian dài hạn và giảm thiểu vấn đề mất mát gradient, phù hợp với bài toán dự đoán vận tốc và thời gian dựa trên dữ liệu GPS liên tục.Dữ liệu thu thập có đủ đại diện cho bài toán không?
Dữ liệu được thu thập từ tuyến xe bus 150 trong 8 ngày với hơn 3700 mẫu, đủ để huấn luyện mô hình ban đầu. Tuy nhiên, mở rộng dữ liệu trên nhiều tuyến và thời gian dài hơn sẽ giúp mô hình tổng quát hơn.Làm thế nào để xử lý dữ liệu GPS không đồng đều về thời gian lấy mẫu?
Dữ liệu được lấy mẫu mỗi 6 giây, tuy nhiên có sai số do thiết bị. Luận văn áp dụng kỹ thuật tiền xử lý, chuẩn hóa và tính toán vận tốc trung bình dựa trên khoảng cách và thời gian thực tế giữa các điểm để giảm thiểu ảnh hưởng này.Mô hình có thể áp dụng cho các tuyến xe bus khác không?
Có thể, nhưng cần thu thập dữ liệu đặc thù của từng tuyến để huấn luyện lại mô hình, vì đặc điểm giao thông và lộ trình khác nhau ảnh hưởng đến vận tốc và thời gian di chuyển.Ứng dụng di động có ảnh hưởng đến an toàn lái xe không?
Ứng dụng được thiết kế với giao diện đơn giản, hạn chế thao tác trên xe để đảm bảo an toàn. Dữ liệu GPS được thu thập tự động, không yêu cầu người lái phải tương tác nhiều trong quá trình vận hành.
Kết luận
- Đã xây dựng thành công hệ thống thu thập dữ liệu GPS từ xe bus qua ứng dụng di động với tần suất lấy mẫu 6 giây, thu thập dữ liệu thực tế trên tuyến 150 trong 8 ngày.
- Áp dụng và khảo sát các mô hình LSTM và GRU để dự đoán vận tốc trung bình, từ đó tính toán thời gian đến trạm với độ chính xác cao, MAPE đạt khoảng 12.9%.
- Mô hình GRU cho thấy hiệu quả huấn luyện nhanh và độ chính xác tốt hơn trong điều kiện dữ liệu hiện tại, tuy nhiên LSTM vẫn có tiềm năng với dữ liệu lớn hơn.
- Giải pháp đề xuất có tính khả thi cao, chi phí thấp, dễ triển khai và mở rộng trên nền tảng Cloud và thiết bị di động.
- Các bước tiếp theo bao gồm mở rộng thu thập dữ liệu, thử nghiệm các mô hình phức tạp hơn, hoàn thiện hệ thống xử lý trên Cloud và phát triển giao diện người dùng để nâng cao trải nghiệm và hiệu quả ứng dụng.
Mời các nhà nghiên cứu và đơn vị quản lý giao thông tiếp tục khai thác và phát triển giải pháp nhằm hướng tới hệ thống giao thông thông minh, hiệu quả và thân thiện với người dùng.