Tổng quan nghiên cứu
Trong bối cảnh phát triển nhanh chóng của công nghệ thông tin, các hệ thống bản đồ số đóng vai trò thiết yếu trong đời sống hiện đại, đặc biệt trong việc hỗ trợ tìm kiếm địa chỉ và chỉ đường. Tại Việt Nam, nền tảng bản đồ số VMap đã ra mắt với hơn 23,4 triệu dữ liệu địa chỉ trên toàn quốc, phục vụ nhu cầu đa dạng của người dùng từ thành thị đến vùng sâu, vùng xa. Tuy nhiên, chức năng chỉ đường của VMap hiện nay vẫn gặp nhiều hạn chế, đặc biệt trong việc ước tính thời gian di chuyển thực tế do thiếu dữ liệu tín hiệu và lưu lượng giao thông. Điều này dẫn đến việc chỉ đường dựa trên khoảng cách ngắn nhất thay vì thời gian di chuyển nhanh nhất, chưa đáp ứng được nhu cầu thực tế của người dùng.
Luận văn tập trung phát triển thuật toán tìm đường đi nhanh nhất theo thời gian cho nền tảng VMap, sử dụng dữ liệu lưu lượng giao thông từ Google Traffic Tiles. Nghiên cứu thực hiện trong phạm vi 12 quận nội thành Hà Nội, với mục tiêu xây dựng công cụ thu thập dữ liệu, phát triển thuật toán ước lượng thời gian di chuyển chính xác và triển khai đánh giá hiệu quả trên nền tảng VMap. Việc cải thiện độ chính xác của chức năng chỉ đường không chỉ nâng cao trải nghiệm người dùng mà còn góp phần thúc đẩy ứng dụng bản đồ số trong các lĩnh vực dân sinh, giao thông và quản lý đô thị.
Cơ sở lý thuyết và phương pháp nghiên cứu
Khung lý thuyết áp dụng
Luận văn dựa trên các lý thuyết và mô hình sau:
Mô hình đồ thị định tuyến: Sử dụng dữ liệu đường bộ được tổ chức theo cấu trúc OpenStreetMap gồm các thành phần tag, node, way và relation để xây dựng đồ thị định tuyến. Thuật toán Dijkstra được áp dụng để tìm đường đi tối ưu dựa trên trọng số thời gian di chuyển trên các cạnh.
Chuẩn Web Map Tile Service (WMTS): Theo chuẩn của tổ chức Open Geospatial Consortium (OGC), WMTS chia bản đồ thành các mảnh (tile) để phục vụ việc truy xuất dữ liệu nhanh chóng và hiệu quả, đặc biệt trong việc xử lý dữ liệu giao thông thời gian thực từ Google Traffic Tiles.
Mô hình học máy RNN (Recurrent Neural Network): Được sử dụng để ước lượng thời gian di chuyển thực tế dựa trên dữ liệu giao thông thu thập được. RNN có khả năng xử lý chuỗi dữ liệu tuần tự, phù hợp với việc dự đoán thời gian di chuyển trên từng đoạn đường.
Các khái niệm chính bao gồm: tốc độ di chuyển thực tế, dữ liệu lưu lượng giao thông, tín hiệu giao thông, thuật toán tìm đường đi nhanh nhất, và mô hình học máy.
Phương pháp nghiên cứu
Nguồn dữ liệu: Dữ liệu địa chỉ và đường bộ từ nền tảng VMap; dữ liệu lưu lượng giao thông thời gian thực từ Google Traffic Tiles; dữ liệu thử nghiệm từ 12 quận nội thành Hà Nội; dữ liệu thời gian di chuyển thực tế từ Google Direction API.
Phương pháp thu thập dữ liệu: Xây dựng công cụ thu thập Google Traffic Tiles sử dụng NodeJS với thư viện polygon-lookup để xác định các tile thuộc khu vực nghiên cứu, tải về dữ liệu ảnh với độ zoom 18, tổng cộng 15.128 tile trong khoảng thời gian trung bình 133,46 giây.
Phương pháp phân tích: Phát triển thuật toán tìm đường đi nhanh nhất dựa trên kết quả chỉ đường hiện có của VMap, sử dụng mô hình học máy RNN để ước lượng thời gian di chuyển thực tế trên từng đoạn đường dựa vào dữ liệu giao thông. Mô hình được huấn luyện và đánh giá trên bộ dữ liệu thử nghiệm gồm 3.401 mẫu, chia thành 3.000 mẫu train và 401 mẫu test.
Timeline nghiên cứu: Thu thập dữ liệu và xây dựng bộ dữ liệu thử nghiệm trong giai đoạn đầu; phát triển và thử nghiệm mô hình học máy; triển khai thuật toán và công cụ thu thập dữ liệu; đánh giá hiệu quả trên nền tảng VMap; hoàn thiện luận văn trong năm 2020.
Kết quả nghiên cứu và thảo luận
Những phát hiện chính
Thu thập dữ liệu Google Traffic Tiles thành công: Tổng số 15.128 tile được tải về cho 12 quận nội thành Hà Nội với thời gian trung bình 133,46 giây, đảm bảo độ phủ dữ liệu giao thông thời gian thực phục vụ cho việc ước lượng tốc độ di chuyển.
Mô hình học máy RNN vượt trội hơn hồi quy tuyến tính: Mô hình RNN đạt hệ số xác định R2 khoảng 0,39, tương đương hồi quy tuyến tính nhưng có sai số RMSE thấp hơn 27%, cho thấy khả năng dự đoán thời gian di chuyển chính xác hơn.
Thuật toán tìm đường đi nhanh nhất cải thiện độ chính xác ước lượng thời gian: So sánh kết quả thử nghiệm thực tế trên các tuyến đường tại Hà Nội, thuật toán mới của VMap cho kết quả thời gian di chuyển gần sát với thực tế hơn so với phiên bản cũ và tương đương với Google Map. Ví dụ, tuyến 144 Xuân Thủy → 716 Láng, thời gian thực tế 17 phút, VMap mới ước lượng 17 phút, trong khi VMap cũ chỉ 10 phút.
Triển khai thành công dịch vụ tìm đường mới trên nền tảng VMap: Thuật toán được tích hợp với API mới sử dụng Python và Flask, chạy ổn định trên cổng 8000, được cấu hình proxy qua nginx, phục vụ hiệu quả trên cả nền tảng web và di động.
Thảo luận kết quả
Việc sử dụng dữ liệu Google Traffic Tiles theo chuẩn WMTS giúp thu thập dữ liệu lưu lượng giao thông thời gian thực với độ phủ rộng và chi phí thấp, khắc phục hạn chế của các phương pháp đo trực tiếp hoặc thu thập từ người dùng. Mô hình RNN tận dụng được tính tuần tự của dữ liệu giao thông, cải thiện đáng kể độ chính xác dự đoán thời gian di chuyển so với mô hình hồi quy tuyến tính truyền thống.
Kết quả thử nghiệm thực tế cho thấy thuật toán mới giúp VMap nâng cao chất lượng dịch vụ chỉ đường, đáp ứng nhu cầu tìm đường theo thời gian di chuyển nhanh nhất của người dùng. So sánh với Google Map, nền tảng bản đồ số quốc tế hàng đầu, VMap đã đạt được mức độ chính xác tương đương, tạo tiền đề phát triển bền vững cho các ứng dụng dân sinh tại Việt Nam.
Dữ liệu có thể được trình bày qua biểu đồ so sánh thời gian di chuyển ước lượng giữa VMap cũ, VMap mới và Google Map trên các tuyến đường thử nghiệm, cũng như bảng thống kê các chỉ số đánh giá mô hình học máy (R2, RMSE).
Đề xuất và khuyến nghị
Mở rộng thu thập dữ liệu Google Traffic Tiles trên toàn quốc: Triển khai công cụ thu thập dữ liệu cho các tỉnh, thành phố khác ngoài Hà Nội nhằm nâng cao độ phủ và tính chính xác của thuật toán ước lượng thời gian di chuyển. Thời gian thực hiện dự kiến 6-12 tháng, do Trung tâm Công nghệ tích hợp liên ngành Giám sát hiện trường (FIMO) chủ trì.
Phát triển mô hình học máy nâng cao: Nghiên cứu áp dụng các mô hình học sâu phức tạp hơn như LSTM hoặc Transformer để cải thiện khả năng dự đoán thời gian di chuyển trong các điều kiện giao thông phức tạp. Thời gian nghiên cứu 6 tháng, do nhóm nghiên cứu khoa học máy tính đảm nhiệm.
Tích hợp dữ liệu tín hiệu giao thông và biển báo hiệu tự động: Xây dựng hệ thống thu thập và cập nhật dữ liệu tín hiệu giao thông tự động để bổ sung cho dữ liệu lưu lượng, nâng cao độ chính xác của thuật toán tìm đường. Thời gian triển khai 12 tháng, phối hợp với các cơ quan quản lý giao thông.
Tăng cường trải nghiệm người dùng và thu thập phản hồi: Phát triển tính năng thu thập dữ liệu vị trí và phản hồi từ người dùng VMap để cải thiện mô hình dự đoán, đồng thời nâng cao độ tin cậy dữ liệu. Thời gian thực hiện liên tục, do bộ phận phát triển sản phẩm VMap đảm nhận.
Đối tượng nên tham khảo luận văn
Nhà phát triển phần mềm bản đồ số và ứng dụng giao thông: Có thể áp dụng thuật toán và phương pháp thu thập dữ liệu để nâng cao chất lượng dịch vụ chỉ đường, cải thiện trải nghiệm người dùng.
Các cơ quan quản lý giao thông và đô thị: Sử dụng kết quả nghiên cứu để xây dựng hệ thống giám sát và điều phối giao thông thông minh, giảm ùn tắc và tai nạn giao thông.
Nhà nghiên cứu trong lĩnh vực khoa học máy tính và trí tuệ nhân tạo: Tham khảo mô hình học máy RNN và quy trình xây dựng bộ dữ liệu thử nghiệm trong lĩnh vực xử lý dữ liệu không gian và dự đoán thời gian di chuyển.
Doanh nghiệp cung cấp dịch vụ logistics và vận tải: Áp dụng thuật toán tìm đường tối ưu theo thời gian để nâng cao hiệu quả vận hành, giảm chi phí và thời gian giao hàng.
Câu hỏi thường gặp
Tại sao cần sử dụng dữ liệu Google Traffic Tiles thay vì dữ liệu từ người dùng?
Dữ liệu Google Traffic Tiles cung cấp thông tin lưu lượng giao thông thời gian thực với độ phủ rộng và ổn định, trong khi dữ liệu từ người dùng thường có độ bao phủ hạn chế và không đồng đều, ảnh hưởng đến độ chính xác của mô hình.Mô hình RNN có ưu điểm gì trong việc ước lượng thời gian di chuyển?
RNN có khả năng xử lý chuỗi dữ liệu tuần tự, ghi nhớ thông tin trước đó để dự đoán chính xác hơn các biến động liên tục trong lưu lượng giao thông, vượt trội so với các mô hình hồi quy tuyến tính.Thuật toán tìm đường mới có thể áp dụng cho các loại phương tiện nào?
Thuật toán hỗ trợ các loại phương tiện phổ biến như ô tô, xe máy, xe đạp và đi bộ, với đồ thị định tuyến riêng biệt cho từng loại nhằm phản ánh đặc điểm di chuyển khác nhau.Làm thế nào để thuật toán xử lý sự không trùng khớp giữa hệ thống đường của VMap và Google?
Thuật toán mở rộng cửa sổ lấy dữ liệu trên tile Google Traffic để bao phủ các đoạn đường không trùng khớp, sử dụng kỹ thuật xử lý ảnh và chuẩn hóa dữ liệu màu sắc để xác định tình trạng giao thông chính xác.Kết quả thử nghiệm thực tế cho thấy độ chính xác của thuật toán như thế nào?
Trên các tuyến đường thử nghiệm tại Hà Nội, thời gian di chuyển ước lượng bởi thuật toán mới của VMap gần sát với thời gian thực tế và tương đương với Google Map, cải thiện đáng kể so với phiên bản cũ.
Kết luận
- Luận văn đã phát triển thành công thuật toán tìm đường đi nhanh nhất theo thời gian cho nền tảng VMap, sử dụng dữ liệu Google Traffic Tiles và mô hình học máy RNN.
- Công cụ thu thập dữ liệu và thuật toán được triển khai hiệu quả trên nền tảng VMap, nâng cao độ chính xác của chức năng chỉ đường.
- Mô hình RNN cho kết quả dự đoán thời gian di chuyển chính xác hơn 27% so với hồi quy tuyến tính.
- Thuật toán mới giúp VMap đạt độ chính xác tương đương Google Map trong thử nghiệm thực tế tại Hà Nội.
- Định hướng phát triển tiếp theo bao gồm mở rộng thu thập dữ liệu, nâng cao mô hình học máy và tích hợp dữ liệu tín hiệu giao thông tự động.
Để tiếp tục phát triển và ứng dụng rộng rãi, các nhà nghiên cứu và phát triển được khuyến khích áp dụng phương pháp và công cụ trong luận văn, đồng thời phối hợp với các cơ quan quản lý để hoàn thiện hệ thống bản đồ số Việt Nam.