Tổng quan nghiên cứu

Việt Nam đang đối mặt với áp lực lớn về tài nguyên nước, đặc biệt tại các lưu vực sông chịu ảnh hưởng từ quá trình đô thị hóa và phát triển kinh tế. Theo báo cáo của Bộ Tài nguyên và Môi trường, lượng nước mặt bình quân đầu người chỉ đạt khoảng 3840 m³/người/năm, thấp hơn tiêu chuẩn 4000 m³/người/năm của Hội Tài nguyên Nước quốc tế. Tình trạng ô nhiễm nước tại các đô thị lớn như Hà Nội, TP. Hồ Chí Minh ngày càng nghiêm trọng do hệ thống xử lý nước thải chưa đồng bộ và hoạt động quan trắc còn nhiều hạn chế. Hiện có khoảng 420 trạm quan trắc tự động trên toàn quốc, nhưng chủ yếu tập trung ở các khu công nghiệp, trong khi các vùng nông thôn và làng nghề vẫn phải sử dụng phương pháp thủ công, dẫn đến độ chính xác và tính cơ động thấp.

Trong bối cảnh đó, việc ứng dụng thuyền tự hành không người lái (USV) tích hợp các cảm biến hiện đại như camera và LiDAR để thực hiện định vị và vẽ bản đồ đồng thời (SLAM) trong môi trường sông ngòi là một hướng đi mới, giúp khắc phục hạn chế của GPS trong khu vực có tán cây che phủ và cải thiện hiệu quả quan trắc. Mục tiêu nghiên cứu của luận văn là phát triển hệ thống SLAM dựa trên kết hợp dữ liệu từ camera đơn và LiDAR 3D, nhằm ước lượng tư thế 6 bậc tự do và xây dựng bản đồ đám mây điểm trong môi trường sông ngòi, đồng thời mở rộng ứng dụng cho các môi trường ngoài trời khác. Nghiên cứu được thực hiện trong giai đoạn từ tháng 9/2021 đến tháng 5/2022, tập trung tại môi trường mô phỏng và dữ liệu thực tế thu thập từ các phương tiện không người lái.

Hệ thống SLAM được thiết kế theo kiến trúc module hóa, song song hóa các thành phần để đảm bảo thời gian thực, sử dụng kỹ thuật chồng lấn chùm tia quét và quản lý bản đồ incremental. Kết quả nghiên cứu có ý nghĩa quan trọng trong việc nâng cao độ chính xác định vị, hỗ trợ công tác khảo sát môi trường sông ngòi, phát hiện nguyên nhân ô nhiễm và góp phần phát triển các giải pháp tự động hóa trong lĩnh vực quan trắc tài nguyên nước.

Cơ sở lý thuyết và phương pháp nghiên cứu

Khung lý thuyết áp dụng

Luận văn dựa trên nền tảng toán học của nhóm Lie và đa tạp trơn để biểu diễn và xử lý các phép biến đổi phi tuyến trong không gian 3 chiều. Nhóm Lie ma trận 𝑆𝐸(3) được sử dụng để mô hình hóa tư thế (pose) của phương tiện trong không gian ba chiều, bao gồm vị trí và góc hướng. Các phép toán như phép mũ (exp), phép logarit (log), và phép liền kề (adjoint) được áp dụng để chuyển đổi giữa không gian tiếp tuyến và nhóm Lie, hỗ trợ trong việc tính toán đạo hàm và tối ưu hóa.

Phương pháp tối ưu bình phương cực tiểu phi tuyến (nonlinear least squares) được triển khai thông qua thuật toán IRLS (Iteratively Reweighted Least Squares) kết hợp nhân bền vững tổng quát Barron để giảm ảnh hưởng của dữ liệu ngoại lai (outliers). Thuật toán Levenberg–Marquardt (LM) được sử dụng để giải bài toán tối ưu trong không gian Lie, đảm bảo hội tụ nhanh và ổn định.

Ba khái niệm chính trong nghiên cứu bao gồm:

  • Image alignment: kỹ thuật xếp chồng các khung ảnh liên tiếp dựa trên tối thiểu hóa thặng dư quang học, giúp ước lượng độ dời tư thế camera với độ bền vững cao và chi phí tính toán thấp.
  • Cloud registration: phương pháp xếp chồng đám mây điểm LiDAR với bản đồ hiện tại để ước lượng tư thế LiDAR, bổ trợ cho image alignment trong trường hợp dữ liệu camera bị suy giảm.
  • Windowed optimization: thuật toán tối ưu hóa dựa trên đồ thị nhân tố (factor graph) để kết hợp kết quả ước lượng từ camera và LiDAR, quản lý bản đồ bằng cấu trúc dữ liệu ikd-Tree nhằm tăng tốc độ truy xuất và cập nhật bản đồ.

Phương pháp nghiên cứu

Nguồn dữ liệu nghiên cứu bao gồm các tập dữ liệu mô phỏng và thực tế:

  • GazeboRiverine: môi trường mô phỏng sông ngòi được xây dựng trên nền tảng Gazebo, tích hợp phương tiện thuyền không người lái (USV) và cảm biến camera, LiDAR để trích xuất dữ liệu cảm biến.
  • ICL-NUIM_RGB-D: tập dữ liệu mô phỏng trong môi trường trong nhà, dùng để đánh giá tính chính xác của giải thuật image alignment.
  • USVInland: tập dữ liệu thực tế thu thập từ thuyền tự hành trên sông, dùng để khảo sát hiệu năng hệ thống trong môi trường sông ngòi tự nhiên.
  • UrbanLocoNewerCollege: tập dữ liệu thực tế trong môi trường đô thị và khuôn viên đại học, dùng để đánh giá khả năng tổng quát hóa của hệ thống SLAM.

Phương pháp phân tích bao gồm:

  • Phát triển và tích hợp các module xử lý dữ liệu cảm biến: đồng bộ cảm biến, lựa chọn điểm ảnh chọn lọc, ước lượng tư thế camera (Image Aligner), ước lượng tư thế LiDAR (Cloud Registrator), tối ưu hóa đồ thị nhân tố (Windowed Optimizer) và quản lý bản đồ (Map Manager).
  • Áp dụng thuật toán IRLS với nhân bền vững Barron để xử lý thặng dư quang học và khoảng cách đám mây điểm, giảm thiểu ảnh hưởng của nhiễu và outliers.
  • Sử dụng phương pháp Levenberg–Marquardt trong không gian Lie để tối ưu hóa các tham số tư thế và nhân tố ánh sáng.
  • Thực hiện đánh giá hiệu năng qua các chỉ tiêu như sai số tuyệt đối đường đi (ATE), sai số tương đối tư thế (RPE), thời gian tính toán và độ trôi của hệ thống trên các tập dữ liệu khác nhau.

Quá trình nghiên cứu được thực hiện trong khoảng thời gian từ tháng 9/2021 đến tháng 5/2022, với cỡ mẫu dữ liệu thu thập và mô phỏng đủ lớn để đảm bảo tính đại diện và độ tin cậy của kết quả.

Kết quả nghiên cứu và thảo luận

Những phát hiện chính

  1. Tăng cường độ chính xác và ổn định định vị nhờ kết hợp camera và LiDAR
    Trên tập dữ liệu ICL-NUIM_RGB-D và GazeboRiverine, hệ thống SLAM tích hợp cho thấy sai số tuyệt đối đường đi (ATE) giảm trung bình khoảng 15-20% so với các phương pháp chỉ sử dụng camera hoặc LiDAR riêng lẻ. Độ trôi tư thế cũng được cải thiện rõ rệt, giúp hệ thống hoạt động ổn định trong điều kiện môi trường có nhiều nhiễu và biến đổi ánh sáng.

  2. Hiệu quả trong môi trường sông ngòi tự nhiên
    Trên tập USVInland, hệ thống đạt sai số tương đối tư thế (RPE) thấp hơn 10% so với các hệ thống định vị thị giác và laser phổ biến như LeGO-LOAM và DVL-SLAM. Đặc biệt, hệ thống thể hiện độ trôi thấp hơn, giúp duy trì định vị chính xác trong suốt hành trình dài trên sông.

  3. Khả năng tổng quát hóa trong môi trường ngoài sông ngòi
    Khi mở rộng khảo sát trên tập UrbanLoco và NewerCollege, hệ thống vẫn duy trì hiệu năng cao với sai số ATE giảm khoảng 12% so với các hệ thống đối thủ. Điều này chứng minh tính linh hoạt và khả năng áp dụng rộng rãi của giải thuật trong các môi trường đô thị và khuôn viên đại học.

  4. Tối ưu hóa thời gian tính toán
    Nhờ áp dụng các xấp xỉ trong tính toán jacobian và sử dụng cấu trúc dữ liệu ikd-Tree, thời gian xử lý mỗi khung hình được giảm xuống trung bình dưới 30 ms, đảm bảo khả năng vận hành thời gian thực trên máy tính nhúng của thuyền tự hành.

Thảo luận kết quả

Nguyên nhân chính giúp hệ thống đạt được hiệu quả trên là do sự kết hợp hài hòa giữa dữ liệu hình ảnh và đám mây điểm LiDAR, tận dụng ưu điểm của từng loại cảm biến để bù trừ nhược điểm. Giải thuật image alignment cải tiến giúp giảm gánh nặng tính toán và tăng độ bền vững trong điều kiện ánh sáng thay đổi, trong khi cloud registration nhanh hỗ trợ khi dữ liệu camera suy giảm hoặc bị che khuất.

So với các nghiên cứu trước đây chỉ tập trung vào một loại cảm biến, việc tích hợp và tối ưu hóa dựa trên đồ thị nhân tố giúp hệ thống không chỉ cải thiện độ chính xác mà còn tăng tính ổn định và khả năng mở rộng. Kết quả đánh giá trên nhiều tập dữ liệu đa dạng cũng cho thấy tính ứng dụng thực tiễn cao, đặc biệt trong môi trường sông ngòi phức tạp với nhiều yếu tố gây nhiễu như tán cây, phản xạ nước.

Dữ liệu có thể được trình bày qua các biểu đồ so sánh sai số ATE và RPE giữa các hệ thống, bảng thống kê thời gian tính toán và biểu đồ thể hiện độ trôi tư thế theo thời gian, giúp minh họa rõ ràng sự vượt trội của hệ thống đề xuất.

Đề xuất và khuyến nghị

  1. Triển khai hệ thống SLAM tích hợp camera-LiDAR trên các phương tiện thuyền tự hành tại các lưu vực sông ngòi trọng điểm
    Mục tiêu giảm sai số định vị xuống dưới 0.1 m trong vòng 12 tháng, do các đơn vị quản lý tài nguyên nước và các trung tâm nghiên cứu thực hiện.

  2. Phát triển thêm các module xử lý dữ liệu cảm biến bổ sung như IMU và GNSS để tăng cường độ tin cậy trong điều kiện môi trường khắc nghiệt
    Thời gian thực hiện dự kiến 18 tháng, phối hợp giữa các viện nghiên cứu và doanh nghiệp công nghệ.

  3. Xây dựng hệ thống quan trắc tự động kết hợp SLAM để giám sát chất lượng nước và cảnh quan ven sông theo thời gian thực
    Mục tiêu nâng cao độ phủ sóng quan trắc, giảm chi phí nhân công, hoàn thành trong 24 tháng, do các cơ quan quản lý môi trường chủ trì.

  4. Mở rộng nghiên cứu và ứng dụng hệ thống SLAM trong các môi trường ngoài trời khác như khu đô thị, khu công nghiệp và khuôn viên trường học
    Đánh giá khả năng tổng quát hóa và điều chỉnh thuật toán phù hợp, thời gian 12-18 tháng, do các nhóm nghiên cứu và trường đại học thực hiện.

Các giải pháp trên cần được thực hiện đồng bộ, có sự phối hợp chặt chẽ giữa các bên liên quan để đảm bảo hiệu quả và tính khả thi trong thực tế.

Đối tượng nên tham khảo luận văn

  1. Các nhà nghiên cứu và sinh viên ngành Kỹ thuật Điều khiển và Tự động hóa
    Học hỏi phương pháp tích hợp cảm biến, kỹ thuật tối ưu hóa trong không gian Lie và ứng dụng SLAM trong môi trường phức tạp.

  2. Các đơn vị quản lý tài nguyên nước và môi trường
    Áp dụng hệ thống SLAM để nâng cao hiệu quả quan trắc, giám sát chất lượng nước và cảnh quan ven sông, hỗ trợ ra quyết định quản lý.

  3. Doanh nghiệp phát triển công nghệ tự động hóa và robot thủy sinh
    Nghiên cứu và phát triển các sản phẩm thuyền tự hành tích hợp cảm biến đa dạng, cải thiện khả năng định vị và lập bản đồ trong môi trường sông ngòi.

  4. Các tổ chức nghiên cứu và phát triển công nghệ GIS và bản đồ số
    Tận dụng dữ liệu bản đồ đám mây điểm chất lượng cao từ hệ thống SLAM để xây dựng các mô hình địa hình, cảnh quan chi tiết phục vụ nhiều lĩnh vực.

Mỗi nhóm đối tượng có thể ứng dụng kết quả nghiên cứu để nâng cao năng lực chuyên môn, phát triển sản phẩm hoặc cải thiện quy trình quản lý, từ đó đóng góp vào sự phát triển bền vững của ngành và xã hội.

Câu hỏi thường gặp

  1. Hệ thống SLAM kết hợp camera và LiDAR có ưu điểm gì so với sử dụng riêng lẻ từng cảm biến?
    Việc kết hợp giúp tận dụng ưu điểm của cả hai loại cảm biến: camera cung cấp thông tin hình ảnh phong phú, LiDAR cung cấp khoảng cách chính xác và không bị ảnh hưởng bởi ánh sáng. Điều này làm tăng độ chính xác, ổn định và khả năng hoạt động trong điều kiện môi trường phức tạp như sông ngòi có tán cây che phủ.

  2. Phương pháp tối ưu IRLS và nhân bền vững Barron giúp gì cho quá trình xử lý dữ liệu?
    IRLS cho phép xử lý các thặng dư có trọng số khác nhau, giảm ảnh hưởng của dữ liệu ngoại lai (outliers). Nhân bền vững Barron điều chỉnh trọng số sao cho các điểm nhiễu không làm sai lệch kết quả tối ưu, giúp hệ thống hoạt động ổn định hơn trong môi trường thực tế nhiều nhiễu.

  3. Tại sao cần xây dựng môi trường mô phỏng GazeboRiverine?
    Môi trường mô phỏng giúp tạo ra dữ liệu cảm biến chuẩn, kiểm thử và đánh giá hệ thống SLAM trong điều kiện kiểm soát được, giảm chi phí và rủi ro khi thử nghiệm thực tế. Đây là bước quan trọng để phát triển và hoàn thiện thuật toán trước khi áp dụng trên phương tiện thực.

  4. Hệ thống có thể hoạt động tốt trong điều kiện mất tín hiệu GPS không?
    Có. Hệ thống SLAM dựa trên dữ liệu camera và LiDAR giúp định vị chính xác ngay cả khi tín hiệu GPS bị che khuất hoặc mất, đặc biệt hữu ích trong môi trường sông ngòi có tán cây dày hoặc khu vực đô thị phức tạp.

  5. Thời gian xử lý của hệ thống có đáp ứng được yêu cầu thời gian thực không?
    Nhờ các cải tiến trong tính toán jacobian và sử dụng cấu trúc dữ liệu ikd-Tree, hệ thống xử lý mỗi khung hình trong khoảng dưới 30 ms, đủ nhanh để vận hành thời gian thực trên máy tính nhúng của thuyền tự hành.

Kết luận

  • Đã phát triển thành công hệ thống SLAM tích hợp camera đơn và LiDAR 3D, ước lượng tư thế 6 bậc tự do và xây dựng bản đồ đám mây điểm trong môi trường sông ngòi và ngoài trời.
  • Giải thuật image alignment cải tiến và cloud registration nhanh giúp tăng độ chính xác và ổn định định vị, giảm sai số và độ trôi so với các phương pháp truyền thống.
  • Hệ thống được hiện thực hóa bằng phần mềm C++ với kiến trúc module hóa, đảm bảo thời gian thực và khả năng mở rộng.
  • Đã xây dựng môi trường mô phỏng GazeboRiverine và thu thập dữ liệu thực tế để đánh giá toàn diện hiệu năng hệ thống.
  • Đề xuất các hướng phát triển tiếp theo bao gồm tích hợp thêm cảm biến, mở rộng ứng dụng và triển khai thực tế trong công tác quan trắc tài nguyên nước.

Các bước tiếp theo là hoàn thiện phần mềm, thử nghiệm thực tế trên các lưu vực sông trọng điểm và phát triển các module bổ sung để nâng cao tính năng hệ thống. Độc giả và các đơn vị quan tâm được khuyến khích áp dụng và phát triển nghiên cứu nhằm góp phần bảo vệ và quản lý bền vững tài nguyên nước.