Tổng quan nghiên cứu

Hành vi vượt đèn đỏ là một trong những nguyên nhân chính gây ra tai nạn giao thông tại Việt Nam và trên thế giới. Theo ước tính, tỷ lệ các vụ tai nạn liên quan đến vi phạm này chiếm một phần đáng kể trong tổng số vụ tai nạn giao thông. Việc giám sát và phát hiện hành vi vượt đèn đỏ truyền thống dựa vào lực lượng cảnh sát giao thông gặp nhiều hạn chế về nhân lực và thời gian, dẫn đến việc không thể phát hiện hết các trường hợp vi phạm. Do đó, việc xây dựng một hệ thống tự động phát hiện hành vi vượt đèn đỏ với độ chính xác cao, chi phí hợp lý và khả năng hoạt động liên tục trong mọi điều kiện thời tiết là rất cần thiết.

Luận văn tập trung nghiên cứu phát hiện hành vi vượt đèn đỏ dựa trên phương pháp deep learning, áp dụng tại các giao lộ ở Việt Nam trong giai đoạn từ năm 2020 đến 2021. Mục tiêu cụ thể là phát triển mô hình nhận diện phương tiện giao thông và đèn tín hiệu giao thông, xây dựng hệ thống phát hiện hành vi vượt đèn đỏ, đồng thời cải tiến các kỹ thuật nhận diện để nâng cao độ chính xác và tốc độ xử lý. Nghiên cứu có ý nghĩa quan trọng trong việc hỗ trợ công tác giám sát giao thông, giảm thiểu tai nạn và nâng cao an toàn giao thông đô thị, đặc biệt tại các thành phố lớn như TP. Hồ Chí Minh.

Cơ sở lý thuyết và phương pháp nghiên cứu

Khung lý thuyết áp dụng

Luận văn sử dụng các lý thuyết và mô hình sau làm nền tảng:

  • Mô hình YOLO (You Only Look Once): Đây là mô hình deep learning nổi bật trong bài toán phát hiện đối tượng, với các phiên bản từ YOLOv1 đến YOLOv4. YOLOv4 được lựa chọn do cân bằng tốt giữa tốc độ xử lý (khoảng 20 FPS) và độ chính xác, phù hợp với yêu cầu xử lý thời gian thực trong giám sát giao thông.

  • Phương pháp Simple Online and Realtime Tracking (SORT): Thuật toán theo dõi đối tượng dựa trên bộ lọc Kalman và giải thuật Hungarian để liên kết các đối tượng phát hiện được qua các khung hình liên tiếp, đảm bảo theo dõi chính xác các phương tiện giao thông trong video.

  • Cây quyết định dựa trên chỉ số Gini: Được sử dụng để loại bỏ nhiễu trong kết quả phát hiện đèn giao thông, cải thiện độ chính xác phân loại màu sắc đèn (đỏ, vàng, xanh) bằng cách kết hợp các thuộc tính hình ảnh như Structural Similarity Index (SSIM), tính tròn và tính lõm.

Các khái niệm chính bao gồm: phát hiện đối tượng (object detection), theo dõi đối tượng (object tracking), bộ lọc Kalman, giải thuật Hungarian, và các mô hình màu HSV, RGB trong xử lý ảnh.

Phương pháp nghiên cứu

Nguồn dữ liệu chính bao gồm hơn 70,000 hình ảnh từ nhiều bộ dữ liệu công khai như SKKU, COCO, Bosch Small, cùng hơn 2,000 hình ảnh thực tế tại các tuyến đường Việt Nam, được gán nhãn chi tiết cho 12 loại đối tượng (phương tiện và đèn giao thông). Bộ dữ liệu thử nghiệm gồm 213 video quay tại các giao lộ có đèn tín hiệu, với tổng số 327 phương tiện vi phạm được gán nhãn và theo dõi.

Phương pháp phân tích gồm:

  • Huấn luyện mô hình YOLOv4 trên bộ dữ liệu đa dạng để phát hiện phương tiện và đèn giao thông.

  • Áp dụng cây quyết định để xử lý hậu kỳ, loại bỏ nhiễu trong phát hiện đèn giao thông.

  • Sử dụng thuật toán SORT kết hợp bộ lọc Kalman và giải thuật Hungarian để theo dõi phương tiện qua các khung hình.

  • Xác định vị trí tương đối của phương tiện so với vạch dừng và trạng thái đèn tín hiệu để phát hiện hành vi vượt đèn đỏ.

Quá trình nghiên cứu được thực hiện trong năm 2021, với các bước từ xây dựng bộ dữ liệu, huấn luyện mô hình, thử nghiệm trên video thực tế đến đánh giá kết quả.

Kết quả nghiên cứu và thảo luận

Những phát hiện chính

  1. Độ chính xác phát hiện hành vi vượt đèn đỏ: Hệ thống đạt độ chính xác (precision) 70,9% và độ bao phủ (recall) 88,67% khi sử dụng kết quả phát hiện đèn giao thông trực tiếp từ YOLOv4. Khi áp dụng phương pháp phân loại đèn giao thông cải tiến bằng cây quyết định, precision tăng lên 74,48% nhưng recall giảm còn 66,05%.

  2. Tốc độ xử lý: Hệ thống xử lý trung bình khoảng 20 khung hình mỗi giây (FPS), đáp ứng yêu cầu thời gian thực. Thời gian xử lý một ảnh trung bình là 0,0528 giây với YOLOv4 và 0,057 giây khi áp dụng phương pháp cải tiến.

  3. Hiệu quả theo dõi phương tiện: Thuật toán SORT hoạt động hiệu quả trong môi trường camera cố định, với sai số vị trí nhỏ hơn kích thước phương tiện, đảm bảo liên kết chính xác các đối tượng qua các khung hình.

  4. Ảnh hưởng của điều kiện thực tế: Các yếu tố như bóng mát, che khuất, tốc độ di chuyển nhanh của phương tiện và vị trí đặt camera ảnh hưởng đến tỷ lệ phát hiện phương tiện, đặc biệt với các phương tiện ở xa hoặc bị mờ.

Thảo luận kết quả

Kết quả cho thấy phương pháp deep learning kết hợp với thuật toán theo dõi SORT và cây quyết định cải tiến mang lại hiệu quả cao trong phát hiện hành vi vượt đèn đỏ. Việc tăng precision khi sử dụng cây quyết định cho thấy khả năng giảm nhiễu và sai sót trong phân loại màu đèn, tuy nhiên điều này đi kèm với giảm recall do một số trường hợp bị loại bỏ quá mức.

So sánh với các nghiên cứu quốc tế, hệ thống đạt tốc độ xử lý và độ chính xác phù hợp với yêu cầu thực tế tại Việt Nam, nơi điều kiện ánh sáng và giao thông phức tạp hơn. Việc sử dụng bộ dữ liệu đa dạng và thực tế Việt Nam giúp mô hình thích nghi tốt hơn với môi trường địa phương.

Dữ liệu có thể được trình bày qua biểu đồ so sánh precision và recall giữa các phương pháp, cũng như bảng thống kê tốc độ xử lý và số lượng phương tiện phát hiện đúng/sai để minh họa hiệu quả của hệ thống.

Đề xuất và khuyến nghị

  1. Tăng cường thu thập và đa dạng hóa dữ liệu huấn luyện: Mở rộng bộ dữ liệu với nhiều điều kiện thời tiết, góc quay và loại phương tiện khác nhau để nâng cao khả năng tổng quát của mô hình. Chủ thể thực hiện: các cơ quan nghiên cứu và đơn vị quản lý giao thông, thời gian 6-12 tháng.

  2. Cải tiến thuật toán theo dõi đối tượng: Kết hợp thêm các đặc trưng nhận dạng phương tiện (ví dụ vector nhúng deep learning) để giảm hiện tượng mất định danh khi phương tiện bị che khuất hoặc biến mất tạm thời. Chủ thể thực hiện: nhóm phát triển phần mềm, thời gian 3-6 tháng.

  3. Triển khai hệ thống thí điểm tại các giao lộ trọng điểm: Lắp đặt camera cố định, tích hợp hệ thống phát hiện hành vi vượt đèn đỏ để đánh giá hiệu quả thực tế và thu thập phản hồi. Chủ thể thực hiện: Sở Giao thông Vận tải, thời gian 6 tháng.

  4. Phát triển giao diện cảnh báo và báo cáo tự động: Hệ thống cần có khả năng gửi cảnh báo vi phạm và tổng hợp báo cáo định kỳ cho cơ quan chức năng, hỗ trợ công tác xử lý vi phạm nhanh chóng. Chủ thể thực hiện: đơn vị phát triển phần mềm, thời gian 3 tháng.

Đối tượng nên tham khảo luận văn

  1. Cơ quan quản lý giao thông và cảnh sát giao thông: Nghiên cứu giúp nâng cao hiệu quả giám sát, xử lý vi phạm giao thông tự động, giảm tải công việc cho lực lượng cảnh sát.

  2. Các nhà nghiên cứu và phát triển công nghệ AI, deep learning: Tham khảo mô hình, thuật toán và phương pháp cải tiến trong phát hiện đối tượng và theo dõi đa phương tiện trong môi trường thực tế.

  3. Doanh nghiệp phát triển hệ thống giám sát giao thông thông minh: Áp dụng các kỹ thuật deep learning và thuật toán theo dõi để xây dựng sản phẩm có độ chính xác và tốc độ xử lý cao.

  4. Sinh viên và học viên ngành khoa học máy tính, kỹ thuật phần mềm: Học tập về ứng dụng thực tế của deep learning trong xử lý ảnh và video, cũng như các kỹ thuật theo dõi đối tượng trong bài toán phức tạp.

Câu hỏi thường gặp

  1. Hệ thống có thể hoạt động trong điều kiện thời tiết xấu không?
    Hệ thống được huấn luyện trên bộ dữ liệu đa dạng, bao gồm nhiều điều kiện ánh sáng và thời tiết khác nhau, giúp duy trì hiệu suất ổn định. Tuy nhiên, các yếu tố như mưa to hoặc sương mù dày đặc có thể ảnh hưởng đến chất lượng hình ảnh và độ chính xác.

  2. Tốc độ xử lý có đáp ứng được yêu cầu thời gian thực không?
    Với tốc độ xử lý khoảng 20 FPS trên cấu hình máy tính tiêu chuẩn, hệ thống có thể xử lý video thời gian thực, phù hợp cho việc giám sát liên tục tại các giao lộ.

  3. Làm thế nào để hệ thống phân biệt được các màu đèn giao thông?
    Hệ thống sử dụng mô hình YOLOv4 để phát hiện đèn giao thông, sau đó áp dụng cây quyết định dựa trên các thuộc tính hình ảnh như SSIM, tính tròn và hệ màu HSV để phân loại chính xác màu sắc đèn.

  4. Phương pháp theo dõi đối tượng SORT có những hạn chế gì?
    SORT dựa chủ yếu vào vị trí và kích thước bounding box, có thể bị mất định danh khi phương tiện bị che khuất hoặc biến mất tạm thời. Việc cải tiến bằng cách kết hợp đặc trưng nhận dạng sâu có thể khắc phục hạn chế này.

  5. Hệ thống có thể áp dụng cho các loại phương tiện khác nhau không?
    Hệ thống được huấn luyện để nhận diện các loại phương tiện phổ biến như xe máy, ô tô, xe đạp. Việc mở rộng nhận diện các loại phương tiện khác cần bổ sung dữ liệu huấn luyện và điều chỉnh mô hình.

Kết luận

  • Luận văn đã phát triển thành công hệ thống phát hiện hành vi vượt đèn đỏ dựa trên phương pháp deep learning kết hợp thuật toán theo dõi SORT và cây quyết định cải tiến, phù hợp với môi trường giao thông Việt Nam.
  • Hệ thống đạt độ chính xác phát hiện vi phạm lên đến 74,48% và tốc độ xử lý gần 20 FPS, đáp ứng yêu cầu thời gian thực.
  • Các phương pháp cải tiến trong phân loại đèn giao thông giúp giảm nhiễu và tăng độ tin cậy của kết quả.
  • Nghiên cứu mở ra hướng phát triển các hệ thống giám sát giao thông thông minh, hỗ trợ công tác quản lý và xử lý vi phạm hiệu quả hơn.
  • Các bước tiếp theo bao gồm mở rộng bộ dữ liệu, cải tiến thuật toán theo dõi và triển khai thí điểm tại các giao lộ trọng điểm để đánh giá thực tế.

Hành động tiếp theo: Các cơ quan và doanh nghiệp liên quan nên phối hợp triển khai thử nghiệm hệ thống, đồng thời tiếp tục nghiên cứu nâng cao hiệu quả và mở rộng ứng dụng trong quản lý giao thông thông minh.