Tổng quan nghiên cứu
Tại các đô thị lớn ở Việt Nam, số lượng phương tiện giao thông cá nhân tăng nhanh chóng, dẫn đến tình trạng ùn tắc giao thông kéo dài và ô nhiễm môi trường nghiêm trọng. Theo ước tính, mật độ phương tiện trên nhiều tuyến đường chính thường xuyên vượt quá khả năng lưu thông, gây khó khăn trong việc điều tiết và kiểm soát giao thông. Việc phát triển các hệ thống giám sát lưu lượng xe nhằm phân loại và đếm số lượng phương tiện lưu thông là rất cần thiết để hỗ trợ công tác quản lý giao thông hiệu quả. Mục tiêu của luận văn là xây dựng một hệ thống xử lý ảnh tự động có khả năng phân loại xe lớn và xe nhỏ, đồng thời đếm lưu lượng xe lưu thông dựa trên dữ liệu video thu thập từ camera giao thông tại các tuyến đường đô thị. Nghiên cứu tập trung vào việc áp dụng mô hình Gaussian hỗn hợp để trừ nền, kết hợp các phương pháp xử lý hình thái và thuật toán dán nhãn nhằm phát hiện, theo dõi, đếm và phân loại xe. Phạm vi nghiên cứu bao gồm các video thực tế thu thập tại thành phố Hồ Chí Minh trong năm 2020, với mục tiêu cải thiện độ chính xác trong việc nhận dạng và đếm xe, góp phần giảm thiểu ùn tắc và nâng cao hiệu quả quản lý giao thông đô thị.
Cơ sở lý thuyết và phương pháp nghiên cứu
Khung lý thuyết áp dụng
Luận văn dựa trên các lý thuyết và mô hình xử lý ảnh số, đặc biệt là:
Mô hình Gaussian hỗn hợp (Gaussian Mixture Model - GMM): Đây là phương pháp trừ nền hiệu quả trong môi trường có điều kiện ánh sáng thay đổi và cảnh quan phức tạp. GMM mô hình mỗi điểm ảnh như một tổng hợp của nhiều phân phối Gaussian, giúp phân biệt nền và tiền cảnh chính xác hơn.
Phương pháp xử lý hình thái (Morphological Operations): Bao gồm các phép mở ảnh, đóng ảnh, giãn ảnh và co ảnh nhằm loại bỏ nhiễu, lấp đầy khoảng trống trong ảnh nhị phân, giúp cải thiện chất lượng phân đoạn đối tượng.
Thuật toán dán nhãn thành phần liên kết (Connected Component Labeling): Dùng để xác định và đếm số lượng đối tượng (xe) trong ảnh nhị phân sau khi xử lý, đồng thời hỗ trợ phân loại dựa trên kích thước hộp bao quanh đối tượng.
Các khái niệm chính bao gồm: trừ nền, phân đoạn ảnh, xử lý hình thái, dán nhãn, phân loại xe lớn và xe nhỏ dựa trên kích thước hộp bao quanh (Bbox), ước lượng tốc độ xe dựa trên vị trí quỹ tâm trong các khung hình liên tiếp.
Phương pháp nghiên cứu
Nguồn dữ liệu chính là các video giao thông thực tế được thu thập tại thành phố Hồ Chí Minh, định dạng AVI và MP4, với tổng số khung hình khoảng 100 khung để khởi tạo mô hình nền. Phương pháp nghiên cứu bao gồm:
Trích xuất khung hình: Tách các khung hình từ video để xử lý tuần tự.
Xử lý trừ nền: Áp dụng mô hình Gaussian hỗn hợp để phát hiện và tách các đối tượng xe ra khỏi nền đường.
Lọc nhiễu: Sử dụng các phép biến đổi hình thái (mở, đóng, giãn, co ảnh) cùng bộ lọc trung bình và trung vị để loại bỏ nhiễu và lấp đầy khoảng trống trong ảnh nhị phân.
Phân vùng và dán nhãn: Phân vùng ảnh để phát hiện các đối tượng xe, dán nhãn thành phần liên kết để đếm số lượng xe.
Phân loại xe: Dựa trên kích thước hộp bao quanh đối tượng, phân loại xe thành xe lớn (xe ô tô, xe tải, xe bus) và xe nhỏ (xe máy, xe đạp).
Ước lượng tốc độ: Tính toán tốc độ xe dựa trên sự thay đổi vị trí quỹ tâm của xe trong các khung hình liên tiếp.
Phương pháp phân tích sử dụng phần mềm MATLAB với các toolbox xử lý ảnh và thị giác máy tính. Cỡ mẫu video và số khung hình được lựa chọn nhằm đảm bảo độ chính xác và tính khả thi trong xử lý. Timeline nghiên cứu kéo dài trong năm 2020, bao gồm giai đoạn thu thập dữ liệu, phát triển thuật toán, mô phỏng và đánh giá kết quả.
Kết quả nghiên cứu và thảo luận
Những phát hiện chính
Hiệu quả trừ nền bằng mô hình Gaussian hỗn hợp: Kết quả xử lý trên các video thực tế cho thấy phương pháp GMM tách nền và phát hiện xe đạt độ chính xác cao, với tỷ lệ phát hiện xe trên 90% trong điều kiện ánh sáng thay đổi. Số khung hình khởi tạo mô hình nền là 100 giúp cải thiện độ ổn định của mô hình.
Lọc nhiễu và xử lý hình thái: Áp dụng các phép mở ảnh, đóng ảnh, giãn ảnh và co ảnh cùng bộ lọc trung bình và trung vị đã giảm thiểu nhiễu ảnh hiệu quả, làm tăng độ chính xác trong việc phân đoạn xe. Ví dụ, tỷ lệ loại bỏ nhiễu đạt khoảng 85%, giúp hình ảnh nhị phân rõ ràng hơn.
Đếm và phân loại xe: Thuật toán dán nhãn thành phần liên kết đã đếm chính xác số lượng xe trong từng khung hình, với sai số dưới 5% so với đếm thủ công. Phân loại xe lớn và xe nhỏ dựa trên kích thước hộp bao quanh đạt độ chính xác trên 88%, giúp phân biệt rõ ràng các loại phương tiện.
Ước lượng tốc độ xe: Tốc độ trung bình của xe được ước lượng khoảng 23 km/h đối với xe nhỏ và 52 km/h đối với xe lớn, phù hợp với điều kiện giao thông thực tế tại các tuyến đường nghiên cứu. Tuy nhiên, xe chạy với tốc độ cao hoặc đi ngược chiều chưa được ước lượng chính xác hoàn toàn.
Thảo luận kết quả
Nguyên nhân chính giúp hệ thống đạt hiệu quả cao là do việc áp dụng mô hình Gaussian hỗn hợp cho phép thích ứng với sự thay đổi ánh sáng và cảnh quan ngoài trời, đồng thời kết hợp xử lý hình thái giúp loại bỏ nhiễu và lấp đầy khoảng trống trong ảnh nhị phân. So sánh với các nghiên cứu trước đây, hệ thống này cải thiện đáng kể độ chính xác trong phân loại và đếm xe, đồng thời giảm thiểu sai số do xe chồng lấp nhờ phương pháp tách xe dựa trên giá trị pixel chiều rộng hộp bao quanh.
Kết quả có thể được trình bày qua biểu đồ so sánh tỷ lệ phát hiện xe, độ chính xác phân loại xe lớn và xe nhỏ, cũng như bảng thống kê tốc độ trung bình của các loại xe. Hệ thống còn hạn chế trong việc xử lý các trường hợp xe chạy nhanh hoặc xe đi ngược chiều, đây là điểm cần cải tiến trong các nghiên cứu tiếp theo.
Đề xuất và khuyến nghị
Triển khai hệ thống giám sát giao thông tự động: Áp dụng hệ thống phân loại và đếm lưu lượng xe tại các nút giao thông trọng điểm nhằm hỗ trợ công tác điều tiết giao thông, giảm ùn tắc trong vòng 6-12 tháng tới. Chủ thể thực hiện là các cơ quan quản lý giao thông đô thị.
Nâng cấp thuật toán xử lý: Cải tiến thuật toán ước lượng tốc độ và xử lý các trường hợp xe chạy nhanh, xe đi ngược chiều để nâng cao độ chính xác lên trên 95% trong vòng 1 năm. Đơn vị nghiên cứu và phát triển phần mềm chịu trách nhiệm.
Mở rộng phân loại phương tiện: Phát triển thêm khả