Tổng quan nghiên cứu

Với sự gia tăng dân số và đô thị hóa nhanh chóng, hiện tượng đám đông người và giao thông ngày càng phổ biến, gây ra nhiều thách thức trong quản lý an ninh và điều tiết giao thông. Ước tính, các khu vực đô thị lớn thường xuyên xuất hiện các đám đông với mật độ và chuyển động phức tạp, đòi hỏi các hệ thống giám sát thông minh để phát hiện, phân tích và cảnh báo kịp thời. Luận văn tập trung phát triển một hệ thống nhận diện và phân tích đám đông trong video, nhằm xác định mật độ và phân tích chuyển động của vùng đám đông trong các tình huống thực tế. Phạm vi nghiên cứu bao gồm các video thực tế quay cảnh đám đông người đi bộ và giao thông tại các địa điểm khác nhau, trong khoảng thời gian từ đầu năm 2017 đến giữa năm 2017. Mục tiêu cụ thể là phát hiện vùng đám đông, ước lượng mật độ tương đối và phân tích độ nhất quán trong chuyển động của đám đông, từ đó hỗ trợ công tác giám sát an ninh và quản lý giao thông hiệu quả hơn. Kết quả nghiên cứu có ý nghĩa quan trọng trong việc nâng cao độ chính xác của các hệ thống giám sát video, góp phần giảm thiểu rủi ro do đám đông gây ra và cải thiện chất lượng dịch vụ công cộng.

Cơ sở lý thuyết và phương pháp nghiên cứu

Khung lý thuyết áp dụng

Luận văn dựa trên hai lý thuyết và mô hình chính để phát hiện và phân tích đám đông:

  1. Phân tích đặc trưng hình ảnh bằng ma trận đồng xuất mức xám (GLCM - Gray Level Co-occurrence Matrix): Đây là phương pháp thống kê để mô tả các mối quan hệ không gian giữa các điểm ảnh trong hình, giúp nhận diện vùng đám đông dựa trên độ đồng nhất (Homogeneity) của các ô nhỏ trong khung hình. Đám đông thường có chỉ số đồng nhất thấp do sự đa dạng về mức xám.

  2. Phân tích chuyển động bằng phương pháp Kanade-Lucas-Tomasi (KLT) tracker: Phương pháp này theo dõi các điểm đặc trưng trong video để xác định vector chuyển động giữa các khung hình liên tiếp, từ đó phân tích luồng chuyển động và độ nhất quán (collectiveness) của đám đông.

Các khái niệm chính bao gồm:

  • Mật độ đám đông: Được phân loại thành các mức kẹt cứng, dày đặc, hạn chế và tự do dựa trên tỷ lệ các ô nhỏ chứa đám đông trong ô lớn.
  • Độ nhất quán hành vi: Đánh giá sự đồng bộ trong chuyển động của các cá thể trong đám đông, từ cấp độ vùng lân cận đến toàn bộ đám đông.
  • Gom nhóm cá thể: Thuật toán phân cụm dựa trên độ nhất quán để xác định các nhóm di chuyển cùng hướng trong đám đông.

Phương pháp nghiên cứu

Nguồn dữ liệu sử dụng là các video thực tế quay cảnh đám đông người và giao thông tại nhiều địa điểm khác nhau, bao gồm cả điều kiện ban ngày và ban đêm. Cỡ mẫu gồm hàng trăm khung hình được phân tích chi tiết.

Phương pháp phân tích gồm các bước:

  • Chuyển đổi video thành chuỗi khung hình và xử lý ảnh mức xám.
  • Phân chia khung hình thành các ô nhỏ (kích thước 20x20 pixel) và ô lớn (kích thước 120x120 pixel) để phân tích GLCM và nhận diện đám đông.
  • Sử dụng ngưỡng đồng nhất để xác định sự xuất hiện của đám đông trong từng ô nhỏ.
  • Ước lượng mật độ đám đông dựa trên số lượng ô nhỏ chứa đám đông trong ô lớn.
  • Áp dụng thuật toán KLT tracker để theo dõi chuyển động các điểm ảnh đặc trưng giữa các khung hình liên tiếp.
  • Tính toán độ nhất quán hành vi dựa trên ma trận trọng số và phân cụm các cá thể di chuyển cùng hướng.
  • Thời gian nghiên cứu từ tháng 1 đến tháng 6 năm 2017, với các thử nghiệm và mô phỏng trên Matlab GUI.

Phương pháp chọn mẫu dựa trên các video có đặc điểm đa dạng về mật độ và chuyển động đám đông nhằm đảm bảo tính tổng quát và độ tin cậy của kết quả.

Kết quả nghiên cứu và thảo luận

Những phát hiện chính

  1. Hiệu quả nhận diện đám đông: Thuật toán dựa trên GLCM đạt độ chính xác trung bình 89,95% trong việc phát hiện các vùng đám đông trên video thực tế. Ví dụ, trong các video người đi bộ, tỷ lệ nhận diện đúng các ô chứa đám đông vượt 89%, trong khi tỷ lệ nhận diện sai chỉ chiếm khoảng 10%.

  2. Ước lượng mật độ đám đông: Phân loại mật độ theo bốn mức (kẹt cứng, dày đặc, hạn chế, tự do) dựa trên tỷ lệ ô nhỏ chứa đám đông trong ô lớn. Ví dụ, ô lớn chứa hơn 75% ô nhỏ đám đông được xác định là kẹt cứng. Kết quả cho thấy phương pháp có thể phân biệt rõ ràng các mức mật độ với độ chính xác cao, đặc biệt trong các cảnh có mật độ cao.

  3. Phân tích chuyển động: Sử dụng KLT tracker, hệ thống xác định được hướng và vận tốc chuyển động của các điểm ảnh đặc trưng. Trong các video người đi bộ băng qua đường, chuyển động đồng hướng được phát hiện rõ ràng với độ nhất quán cao (độ nhất quán khoảng 0.7). Trong khi đó, các video có chuyển động lộn xộn cho kết quả độ nhất quán thấp hơn (khoảng 0.38).

  4. Phân tích độ nhất quán và gom nhóm: Thuật toán phân cụm dựa trên độ nhất quán hành vi thành công trong việc nhóm các cá thể di chuyển cùng hướng. Ví dụ, trong video giao thông, các nhóm xe di chuyển đồng bộ được phân biệt rõ ràng với độ nhất quán cao, hỗ trợ dự báo nguy cơ ùn tắc hoặc tai nạn.

Thảo luận kết quả

Kết quả nhận diện và phân tích mật độ đám đông dựa trên GLCM cho thấy ưu điểm vượt trội trong việc xử lý hình ảnh tĩnh, không cần dữ liệu huấn luyện phức tạp. Tuy nhiên, một số cảnh vật tĩnh như tay vịn thang máy hoặc ánh đèn ban đêm đôi khi bị nhận diện nhầm thành đám đông, ảnh hưởng đến độ chính xác. So với các nghiên cứu trước đây sử dụng mô hình Social Force hay Optical Flow, phương pháp này đơn giản hơn nhưng vẫn đảm bảo độ chính xác cao trong nhiều tình huống.

Phân tích chuyển động bằng KLT tracker cho phép theo dõi chi tiết luồng di chuyển trong đám đông, giúp đánh giá độ nhất quán hành vi. So với các mô hình phức tạp như SAEM hay MDA, phương pháp này có ưu điểm về tính khả thi và hiệu quả tính toán trên video thực tế. Tuy nhiên, trong điều kiện ánh sáng yếu hoặc đám đông có chuyển động phức tạp, độ chính xác giảm do khó nhận diện điểm ảnh chuyển động.

Việc gom nhóm cá thể dựa trên độ nhất quán hành vi giúp phát hiện các nhóm di chuyển đồng bộ, có thể ứng dụng trong cảnh báo sớm các tình huống bất thường hoặc nguy hiểm. Kết quả này phù hợp với các nghiên cứu trong lĩnh vực computer vision về phân tích hành vi đám đông.

Dữ liệu có thể được trình bày qua các biểu đồ độ chính xác nhận diện, biểu đồ phân bố mật độ đám đông theo các mức, và bảng thống kê độ nhất quán hành vi trong các video thử nghiệm, giúp minh họa rõ ràng hiệu quả của hệ thống.

Đề xuất và khuyến nghị

  1. Cải tiến thuật toán nhận diện đám đông: Tăng cường xử lý tiền cảnh để loại bỏ các vật thể tĩnh gây nhiễu như tay vịn thang máy hoặc ánh đèn ban đêm, nhằm giảm tỷ lệ nhận diện sai. Thời gian thực hiện dự kiến 6 tháng, do nhóm nghiên cứu và kỹ sư phần mềm thực hiện.

  2. Tích hợp mô hình học sâu: Áp dụng các mô hình deep learning để nâng cao khả năng phân biệt đám đông và vật thể tĩnh, đặc biệt trong điều kiện ánh sáng yếu hoặc phức tạp. Mục tiêu tăng độ chính xác nhận diện lên trên 95% trong vòng 1 năm, phối hợp với các chuyên gia AI.

  3. Phát triển hệ thống cảnh báo tự động: Dựa trên kết quả phân tích mật độ và độ nhất quán hành vi, xây dựng module cảnh báo sớm các tình huống nguy hiểm như ùn tắc giao thông hoặc đám đông bất thường. Thời gian triển khai 9 tháng, phối hợp với đơn vị quản lý an ninh và giao thông.

  4. Mở rộng thử nghiệm thực tế: Thu thập và phân tích thêm các bộ dữ liệu video đa dạng về địa điểm, thời gian và điều kiện ánh sáng để đánh giá toàn diện hiệu quả hệ thống. Kế hoạch thực hiện trong 12 tháng, hợp tác với các cơ quan quản lý đô thị.

Đối tượng nên tham khảo luận văn

  1. Các nhà nghiên cứu và sinh viên ngành kỹ thuật điện tử, computer vision: Luận văn cung cấp phương pháp và thuật toán chi tiết về nhận diện và phân tích đám đông, hỗ trợ phát triển các đề tài nghiên cứu liên quan.

  2. Chuyên gia phát triển hệ thống giám sát an ninh: Các giải pháp nhận diện đám đông và phân tích chuyển động giúp nâng cao hiệu quả giám sát, cảnh báo sớm các tình huống bất thường.

  3. Cơ quan quản lý giao thông đô thị: Ứng dụng kết quả nghiên cứu để theo dõi mật độ giao thông, dự báo ùn tắc và điều phối phương tiện hiệu quả hơn.

  4. Doanh nghiệp phát triển phần mềm giám sát video: Tham khảo các thuật toán và giao diện mô phỏng Matlab GUI để tích hợp vào sản phẩm giám sát thông minh.

Câu hỏi thường gặp

  1. Phương pháp GLCM có phù hợp với mọi điều kiện ánh sáng không?
    Phương pháp GLCM hoạt động tốt trong điều kiện ánh sáng đầy đủ, nhưng trong điều kiện ánh sáng yếu hoặc ban đêm, có thể xảy ra nhận diện sai do ánh đèn được hiểu nhầm là đám đông. Ví dụ, trong video ban đêm, vùng đèn chiếu bị nhận diện thành vùng đám đông lớn.

  2. KLT tracker có thể theo dõi chuyển động trong đám đông phức tạp không?
    KLT tracker hiệu quả trong việc theo dõi chuyển động đồng bộ, nhưng khi đám đông có chuyển động lộn xộn hoặc mật độ cao, độ chính xác giảm do khó xác định điểm ảnh đặc trưng. Ví dụ, trong nhà ga đông người, chuyển động cá nhân khác nhau gây khó khăn cho phân tích.

  3. Hệ thống có thể phân biệt đám đông người và phương tiện giao thông không?
    Hệ thống nhận diện dựa trên đặc trưng hình ảnh và chuyển động, có thể phát hiện cả đám đông người và xe cộ. Tuy nhiên, một số xe cộ có thể bị nhận diện thiếu do trùng với cảnh trí tĩnh hoặc bị che khuất.

  4. Độ nhất quán hành vi của đám đông được tính toán như thế nào?
    Độ nhất quán được tính dựa trên ma trận trọng số giữa các cá thể trong vùng lân cận và trên các đường dẫn khác nhau, phản ánh sự đồng bộ trong chuyển động. Ví dụ, đám đông di chuyển cùng hướng có độ nhất quán cao (khoảng 0.7), trong khi đám đông lộn xộn có độ nhất quán thấp (khoảng 0.38).

  5. Hệ thống có thể ứng dụng trong giám sát an ninh thực tế không?
    Có, hệ thống đã được thử nghiệm trên nhiều video thực tế với độ chính xác cao, phù hợp để cảnh báo sớm các tình huống bất thường trong đám đông và hỗ trợ quản lý giao thông. Tuy nhiên, cần cải tiến thêm để xử lý các trường hợp phức tạp như ánh sáng yếu hoặc vật thể tĩnh gây nhiễu.

Kết luận

  • Luận văn đã phát triển thành công hệ thống nhận diện và phân tích đám đông trong video dựa trên phương pháp GLCM và KLT tracker với độ chính xác nhận diện trung bình đạt gần 90%.
  • Hệ thống có khả năng ước lượng mật độ đám đông và phân tích chuyển động, đánh giá độ nhất quán hành vi, hỗ trợ dự báo nguy hiểm trong đám đông.
  • Kết quả thử nghiệm trên các video thực tế đa dạng cho thấy tính khả thi và hiệu quả của phương pháp trong nhiều tình huống khác nhau.
  • Các hạn chế như nhận diện sai trong điều kiện ánh sáng yếu và vật thể tĩnh được xác định, làm cơ sở cho các hướng cải tiến tiếp theo.
  • Đề xuất phát triển thêm các thuật toán học sâu, hệ thống cảnh báo tự động và mở rộng thử nghiệm thực tế trong thời gian tới nhằm nâng cao hiệu quả ứng dụng.

Hành động tiếp theo là triển khai các giải pháp cải tiến và phối hợp với các đơn vị quản lý để ứng dụng hệ thống vào thực tế, góp phần nâng cao an ninh và quản lý giao thông đô thị.