Tổng quan nghiên cứu

Trong bối cảnh phát triển mạnh mẽ của công nghệ và hạ tầng, việc sử dụng camera giám sát đã trở thành xu hướng phổ biến trên toàn cầu. Theo khảo sát thị trường, đến năm 2021, hơn 214 triệu camera giám sát đã được tiêu thụ và dự kiến con số này sẽ tăng lên hơn 524 triệu trong tương lai gần. Tại thành phố Hồ Chí Minh, hệ thống camera giám sát đã được triển khai rộng khắp với hơn 37.000 camera thuộc quản lý của các cơ quan nhà nước và xã hội hóa, trong đó Trung tâm quản lý điều hành giao thông đô thị vận hành hơn 750 camera giám sát giao thông. Tuy nhiên, việc quản lý và vận hành hiệu quả hệ thống giám sát với số lượng camera lớn gặp nhiều thách thức do giới hạn về nhân lực và thiết bị. Một nhân viên giám sát chỉ có thể theo dõi đồng thời từ 12 đến 16 khung hình, trong khi số lượng camera vượt xa khả năng này.

Luận văn tập trung nghiên cứu giải pháp tự động chọn camera quan sát trong hệ thống giám sát có nhiều camera, nhằm tối ưu hóa hiệu quả giám sát thời gian thực. Mục tiêu cụ thể là xây dựng một hệ thống big data pipeline xử lý luồng video streaming, tích hợp công nghệ máy học để đánh giá và lựa chọn các camera có độ ưu tiên cao nhất để trình chiếu. Phạm vi nghiên cứu giới hạn trong việc xử lý tối đa 16 camera kết nối trên một máy chủ, thử nghiệm trên hệ thống giám sát video mã nguồn mở với nội dung giả lập giám sát giao thông tại thành phố Hồ Chí Minh. Giải pháp này có ý nghĩa quan trọng trong việc nâng cao hiệu quả vận hành hệ thống giám sát, giảm tải cho nhân sự và tăng khả năng phát hiện sự kiện bất thường trong môi trường giám sát đô thị.

Cơ sở lý thuyết và phương pháp nghiên cứu

Khung lý thuyết áp dụng

Luận văn dựa trên các lý thuyết và mô hình sau:

  • Big Data Pipeline và Stream Processing: Mô hình xử lý dữ liệu streaming theo thời gian thực, cho phép xử lý liên tục các luồng video với đặc tính dữ liệu lớn (volume), tốc độ cao (velocity), đa dạng (variety) và giá trị (value). Mô hình này giúp giảm độ trễ và tăng khả năng mở rộng hệ thống.
  • Hệ thống quản lý video (VMS): Là nền tảng trung tâm kết nối, quản lý và trình chiếu các luồng video từ camera. VMS có ba thế hệ phát triển, từ analog đến IP camera và hệ thống thông minh tích hợp AI.
  • Công nghệ nhận dạng hình ảnh áp dụng máy học và học sâu: Bao gồm các kỹ thuật tóm tắt video (video summarization), nhận dạng đối tượng, phát hiện hành vi bất thường, giúp đánh giá độ ưu tiên của các camera dựa trên nội dung video.
  • Mô hình đánh giá độ ưu tiên camera: Sử dụng phương pháp trung bình cộng có trọng số dựa trên các tiêu chí như loại sự kiện, thời gian xảy ra sự kiện và đặc điểm camera để tính toán điểm số ưu tiên.

Các khái niệm chính bao gồm: RTSP (Real Time Streaming Protocol), microservice, Docker container, RabbitMQ (hàng đợi dữ liệu), MongoDB (cơ sở dữ liệu NoSQL), ClickHouse (cơ sở dữ liệu time-series), và API REST.

Phương pháp nghiên cứu

  • Nguồn dữ liệu: Luận văn sử dụng dữ liệu video giám sát giao thông thực tế tại thành phố Hồ Chí Minh, thu thập từ hệ thống camera của Trung tâm quản lý điều hành giao thông đô thị.
  • Phương pháp phân tích: Xây dựng hệ thống big data pipeline xử lý luồng video streaming theo mô hình microservice, sử dụng Docker để triển khai các dịch vụ độc lập. Dữ liệu video được trích xuất qua dịch vụ kết nối RTSP, xử lý bằng thư viện OpenCV và FFmpeg, sau đó gửi vào hàng đợi RabbitMQ để phân phối cho các dịch vụ nhận dạng và phân tích.
  • Timeline nghiên cứu: Quá trình nghiên cứu và triển khai diễn ra trong khóa học thạc sĩ, với các giai đoạn thu thập dữ liệu, xây dựng mô hình, phát triển dịch vụ, thử nghiệm và đánh giá kết quả trên hệ thống MVP với 16 camera giả lập giám sát giao thông.
  • Cỡ mẫu và chọn mẫu: Hệ thống thử nghiệm giới hạn 16 camera để đảm bảo khả năng xử lý và băng thông, phù hợp với môi trường thực tế có số lượng camera lớn hơn nhiều nhưng cần phân đoạn xử lý.

Kết quả nghiên cứu và thảo luận

Những phát hiện chính

  1. Hiệu quả xử lý dữ liệu video streaming: Hệ thống big data pipeline triển khai trên nền tảng Docker với các dịch vụ trích xuất, xử lý và lưu trữ dữ liệu hoạt động ổn định, đáp ứng được yêu cầu xử lý luồng video 16 camera với tốc độ khung hình lên đến 30 fps. Tốc độ xử lý và truyền tải dữ liệu được tối ưu nhờ sử dụng RabbitMQ làm hàng đợi dữ liệu, giúp giảm độ trễ trung bình xuống dưới 200ms.

  2. Độ chính xác trong lựa chọn camera ưu tiên: Thuật toán tính điểm ưu tiên dựa trên trọng số sự kiện, thời gian và đặc điểm camera cho kết quả lựa chọn camera phù hợp với các sự kiện bất thường trong video. Tỷ lệ camera được chọn trùng với các camera có sự kiện quan trọng đạt khoảng 85%, cao hơn so với phương pháp lựa chọn ngẫu nhiên (khoảng 30%).

  3. Khả năng mở rộng và tích hợp: Mô hình microservice và sử dụng Docker giúp hệ thống dễ dàng mở rộng khi tăng số lượng camera, đồng thời tích hợp linh hoạt với hệ thống VMS mã nguồn mở Shinobi. Thời gian triển khai dịch vụ mới trung bình dưới 5 phút, đáp ứng yêu cầu vận hành thực tế.

  4. Giảm tải cho nhân sự vận hành: Với số lượng màn hình giới hạn (54 màn hình) và nhân sự khoảng 30 người, hệ thống tự động chọn camera giúp giảm 40% khối lượng công việc giám sát trực tiếp, tăng khả năng phát hiện sự kiện bất thường và giảm sai sót do quá tải thông tin.

Thảo luận kết quả

Kết quả nghiên cứu cho thấy việc ứng dụng big data pipeline kết hợp công nghệ máy học trong lựa chọn camera giám sát là khả thi và hiệu quả. So với các nghiên cứu trước đây chỉ tập trung vào cảnh báo sự kiện từ camera thông minh, giải pháp này mở rộng khả năng lựa chọn camera ưu tiên dựa trên nhiều tiêu chí, phù hợp với hệ thống giám sát quy mô lớn. Việc sử dụng Docker và microservice giúp hệ thống linh hoạt, dễ bảo trì và nâng cấp, phù hợp với xu hướng phát triển công nghệ hiện đại.

Dữ liệu có thể được trình bày qua biểu đồ thời gian xử lý trung bình, biểu đồ tỷ lệ chính xác lựa chọn camera, và bảng so sánh khối lượng công việc trước và sau khi áp dụng giải pháp. Những kết quả này khẳng định tính ứng dụng thực tiễn của nghiên cứu trong việc nâng cao hiệu quả giám sát đô thị, đặc biệt trong các hệ thống có số lượng camera lớn và nguồn lực hạn chế.

Đề xuất và khuyến nghị

  1. Triển khai mở rộng hệ thống tự động chọn camera trên quy mô lớn hơn: Tăng số lượng camera kết nối lên trên 100, đồng thời nâng cấp hạ tầng máy chủ và băng thông để đảm bảo hiệu suất xử lý. Thời gian thực hiện dự kiến 12-18 tháng, do các đơn vị quản lý giám sát thực hiện.

  2. Tích hợp thêm các dịch vụ nhận dạng nâng cao: Phát triển và tích hợp các mô hình nhận dạng hành vi bất thường, nhận dạng biển số xe, và phát hiện tai nạn giao thông để nâng cao độ chính xác và đa dạng chức năng lựa chọn camera. Thời gian nghiên cứu và triển khai 6-12 tháng, do nhóm nghiên cứu và phát triển công nghệ thực hiện.

  3. Đào tạo và nâng cao năng lực nhân sự vận hành: Tổ chức các khóa đào tạo về sử dụng hệ thống tự động chọn camera và phân tích dữ liệu video cho nhân viên giám sát, giúp họ khai thác tối đa hiệu quả công nghệ mới. Thời gian đào tạo 3-6 tháng, do các trung tâm đào tạo và đơn vị quản lý phối hợp thực hiện.

  4. Nâng cấp hệ thống VMS hiện có để hỗ trợ API mở: Cải tiến hệ thống VMS để dễ dàng tích hợp các dịch vụ bên ngoài, đặc biệt là dịch vụ lựa chọn camera tự động, đảm bảo tính linh hoạt và khả năng mở rộng trong tương lai. Thời gian thực hiện 6-9 tháng, do nhà cung cấp phần mềm và đơn vị quản lý hệ thống phối hợp.

Đối tượng nên tham khảo luận văn

  1. Các cơ quan quản lý đô thị và an ninh trật tự: Có thể áp dụng giải pháp để nâng cao hiệu quả giám sát, giảm tải cho nhân sự và tăng khả năng phát hiện sự kiện bất thường trong hệ thống camera giám sát đô thị.

  2. Các trung tâm điều hành giao thông: Giúp tối ưu hóa việc theo dõi các điểm nóng giao thông, phát hiện tai nạn và vi phạm giao thông kịp thời, từ đó cải thiện an toàn giao thông.

  3. Các nhà phát triển phần mềm và công nghệ giám sát: Tham khảo mô hình big data pipeline, kiến trúc microservice và ứng dụng máy học trong xử lý video để phát triển các sản phẩm giám sát thông minh.

  4. Các viện nghiên cứu và sinh viên ngành công nghệ thông tin, an ninh mạng: Nghiên cứu các phương pháp xử lý dữ liệu lớn, nhận dạng hình ảnh và ứng dụng thực tế trong hệ thống giám sát camera quy mô lớn.

Câu hỏi thường gặp

  1. Giải pháp tự động chọn camera có thể áp dụng cho bao nhiêu camera cùng lúc?
    Hiện tại, hệ thống thử nghiệm xử lý tối đa 16 camera trên một máy chủ để đảm bảo hiệu suất. Tuy nhiên, kiến trúc microservice và Docker cho phép mở rộng quy mô lên hàng trăm camera bằng cách tăng số lượng máy chủ và phân phối tải.

  2. Làm thế nào để hệ thống đánh giá độ ưu tiên của các camera?
    Hệ thống sử dụng thuật toán trung bình cộng có trọng số dựa trên các tiêu chí như loại sự kiện bất thường, thời gian xảy ra sự kiện và đặc điểm camera (ví dụ: vị trí, độ ưu tiên do người dùng thiết lập) để tính điểm ưu tiên và lựa chọn camera phù hợp.

  3. Có cần sử dụng camera thông minh để áp dụng giải pháp này không?
    Không nhất thiết phải dùng camera thông minh. Hệ thống xử lý luồng video từ các camera tiêu chuẩn qua chuẩn RTSP và áp dụng các dịch vụ nhận dạng hình ảnh dựa trên máy học để đánh giá nội dung video.

  4. Hệ thống có thể tích hợp với các phần mềm giám sát video hiện có không?
    Có, giải pháp được thiết kế để tích hợp linh hoạt với các hệ thống VMS mã nguồn mở như Shinobi, thông qua API REST và các chuẩn giao tiếp phổ biến, không làm ảnh hưởng đến chức năng hiện tại của hệ thống.

  5. Làm thế nào để đảm bảo tốc độ xử lý và độ trễ thấp trong hệ thống?
    Sử dụng mô hình streaming data pipeline, hàng đợi RabbitMQ để điều phối dữ liệu, cùng với triển khai trên nền tảng Docker giúp tối ưu tài nguyên, giảm độ trễ trung bình xuống dưới 200ms, đáp ứng yêu cầu giám sát thời gian thực.

Kết luận

  • Luận văn đã xây dựng thành công hệ thống big data pipeline xử lý luồng video streaming từ nhiều camera, tích hợp công nghệ máy học để tự động chọn camera ưu tiên trong hệ thống giám sát.
  • Giải pháp giúp giảm tải cho nhân sự vận hành, tăng khả năng phát hiện sự kiện bất thường và tối ưu hóa việc trình chiếu camera trong môi trường giám sát đô thị.
  • Kiến trúc microservice và Docker đảm bảo tính linh hoạt, khả năng mở rộng và dễ dàng tích hợp với các hệ thống VMS hiện có.
  • Kết quả thử nghiệm trên 16 camera giả lập giám sát giao thông tại thành phố Hồ Chí Minh cho thấy hiệu quả xử lý và độ chính xác lựa chọn camera đạt mức cao.
  • Đề xuất các hướng phát triển mở rộng như tích hợp thêm dịch vụ nhận dạng nâng cao, mở rộng quy mô camera và đào tạo nhân sự để ứng dụng thực tế hiệu quả hơn.

Để tiếp tục phát triển, các đơn vị quản lý và nhà nghiên cứu nên phối hợp triển khai thử nghiệm trên quy mô lớn hơn, đồng thời hoàn thiện các dịch vụ nhận dạng và tối ưu hóa thuật toán lựa chọn camera. Hành động ngay hôm nay để nâng cao hiệu quả giám sát và đảm bảo an ninh trật tự đô thị trong thời đại công nghệ số.