Ước Lượng Mật Độ Đám Đông Trong Video Giám Sát - Luận Văn Thạc Sĩ

Luận văn thạc sĩ về ước lượng mật độ đám đông trong video giám sát, sử dụng khoa học máy tính. Nghiên cứu ứng dụng trong an ninh, giao thông.

Trường đại học

Trường Đại Học Công Nghệ Thông Tin - Đại Học Quốc Gia TP.HCM

Chuyên ngành

Khoa Học Máy Tính

Người đăng

Ẩn danh

Thể loại

Luận Văn Thạc Sĩ

2017

Phí lưu trữ

30 Point

Mục lục chi tiết

LỜI CAM ĐOAN

LỜI CẢM ƠN

1. MỞ ĐẦU

1.1. Mục tiêu luận văn

1.2. Đối tượng và phạm vi nghiên cứu

1.3. Bố cục luận văn

2. CHƯƠNG 2: NGHIÊN CỨU LIÊN QUAN VÀ CƠ SỞ LÍ THUYẾT

2.1. Giới thiệu bài toán

2.2. Khái niệm đám đông

2.3. Khái niệm mật độ

2.4. Một số khái niệm trong ước lượng

2.5. Phương pháp ước lượng mật độ

2.6. Một số nghiên cứu liên quan

2.7. Tổng quan về CNN

2.7.1. Khái niệm CNN

2.7.2. Mô hình CNN

3. CHƯƠNG 3

3.1. Phương pháp CCNN

3.2. Phương pháp Hydra CNN

3.3. Phương pháp cải tiến

4. CHƯƠNG 4: THỰC NGHIỆM VÀ ĐÁNH GIÁ

4.1. Độ đo và dataset sử dụng

4.1.1. Giới thiệu các bộ dữ liệu

4.2. Thực nghiệm và đánh giá

4.2.1. Thực nghiệm và đánh giá trên bộ dữ liệu người đi bộ UCSD

4.2.2. Thực nghiệm và đánh giá trên bộ dữ liệu UCF_CC_50

4.2.3. Thực nghiệm và đánh giá trên bộ dữ liệu TRANCOS

4.2.4. Thực nghiệm và đánh giá phương pháp cải tiến

4.3. Xây dựng ứng dụng demo

4.3.1. Kiến trúc ứng dụng

KẾT LUẬN VÀ HƯỚNG PHÁT TRIỂN

TÀI LIỆU THAM KHẢO

Tóm tắt

I. Tổng Quan Ước Lượng Mật Độ Đám Đông Video Giám Sát

Ngày nay, hệ thống camera giám sát được triển khai rộng rãi, đặc biệt tại các thành phố lớn. Chúng đóng vai trò quan trọng trong việc theo dõi an ninh trật tự, quản lý giao thông và đảm bảo an ninh công cộng. Tuy nhiên, việc giám sát thủ công bằng con người đối với số lượng lớn camera trở nên quá tải và dễ sai sót. Do đó, việc phát triển hệ thống tự động ước lượng mật độ đám đông từ video giám sát là một nhu cầu cấp thiết. Luận văn này tập trung vào việc nghiên cứu, cải tiến các phương pháp ước lượng mật độ đám đông dựa trên mô hình CNN, góp phần xây dựng hệ thống giám sát thông minh, hỗ trợ cảnh báo sớm và phòng ngừa các tình huống bất thường. Bài toán này trở nên quan trọng hơn bao giờ hết khi mà tình hình an ninh thế giới ngày càng phức tạp, các sự kiện tập trung đông người tiềm ẩn nhiều rủi ro. Ngoài ra, quản lý giao thông hiệu quả cũng cần đến phân tích đám đông để giảm thiểu ùn tắc.

1.1. Tầm Quan Trọng Của Ước Lượng Mật Độ Trong An Ninh

Với tình hình khủng bố diễn biến phức tạp, việc ước lượng mật độ đám đông giúp xác định khu vực tập trung đông người, từ đó có biện pháp phòng ngừa, ứng phó kịp thời. Hệ thống có thể cảnh báo khi mật độ vượt ngưỡng cho phép, hỗ trợ lực lượng chức năng can thiệp, ngăn chặn các hành vi gây rối, bạo loạn. Theo tài liệu gốc, các hệ thống camera giám sát thường được dùng để theo dõi và đánh giá tình hình an ninh trật tự ở các địa điểm công cộng, tuyến đường giao thông quan trọng, khu vực trọng yếu, Việc phát hiện đám đông và phân tích đám đông hiệu quả là yếu tố then chốt trong việc đảm bảo an ninh.

1.2. Ứng Dụng Ước Lượng Mật Độ Trong Quản Lý Giao Thông

Tình trạng kẹt xe gây thiệt hại lớn cho nền kinh tế. Ước lượng mật độ đám đông phương tiện giao thông giúp cơ quan chức năng điều tiết giao thông hợp lý, giảm ùn tắc. Hệ thống có thể tự động điều chỉnh đèn tín hiệu, phân luồng giao thông dựa trên mật độ phương tiện, tối ưu hóa lưu lượng. Bài toán này đặc biệt quan trọng tại các thành phố lớn với mật độ dân số cao. Thành phố Hồ Chí Minh bị thiệt hại khoảng 27.000 tỉ đồng mỗi năm do tình trạng kẹt xe gây ra. Do đó, việc điều khiển đám đông phương tiện là một bài toán cấp thiết.

II. Bài Toán Ước Lượng Mật Độ Đám Đông Các Thách Thức Lớn

Việc ước lượng mật độ đám đông trong video giám sát là một bài toán phức tạp do nhiều yếu tố tác động. Hình ảnh từ camera thường có độ phân giải thấp, góc nhìn khác nhau, gây khó khăn cho việc nhận diện và đếm số lượng người. Sự chồng lấp của các đối tượng, thay đổi ánh sáng, thời tiết cũng ảnh hưởng đến độ chính xác của thuật toán. Luận văn cần giải quyết các vấn đề này để nâng cao hiệu quả của hệ thống. Theo [36], việc giải quyết bài toán ước lượng mật độ đám đông có thể áp dụng vào các hệ thống giám sát thông minh, giúp cho việc cảnh báo sớm những nơi có mật độ người và phương tiện quá cao. Với thông tin cảnh báo tin cậy sẽ giúp cho cơ quan giám sát có các biện pháp theo dõi và phòng ngừa kịp thời, tránh xảy ra hậu quả nghiêm trọng.

2.1. Khó Khăn Về Góc Nhìn Và Độ Phân Giải Video Giám Sát

Góc nhìn camera khác nhau làm thay đổi kích thước và hình dạng của đối tượng, gây khó khăn cho việc nhận diện. Độ phân giải thấp khiến việc phân biệt các đối tượng bị chồng lấp trở nên khó khăn hơn. Xử lý ảnh và thị giác máy tính cần được áp dụng để giải quyết các vấn đề này. Do hình ảnh từ camera thường có bối cảnh phức tạp (góc nhìn camera, sự chồng lắp của các đối tượng,.), khiến việc ước lượng chính xác mật độ đám đông là một bài toán khó, tiếp tục được cộng đồng khoa học nghiên cứu và giải quyết.

2.2. Ảnh Hưởng Của Ánh Sáng Và Điều Kiện Thời Tiết

Thay đổi ánh sáng đột ngột, bóng đổ, hoặc điều kiện thời tiết xấu (mưa, sương mù) làm giảm khả năng nhận diện đối tượng. Thuật toán cần có khả năng thích ứng với các điều kiện môi trường khác nhau để đảm bảo độ chính xác. Việc phát hiện bất thường trong đám đông cũng bị ảnh hưởng bởi các yếu tố này.

2.3. Vấn Đề Chồng Lấp Và Che Khuất Đối Tượng

Khi đám đông tập trung quá đông, các đối tượng bị chồng lấp lên nhau, gây khó khăn cho việc đếm số lượng người. Thuật toán cần có khả năng phân biệt và đếm chính xác số lượng đối tượng ngay cả khi bị che khuất một phần. Cần cải tiến để tăng độ chính xác ước lượng trong những trường hợp này.

III. Phương Pháp CNN Ước Lượng Mật Độ Chi Tiết và Cách Cải Tiến

Luận văn này tập trung vào học sâu (Deep Learning), cụ thể là mạng nơ-ron tích chập (CNN), để ước lượng mật độ đám đông. Phương pháp CNN cho phép hệ thống tự động học các đặc trưng từ hình ảnh, thay vì phải trích xuất thủ công. Mô hình CNN có khả năng xử lý hình ảnh với độ phức tạp cao, mang lại độ chính xác cao hơn so với các phương pháp truyền thống. Nghiên cứu và cài đặt lại phương pháp được đề xuất tại [36]. Sau khi khi nghiên cứu, cài đặt lại và đánh giá phương pháp lựa chọn, học viên đã đề xuất phương pháp cải tiến. Kết quả thực nghiệm đã cho thấy các phương pháp học viên lựa chọn là tiên tiến và giải pháp cải tiến học viên đề xuất cho kết quả tốt hơn.

3.1. Kiến Trúc Mạng CNN Ứng Dụng Trong Ước Lượng Mật Độ

Mô hình CNN bao gồm nhiều lớp tích chập, lớp gộp và lớp kết nối đầy đủ. Các lớp tích chập trích xuất các đặc trưng từ hình ảnh, lớp gộp giảm kích thước dữ liệu, lớp kết nối đầy đủ đưa ra dự đoán về mật độ đám đông. Cần tìm hiểu các kiến trúc CNN phổ biến như CSRNet, MCNN để lựa chọn kiến trúc phù hợp. Chương 2 trình bày bài toán, một số nghiên cứu liên quan và cơ sở lý thuyết liên quan đến việc ước lượng mật độ đám đông. Cùng với đó, giới thiệu mô hình CNN được sử dụng trong phương pháp CCNN, Hydra CNN mà học viên sẽ nghiên cứu và cài đặt lại.

3.2. Giải Thuật Hồi Quy Để Ánh Xạ Ảnh Vào Bản Đồ Mật Độ

Thuật toán hồi quy được sử dụng để ánh xạ ảnh đầu vào thành bản đồ mật độ tương ứng. Bản đồ mật độ thể hiện số lượng người trên mỗi vùng ảnh. Cần lựa chọn thuật toán hồi quy phù hợp để đạt được độ chính xác cao nhất. Phương pháp tiếp cận dựa trên hồi quy và phương pháp tiếp cận dựa trên phát hiện đều có những ưu điểm riêng.

3.3. Các Phương Pháp Cải Tiến Mô Hình CCNN Để Tăng Độ Chính Xác

Luận văn đề xuất phương pháp cải tiến mô hình CCNN để tăng độ chính xác ước lượng. Các phương pháp cải tiến có thể bao gồm: thêm lớp tích chập, thay đổi hàm kích hoạt, sử dụng kỹ thuật regularization. Chương 3 giới thiệu phương pháp ước lượng mật độ đám đông sử dụng mô hình CCNN và Hydra CNN. Từ đó, là nền tảng để học viên đề xuất phương pháp cải tiến cho mô hình CCNN.

IV. Thực Nghiệm Đánh Giá Kết Quả Ước Lượng Mật Độ Đám Đông

Để đánh giá hiệu quả của phương pháp, luận văn tiến hành thực nghiệm trên các benchmark dataset phổ biến. Các độ đo như MAE (Mean Absolute Error), MSE (Mean Squared Error) được sử dụng để đánh giá độ chính xác ước lượng. Kết quả thực nghiệm cho thấy phương pháp CNN đạt được độ chính xác cao hơn so với các phương pháp truyền thống. Cần so sánh kết quả với các phương pháp state-of-the-art để đánh giá khách quan. Chương 4 giới thiệu bộ dữ liệu chuẩn về người (UCF_CC_50, UCSD) và phương tiện (TRANCOS) sử dụng khi thực nghiệm. Sau đó, giới thiệu một số độ đo được sử dụng khi đánh giá kết quả thực nghiệm khi ước lượng mật độ đám đông bằng phương pháp CCNN và Hydra CNN và phương pháp học viên đề xuất cải tiến. Từ kết quả thực nghiệm được, so sánh và đánh giá với kết quả của các phương pháp tiên tiến khác học và đánh giá các kết quả thực nghiệm này.

4.1. Các Bộ Dữ Liệu Chuẩn Benchmark Datasets Sử Dụng

Các bộ dữ liệu UCF_CC_50, UCSD, TRANCOS được sử dụng để đánh giá hiệu suất của thuật toán. Các bộ dữ liệu này chứa hình ảnh và video giám sát với mật độ đám đông khác nhau. Cần mô tả chi tiết các bộ dữ liệu này, bao gồm số lượng ảnh, độ phân giải, và đặc điểm của đám đông. Các cơ sở dữ liệu đám đông này đóng vai trò quan trọng trong việc so sánh hiệu suất giữa các thuật toán khác nhau.

4.2. Độ Đo MAE MSE Để Đánh Giá Độ Chính Xác Thuật Toán

MAE và MSE là các độ đo phổ biến để đánh giá độ chính xác ước lượng. MAE đo trung bình độ lệch tuyệt đối giữa giá trị dự đoán và giá trị thực tế. MSE đo trung bình bình phương độ lệch giữa giá trị dự đoán và giá trị thực tế. Cần giải thích ý nghĩa của các độ đo này và cách chúng được tính toán. Bảng 4. So sánh kết quả cài đặt lại với các phương pháp CCNN và CCNN cải tiến cho bộ dữ liệu UCF_CC_ 50 với độ do MAE và MSD.

4.3. So Sánh Hiệu Suất Với Các Phương Pháp Tiên Tiến Nhất

Kết quả thực nghiệm cần được so sánh với các phương pháp state-of-the-art để đánh giá khách quan. Cần trình bày rõ ràng kết quả so sánh, bao gồm cả ưu điểm và nhược điểm của phương pháp đề xuất. So sánh kết quả cài đặt lại với các phương pháp tiên tiền nhất cho bộ dữ liệu TRANCOS với độ đo GAME. Cần so sánh hiệu suất thuật toán trên các bộ dữ liệu khác nhau.

V. Ứng Dụng Thực Tế Tương Lai Ước Lượng Mật Độ Đám Đông CNTT

Việc ước lượng mật độ đám đông có nhiều ứng dụng video giám sát đám đông trong thực tế. Hệ thống có thể được sử dụng để quản lý an ninh tại các sự kiện lớn, điều khiển giao thông, và phát hiện các tình huống bất thường. Trong tương lai, có thể tích hợp hệ thống với các công nghệ khác như IoT, Big Data để tạo ra các giải pháp thông minh hơn. Luận văn cần đề xuất các hướng nghiên cứu tiếp theo để phát triển lĩnh vực này. Tổng kết những kết qua đạt được, những đóng góp mới và những đề xuất về một số hướng phát triển của đề tài trong tương lai.

5.1. Ứng Dụng Trong An Ninh Công Cộng Và Quản Lý Sự Kiện

Hệ thống có thể được sử dụng để cảnh báo về mật độ đám đông quá cao, giúp ngăn chặn các vụ chen lấn, xô đẩy, hoặc các hành vi gây rối. Trong an ninh công cộng, hệ thống có thể phát hiện các hành vi bất thường, giúp lực lượng chức năng can thiệp kịp thời.

5.2. Ứng Dụng Trong Điều Khiển Giao Thông Thông Minh

Hệ thống có thể được sử dụng để điều chỉnh đèn tín hiệu, phân luồng giao thông dựa trên mật độ phương tiện, giảm ùn tắc. Thông tin về mật độ giao thông có thể được chia sẻ với người dùng thông qua ứng dụng di động, giúp họ lựa chọn lộ trình phù hợp. Riêng tại thành phó Hồ Chí Minh, tình trạng kẹt xe đã gây thiệt hại cho thành phố mỗi năm khoảng 27.

5.3. Hướng Nghiên Cứu Tiếp Theo Phát Triển Trong Tương Lai

Cần nghiên cứu các phương pháp để tăng độ chính xác ước lượng trong điều kiện ánh sáng yếu, góc nhìn phức tạp. Tích hợp hệ thống với các công nghệ khác như IoT, Big Data để tạo ra các giải pháp thông minh hơn. Nghiên cứu các phương pháp mô hình hóa đám đông để dự đoán hành vi và đưa ra cảnh báo sớm.

25/04/2025

Bạn đang xem trước tài liệu:

Luận văn thạc sĩ khoa học máy tính ước lượng mật độ đám đông trong video giám sát

Tải đầy đủ

Nội dung chính

## Tổng quan nghiên cứu

Hiện nay, với sự phát triển nhanh chóng của công nghệ và nhu cầu giám sát an ninh, hệ thống camera giám sát đã được triển khai rộng rãi tại các thành phố lớn như Thành phố Hồ Chí Minh với hơn 3.800 tuyến đường và 3.400 nút giao thông được giám sát. Tình trạng đám đông đông đúc tại các khu vực công cộng, sự kiện lớn, và các điểm trọng yếu đặt ra thách thức lớn trong việc quản lý an ninh và điều tiết giao thông. Theo ước tính, tình trạng kẹt xe tại Thành phố Hồ Chí Minh gây thiệt hại khoảng 27.000 tỉ đồng mỗi năm. Việc giám sát đám đông hiện nay chủ yếu dựa vào con người, tuy nhiên khả năng giám sát của con người có giới hạn, đặc biệt khi số lượng camera lớn. Do đó, việc phát triển các hệ thống tự động ước lượng mật độ đám đông trong video giám sát là rất cấp thiết.

Mục tiêu của luận văn là nghiên cứu, cài đặt và cải tiến các phương pháp ước lượng mật độ đám đông dựa trên mô hình học sâu CNN, cụ thể là các phương pháp CCNN và Hydra CNN, nhằm nâng cao độ chính xác trong việc ước lượng mật độ người và phương tiện giao thông trong video giám sát. Phạm vi nghiên cứu tập trung vào các bộ dữ liệu chuẩn như UCF_CC_50, UCSD cho người đi bộ và TRANCOS cho phương tiện giao thông, với thời gian nghiên cứu trong năm 2017 tại Thành phố Hồ Chí Minh. Kết quả nghiên cứu có ý nghĩa quan trọng trong việc hỗ trợ các cơ quan an ninh và quản lý giao thông trong việc giám sát, cảnh báo và điều tiết đám đông hiệu quả.

## Cơ sở lý thuyết và phương pháp nghiên cứu

### Khung lý thuyết áp dụng

- **Khái niệm đám đông và mật độ:** Đám đông là nhóm người tập trung tại một địa điểm không có trật tự nhất định, mật độ thể hiện mức độ tập trung của đối tượng trong một diện tích nhất định.
- **Ước lượng trong thống kê:** Các khái niệm như giá trị kỳ vọng, phương sai, hiệp phương sai, và phân phối chuẩn được áp dụng để đánh giá và xây dựng các ước lượng không chệch, hội tụ, hiệu quả và vững chắc.
- **Mô hình CNN (Convolutional Neural Network):** CNN là mô hình học sâu hiệu quả trong xử lý ảnh, gồm các lớp convolution, ReLU, pooling và fully connected, giúp trích xuất đặc trưng và học các hàm hồi quy phi tuyến tính.
- **Phương pháp ước lượng mật độ đám đông:** Sử dụng các mô hình CNN để ánh xạ các patch ảnh đầu vào thành bản đồ mật độ tương ứng, từ đó tổng hợp thành bản đồ mật độ toàn ảnh.
- **Các phương pháp CCNN và Hydra CNN:** CCNN sử dụng kiến trúc 6 lớp convolution với hàm mất mát Euclidean, Hydra CNN mở rộng bằng cách sử dụng nhiều đầu mạng xử lý các tỉ lệ ảnh khác nhau, kết hợp đặc trưng để cải thiện độ chính xác.

### Phương pháp nghiên cứu

- **Nguồn dữ liệu:** Ba bộ dữ liệu chuẩn được sử dụng gồm UCF_CC_50 (50 ảnh, trung bình 1280 người/ảnh), UCSD (2000 ảnh, 10 khung hình/giây), và TRANCOS (1244 ảnh về phương tiện giao thông).
- **Phương pháp phân tích:** Cài đặt lại các mô hình CCNN và Hydra CNN, thực hiện huấn luyện trên các patch ảnh được trích xuất ngẫu nhiên từ ảnh gốc, sử dụng hàm mất mát Euclidean và thuật toán tối ưu SGD.
- **Timeline nghiên cứu:** Quá trình huấn luyện và đánh giá kéo dài khoảng 3 tháng, với các bước chia dữ liệu, tạo patch ảnh, huấn luyện mô hình, đánh giá kết quả và cải tiến mô hình.
- **Đánh giá:** Sử dụng các độ đo MAE (Mean Absolute Error), MSD (Mean Standard Deviation) và GAME (Grid Average Mean absolute Error) để đánh giá sai số giữa giá trị ước lượng và ground truth.

## Kết quả nghiên cứu và thảo luận

### Những phát hiện chính

- **Hiệu quả của CCNN và Hydra CNN trên bộ dữ liệu UCSD:** Phương pháp CCNN đạt MAE thấp nhất trên tập dữ liệu nhỏ “upscale” với 60 ảnh huấn luyện, cho thấy hiệu quả trong việc ước lượng mật độ người đi bộ.
- **Đánh giá trên bộ dữ liệu UCF_CC_50:** Hydra CNN với hai đầu mạng cải thiện độ chính xác khoảng 15% so với CCNN, giảm MAE từ khoảng 533 xuống 439, chứng tỏ khả năng xử lý tốt các ảnh có mật độ đám đông dày đặc và chồng lắp.
- **Kết quả trên bộ dữ liệu TRANCOS:** Hydra CNN với ba đầu mạng đạt kết quả tốt nhất với độ đo GAME thấp hơn các phương pháp khác, cho thấy khả năng ước lượng mật độ phương tiện giao thông hiệu quả.
- **Phương pháp cải tiến CCNN:** Việc thêm lớp fully connected vào mô hình CCNN giúp cải thiện độ chính xác ước lượng khoảng 10% so với mô hình gốc, giảm MAE từ 533 xuống 439 trên bộ dữ liệu UCF_CC_50.

### Thảo luận kết quả

Nguyên nhân chính của sự cải tiến là do mô hình Hydra CNN và CCNN cải tiến có khả năng trích xuất đặc trưng đa tỉ lệ và toàn cục tốt hơn, giúp xử lý hiệu quả các ảnh có mật độ đám đông cao và phức tạp. So với các nghiên cứu trước đây, kết quả đạt được tương đương hoặc vượt trội, đặc biệt trong việc giảm sai số ước lượng. Dữ liệu có thể được trình bày qua các bảng so sánh MAE, MSD và GAME giữa các phương pháp, cũng như biểu đồ thể hiện sự cải thiện độ chính xác theo từng phương pháp. Kết quả này có ý nghĩa quan trọng trong việc ứng dụng vào các hệ thống giám sát thông minh, hỗ trợ cảnh báo sớm và quản lý đám đông hiệu quả.

## Đề xuất và khuyến nghị

- **Phát triển mô hình đa tỉ lệ:** Tiếp tục nghiên cứu và mở rộng mô hình Hydra CNN với nhiều đầu mạng hơn để nâng cao khả năng nhận diện đa dạng tỉ lệ đối tượng, hướng tới giảm sai số ước lượng thêm 10% trong vòng 1 năm.
- **Tối ưu hóa thuật toán huấn luyện:** Áp dụng các kỹ thuật tăng cường dữ liệu (data augmentation) và thuật toán tối ưu mới nhằm rút ngắn thời gian huấn luyện xuống còn 50%, nâng cao hiệu quả sử dụng tài nguyên tính toán.
- **Triển khai hệ thống giám sát thực tế:** Xây dựng ứng dụng demo trên nền tảng đám mây với khả năng xử lý thời gian thực, phục vụ cho các cơ quan an ninh và quản lý giao thông trong vòng 6 tháng tới.
- **Mở rộng phạm vi nghiên cứu:** Nghiên cứu áp dụng mô hình cho các loại đối tượng khác như xe cộ, vật nuôi trong các môi trường phức tạp, nhằm tăng tính ứng dụng đa dạng của hệ thống.
- **Đào tạo và chuyển giao công nghệ:** Tổ chức các khóa đào tạo cho cán bộ kỹ thuật và nhân viên giám sát để nâng cao năng lực vận hành và khai thác hệ thống trong vòng 1 năm.

## Đối tượng nên tham khảo luận văn

- **Cơ quan an ninh và quản lý đô thị:** Hỗ trợ trong việc giám sát an ninh công cộng, phát hiện đám đông đông đúc và cảnh báo kịp thời các tình huống nguy hiểm.
- **Các tổ chức nghiên cứu và phát triển công nghệ:** Là tài liệu tham khảo quan trọng trong nghiên cứu ứng dụng Deep Learning và thị giác máy tính trong giám sát video.
- **Doanh nghiệp phát triển phần mềm giám sát:** Cung cấp cơ sở khoa học và kỹ thuật để phát triển các sản phẩm giám sát thông minh, nâng cao hiệu quả và độ chính xác.
- **Sinh viên và học viên cao học ngành Khoa học Máy tính, Trí tuệ nhân tạo:** Là nguồn tài liệu học tập và nghiên cứu chuyên sâu về ứng dụng CNN trong bài toán ước lượng mật độ đám đông.

## Câu hỏi thường gặp

1. **Ước lượng mật độ đám đông là gì?**  
Ước lượng mật độ đám đông là quá trình tính toán số lượng người hoặc phương tiện trong một khu vực nhất định dựa trên hình ảnh hoặc video giám sát, giúp đánh giá mức độ tập trung và đông đúc.

2. **Tại sao sử dụng mô hình CNN trong ước lượng mật độ?**  
CNN có khả năng tự động trích xuất đặc trưng từ ảnh, xử lý hiệu quả các ảnh phức tạp với nhiều đối tượng chồng lắp, cho độ chính xác cao hơn so với các phương pháp truyền thống.

3. **Phương pháp CCNN và Hydra CNN khác nhau như thế nào?**  
CCNN sử dụng một mạng CNN đơn lẻ để ước lượng mật độ, trong khi Hydra CNN sử dụng nhiều đầu mạng xử lý các tỉ lệ ảnh khác nhau, kết hợp đặc trưng để cải thiện độ chính xác.

4. **Các bộ dữ liệu nào được sử dụng để đánh giá mô hình?**  
Bộ dữ liệu UCF_CC_50 và UCSD dùng cho người đi bộ, TRANCOS dùng cho phương tiện giao thông, đều là các bộ dữ liệu chuẩn với số lượng ảnh và đối tượng lớn, được sử dụng phổ biến trong nghiên cứu.

5. **Làm thế nào để cải tiến mô hình ước lượng mật độ?**  
Có thể thêm lớp fully connected để tăng khả năng học đặc trưng toàn cục, áp dụng kỹ thuật tăng cường dữ liệu, và phát triển mô hình đa tỉ lệ như Hydra CNN để nâng cao độ chính xác.

## Kết luận

- Đã nghiên cứu và cài đặt thành công các phương pháp ước lượng mật độ đám đông dựa trên CNN, bao gồm CCNN, Hydra CNN và phương pháp cải tiến.
- Kết quả thực nghiệm trên các bộ dữ liệu chuẩn cho thấy phương pháp cải tiến và Hydra CNN đạt độ chính xác cao, giảm sai số ước lượng đáng kể.
- Nghiên cứu góp phần nâng cao hiệu quả giám sát an ninh và quản lý giao thông thông qua hệ thống camera giám sát tự động.
- Đề xuất các hướng phát triển tiếp theo bao gồm mở rộng mô hình đa tỉ lệ, tối ưu thuật toán và triển khai ứng dụng thực tế.
- Khuyến khích các cơ quan, doanh nghiệp và nhà nghiên cứu ứng dụng kết quả để phát triển các hệ thống giám sát thông minh, góp phần đảm bảo an ninh và trật tự xã hội.

Trích đoạn nội dung tài liệu

Chương 1.1 Giới thiệu Hiện nay, với sự bùng nổ dân số, sự phát triển của xã hội cùng với sự đa dạng của các hoạt động của con người như: tập trung làm việc và sinh sống ở các thành phó lớn; tham dự các lễ hội, sự kién,. Điều này dẫn đến việc tại cùng một thời điểm, có những địa điểm có rất nhiều người tập trung đông đúc, dẫn đến nhiều tình huống phức tạp có thể xảy ra. Vì vậy, nhiều hệ thống camera giám sát đã được triển khai rộng khắp đê phục vụ cho việc quản lí, giám sát các địa điểm này. Các hệ thống camera nay thường được sử dụng dé theo dõi và đánh giá tình hình an ninh trật tự ở các địa điểm công cộng, tuyến đường giao thông quan trọng, khu vực trọng yếu,.

Dữ liệu giám sát đám đông! Hiện nay, với chủ nghĩa khủng bố len lỏi khắp nơi trên thế giới, những kẻ khủng bố luôn chọn những địa điểm tập trung đông người để khủng bó, gây nên thiệt hại nặng nề về con người. Ngoài ra, những kẻ xấu vì động cơ nào đó có thẻ lợi dụng nơi đông người tụ tập đề gây ra hiệu ứng đám đông dẫn đến bùng phát bạo loạn. Do http://www.com/special-events 9 TÔNG QUAN đó, đối tượng cần được ưu tiên giám sát là con người với hành vi cần được ưu tiên Hình 1. Dữ liệu giám sát giao thông” Cùng với sự bùng né dan sé đã kéo theo sự gia tăng về phương tiện giao thông cá nhân, dẫn đến hạ tầng giao thông đáp ứng được nhu cầu của con người, gây ra tình trạng tắc nghẽn giao thông dẫn đến những thiệt hại nặng nề cho kinh tế.

Riêng tại thành phó Hồ Chí Minh, tình trạng kẹt xe đã gây thiệt hại cho thành phố mỗi năm khoảng 27. Vì vậy, đối tượng cũng rất quan trọng cần ưu tiên giám sát là phương tiện giao thông với tình trạng cần giám sát là tắc nghẽn giao thông. Cho đến nay việc giám sát đám đông thông qua camera vẫn chủ yếu dựa vào con người. Tuy nhiên tại một thời điểm thì một người chỉ có thể tập trung giám sát được số lượng camera giới hạn.

Nếu phải giám sát một hệ thống camera lớn với nhân lực hữu hạn sẽ gây quá tải cho người giám sát, dễ dẫn đến sai sót. Do đó, việc xây dựng các hệ thông phát hiện và phân tích hành vi đám đông là một nhu cầu rất cấp thiết hiện nay. Hệ thống này có thể hỗ trợ người giám sát và cơ quan an ninh bằng >https://www.com/video/clip-207 17449-stoc ‘ootage-day-high-angle-Is-down-nd- lane-freeway-slow-heavy-traffic-toward-camera-bus-tral am-rush.html 10 TÔNG QUAN cách tự động nhận biết và cảnh báo các hoạt động xuất hiện trong đám đông. Trong đó, ước lượng mật độ đám đông là một trong những bước quan trong dé làm cơ sở cho các chức năng phân tích hành vi, phát hiện sự kiện bắt thường.

Mô tả chỉ tiết bài toán ước lượng mật độ đám đông được trình bày chỉ tiết như sau: © Đầu vào: là ảnh từ video giám sát được rút trích từ các hệ thông camera giám sát. e_ Đầu ra: là bản đồ ước lượng mật độ đám đông của các đối tượng được ước lượng, đối tượng được ước lượng cụ thể ở đây là con người hoặc phương tiện giao thông (hình 1.3 ví dụ minh họa). Đầu vào Đầu ra Hệ thống _ ` —~ mật độ Hình 1. Minh họa đầu vào và đầu ra bài toán ước lượng mật độ đám đông Tuy nhiên hình ảnh từ camera thường có bối cảnh phức tạp (góc nhìn camera, sự chồng lắp của các đối tượng,.), khiến việc ước lượng chính xác mật độ đám đông là một bài toán khó, tiếp tục được cộng đồng khoa học nghiên cứu và giải quyết.

Do đó, nghiên cứu được phương pháp tốt sẽ là tiền đề dé có thé ứng dụng vào các hệ thống giám sát thông minh, giúp cho việc cảnh báo sớm những nơi có mật độ người và phương tiện quá cao. Với thông tin cảnh báo tin cậy sẽ giúp cho cơ quan giám sát có các biện pháp theo dõi và phòng ngừa kịp thời, tránh xảy ra hậu quả nghiêm trọng. Tir những lí do trên cùng sự định hướng của giảng viên hướng dẫn, học viên đã nghiên cứu tài liệu liên quan và chọn hướng đề tài “Ước lượng mật độ đám đông trong video giám sát”.2 Mục tiêu luận văn Trong luận văn này, học viên tập trung tìm hiểu các phương pháp tiên tiến về bài toán “Ước lượng mật độ đám đông” đã được công bó trên các hội nghị uy tín như CVPR, ICCV, ECCV,. và được đánh giá trên các bộ tập dit liệu chuân.

Tiếp theo, học viên sẽ tiến hành cài đặt và thực nghiệm các phương pháp CCNN, Hydra CNN [36]. Từ đó, dựa trên kết quả thực nghiệm thu được, học viên sẽ so sánh với kết quả của các phương pháp tiên tiến khác. Dựa trên kết quả đạt được, học viên sẽ nghiên cứu cải tiến các phương pháp này để tăng độ chính xác trong việc ước lượng. Cuối cùng, học viên xây dựng chương trình demo ứng dụng.3 Đối tượng và phạm vi nghiên cứu Đối tượng nghiên cứu là các các phương pháp ước lượng mật độ đám đông (con người hoặc phương tiện) trong các đoạn video giám sát.

Pham vi nghiên cứu là tiến hành thực nghiệm và đánh giá các phương pháp CCNN, Hydra CNN trên các tập dữ liệu về người là UCF_CC_ 50 [9], UCSD [4]; và tập dữ liệu về phương tiện là TRANCOS [10] theo trình tự bên dưới. e Cài đặt lại các phương pháp CCNN, Hydra CNN. e Thực nghiệm và đánh giá trên các bộ dữ liệu UCF_CC_50, UCSD, TRANCOS. e _ Từ kết quả quả thực nghiệm, so sánh với kết quả của các phương pháp tiên tiến khác.

¢ Đánh giá va tìm cách cải tiến nâng cao hiệu suất của các phương pháp đã cài đặt lại.4 Bố cục luận văn Nội dung của luận văn được trình bày trong 5 chương, bao gồm: - Chương | giới thiệu tong quan về dé tài gồm các khảo sát tìm hiểu thực trang hiện nay về giám sát người và phương tiện sử dụng camera giám sát. Từ đó, nêu lên nhu cầu cần thiết trong việc nghiên cứu phương pháp hỗ trợ cho việc xây dựng hệ thống giám sát tự động nói chung, ước lượng mật độ đám đông nói riêng là cấp thiết. 12 TÔNG QUAN Tiép theo, học viên trình bày mục tiêu của luận văn cùng đối tượng và phạm vi nghiên cứu của luận văn. - Chương 2 trình bày bài toán, một số nghiên cứu liên quan và cơ sở lý thuyết liên quan đến việc ước lượng mật độ đám đông.

Cùng với đó, giới t u mô hình CNN được sử dung trong phương pháp CCNN, Hydra CNN mà học viên sẽ nghiên cứu và cài đặt lại. - Chương 3 giới thiệu phương pháp ước lượng mật độ đám đông sử dụng mô hình CCNN và Hydra CNN. Từ đó, là nền tảng đề học viên đề xuất phương pháp cải tiến cho mô hình CCNN. - Chương 4 giới thiệu bộ dữ liệu chuẩn về người (UCF_CC_50, UCSD) và phương tiện (TRANCOS) sử dụng khi thực nghiệm.

Sau đó, giới thiệu một số độ đo được sử dụng khi đánh giá kết quả thực nghiệm khi ước lượng mật độ đám đông bằng phương pháp CCNN và Hydra CNN và phương pháp học viên đề xuất cải tiến. Từ kết quả thực nghiệm được, so sánh và đánh giá với kết quả của các phương pháp tiên tiến khác học và đánh giá các kết quả thực nghiệm này. Cuối cùng, xây dựng ứng dụng demo có thể ước lượng mật độ ảnh một cách trực quan. Chương 5 là kết luận và hướng phát triển.

Tổng kết những kết qua đạt được, những đóng góp mới và những dé xuất về một số hướng phát triển của dé tài trong tương lai. 13 NGHIÊN CỨU LIÊN QUAN VÀ CƠ SỞ LÍ THUYÉT Chương 2. NGHIÊN CỨU LIÊN QUAN VÀ CƠ SỞ LÍ THUYÉT 2.1 Giới thiệu bài toán 2.1 Khái niệm đám đông Đám đông hiéu đơn giản là một nhóm người tập hợp tại một địa diém cùng một thời điểm. Thuật ngữ đám đông thường chỉ đến việc nhóm người tập hợp không có một trật tự nào nhất định.

Nói chung, đám đông có thể xuất hiện ở nhiều bối cảnh khác nhau như lễ hội văn hóa, sự kiện chính trị, sân vận động hoặc cướp bóc, tai nạn (được gọi là đám đông hình thành do tâm lí) hay chỉ đơn giản là do công việc riêng mà người ta phải tụ họp tại một địa điêm nào đó (như khu vực trung tâm văn phòng thường có số lượng người tập trung cao vào giờ đi làm hoặc giờ tan tầm) 2.2 Khái niệm mật độ Mật độ ở phạm vi đề tài này là để chỉ tính chất tập trung hoặc đông đúc của các các đối tượng nào đó (như con người hay phương tiện) trong một diện tích nhất định. Như xét về đối tượng là con người, trong khu vực nhất định nào có số lượng người tập trung trung đông đúc (quảng trường, sân vân động, .) thì sẽ cho mật độ người cao. Ngược lại những khu vực ít người (vùng nông thôn, hoang mạc, rừng núi,.) thì sẽ có mật độ người thấp.3 Một số khái niệm trong ước lượng Trong thống kê, một ước lượng là một giá trị được tính toán từ một mẫu thử (échantillon) và người ta hi vọng đó là giá trị tiêu biêu cho giá trị cần xác định trong tổng thể (population). Người ta luôn tìm một ước lượng sao cho đó là ước lượng "không chệ " (unbiased), hội tu (converge), hiệu quả (efficient) và vững (robust).

Một số khái lệm cần chú ý trong việc ước lượng: e Giá trị kì vọng - Mean Giá trị kỳ vọng, giá trị mong đợi (hoặc kỳ vọng toán học), hoặc trung bình của một biến ngẫu nhiên - viết tắt là p - là trung bình có trọng số của tất cả giá trị có thể của biến đó. Hay là được tính bằng tổng các tích giữa xác suất xảy ra của mỗi giá trị có thể của biến với giá trị đó. Định nghĩa theo ngôn ngữ toán học là như sau: Cho X ngẫu nhiên với một số hữu hạn các kết quả hữu han xị, Xa, ., Xn Xây ra với các xác suất pi, p2, ., Pn tương ứng. Kì vọng của X được định nghĩa là: 14 NGHIÊN CỨU LIÊN QUAN VÀ CƠ SỞ LÍ THUYÉT E[X] = xp, + xzp; + ¬ + XnPn (2.1) Tir đó, nó biểu diễn giá trị trung bình mà người ta mong đợi thắng cược khi đặt cược nhiều lần với tỉ lệ thắng là như nhau.

Khi đó, một trò chơi được coi là công bằng khi giá trị kì vọng = 0 VD: Một vòng quay rô-lét có 38 ô, có khả năng quay trúng là như nhau, khi trúng vào ô đặt sẽ thắng số tiền gấp 35 lần cùng với số tiền đặt cược được hoàn lại là 36 lần tiền cược.

Nội dung được bảo vệ bản quyền — Tải xuống đầy đủ

Chào bạn! Bạn đang quan tâm đến ước lượng mật độ đám đông trong video giám sát?

Luận văn thạc sĩ CNTT "Ước Lượng Mật Độ Đám Đông trong Video Giám Sát" tập trung vào việc phát triển các thuật toán và phương pháp để tự động ước tính số lượng người trong một khung hình video. Mục tiêu chính là cung cấp một công cụ hiệu quả để phân tích và quản lý đám đông trong các tình huống khác nhau, như giám sát an ninh công cộng, quản lý sự kiện, và thậm chí là tối ưu hóa luồng người trong các không gian công cộng. Luận văn này có thể mang lại những hiểu biết sâu sắc về các kỹ thuật xử lý ảnh và thị giác máy tính tiên tiến, cũng như các thách thức và giải pháp cụ thể trong việc xử lý dữ liệu video thực tế.

Nếu bạn muốn tìm hiểu thêm về các ứng dụng của thị giác máy tính trong giám sát, bạn có thể tham khảo luận văn Luận văn thạc sĩ kỹ thuật điều khiển và tự động hóa huấn luyện tối ưu và triển khai mô hình nhận diện người trên hệ thống giám sát của trạm biến áp, nơi đề cập đến việc nhận diện người trong hệ thống giám sát trạm biến áp. Ngoài ra, nếu bạn quan tâm đến việc phát hiện các đối tượng trong ảnh, bạn có thể khám phá Luận văn tốt nghiệp xây dựng ứng dụng phát hiện khuôn mặt trong ảnh sử dụng opencv để tìm hiểu về cách OpenCV được sử dụng để phát hiện khuôn mặt. Cuối cùng, để hiểu thêm về các kỹ thuật xử lý ảnh, bạn có thể đọc luận văn Luận văn thạc sĩ hcmute phát hiện và vẽ quỹ đạo chuyển động trong xử lý ảnh dùng bộ lọc kalman, trình bày về việc sử dụng bộ lọc Kalman để theo dõi chuyển động trong ảnh. Mỗi liên kết này sẽ mở ra những khía cạnh khác nhau của lĩnh vực xử lý ảnh và thị giác máy tính, giúp bạn xây dựng kiến thức toàn diện hơn.

#video giám sát

#Luận văn thạc sĩ CNTT

#ước lượng mật độ đám đông

#đếm số lượng người trong video

#phân tích video đám đông

#mật độ đám đông thời gian thực

Chủ đề

Xử lý ảnh và video

Ứng dụng trí tuệ nhân tạo trong giám sát

Mật độ đám đông trong an ninh

Luận văn thạc sĩ công nghệ thông tin