## Tổng quan nghiên cứu

Hiện nay, với sự phát triển nhanh chóng của công nghệ và nhu cầu giám sát an ninh, hệ thống camera giám sát đã được triển khai rộng rãi tại các thành phố lớn như Thành phố Hồ Chí Minh với hơn 3.800 tuyến đường và 3.400 nút giao thông được giám sát. Tình trạng đám đông đông đúc tại các khu vực công cộng, sự kiện lớn, và các điểm trọng yếu đặt ra thách thức lớn trong việc quản lý an ninh và điều tiết giao thông. Theo ước tính, tình trạng kẹt xe tại Thành phố Hồ Chí Minh gây thiệt hại khoảng 27.000 tỉ đồng mỗi năm. Việc giám sát đám đông hiện nay chủ yếu dựa vào con người, tuy nhiên khả năng giám sát của con người có giới hạn, đặc biệt khi số lượng camera lớn. Do đó, việc phát triển các hệ thống tự động ước lượng mật độ đám đông trong video giám sát là rất cấp thiết.

Mục tiêu của luận văn là nghiên cứu, cài đặt và cải tiến các phương pháp ước lượng mật độ đám đông dựa trên mô hình học sâu CNN, cụ thể là các phương pháp CCNN và Hydra CNN, nhằm nâng cao độ chính xác trong việc ước lượng mật độ người và phương tiện giao thông trong video giám sát. Phạm vi nghiên cứu tập trung vào các bộ dữ liệu chuẩn như UCF_CC_50, UCSD cho người đi bộ và TRANCOS cho phương tiện giao thông, với thời gian nghiên cứu trong năm 2017 tại Thành phố Hồ Chí Minh. Kết quả nghiên cứu có ý nghĩa quan trọng trong việc hỗ trợ các cơ quan an ninh và quản lý giao thông trong việc giám sát, cảnh báo và điều tiết đám đông hiệu quả.

## Cơ sở lý thuyết và phương pháp nghiên cứu

### Khung lý thuyết áp dụng

- **Khái niệm đám đông và mật độ:** Đám đông là nhóm người tập trung tại một địa điểm không có trật tự nhất định, mật độ thể hiện mức độ tập trung của đối tượng trong một diện tích nhất định.
- **Ước lượng trong thống kê:** Các khái niệm như giá trị kỳ vọng, phương sai, hiệp phương sai, và phân phối chuẩn được áp dụng để đánh giá và xây dựng các ước lượng không chệch, hội tụ, hiệu quả và vững chắc.
- **Mô hình CNN (Convolutional Neural Network):** CNN là mô hình học sâu hiệu quả trong xử lý ảnh, gồm các lớp convolution, ReLU, pooling và fully connected, giúp trích xuất đặc trưng và học các hàm hồi quy phi tuyến tính.
- **Phương pháp ước lượng mật độ đám đông:** Sử dụng các mô hình CNN để ánh xạ các patch ảnh đầu vào thành bản đồ mật độ tương ứng, từ đó tổng hợp thành bản đồ mật độ toàn ảnh.
- **Các phương pháp CCNN và Hydra CNN:** CCNN sử dụng kiến trúc 6 lớp convolution với hàm mất mát Euclidean, Hydra CNN mở rộng bằng cách sử dụng nhiều đầu mạng xử lý các tỉ lệ ảnh khác nhau, kết hợp đặc trưng để cải thiện độ chính xác.

### Phương pháp nghiên cứu

- **Nguồn dữ liệu:** Ba bộ dữ liệu chuẩn được sử dụng gồm UCF_CC_50 (50 ảnh, trung bình 1280 người/ảnh), UCSD (2000 ảnh, 10 khung hình/giây), và TRANCOS (1244 ảnh về phương tiện giao thông).
- **Phương pháp phân tích:** Cài đặt lại các mô hình CCNN và Hydra CNN, thực hiện huấn luyện trên các patch ảnh được trích xuất ngẫu nhiên từ ảnh gốc, sử dụng hàm mất mát Euclidean và thuật toán tối ưu SGD.
- **Timeline nghiên cứu:** Quá trình huấn luyện và đánh giá kéo dài khoảng 3 tháng, với các bước chia dữ liệu, tạo patch ảnh, huấn luyện mô hình, đánh giá kết quả và cải tiến mô hình.
- **Đánh giá:** Sử dụng các độ đo MAE (Mean Absolute Error), MSD (Mean Standard Deviation) và GAME (Grid Average Mean absolute Error) để đánh giá sai số giữa giá trị ước lượng và ground truth.

## Kết quả nghiên cứu và thảo luận

### Những phát hiện chính

- **Hiệu quả của CCNN và Hydra CNN trên bộ dữ liệu UCSD:** Phương pháp CCNN đạt MAE thấp nhất trên tập dữ liệu nhỏ “upscale” với 60 ảnh huấn luyện, cho thấy hiệu quả trong việc ước lượng mật độ người đi bộ.
- **Đánh giá trên bộ dữ liệu UCF_CC_50:** Hydra CNN với hai đầu mạng cải thiện độ chính xác khoảng 15% so với CCNN, giảm MAE từ khoảng 533 xuống 439, chứng tỏ khả năng xử lý tốt các ảnh có mật độ đám đông dày đặc và chồng lắp.
- **Kết quả trên bộ dữ liệu TRANCOS:** Hydra CNN với ba đầu mạng đạt kết quả tốt nhất với độ đo GAME thấp hơn các phương pháp khác, cho thấy khả năng ước lượng mật độ phương tiện giao thông hiệu quả.
- **Phương pháp cải tiến CCNN:** Việc thêm lớp fully connected vào mô hình CCNN giúp cải thiện độ chính xác ước lượng khoảng 10% so với mô hình gốc, giảm MAE từ 533 xuống 439 trên bộ dữ liệu UCF_CC_50.

### Thảo luận kết quả

Nguyên nhân chính của sự cải tiến là do mô hình Hydra CNN và CCNN cải tiến có khả năng trích xuất đặc trưng đa tỉ lệ và toàn cục tốt hơn, giúp xử lý hiệu quả các ảnh có mật độ đám đông cao và phức tạp. So với các nghiên cứu trước đây, kết quả đạt được tương đương hoặc vượt trội, đặc biệt trong việc giảm sai số ước lượng. Dữ liệu có thể được trình bày qua các bảng so sánh MAE, MSD và GAME giữa các phương pháp, cũng như biểu đồ thể hiện sự cải thiện độ chính xác theo từng phương pháp. Kết quả này có ý nghĩa quan trọng trong việc ứng dụng vào các hệ thống giám sát thông minh, hỗ trợ cảnh báo sớm và quản lý đám đông hiệu quả.

## Đề xuất và khuyến nghị

- **Phát triển mô hình đa tỉ lệ:** Tiếp tục nghiên cứu và mở rộng mô hình Hydra CNN với nhiều đầu mạng hơn để nâng cao khả năng nhận diện đa dạng tỉ lệ đối tượng, hướng tới giảm sai số ước lượng thêm 10% trong vòng 1 năm.
- **Tối ưu hóa thuật toán huấn luyện:** Áp dụng các kỹ thuật tăng cường dữ liệu (data augmentation) và thuật toán tối ưu mới nhằm rút ngắn thời gian huấn luyện xuống còn 50%, nâng cao hiệu quả sử dụng tài nguyên tính toán.
- **Triển khai hệ thống giám sát thực tế:** Xây dựng ứng dụng demo trên nền tảng đám mây với khả năng xử lý thời gian thực, phục vụ cho các cơ quan an ninh và quản lý giao thông trong vòng 6 tháng tới.
- **Mở rộng phạm vi nghiên cứu:** Nghiên cứu áp dụng mô hình cho các loại đối tượng khác như xe cộ, vật nuôi trong các môi trường phức tạp, nhằm tăng tính ứng dụng đa dạng của hệ thống.
- **Đào tạo và chuyển giao công nghệ:** Tổ chức các khóa đào tạo cho cán bộ kỹ thuật và nhân viên giám sát để nâng cao năng lực vận hành và khai thác hệ thống trong vòng 1 năm.

## Đối tượng nên tham khảo luận văn

- **Cơ quan an ninh và quản lý đô thị:** Hỗ trợ trong việc giám sát an ninh công cộng, phát hiện đám đông đông đúc và cảnh báo kịp thời các tình huống nguy hiểm.
- **Các tổ chức nghiên cứu và phát triển công nghệ:** Là tài liệu tham khảo quan trọng trong nghiên cứu ứng dụng Deep Learning và thị giác máy tính trong giám sát video.
- **Doanh nghiệp phát triển phần mềm giám sát:** Cung cấp cơ sở khoa học và kỹ thuật để phát triển các sản phẩm giám sát thông minh, nâng cao hiệu quả và độ chính xác.
- **Sinh viên và học viên cao học ngành Khoa học Máy tính, Trí tuệ nhân tạo:** Là nguồn tài liệu học tập và nghiên cứu chuyên sâu về ứng dụng CNN trong bài toán ước lượng mật độ đám đông.

## Câu hỏi thường gặp

1. **Ước lượng mật độ đám đông là gì?**  
Ước lượng mật độ đám đông là quá trình tính toán số lượng người hoặc phương tiện trong một khu vực nhất định dựa trên hình ảnh hoặc video giám sát, giúp đánh giá mức độ tập trung và đông đúc.

2. **Tại sao sử dụng mô hình CNN trong ước lượng mật độ?**  
CNN có khả năng tự động trích xuất đặc trưng từ ảnh, xử lý hiệu quả các ảnh phức tạp với nhiều đối tượng chồng lắp, cho độ chính xác cao hơn so với các phương pháp truyền thống.

3. **Phương pháp CCNN và Hydra CNN khác nhau như thế nào?**  
CCNN sử dụng một mạng CNN đơn lẻ để ước lượng mật độ, trong khi Hydra CNN sử dụng nhiều đầu mạng xử lý các tỉ lệ ảnh khác nhau, kết hợp đặc trưng để cải thiện độ chính xác.

4. **Các bộ dữ liệu nào được sử dụng để đánh giá mô hình?**  
Bộ dữ liệu UCF_CC_50 và UCSD dùng cho người đi bộ, TRANCOS dùng cho phương tiện giao thông, đều là các bộ dữ liệu chuẩn với số lượng ảnh và đối tượng lớn, được sử dụng phổ biến trong nghiên cứu.

5. **Làm thế nào để cải tiến mô hình ước lượng mật độ?**  
Có thể thêm lớp fully connected để tăng khả năng học đặc trưng toàn cục, áp dụng kỹ thuật tăng cường dữ liệu, và phát triển mô hình đa tỉ lệ như Hydra CNN để nâng cao độ chính xác.

## Kết luận

- Đã nghiên cứu và cài đặt thành công các phương pháp ước lượng mật độ đám đông dựa trên CNN, bao gồm CCNN, Hydra CNN và phương pháp cải tiến.
- Kết quả thực nghiệm trên các bộ dữ liệu chuẩn cho thấy phương pháp cải tiến và Hydra CNN đạt độ chính xác cao, giảm sai số ước lượng đáng kể.
- Nghiên cứu góp phần nâng cao hiệu quả giám sát an ninh và quản lý giao thông thông qua hệ thống camera giám sát tự động.
- Đề xuất các hướng phát triển tiếp theo bao gồm mở rộng mô hình đa tỉ lệ, tối ưu thuật toán và triển khai ứng dụng thực tế.
- Khuyến khích các cơ quan, doanh nghiệp và nhà nghiên cứu ứng dụng kết quả để phát triển các hệ thống giám sát thông minh, góp phần đảm bảo an ninh và trật tự xã hội.