## Tổng quan nghiên cứu
Trong bối cảnh phát triển nhanh chóng của công nghệ thị giác máy tính, việc nhận diện cơ thể người trong ảnh số và video đã trở thành một lĩnh vực nghiên cứu trọng điểm với nhiều ứng dụng thực tiễn như giám sát an ninh, hỗ trợ lái xe tự động và quản lý nội dung đa phương tiện. Theo ước tính, các hệ thống nhận diện người đi đường đóng vai trò quan trọng trong việc nâng cao an toàn giao thông và hiệu quả giám sát. Tuy nhiên, bài toán này vẫn còn nhiều thách thức do sự biến đổi đa dạng về kích thước, tư thế, điều kiện ánh sáng và môi trường ngoại cảnh. Mục tiêu nghiên cứu của luận văn là phân tích, đánh giá các phương pháp nhận diện người đi đường hiện đại, đặc biệt là phương pháp Aggregated Channel Features (ACF) kết hợp với thuật toán AdaBoost, đồng thời đề xuất cải tiến bằng việc ứng dụng bộ lọc Kalman để nâng cao hiệu quả nhận diện và theo dõi đối tượng trong video. Phạm vi nghiên cứu tập trung vào dữ liệu ảnh và video thu thập tại Việt Nam trong giai đoạn 2014-2017, sử dụng các bộ dữ liệu chuẩn như Caltech và ETH để đánh giá. Nghiên cứu có ý nghĩa quan trọng trong việc phát triển các hệ thống nhận diện người đi đường chính xác và nhanh chóng, góp phần cải thiện an toàn giao thông và ứng dụng trong các hệ thống giám sát hiện đại.
## Cơ sở lý thuyết và phương pháp nghiên cứu
### Khung lý thuyết áp dụng
- **Gradient ảnh và đặc trưng biên độ gradient**: Gradient biểu thị sự thay đổi cường độ sáng theo hướng x, y trong ảnh, là cơ sở để phát hiện biên và trích xuất đặc trưng hình ảnh. Các toán tử phổ biến như Sobel, Prewitt và Robert được sử dụng để tính toán gradient.
- **Đặc trưng Histogram of Oriented Gradient (HOG)**: HOG là phương pháp trích xuất đặc trưng dựa trên phân phối hướng gradient trong các vùng cục bộ của ảnh, giúp mô tả hình dáng và cấu trúc đối tượng người một cách hiệu quả. HOG được chuẩn hóa qua các khối (block) để giảm ảnh hưởng của điều kiện ánh sáng.
- **Không gian màu CIELUV**: Không gian màu này được sử dụng để chuẩn hóa màu sắc, giảm thiểu ảnh hưởng của điều kiện ánh sáng thay đổi trong ảnh đầu vào.
- **Thuật toán AdaBoost**: Thuật toán học máy mạnh mẽ giúp kết hợp nhiều bộ phân loại yếu thành một bộ phân loại mạnh, tăng độ chính xác nhận diện thông qua trọng số điều chỉnh trên các mẫu huấn luyện.
- **Bộ lọc Kalman**: Mô hình toán học dùng để theo dõi và dự đoán vị trí đối tượng trong chuỗi video, giúp cải thiện khả năng bám sát người đi đường trong môi trường động.
### Phương pháp nghiên cứu
- **Nguồn dữ liệu**: Sử dụng các bộ dữ liệu chuẩn quốc tế như Caltech Pedestrian Detection Benchmark và ETH Dataset, cùng với dữ liệu thực tế thu thập tại Việt Nam.
- **Phương pháp phân tích**: Triển khai thuật toán nhận diện người đi đường dựa trên đặc trưng ACF kết hợp AdaBoost, đánh giá hiệu năng qua các chỉ số như độ chính xác (Precision), độ nhạy (Recall), và tỷ lệ lỗi (Miss rate). Áp dụng bộ lọc Kalman để theo dõi đối tượng trong video, so sánh kết quả với phương pháp truyền thống.
- **Timeline nghiên cứu**: Nghiên cứu lý thuyết và thu thập dữ liệu (6 tháng), triển khai thuật toán và thử nghiệm (8 tháng), phân tích kết quả và đề xuất cải tiến (4 tháng).
## Kết quả nghiên cứu và thảo luận
### Những phát hiện chính
- Phương pháp ACF kết hợp AdaBoost đạt độ chính xác nhận diện người đi đường trên bộ dữ liệu Caltech với tỷ lệ miss rate khoảng 15%, cải thiện đáng kể so với các phương pháp truyền thống có tỷ lệ từ 20-25%.
- Việc sử dụng tháp đặc trưng nhanh giúp giảm thời gian xử lý xuống còn khoảng 33% so với phương pháp tính toán truyền thống, đảm bảo khả năng ứng dụng trong thời gian thực.
- Ứng dụng bộ lọc Kalman trong theo dõi người đi đường giúp giảm tỷ lệ mất đối tượng (false negative) trong video xuống dưới 10%, đồng thời tăng độ ổn định của hệ thống theo dõi.
- Đặc trưng HOG với chuẩn hóa L1-sqrt cho hiệu quả nhận diện tốt hơn so với các chuẩn khác, đặc biệt trong điều kiện ánh sáng thay đổi.
### Thảo luận kết quả
Nguyên nhân của sự cải tiến về độ chính xác và tốc độ xử lý là do phương pháp ACF tận dụng hiệu quả các đặc trưng tổng hợp đa kênh, kết hợp với thuật toán AdaBoost giúp chọn lọc đặc trưng phù hợp nhất. Việc xây dựng tháp đặc trưng nhanh dựa trên quy luật lũy thừa của đặc trưng ảnh theo tỷ lệ lấy mẫu giúp giảm đáng kể khối lượng tính toán mà không làm giảm độ chính xác. So với các nghiên cứu trước đây, kết quả này thể hiện sự tiến bộ rõ rệt, đặc biệt trong việc cân bằng giữa tốc độ và độ chính xác. Bộ lọc Kalman đóng vai trò quan trọng trong việc duy trì theo dõi liên tục đối tượng trong môi trường video có nhiều nhiễu và biến động, điều mà các phương pháp nhận diện tĩnh không thể đảm bảo. Dữ liệu có thể được trình bày qua biểu đồ miss rate - FPPI và đường cong Precision-Recall để minh họa hiệu năng của các phương pháp.
## Đề xuất và khuyến nghị
- **Triển khai hệ thống nhận diện người đi đường dựa trên ACF và AdaBoost** nhằm nâng cao độ chính xác nhận diện, mục tiêu giảm miss rate xuống dưới 10% trong vòng 12 tháng, do các trung tâm nghiên cứu công nghệ thực hiện.
- **Tích hợp bộ lọc Kalman vào hệ thống theo dõi video** để cải thiện khả năng bám sát đối tượng, giảm false negative xuống dưới 5% trong 6 tháng tiếp theo, do các nhóm phát triển phần mềm giám sát đảm nhiệm.
- **Phát triển phần mềm xử lý ảnh tối ưu hóa tháp đặc trưng nhanh** nhằm giảm thời gian xử lý ảnh xuống dưới 50ms mỗi khung hình, phù hợp cho ứng dụng thời gian thực trên các thiết bị nhúng, hoàn thành trong 9 tháng.
- **Đào tạo và chuyển giao công nghệ cho các đơn vị an ninh và giao thông** để ứng dụng hệ thống nhận diện và theo dõi người đi đường, nâng cao hiệu quả giám sát và an toàn giao thông trong 1-2 năm tới.
- **Nghiên cứu mở rộng ứng dụng nhận diện người trong các môi trường phức tạp** như khu vực đông đúc, điều kiện ánh sáng yếu, nhằm tăng tính ứng dụng thực tế của hệ thống.
## Đối tượng nên tham khảo luận văn
- **Nhà nghiên cứu và sinh viên ngành thị giác máy tính, xử lý ảnh số**: Nắm bắt kiến thức chuyên sâu về các phương pháp nhận diện người hiện đại, ứng dụng thuật toán AdaBoost và bộ lọc Kalman.
- **Các kỹ sư phát triển phần mềm giám sát an ninh và giao thông**: Áp dụng các thuật toán nhận diện và theo dõi người đi đường để xây dựng hệ thống giám sát hiệu quả, giảm thiểu sai sót trong phát hiện.
- **Doanh nghiệp công nghệ phát triển hệ thống hỗ trợ lái xe tự động**: Tận dụng các kết quả nghiên cứu để cải tiến hệ thống cảnh báo va chạm người đi đường, nâng cao an toàn giao thông.
- **Cơ quan quản lý giao thông và an ninh công cộng**: Sử dụng luận văn làm cơ sở khoa học để triển khai các giải pháp giám sát, quản lý người đi đường trong đô thị và các khu vực công cộng.
## Câu hỏi thường gặp
1. **Phương pháp ACF là gì và ưu điểm của nó?**
ACF là phương pháp nhận diện dựa trên các đặc trưng tổng hợp đa kênh, kết hợp với thuật toán AdaBoost để phân loại. Ưu điểm là độ chính xác cao và tốc độ xử lý nhanh nhờ xây dựng tháp đặc trưng nhanh, phù hợp cho ứng dụng thời gian thực.
2. **Bộ lọc Kalman giúp gì trong nhận diện người đi đường?**
Bộ lọc Kalman giúp theo dõi và dự đoán vị trí người đi đường trong video, giảm thiểu mất đối tượng và tăng độ ổn định của hệ thống theo dõi, đặc biệt trong môi trường có nhiều nhiễu và biến động.
3. **Đặc trưng HOG được tính toán như thế nào?**
HOG tính toán phân phối hướng gradient trong các vùng cục bộ (cell) của ảnh, sau đó chuẩn hóa theo các khối (block) để giảm ảnh hưởng của ánh sáng và tạo vector đặc trưng mô tả hình dáng đối tượng.
4. **Làm thế nào để đánh giá hiệu quả của phương pháp nhận diện?**
Hiệu quả được đánh giá qua các chỉ số như miss rate, false positive per image (FPPI), precision và recall, thường được thể hiện qua các biểu đồ miss rate - FPPI và đường cong Precision-Recall.
5. **Phương pháp này có thể áp dụng trong điều kiện ánh sáng yếu không?**
Có, nhờ sử dụng không gian màu CIELUV và chuẩn hóa gamma, phương pháp giảm thiểu ảnh hưởng của điều kiện ánh sáng thay đổi, giúp nhận diện người đi đường hiệu quả trong nhiều môi trường ánh sáng khác nhau.
## Kết luận
- Luận văn đã nghiên cứu và đánh giá thành công phương pháp nhận diện người đi đường dựa trên đặc trưng ACF kết hợp AdaBoost, đạt độ chính xác cao với miss rate khoảng 15% trên bộ dữ liệu chuẩn.
- Phương pháp xây dựng tháp đặc trưng nhanh giúp giảm thời gian xử lý xuống còn khoảng 33% so với cách tính truyền thống, phù hợp cho ứng dụng thời gian thực.
- Ứng dụng bộ lọc Kalman trong theo dõi video giúp giảm tỷ lệ mất đối tượng và tăng độ ổn định của hệ thống nhận diện.
- Đề xuất các giải pháp triển khai và cải tiến hệ thống nhận diện người đi đường, hướng tới ứng dụng thực tế trong giám sát an ninh và hỗ trợ lái xe tự động.
- Khuyến nghị tiếp tục nghiên cứu mở rộng ứng dụng trong các môi trường phức tạp và đào tạo chuyển giao công nghệ cho các đơn vị liên quan.
Hành động tiếp theo là triển khai thử nghiệm thực tế tại các địa điểm có lưu lượng người đi lại cao và phát triển phần mềm tích hợp bộ lọc Kalman để nâng cao hiệu quả nhận diện và theo dõi người đi đường.