I. Giới thiệu và động lực nghiên cứu
Khóa luận tập trung vào phát hiện bất thường trong video giám sát sử dụng Deep Learning, một lĩnh vực quan trọng trong Khoa học máy tính. Nghiên cứu này xuất phát từ nhu cầu thực tế trong việc xây dựng thành phố thông minh tại Việt Nam, nơi các hệ thống giám sát thông minh đang được triển khai rộng rãi. Phát hiện bất thường trong video giám sát giúp nhận diện các sự kiện như đánh nhau, trộm cắp, cướp giật, từ đó hỗ trợ công tác quản lý và an ninh. Với sự gia tăng dân số và các hoạt động đa dạng tại các đô thị, việc tự động hóa quá trình này là cần thiết để giảm chi phí nhân công và nâng cao hiệu quả.
1.1. Bài toán phát hiện bất thường
Bài toán phát hiện bất thường trong video giám sát đặt ra nhiều thách thức do sự đa dạng trong hành vi con người và góc quay của camera. Nghiên cứu này nhằm xây dựng một mô hình dựa trên Deep Learning để tự động phát hiện các sự kiện bất thường, đồng thời xây dựng bộ dữ liệu về các sự kiện này tại Việt Nam.
II. Phương pháp và kỹ thuật sử dụng
Khóa luận sử dụng các kỹ thuật học sâu như mạng nơ-ron tích chập (CNN) và mạng tự mã hóa (Autoencoder) để trích xuất đặc trưng từ video. Các phương pháp tiên tiến như Future Frame Prediction (FFP) và Memory-guided Normality for Anomaly Detection (MNAD) được áp dụng để cải thiện độ chính xác của mô hình. Nghiên cứu cũng đề xuất các cải tiến trong hàm độ lỗi và quy trình phát hiện bất thường để tối ưu hóa hiệu suất.
2.1. Trích xuất đặc trưng và mô hình học sâu
Các kỹ thuật trích xuất đặc trưng như HOG và SIFT được sử dụng để phân tích hành vi trong video. Mạng nơ-ron tích chập (CNN) và mạng tự mã hóa (Autoencoder) được triển khai để học các đặc trưng phức tạp từ dữ liệu video.
2.2. Cải tiến phương pháp phát hiện bất thường
Nghiên cứu đề xuất các cải tiến trong hàm độ lỗi của Future Frame Prediction (FFP) và quy trình phát hiện bất thường của MNAD để nâng cao độ chính xác và hiệu quả của mô hình.
III. Kết quả và đánh giá
Khóa luận đã xây dựng bộ dữ liệu VNAnomaly gồm 217 video giám sát từ các camera tại Việt Nam. Các mô hình FFP, MNAD, và MLEP được thử nghiệm trên bộ dữ liệu này, cho kết quả khả quan với độ chính xác cao. Nghiên cứu cũng đề xuất các cải tiến giúp tăng hiệu suất của mô hình, đồng thời phát triển một ứng dụng demo để minh họa quá trình phát hiện bất thường.
3.1. Bộ dữ liệu VNAnomaly
Bộ dữ liệu VNAnomaly được thu thập từ các camera giám sát tại Việt Nam, bao gồm các sự kiện bất thường như đánh nhau, cướp giật. Dữ liệu được tiền xử lý và gán nhãn để phục vụ cho việc huấn luyện mô hình.
3.2. Đánh giá kết quả thực nghiệm
Các mô hình FFP, MNAD, và MLEP được đánh giá dựa trên các chỉ số như ROC-AUC và confusion matrix. Kết quả cho thấy các mô hình này có khả năng phát hiện bất thường hiệu quả trên bộ dữ liệu VNAnomaly.
IV. Ứng dụng và hướng phát triển
Nghiên cứu này có tiềm năng ứng dụng cao trong các hệ thống giám sát thông minh tại Việt Nam, đặc biệt trong bối cảnh xây dựng thành phố thông minh. Các kết quả đạt được đã được công bố tại các hội nghị quốc gia và quốc tế, mở ra hướng phát triển mới trong lĩnh vực phân tích video và an ninh.
4.1. Ứng dụng thực tế
Mô hình phát hiện bất thường có thể được tích hợp vào các hệ thống camera giám sát để tự động cảnh báo các sự kiện bất thường, giúp giảm thiểu chi phí nhân công và nâng cao hiệu quả quản lý.
4.2. Hướng phát triển tương lai
Nghiên cứu đề xuất hướng phát triển tiếp theo là mở rộng bộ dữ liệu và cải tiến các mô hình học sâu để tăng độ chính xác và khả năng ứng dụng trong các tình huống thực tế phức tạp hơn.