Luận văn thạc sĩ: Nghiên cứu và ứng dụng deep learning để phát hiện người xâm nhập

Trường đại học

Trường Đại Học Bà Rịa-Vũng Tàu

Chuyên ngành

Công Nghệ Thông Tin

Người đăng

Ẩn danh

Thể loại

luận văn thạc sĩ

2021

100

Phí lưu trữ

35 Point

Mục lục chi tiết

LỜI CAM ĐOAN

1. CHƯƠNG 1: TỔNG QUAN VỀ XỬ LÝ ẢNH SỐ, HỌC MÁY VÀ HỌC SÂU

1.1. Xử lý ảnh và các vấn đề cơ bản về xử lý ảnh

1.2. Các vấn đề cơ bản về xử lý ảnh

1.3. Ảnh số và điểm ảnh

1.4. Nắn chỉnh biến dạng

1.5. Một số phương pháp xử lý ảnh số

1.5.1. Các kỹ thuật lọc nhiễu

1.5.1.1. Kỹ thuật lọc trung bình

1.5.1.2. Kỹ thuật lọc trung vị

1.5.1.3. Lọc thông thấp

1.5.1.4. Lọc thông cao

1.5.2. Kỹ thuật phân ngưỡng

1.5.2.1. Kỹ thuật phân ngưỡng tự động

1.5.3. Phương pháp sử dụng các điểm biên

1.5.3.1. Một số kĩ thuật phát hiện biên

1.5.3.1.1. Kỹ thuật gradient

1.5.3.1.2. Kỹ thuật Laplace

1.5.3.1.3. Kỹ thuật sobel

1.5.3.1.4. Kỹ thuật prewitt

1.6. Các giải thuật học máy

1.7. Các ứng dụng của học máy

1.8. Cách thức hoạt động của học sâu

1.9. Các ứng dụng phổ biến của học sâu

1.9.1. Máy bay không người lái và xe ô tô tự hành

1.9.2. Chatbots và dịch vụ bots

1.9.3. Tô màu hình ảnh

1.9.4. Nhận dạng khuôn mặt

1.9.5. Y học và dược phẩm

1.9.6. Mua sắm và giải trí được cá nhân hóa

2. CHƯƠNG 2: TỔNG QUAN CÁC PHƯƠNG PHÁP NHẬN DẠNG ĐỐI TƯỢNG, PHÁT HIỆN NGƯỜI VÀ KHUÔN MẶT TRÊN ẢNH

2.1. Đặc điểm các loại đối tượng và người

2.2. Các phương pháp nhận dạng đối tượng hiện nay

2.2.1. Phương pháp dựa trên cơ sở tri thức

2.2.2. Phương pháp dựa trên đặc trưng bất biến

2.2.3. Phương pháp dựa trên so khớp mẫu

2.2.4. Phương pháp dựa trên diện mạo

2.3. Các kỹ thuật phát hiện người

2.4. Các kỹ thuật phát hiện khuôn mặt

3. CHƯƠNG 3: THUẬT TOÁN PHÁT HIỆN NGƯỜI VÀ KHUÔN MẶT SỬ DỤNG MẠNG NƠ-RON TÍCH CHẬP, YOLOV3 VÀ THUẬT TOÁN VIOLA-JONES

3.1. Kỹ thuật nhận dạng đối tượng bằng mạng nơ-ron tích chập

3.1.1. Lớp tích chập (Convolution Layer)

3.1.2. Lớp chuyển đổi (ReLU Layer)

3.1.3. Lớp tổng hợp (Pooling Layer)

3.1.4. Lớp kết nối đầy đủ (Fully-Connected Layer)

3.1.5. Các bước thực hiện nhận dạng đối tượng bằng mạng nơ-ron tích chập

3.2. Kỹ thuật nhận dạng đối tượng bằng YOLOv3

3.2.1. Kiến trúc mạng YOLO

3.2.2. Các phiên bản của YOLO

3.2.3. Nhận dạng đối tượng bằng YOLOv3

3.3. Kỹ thuật phát hiện khuôn mặt Viola-Jones

3.3.1. Các đặc trưng Haar-Like

3.3.2. Sơ đồ tìm kiếm khuôn mặt

4. CHƯƠNG 4: KẾT QUẢ THỰC NGHIỆM VÀ ÁP DỤNG TRONG THỰC TẾ

4.1. Mô hình hệ thống dự kiến

4.2. Thuật toán tìm người và khuôn mặt đề xuất

4.2.1. Thuật toán tìm người và khuôn mặt trên ảnh tĩnh

4.2.2. Mô hình thuật toán

4.2.3. Thuật toán tìm người và khuôn mặt trên video

4.2.4. Mô hình thuật toán

4.2.5. Chú thích bằng lời

4.3. Kết quả thực nghiệm. Đánh giá kết quả

4.4. Kết luận và hướng phát triển

TÀI LIỆU THAM KHẢO

Tóm tắt

I. Tính cấp thiết của đề tài

Trong bối cảnh hiện đại, việc đảm bảo an ninh mạng trở thành một vấn đề cấp bách. Deep learning đã mở ra những khả năng mới trong việc phát hiện xâm nhập. Hệ thống camera giám sát hiện tại chỉ có khả năng ghi lại hình ảnh mà không thể tự động phát hiện và cảnh báo các hành vi xâm nhập. Việc ứng dụng machine learning và học sâu vào hệ thống này giúp nâng cao khả năng phát hiện, giảm thiểu các cảnh báo sai. Theo nghiên cứu, việc sử dụng học sâu có thể cải thiện đáng kể độ chính xác trong việc phát hiện các đối tượng xâm nhập, từ đó bảo vệ an ninh cho các cơ quan, tổ chức.

II. Mục tiêu của đề tài

Mục tiêu chính của nghiên cứu này là phát triển một hệ thống phát hiện xâm nhập tự động dựa trên công nghệ deep learning. Cụ thể, nghiên cứu sẽ xây dựng mô hình phát hiện người và khuôn mặt trong ảnh tĩnh và video. Hệ thống sẽ sử dụng các thuật toán như YOLOv3 và mạng nơ-ron tích chập để nhận diện và phân loại đối tượng. Mục tiêu cuối cùng là áp dụng mô hình này vào thực tế tại Trung tâm hành chính tỉnh Bà Rịa-Vũng Tàu, nhằm nâng cao hiệu quả giám sát và bảo mật thông tin.

III. Tổng quan về lĩnh vực nghiên cứu

Nghiên cứu về phát hiện xâm nhập đã được thực hiện từ lâu, tuy nhiên, sự phát triển của học sâu đã mang lại những bước tiến vượt bậc. Các phương pháp truyền thống thường gặp khó khăn trong việc phân loại và nhận diện đối tượng trong các tình huống phức tạp. Deep learning cho phép xây dựng các mô hình phức tạp hơn, có khả năng học từ dữ liệu lớn và tự động cải thiện hiệu suất. Các nghiên cứu trước đây đã chỉ ra rằng việc áp dụng AI trong an ninh mạng có thể giúp phát hiện các hành vi bất thường một cách hiệu quả hơn.

IV. Các phương pháp phát hiện đối tượng

Có nhiều phương pháp để phát hiện đối tượng trong ảnh và video. Các phương pháp này thường dựa vào các đặc trưng như màu sắc, hình dạng và kết cấu bề mặt. Việc áp dụng học sâu đã dẫn đến sự ra đời của các thuật toán như R-CNN, YOLO và SSD, cho phép phát hiện đối tượng với độ chính xác cao. Các nghiên cứu đã chỉ ra rằng mạng nơ-ron có thể học và nhận diện các đặc trưng phức tạp mà các phương pháp truyền thống không thể làm được. Điều này mở ra cơ hội mới cho việc phát hiện xâm nhập trong các hệ thống giám sát.

V. Kết quả thực nghiệm và ứng dụng thực tế

Kết quả thực nghiệm cho thấy mô hình phát hiện xâm nhập dựa trên deep learning có khả năng nhận diện người và khuôn mặt với độ chính xác cao. Hệ thống đã được thử nghiệm trong môi trường thực tế tại Trung tâm hành chính tỉnh Bà Rịa-Vũng Tàu. Các thử nghiệm cho thấy tỷ lệ phát hiện thành công đạt trên 90%, trong khi tỷ lệ cảnh báo sai chỉ dưới 5%. Điều này chứng tỏ rằng việc ứng dụng học sâu trong phát hiện xâm nhập không chỉ khả thi mà còn mang lại hiệu quả cao trong việc bảo vệ an ninh.

25/01/2025

Bạn đang xem trước tài liệu:

Luận văn thạc sĩ nghiên cứu và ứng dụng deep learning phát hiện người xâm nhập

Tải đầy đủ

Nội dung chính

Tổng quan nghiên cứu

Trong bối cảnh công nghệ phát triển mạnh mẽ, việc ứng dụng trí tuệ nhân tạo, đặc biệt là học sâu (Deep Learning), vào các hệ thống giám sát an ninh ngày càng trở nên cấp thiết. Tại Trung tâm Hành chính tỉnh Bà Rịa – Vũng Tàu, hệ thống camera giám sát hiện đại được trang bị nhằm đảm bảo an ninh 24/24, tuy nhiên vẫn còn hạn chế trong việc tự động phát hiện và cảnh báo người xâm nhập trái phép ngoài giờ hành chính. Theo ước tính, việc phát hiện tự động có thể giảm thiểu đến 70% các sự cố an ninh do con người giám sát không kịp thời hoặc bỏ sót. Mục tiêu của nghiên cứu là xây dựng và ứng dụng thành công các mô hình học sâu để phát hiện người xâm nhập và trích xuất khuôn mặt trên ảnh tĩnh và video, từ đó hỗ trợ cảnh báo tự động tại các cơ quan, đơn vị trong Trung tâm Hành chính tỉnh Bà Rịa – Vũng Tàu. Nghiên cứu tập trung trong phạm vi thời gian từ năm 2020 đến 2021, với dữ liệu thu thập từ hệ thống camera giám sát thực tế tại các trụ sở hành chính. Việc ứng dụng Deep Learning không chỉ nâng cao độ chính xác phát hiện người xâm nhập lên trên 90%, mà còn giảm tỷ lệ cảnh báo sai xuống dưới 5%, góp phần tăng cường hiệu quả công tác an ninh và giảm thiểu chi phí vận hành.

Cơ sở lý thuyết và phương pháp nghiên cứu

Khung lý thuyết áp dụng

Nghiên cứu dựa trên hai lý thuyết chính: Thị giác máy tính (Computer Vision) và Học sâu (Deep Learning). Thị giác máy tính cung cấp nền tảng về xử lý ảnh số, trích xuất đặc trưng và nhận dạng đối tượng, trong đó các kỹ thuật như lọc nhiễu, phân ngưỡng, phát hiện biên được sử dụng để chuẩn bị dữ liệu ảnh. Học sâu, đặc biệt là mạng nơ-ron tích chập (Convolutional Neural Networks - CNN), được áp dụng để xây dựng mô hình nhận dạng người và khuôn mặt với khả năng trích xuất đặc trưng tự động và phân loại chính xác. Thuật toán YOLOv3 (You Only Look Once phiên bản 3) được lựa chọn làm mô hình chính để phát hiện người nhờ ưu điểm về tốc độ xử lý (khoảng 20-45 FPS) và độ chính xác cao (mAP đạt trên 55% trên tập COCO). Thuật toán Viola-Jones được sử dụng để phát hiện khuôn mặt trên ảnh tĩnh nhờ khả năng làm việc thời gian thực và độ chính xác phù hợp với điều kiện thực tế.

Các khái niệm chính bao gồm:

Điểm ảnh (Pixel) và ảnh số (Digital Image)
Mạng nơ-ron tích chập (CNN) và các lớp cơ bản: lớp tích chập, lớp ReLU, lớp pooling, lớp kết nối đầy đủ
Thuật toán YOLOv3 và kiến trúc mạng
Thuật toán Viola-Jones và đặc trưng Haar-Like
Các kỹ thuật xử lý ảnh tiền xử lý: lọc trung bình, lọc trung vị, lọc thông thấp và cao, phân ngưỡng tự động, phát hiện biên bằng toán tử gradient và Laplace

Phương pháp nghiên cứu

Nguồn dữ liệu chính là các hình ảnh và video thu thập từ hệ thống camera giám sát tại Trung tâm Hành chính tỉnh Bà Rịa – Vũng Tàu trong khoảng thời gian từ tháng 6/2020 đến tháng 3/2021. Cỡ mẫu gồm hơn 10.000 ảnh tĩnh và 200 giờ video được sử dụng để huấn luyện và kiểm thử mô hình. Phương pháp chọn mẫu là lấy mẫu ngẫu nhiên có kiểm soát nhằm đảm bảo đa dạng về điều kiện ánh sáng, góc quay và số lượng người xuất hiện.

Phân tích dữ liệu được thực hiện bằng cách xây dựng mô hình CNN với thuật toán YOLOv3 để phát hiện người trên ảnh tĩnh, sau đó áp dụng thuật toán Viola-Jones để trích xuất khuôn mặt từ các vùng phát hiện được. Mô hình được mở rộng để xử lý video bằng cách tách khung hình và áp dụng tuần tự các thuật toán trên. Quá trình huấn luyện sử dụng bộ dữ liệu COCO kết hợp với dữ liệu thực tế, tối ưu hóa bằng thuật toán Adam với learning rate điều chỉnh theo từng epoch. Thời gian nghiên cứu kéo dài 10 tháng, bao gồm các giai đoạn thu thập dữ liệu, xây dựng mô hình, huấn luyện, kiểm thử và triển khai thử nghiệm thực tế.

Kết quả nghiên cứu và thảo luận

Những phát hiện chính

Hiệu quả phát hiện người trên ảnh tĩnh: Mô hình YOLOv3 đạt độ chính xác trung bình (mAP) 57,9% trên tập dữ liệu COCO và trên 90% khi áp dụng trên dữ liệu thực tế tại Trung tâm Hành chính. Tốc độ xử lý đạt khoảng 20 FPS, phù hợp với yêu cầu thời gian thực.
Trích xuất khuôn mặt chính xác: Thuật toán Viola-Jones phát hiện khuôn mặt với độ chính xác trên 85% trong điều kiện ánh sáng đa dạng và góc quay khác nhau, giảm thiểu sai sót do che khuất hoặc biến dạng khuôn mặt.
Phát hiện người và khuôn mặt trên video: Mô hình kết hợp xử lý tuần tự các khung hình video cho kết quả phát hiện người với tỷ lệ chính xác trên 88%, đồng thời trích xuất khuôn mặt thành công trong hơn 80% các trường hợp người xâm nhập.
Giảm tỷ lệ cảnh báo sai: Hệ thống cảnh báo tự động giảm tỷ lệ cảnh báo sai xuống dưới 5%, so với mức khoảng 20% khi chỉ sử dụng camera giám sát truyền thống.

Thảo luận kết quả

Nguyên nhân chính của hiệu quả cao đến từ việc ứng dụng mô hình YOLOv3 với kiến trúc mạng nơ-ron tích chập sâu, cho phép trích xuất đặc trưng đa cấp và nhận dạng chính xác trong môi trường phức tạp. So sánh với các nghiên cứu trước đây, kết quả này vượt trội hơn hẳn các phương pháp dựa trên HOG hoặc SVM, vốn chỉ đạt độ chính xác khoảng 70-80% và tốc độ xử lý thấp hơn nhiều. Việc kết hợp thuật toán Viola-Jones giúp tăng cường khả năng nhận dạng khuôn mặt trong điều kiện ánh sáng yếu và che khuất một phần, điều mà các mô hình học sâu thuần túy đôi khi gặp khó khăn.

Dữ liệu có thể được trình bày qua biểu đồ so sánh độ chính xác phát hiện người giữa các thuật toán (YOLOv3, HOG, SVM) và bảng thống kê tỷ lệ cảnh báo sai trước và sau khi áp dụng mô hình học sâu. Kết quả này khẳng định tính khả thi và hiệu quả của việc ứng dụng Deep Learning trong giám sát an ninh thực tế, góp phần nâng cao chất lượng quản lý và bảo vệ an ninh tại các cơ quan nhà nước.

Đề xuất và khuyến nghị

Triển khai hệ thống giám sát tự động: Áp dụng mô hình YOLOv3 kết hợp Viola-Jones trên toàn bộ hệ thống camera tại Trung tâm Hành chính tỉnh Bà Rịa – Vũng Tàu nhằm phát hiện và cảnh báo người xâm nhập ngoài giờ hành chính. Thời gian thực hiện dự kiến trong 6 tháng, do phòng công nghệ thông tin chủ trì.
Nâng cấp phần cứng camera: Đề xuất nâng cấp các camera hiện tại lên loại có độ phân giải cao và khả năng truyền dữ liệu nhanh để đảm bảo chất lượng ảnh đầu vào, từ đó nâng cao hiệu quả phát hiện. Thời gian thực hiện trong vòng 12 tháng, phối hợp với nhà cung cấp thiết bị.
Đào tạo nhân viên vận hành: Tổ chức các khóa đào tạo về vận hành và bảo trì hệ thống giám sát tự động cho đội ngũ bảo vệ và kỹ thuật viên nhằm đảm bảo hệ thống hoạt động ổn định và hiệu quả. Thời gian đào tạo 3 tháng, do phòng nhân sự phối hợp với đơn vị nghiên cứu thực hiện.
Phát triển hệ thống cảnh báo đa kênh: Mở rộng hệ thống cảnh báo tự động qua SMS, email và ứng dụng di động để tăng khả năng phản ứng nhanh khi phát hiện người xâm nhập. Thời gian phát triển dự kiến 4 tháng, do phòng công nghệ thông tin đảm nhiệm.

Đối tượng nên tham khảo luận văn

Các nhà quản lý an ninh và bảo vệ: Nghiên cứu cung cấp giải pháp công nghệ hiện đại giúp nâng cao hiệu quả giám sát, giảm thiểu rủi ro an ninh tại các cơ quan, đơn vị.
Chuyên gia và sinh viên ngành Công nghệ Thông tin: Luận văn trình bày chi tiết về ứng dụng Deep Learning trong xử lý ảnh và nhận dạng đối tượng, là tài liệu tham khảo quý giá cho nghiên cứu và phát triển.
Các đơn vị phát triển phần mềm và thiết bị giám sát: Cung cấp cơ sở khoa học và kỹ thuật để phát triển các sản phẩm giám sát thông minh, tích hợp công nghệ AI.
Cơ quan quản lý nhà nước về an ninh trật tự: Hỗ trợ xây dựng các chính sách và hướng dẫn ứng dụng công nghệ mới trong công tác bảo vệ an ninh, đặc biệt trong bối cảnh đô thị hóa và phát triển công nghệ số.

Câu hỏi thường gặp

Deep Learning có ưu điểm gì so với các phương pháp truyền thống trong phát hiện người?
Deep Learning, đặc biệt là mạng nơ-ron tích chập, tự động trích xuất đặc trưng từ dữ liệu lớn, cho độ chính xác cao và khả năng xử lý đa dạng điều kiện môi trường, vượt trội so với các phương pháp dựa trên đặc trưng thủ công như HOG hay SVM.
Tại sao chọn YOLOv3 làm mô hình phát hiện người?
YOLOv3 cân bằng tốt giữa tốc độ và độ chính xác, xử lý được 20-45 khung hình mỗi giây với mAP trên 55%, phù hợp cho ứng dụng thời gian thực trong giám sát an ninh.
Viola-Jones có thể phát hiện khuôn mặt trong điều kiện ánh sáng yếu không?
Thuật toán Viola-Jones có khả năng phát hiện nhanh và chính xác trong nhiều điều kiện ánh sáng, tuy nhiên hiệu quả giảm khi khuôn mặt bị che khuất hoặc ánh sáng quá yếu, do đó cần kết hợp với các kỹ thuật bổ trợ.
Hệ thống có thể giảm tỷ lệ cảnh báo sai như thế nào?
Bằng cách sử dụng mô hình học sâu kết hợp với các thuật toán tiền xử lý ảnh và lọc nhiễu, hệ thống giảm tỷ lệ cảnh báo sai xuống dưới 5%, giúp tăng độ tin cậy và giảm phiền toái cho người vận hành.
Làm thế nào để triển khai hệ thống này tại các cơ quan khác?
Cần thu thập dữ liệu thực tế tại địa điểm mới, huấn luyện lại mô hình với dữ liệu đặc thù, đồng thời nâng cấp phần cứng camera và đào tạo nhân viên vận hành để đảm bảo hiệu quả tương tự.

Kết luận

Nghiên cứu đã xây dựng thành công mô hình phát hiện người và trích xuất khuôn mặt dựa trên Deep Learning, ứng dụng hiệu quả tại Trung tâm Hành chính tỉnh Bà Rịa – Vũng Tàu.
Mô hình YOLOv3 và thuật toán Viola-Jones phối hợp cho kết quả phát hiện chính xác trên 90% và giảm tỷ lệ cảnh báo sai dưới 5%.
Hệ thống có khả năng xử lý thời gian thực với tốc độ từ 20 đến 45 FPS, phù hợp với yêu cầu giám sát an ninh hiện đại.
Đề xuất triển khai hệ thống giám sát tự động, nâng cấp phần cứng và đào tạo nhân viên để tối ưu hóa hiệu quả vận hành.
Các bước tiếp theo bao gồm mở rộng ứng dụng tại các cơ quan khác, phát triển hệ thống cảnh báo đa kênh và nghiên cứu nâng cao khả năng nhận dạng trong điều kiện phức tạp hơn.

Hãy bắt đầu ứng dụng công nghệ Deep Learning để nâng cao an ninh và bảo vệ tài sản tại đơn vị của bạn ngay hôm nay!

Bài luận văn thạc sĩ mang tiêu đề "Nghiên cứu và ứng dụng deep learning để phát hiện người xâm nhập" của tác giả Mai Xuân Giang, dưới sự hướng dẫn của TS. Phan Ngọc Hoàng tại Trường Đại Học Bà Rịa-Vũng Tàu, tập trung vào việc áp dụng công nghệ deep learning trong việc phát hiện các hành vi xâm nhập. Nghiên cứu này không chỉ cung cấp cái nhìn sâu sắc về các phương pháp hiện đại trong lĩnh vực an ninh mạng mà còn mở ra hướng đi mới cho việc bảo vệ hệ thống thông tin. Độc giả sẽ tìm thấy những lợi ích thiết thực từ việc hiểu rõ cách thức hoạt động của các mô hình học sâu, từ đó có thể áp dụng vào thực tiễn để nâng cao khả năng bảo mật.

Nếu bạn quan tâm đến các khía cạnh khác của công nghệ thông tin và an ninh mạng, hãy khám phá thêm về Các Tấn Công Tích Cực Lên Hệ Thống Thông Tin Di Động 5G, nơi nghiên cứu về các mối đe dọa trong hệ thống thông tin di động hiện đại. Bên cạnh đó, bài viết Khám Phá Bảo Mật Mạng Trong Luận Văn Thạc Sĩ Kỹ Thuật Vô Tuyến Điện Tử MPLS cũng sẽ cung cấp cho bạn cái nhìn tổng quan về các vấn đề bảo mật trong mạng không dây. Cuối cùng, bạn có thể tham khảo Nghiên cứu ứng dụng học máy trong sửa lỗi tự động các lỗ hổng bảo mật để hiểu rõ hơn về cách mà học máy có thể hỗ trợ trong việc bảo vệ an ninh mạng. Những tài liệu này sẽ giúp bạn mở rộng kiến thức và có cái nhìn đa chiều hơn về lĩnh vực công nghệ thông tin.

#an ninh mạng

#phát hiện xâm nhập

#Mô Hình Dự Đoán

#an toàn thông tin

#thuật toán phát hiện

Chủ đề

Công nghệ thông tin

nghiên cứu khoa học

Trí tuệ nhân tạo