Luận văn thạc sĩ công nghệ thông tin nghiên cứu và ứng dụng deep learning phát hiện người xâm nhập

Luận văn thạc sĩ kỹ thuật nghiên cứu công nghệ thông tin nghiên cứu và ứng dụng deep learning phát hiện người xâm nhập, khảo sát thực trạng, phân tích nguyên nhân, đề xuất giải

Trường đại học

Trường Đại Học Bà Rịa-Vũng Tàu

Chuyên ngành

Công Nghệ Thông Tin

Người đăng

Ẩn danh

Thể loại

luận văn thạc sĩ

2021

100

Phí lưu trữ

35 Point

Mục lục chi tiết

LỜI CAM ĐOAN

1. CHƯƠNG 1: TỔNG QUAN VỀ XỬ LÝ ẢNH SỐ, HỌC MÁY VÀ HỌC SÂU

1.1. Xử lý ảnh và các vấn đề cơ bản về xử lý ảnh

1.2. Các vấn đề cơ bản về xử lý ảnh

1.3. Ảnh số và điểm ảnh

1.4. Nắn chỉnh biến dạng

1.5. Một số phương pháp xử lý ảnh số

1.6. Các kỹ thuật lọc nhiễu

1.6.1. Kỹ thuật lọc trung bình

1.6.2. Kỹ thuật lọc trung vị

1.6.3. Lọc thông thấp

1.6.4. Lọc thông cao

1.7. Kỹ thuật phân ngưỡng

1.7.1. Kỹ thuật phân ngưỡng tự động

1.8. Phương pháp sử dụng các điểm biên

1.8.1. Một số kĩ thuật phát hiện biên

1.8.1.1. Kỹ thuật gradient

1.8.1.2. Kỹ thuật Laplace

1.8.1.3. Kỹ thuật sobel

1.8.1.4. Kỹ thuật prewitt

1.9. Các giải thuật học máy

1.10. Các ứng dụng của học máy

1.11. Cách thức hoạt động của học sâu

1.12. Các ứng dụng phổ biến của học sâu

1.12.1. Máy bay không người lái và xe ô tô tự hành

1.12.2. Chatbots và dịch vụ bots

1.12.3. Tô màu hình ảnh

1.12.4. Nhận dạng khuôn mặt

1.12.5. Y học và dược phẩm

1.12.6. Mua sắm và giải trí được cá nhân hóa

2. CHƯƠNG 2: TỔNG QUAN CÁC PHƯƠNG PHÁP NHẬN DẠNG ĐỐI TƯỢNG, PHÁT HIỆN NGƯỜI VÀ KHUÔN MẶT TRÊN ẢNH

2.1. Đặc điểm các loại đối tượng và người

2.2. Các phương pháp nhận dạng đối tượng hiện nay

2.2.1. Phương pháp dựa trên cơ sở tri thức

2.2.2. Phương pháp dựa trên đặc trưng bất biến

2.2.3. Phương pháp dựa trên so khớp mẫu

2.2.4. Phương pháp dựa trên diện mạo

2.3. Các kỹ thuật phát hiện người

2.4. Các kỹ thuật phát hiện khuôn mặt

3. CHƯƠNG 3: THUẬT TOÁN PHÁT HIỆN NGƯỜI VÀ KHUÔN MẶT SỬ DỤNG MẠNG NƠ-RON TÍCH CHẬP, YOLOV3 VÀ THUẬT TOÁN VIOLA-JONES

3.1. Kỹ thuật nhận dạng đối tượng bằng mạng nơ-ron tích chập

3.1.1. Lớp tích chập (Convolution Layer)

3.1.2. Lớp chuyển đổi (ReLU Layer)

3.1.3. Lớp tổng hợp (Pooling Layer)

3.1.4. Lớp kết nối đầy đủ (Fully-Connected Layer)

3.1.5. Các bước thực hiện nhận dạng đối tượng bằng mạng nơ-ron tích chập

3.2. Kỹ thuật nhận dạng đối tượng bằng YOLOv3

3.2.1. Kiến trúc mạng YOLO

3.2.2. Các phiên bản của YOLO

3.2.3. Nhận dạng đối tượng bằng YOLOv3

3.3. Kỹ thuật phát hiện khuôn mặt Viola-Jones

3.3.1. Các đặc trưng Haar-Like

3.3.2. Sơ đồ tìm kiếm khuôn mặt

4. CHƯƠNG 4: KẾT QUẢ THỰC NGHIỆM VÀ ÁP DỤNG TRONG THỰC TẾ

4.1. Mô hình hệ thống dự kiến

4.2. Thuật toán tìm người và khuôn mặt đề xuất

4.2.1. Thuật toán tìm người và khuôn mặt trên ảnh tĩnh

4.2.1.1. Mô hình thuật toán

4.2.2. Thuật toán tìm người và khuôn mặt trên video

4.2.2.1. Mô hình thuật toán

4.2.2.2. Chú thích bằng lời

4.3. Kết quả thực nghiệm

4.4. Đánh giá kết quả

4.5. Kết luận và hướng phát triển

TÀI LIỆU THAM KHẢO

Tóm tắt

I. Tính cấp thiết của đề tài

Đề tài 'Nghiên Cứu & Ứng Dụng Deep Learning Phát Hiện Người Xâm Nhập' được hình thành trong bối cảnh an ninh ngày càng trở nên quan trọng. Việc sử dụng camera giám sát tại các cơ quan nhà nước tại Bà Rịa-Vũng Tàu hiện nay chủ yếu chỉ dừng lại ở việc ghi lại hình ảnh mà chưa có khả năng tự động phát hiện và cảnh báo các hành vi xâm nhập trái phép. Điều này dẫn đến nhu cầu cấp thiết trong việc ứng dụng công nghệ học sâu (Deep Learning) để cải thiện khả năng phát hiện và cảnh báo. Hệ thống giám sát hiện tại chưa đáp ứng được yêu cầu an ninh, đặc biệt trong các tình huống khẩn cấp. Việc áp dụng các thuật toán học sâu có thể giúp tăng cường độ chính xác trong việc phát hiện người xâm nhập, từ đó nâng cao hiệu quả giám sát an ninh.

II. Mục tiêu của đề tài

Mục tiêu tổng quát của đề tài là nghiên cứu và ứng dụng thành công công nghệ học sâu để hỗ trợ việc giám sát, phát hiện và cảnh báo người xâm nhập tại Trung tâm Hành chính tỉnh Bà Rịa-Vũng Tàu. Mục tiêu cụ thể bao gồm việc xây dựng mô hình phát hiện người trên ảnh tĩnh dựa trên mạng nơ-ron tích chập (CNN) và thuật toán nhận dạng đối tượng (YOLOv3). Ngoài ra, đề tài còn hướng đến việc phát triển mô hình trích xuất khuôn mặt người trên ảnh tĩnh và video. Việc áp dụng mô hình này trong thực tế sẽ giúp nâng cao khả năng phát hiện và cảnh báo, từ đó đảm bảo an ninh cho các cơ quan nhà nước.

III. Tổng quan về lĩnh vực nghiên cứu

Lĩnh vực nghiên cứu bao gồm các phương pháp nhận dạng đối tượng và phát hiện người trong ảnh tĩnh và video. Nhận dạng đối tượng là quá trình phân loại các đối tượng dựa trên các mẫu đã biết. Các thuật toán hiện nay chủ yếu áp dụng cho ảnh tĩnh, do đó cần tách các khung hình từ video để áp dụng. Việc áp dụng các phương pháp hiện đại như R-CNN, YOLO, và SSD đã mang lại những bước tiến lớn trong việc phát hiện đối tượng với độ chính xác cao. Các nghiên cứu trước đây đã chứng minh hiệu quả của các phương pháp này trong nhiều lĩnh vực, từ an ninh đến quản lý nhân sự.

IV. Kỹ thuật phát hiện người và khuôn mặt

Đề tài sử dụng các kỹ thuật phát hiện người và khuôn mặt dựa trên mạng nơ-ron tích chập và thuật toán Viola-Jones. Kỹ thuật nhận dạng đối tượng bằng mạng nơ-ron tích chập (CNN) cho phép xử lý hình ảnh một cách hiệu quả, trong khi thuật toán Viola-Jones cung cấp một phương pháp nhanh chóng và chính xác để phát hiện khuôn mặt. Việc kết hợp các kỹ thuật này sẽ tạo ra một hệ thống giám sát an ninh mạnh mẽ, có khả năng phát hiện người xâm nhập trong thời gian thực. Điều này không chỉ giúp nâng cao độ tin cậy của hệ thống giám sát mà còn giảm thiểu các cảnh báo sai lệch.

V. Kết quả thực nghiệm và ứng dụng thực tế

Kết quả thực nghiệm cho thấy mô hình phát hiện người và khuôn mặt hoạt động hiệu quả trong các điều kiện thực tế. Hệ thống đã được triển khai tại Trung tâm Hành chính tỉnh Bà Rịa-Vũng Tàu, cho phép phát hiện người xâm nhập và cảnh báo kịp thời. Việc áp dụng công nghệ học sâu không chỉ nâng cao khả năng giám sát mà còn tạo ra một giải pháp an ninh thông minh, giúp bảo vệ tài sản và an toàn cho các cơ quan nhà nước. Kết quả này mở ra hướng đi mới cho việc ứng dụng công nghệ trong lĩnh vực an ninh.

06/02/2025

Bạn đang xem trước tài liệu:

Luận văn thạc sĩ công nghệ thông tin nghiên cứu và ứng dụng deep learning phát hiện người xâm nhập

Tải đầy đủ

Nội dung chính

Tổng quan nghiên cứu

Trong bối cảnh công nghệ phát triển mạnh mẽ, việc ứng dụng trí tuệ nhân tạo và học sâu (Deep Learning) vào các hệ thống giám sát an ninh ngày càng trở nên cấp thiết. Tại Trung tâm Hành chính tỉnh Bà Rịa – Vũng Tàu, hệ thống camera giám sát hiện có chưa đáp ứng được yêu cầu tự động phát hiện và cảnh báo người xâm nhập trái phép ngoài giờ hành chính. Theo ước tính, việc giám sát thủ công và hệ thống camera truyền thống chưa thể bao quát toàn bộ không gian do diện tích rộng, nhiều lối ra vào và điều kiện thời tiết phức tạp như ban đêm hay mưa bão. Mục tiêu nghiên cứu của luận văn là xây dựng và ứng dụng thành công mô hình học sâu dựa trên mạng nơ-ron tích chập (CNN) và thuật toán YOLOv3 để phát hiện người xâm nhập và trích xuất khuôn mặt trên ảnh tĩnh và video, từ đó hỗ trợ cảnh báo tự động trong thời gian thực tại các cơ quan, đơn vị thuộc Trung tâm Hành chính tỉnh Bà Rịa – Vũng Tàu. Nghiên cứu tập trung trong phạm vi thời gian từ năm 2020 đến 2021, với dữ liệu thu thập từ hệ thống camera giám sát thực tế tại địa phương. Việc ứng dụng Deep Learning trong giám sát an ninh không chỉ nâng cao độ chính xác phát hiện người xâm nhập mà còn giảm thiểu cảnh báo sai, góp phần đảm bảo an toàn, an ninh hiệu quả hơn cho các cơ quan nhà nước.

Cơ sở lý thuyết và phương pháp nghiên cứu

Khung lý thuyết áp dụng

Luận văn dựa trên hai lý thuyết và mô hình nghiên cứu chính:

Xử lý ảnh số và Thị giác máy tính (Computer Vision): Đây là nền tảng để thu nhận, tiền xử lý và trích xuất đặc trưng từ ảnh và video. Các kỹ thuật xử lý ảnh như lọc nhiễu, chỉnh mức xám, phát hiện biên (gradient, Laplace, Sobel, Prewitt) được áp dụng để chuẩn bị dữ liệu đầu vào cho mô hình học sâu.
Học sâu (Deep Learning) với mạng nơ-ron tích chập (CNN) và thuật toán YOLOv3: CNN là mô hình mạng nơ-ron nhân tạo chuyên biệt cho xử lý ảnh, có khả năng tự động trích xuất đặc trưng phân cấp từ thấp đến cao. YOLOv3 là thuật toán nhận dạng đối tượng hiện đại, cho phép phát hiện nhanh và chính xác nhiều đối tượng trong ảnh hoặc video với tốc độ xử lý lên đến 20-45 khung hình mỗi giây (FPS) trên tập dữ liệu COCO. Các khái niệm chính bao gồm lớp tích chập (Convolution Layer), lớp kích hoạt ReLU, lớp tổng hợp (Pooling Layer), và lớp kết nối đầy đủ (Fully-Connected Layer).

Ngoài ra, thuật toán Viola-Jones được sử dụng để phát hiện khuôn mặt dựa trên đặc trưng Haar-Like, phù hợp cho việc trích xuất khuôn mặt sau khi phát hiện người.

Phương pháp nghiên cứu

Nguồn dữ liệu chính là các hình ảnh và video thu thập từ hệ thống camera giám sát tại Trung tâm Hành chính tỉnh Bà Rịa – Vũng Tàu. Cỡ mẫu gồm hàng nghìn ảnh tĩnh và video ghi lại các tình huống có và không có người xâm nhập trong nhiều điều kiện ánh sáng và môi trường khác nhau.

Phương pháp chọn mẫu là lấy mẫu ngẫu nhiên có kiểm soát nhằm đảm bảo đa dạng về góc nhìn, tư thế người và điều kiện môi trường. Phân tích dữ liệu sử dụng các thuật toán học sâu, trong đó mô hình YOLOv3 được huấn luyện và tinh chỉnh trên tập dữ liệu thu thập được, kết hợp với thuật toán Viola-Jones để trích xuất khuôn mặt.

Timeline nghiên cứu kéo dài khoảng 12 tháng, bao gồm các giai đoạn: thu thập dữ liệu, tiền xử lý ảnh, xây dựng và huấn luyện mô hình, thử nghiệm trên ảnh tĩnh và video, đánh giá hiệu quả và triển khai thử nghiệm thực tế.

Kết quả nghiên cứu và thảo luận

Những phát hiện chính

Hiệu quả phát hiện người trên ảnh tĩnh: Mô hình YOLOv3 đạt độ chính xác trung bình (mAP) khoảng 57,9% trên tập dữ liệu COCO, tương đương với các nghiên cứu quốc tế, với tốc độ xử lý 20 FPS. Trong thực nghiệm tại Trung tâm Hành chính, tỷ lệ phát hiện người xâm nhập chính xác đạt trên 90%, giảm thiểu cảnh báo sai so với các hệ thống camera thông minh truyền thống.
Trích xuất khuôn mặt sau phát hiện người: Thuật toán Viola-Jones cho kết quả trích xuất khuôn mặt chính xác trên 85% các ảnh tĩnh có người xâm nhập, ngay cả trong điều kiện ánh sáng yếu hoặc góc chụp không thuận lợi.
Phát hiện người và khuôn mặt trên video: Mô hình kết hợp xử lý ảnh tĩnh từ video cho phép phát hiện người và trích xuất khuôn mặt trong thời gian thực với tốc độ xử lý đạt 20-30 FPS, đảm bảo khả năng cảnh báo kịp thời.
Ứng dụng thực tế tại Trung tâm Hành chính: Hệ thống thử nghiệm cho thấy khả năng phát hiện người xâm nhập ngoài giờ hành chính với tỷ lệ cảnh báo sai dưới 5%, cải thiện đáng kể so với phương pháp giám sát thủ công và camera truyền thống.

Thảo luận kết quả

Nguyên nhân của hiệu quả cao đến từ việc áp dụng mô hình YOLOv3, vốn nổi bật về tốc độ và độ chính xác trong nhận dạng đối tượng đa lớp. So với các thuật toán như HOG hay SSD, YOLOv3 cho phép xử lý nhanh hơn gấp 4 lần trong khi vẫn duy trì độ chính xác cao. Việc kết hợp thuật toán Viola-Jones giúp trích xuất khuôn mặt hiệu quả, hỗ trợ cho các hệ thống nhận dạng và xác thực sau này.

So sánh với các nghiên cứu trong nước và quốc tế, kết quả này phù hợp với xu hướng ứng dụng Deep Learning trong giám sát an ninh hiện đại. Dữ liệu có thể được trình bày qua biểu đồ so sánh mAP và FPS giữa các thuật toán, bảng thống kê tỷ lệ phát hiện chính xác và cảnh báo sai trong các điều kiện thử nghiệm khác nhau.

Ý nghĩa của nghiên cứu là tạo ra một hệ thống giám sát tự động, giảm thiểu sự phụ thuộc vào con người, nâng cao hiệu quả an ninh và tiết kiệm chi phí vận hành.

Đề xuất và khuyến nghị

Triển khai hệ thống giám sát tự động tại các cơ quan nhà nước: Áp dụng mô hình YOLOv3 kết hợp Viola-Jones để phát hiện người xâm nhập và trích xuất khuôn mặt, nhằm nâng cao độ chính xác và giảm thiểu cảnh báo sai. Thời gian thực hiện trong vòng 6 tháng, chủ thể thực hiện là phòng công nghệ thông tin các cơ quan.
Nâng cấp phần cứng camera và máy chủ xử lý: Đầu tư camera có độ phân giải cao và máy chủ có GPU mạnh để đảm bảo tốc độ xử lý tối ưu, đáp ứng yêu cầu xử lý video thời gian thực. Thời gian thực hiện 3-4 tháng, chủ thể là ban quản lý Trung tâm Hành chính.
Đào tạo nhân viên vận hành và bảo trì hệ thống: Tổ chức các khóa đào tạo về vận hành hệ thống Deep Learning và xử lý sự cố nhằm đảm bảo hệ thống hoạt động ổn định. Thời gian đào tạo 2 tháng, chủ thể là đơn vị cung cấp giải pháp và phòng nhân sự.
Phát triển hệ thống cảnh báo tự động qua điện thoại và email: Tích hợp hệ thống gửi cảnh báo tức thì khi phát hiện người xâm nhập, giúp tăng cường phản ứng nhanh chóng. Thời gian phát triển 3 tháng, chủ thể là đội phát triển phần mềm.

Đối tượng nên tham khảo luận văn

Các nhà quản lý an ninh và công nghệ thông tin tại các cơ quan nhà nước: Giúp hiểu rõ về ứng dụng Deep Learning trong giám sát an ninh, từ đó có cơ sở triển khai hệ thống tự động.
Nhà nghiên cứu và sinh viên ngành Công nghệ Thông tin, Trí tuệ Nhân tạo: Cung cấp kiến thức chuyên sâu về xử lý ảnh, học sâu, và các thuật toán phát hiện người, khuôn mặt.
Các doanh nghiệp phát triển giải pháp an ninh và camera giám sát: Tham khảo để cải tiến sản phẩm, tích hợp công nghệ học sâu nâng cao hiệu quả phát hiện và cảnh báo.
Cơ quan quản lý và hoạch định chính sách về an ninh công nghệ: Hỗ trợ xây dựng các tiêu chuẩn, quy định về ứng dụng công nghệ mới trong giám sát an ninh.

Câu hỏi thường gặp

Deep Learning có ưu điểm gì so với các phương pháp truyền thống trong phát hiện người?
Deep Learning, đặc biệt là mạng nơ-ron tích chập, tự động trích xuất đặc trưng từ dữ liệu, cho độ chính xác cao và khả năng xử lý đa dạng tình huống hơn so với các phương pháp dựa trên đặc trưng thủ công như HOG hay SVM.
Tại sao chọn YOLOv3 cho bài toán phát hiện người?
YOLOv3 cân bằng tốt giữa tốc độ và độ chính xác, có thể xử lý 20-45 FPS với mAP trên 50% trên tập COCO, phù hợp cho ứng dụng thời gian thực trong giám sát an ninh.
Viola-Jones có phù hợp để phát hiện khuôn mặt trong điều kiện ánh sáng yếu không?
Viola-Jones hoạt động hiệu quả trong nhiều điều kiện ánh sáng, tuy nhiên độ chính xác có thể giảm khi ánh sáng quá yếu hoặc khuôn mặt bị che khuất. Kết hợp với các kỹ thuật tiền xử lý ảnh giúp cải thiện kết quả.
Hệ thống có thể phát hiện người trong các tình huống phức tạp như che khuất hay nhiều người cùng lúc không?
Mô hình YOLOv3 có khả năng phát hiện đa đối tượng và xử lý một phần che khuất, tuy nhiên hiệu quả giảm khi che khuất quá nhiều hoặc số lượng người quá lớn. Cần bổ sung dữ liệu huấn luyện đa dạng để cải thiện.
Làm thế nào để giảm cảnh báo sai trong hệ thống giám sát?
Sử dụng mô hình học sâu với dữ liệu huấn luyện chất lượng, kết hợp thuật toán trích xuất khuôn mặt để xác thực, đồng thời thiết lập ngưỡng cảnh báo phù hợp giúp giảm thiểu cảnh báo sai.

Kết luận

Nghiên cứu đã xây dựng thành công mô hình phát hiện người và trích xuất khuôn mặt dựa trên mạng nơ-ron tích chập và thuật toán YOLOv3, kết hợp Viola-Jones.
Mô hình đạt độ chính xác phát hiện người trên 90% và trích xuất khuôn mặt trên 85% trong điều kiện thực tế tại Trung tâm Hành chính tỉnh Bà Rịa – Vũng Tàu.
Hệ thống có khả năng xử lý video thời gian thực với tốc độ 20-30 FPS, phù hợp cho ứng dụng giám sát an ninh tự động.
Đề xuất triển khai hệ thống giám sát tự động, nâng cấp phần cứng và đào tạo nhân viên để đảm bảo hiệu quả vận hành.
Các bước tiếp theo bao gồm mở rộng dữ liệu huấn luyện, tích hợp hệ thống cảnh báo tự động và phát triển các ứng dụng nhận dạng nâng cao.

Hãy bắt đầu ứng dụng công nghệ Deep Learning để nâng cao hiệu quả giám sát an ninh ngay hôm nay!

Bài viết "Luận Văn Thạc Sĩ CNTT: Nghiên Cứu & Ứng Dụng Deep Learning Phát Hiện Người Xâm Nhập" khám phá cách mà công nghệ Deep Learning có thể được áp dụng để phát hiện các hành vi xâm nhập trong hệ thống mạng. Tác giả trình bày các phương pháp và thuật toán hiện đại, cùng với những thách thức và giải pháp trong việc bảo mật thông tin. Bài viết không chỉ cung cấp cái nhìn sâu sắc về lĩnh vực an ninh mạng mà còn giúp người đọc hiểu rõ hơn về cách mà trí tuệ nhân tạo có thể cải thiện khả năng phát hiện và ngăn chặn các mối đe dọa.

Nếu bạn muốn mở rộng kiến thức của mình về các ứng dụng công nghệ trong lĩnh vực CNTT, hãy tham khảo thêm bài viết Luận văn thạc sĩ kỹ thuật viễn thông phân loại chủ đề bản tin online sử dụng máy học, nơi bạn sẽ tìm hiểu về cách máy học có thể phân loại thông tin hiệu quả. Ngoài ra, bài viết Luận văn thạc sĩ khoa học máy tính nghiên cứu các phương pháp trích xuất thông tin trong ảnh tài liệu và ứng dụng sẽ giúp bạn khám phá thêm về việc trích xuất thông tin từ hình ảnh, một lĩnh vực liên quan mật thiết đến Deep Learning. Cuối cùng, bạn cũng có thể tìm hiểu về Nghiên cứu thuật toán mã hóa có xác thực norx luận văn thạc sĩ, để nắm bắt thêm về các phương pháp bảo mật thông tin trong công nghệ hiện đại. Những tài liệu này sẽ giúp bạn có cái nhìn toàn diện hơn về các ứng dụng của công nghệ trong lĩnh vực CNTT.

#Luận văn Thạc sĩ

#an ninh mạng

#công nghệ thông tin

#hệ thống phát hiện xâm nhập

#Phát Hiện Người Xâm Nhập

#Nghiên Cứu CNTT

Chủ đề

Công nghệ thông tin

Học Sâu (Deep Learning)

Ứng Dụng AI trong Bảo Mật

Luận văn thạc sĩ công nghệ thông tin nghiên cứu và ứng dụng deep learning phát hiện người xâm nhập

LỜI CAM ĐOAN

1. CHƯƠNG 1: TỔNG QUAN VỀ XỬ LÝ ẢNH SỐ, HỌC MÁY VÀ HỌC SÂU

1.1. Xử lý ảnh và các vấn đề cơ bản về xử lý ảnh

1.2. Các vấn đề cơ bản về xử lý ảnh

1.3. Ảnh số và điểm ảnh

1.4. Nắn chỉnh biến dạng

1.5. Một số phương pháp xử lý ảnh số

1.6. Các kỹ thuật lọc nhiễu

1.6.1. Kỹ thuật lọc trung bình

1.6.2. Kỹ thuật lọc trung vị

1.6.3. Lọc thông thấp

1.6.4. Lọc thông cao

1.7. Kỹ thuật phân ngưỡng

1.7.1. Kỹ thuật phân ngưỡng tự động

1.8. Phương pháp sử dụng các điểm biên

1.8.1. Một số kĩ thuật phát hiện biên

1.8.1.1. Kỹ thuật gradient

1.8.1.2. Kỹ thuật Laplace

1.8.1.3. Kỹ thuật sobel

1.8.1.4. Kỹ thuật prewitt

1.9. Các giải thuật học máy

1.10. Các ứng dụng của học máy

1.11. Cách thức hoạt động của học sâu

1.12. Các ứng dụng phổ biến của học sâu

1.12.1. Máy bay không người lái và xe ô tô tự hành

1.12.2. Chatbots và dịch vụ bots

1.12.3. Tô màu hình ảnh

1.12.4. Nhận dạng khuôn mặt

1.12.5. Y học và dược phẩm

1.12.6. Mua sắm và giải trí được cá nhân hóa

2. CHƯƠNG 2: TỔNG QUAN CÁC PHƯƠNG PHÁP NHẬN DẠNG ĐỐI TƯỢNG, PHÁT HIỆN NGƯỜI VÀ KHUÔN MẶT TRÊN ẢNH

2.1. Đặc điểm các loại đối tượng và người

2.2. Các phương pháp nhận dạng đối tượng hiện nay

2.2.1. Phương pháp dựa trên cơ sở tri thức

2.2.2. Phương pháp dựa trên đặc trưng bất biến

2.2.3. Phương pháp dựa trên so khớp mẫu

2.2.4. Phương pháp dựa trên diện mạo

2.3. Các kỹ thuật phát hiện người

2.4. Các kỹ thuật phát hiện khuôn mặt

3. CHƯƠNG 3: THUẬT TOÁN PHÁT HIỆN NGƯỜI VÀ KHUÔN MẶT SỬ DỤNG MẠNG NƠ-RON TÍCH CHẬP, YOLOV3 VÀ THUẬT TOÁN VIOLA-JONES

3.1. Kỹ thuật nhận dạng đối tượng bằng mạng nơ-ron tích chập

3.1.1. Lớp tích chập (Convolution Layer)

3.1.2. Lớp chuyển đổi (ReLU Layer)

3.1.3. Lớp tổng hợp (Pooling Layer)

3.1.4. Lớp kết nối đầy đủ (Fully-Connected Layer)

3.1.5. Các bước thực hiện nhận dạng đối tượng bằng mạng nơ-ron tích chập

3.2. Kỹ thuật nhận dạng đối tượng bằng YOLOv3

3.2.1. Kiến trúc mạng YOLO

3.2.2. Các phiên bản của YOLO

3.2.3. Nhận dạng đối tượng bằng YOLOv3

3.3. Kỹ thuật phát hiện khuôn mặt Viola-Jones

3.3.1. Các đặc trưng Haar-Like

3.3.2. Sơ đồ tìm kiếm khuôn mặt

4. CHƯƠNG 4: KẾT QUẢ THỰC NGHIỆM VÀ ÁP DỤNG TRONG THỰC TẾ

4.1. Mô hình hệ thống dự kiến

4.2. Thuật toán tìm người và khuôn mặt đề xuất

4.2.1. Thuật toán tìm người và khuôn mặt trên ảnh tĩnh

4.2.1.1. Mô hình thuật toán

4.2.2. Thuật toán tìm người và khuôn mặt trên video

4.2.2.1. Mô hình thuật toán

4.2.2.2. Chú thích bằng lời

4.3. Kết quả thực nghiệm

4.4. Đánh giá kết quả

4.5. Kết luận và hướng phát triển

TÀI LIỆU THAM KHẢO

I. Tính cấp thiết của đề tài

II. Mục tiêu của đề tài

III. Tổng quan về lĩnh vực nghiên cứu

IV. Kỹ thuật phát hiện người và khuôn mặt

V. Kết quả thực nghiệm và ứng dụng thực tế

Tài liệu liên quan

THÔNG TIN CHI TIẾT

Tác giả: Mai Xuân Giang

Người hướng dẫn: TS. Phan Ngọc Hoàng

Trường học: Trường Đại Học Bà Rịa-Vũng Tàu

Chuyên ngành: Công Nghệ Thông Tin

Đề tài: Nghiên Cứu & Ứng Dụng Deep Learning Phát Hiện Người Xâm Nhập

Loại tài liệu: luận văn thạc sĩ

Năm xuất bản: 2021