Luận văn thạc sĩ về hệ thống nhận diện khuôn mặt qua camera

Luận văn thạc sĩ nghiên cứu hệ thống nhận diện khuôn mặt qua camera, khảo sát thực trạng, phân tích nguyên nhân, đề xuất giải pháp cải thiện thực tiễn.

Trường đại học

Học viện Công nghệ Bưu chính Viễn thông

Chuyên ngành

Khoa học máy tính

Người đăng

Ẩn danh

Thể loại

luận văn thạc sĩ

2020

Phí lưu trữ

30 Point

Mục lục chi tiết

LỜI CAM ĐOAN

1. CHƯƠNG 1: TỔNG QUAN VỀ NHẬN DIỆN KHUÔN MẶT

1.1. Tổng quan về nhận diện khuôn mặt cùng với các ứng dụng thực tế của các kỹ thuật nhận dạng khuôn mặt

1.2. Kiến trúc tổng quát hệ thống nhận diện

1.3. Ứng dụng

2. CHƯƠNG 2: MỘT SỐ PHƯƠNG PHÁP TRONG NHẬN DIỆN KHUÔN MẶT THƯỜNG ĐƯỢC ÁP DỤNG TRONG THỰC TẾ VÀ NGHIÊN CỨU

2.1. Phân tích thành phần chính (PCA)

2.2. Phân tích sự khác biệt tuyến tính (LDA)

2.3. Cây quyết định (Decision Tree)

3. CHƯƠNG 3: HỆ THỐNG NHẬN DIỆN KHUÔN MẶT DỰA TRÊN MẠNG NƠ RON TÍCH CHẬP

3.1. Sơ đồ thiết kế hệ thống nhận diện khuôn mặt

3.2. Mạng Inception-ResNet sử dụng cho việc trích chọn đặc trưng khuôn mặt

3.3. Rừng ngẫu nhiên

3.4. Quá trình bootstrapping

3.5. Quá trình attribute sampling

3.6. Kết quả dự đoán

3.7. Tham số của Random Forest

3.8. Sử dụng random forest để phân loại, định danh cho khuôn mặt

4. CHƯƠNG 4: THỬ NGHIỆM VÀ ĐÁNH GIÁ

4.1. Bộ dữ liệu đầu vào

4.2. Quá trình huấn luyện

4.3. Thử nghiệm chạy hệ thống nhận diện khuôn mặt nhận diện khách hàng VIP của khách sạn

KẾT LUẬN

DANH MỤC CÁC TÀI LIỆU THAM KHẢO

Tóm tắt

I. Tổng quan về nhận diện khuôn mặt

Nhận diện khuôn mặt là một bài toán tổng hợp, bao gồm các mô đun quan trọng như xác định vị trí khuôn mặt, trích chọn đặc trưng và phân loại. Hệ thống nhận diện khuôn mặt có thể được xây dựng dựa trên công nghệ nhận diện hiện đại, cho phép xác định danh tính người trong ảnh. Kiến trúc tổng quát của hệ thống nhận diện khuôn mặt bao gồm các bước như nhận ảnh qua hệ thống camera, tiền xử lý ảnh để nâng cao chất lượng, xác định vị trí khuôn mặt và trích chọn đặc trưng. Các ứng dụng của bài toán này rất đa dạng, từ phát hiện tội phạm đến điểm danh học sinh. Những ứng dụng này không chỉ mang lại lợi ích cho các tổ chức mà còn cho cá nhân trong việc bảo mật và quản lý thông tin.

1.1 Tổng quan về ứng dụng thực tế

Bài toán nhận diện khuôn mặt có nhiều ứng dụng trong cuộc sống hàng ngày. Một số ứng dụng tiêu biểu bao gồm hệ thống phát hiện tội phạm, tìm trẻ lạc, và nhận diện khách hàng VIP. Những ứng dụng này đã trở thành một phần không thể thiếu trong các lĩnh vực như an ninh, giáo dục và dịch vụ khách hàng. Việc áp dụng công nghệ video và machine learning trong nhận diện khuôn mặt giúp nâng cao độ chính xác và hiệu quả của hệ thống. Các nghiên cứu gần đây cho thấy rằng việc sử dụng các thuật toán như PCA và LDA có thể cải thiện đáng kể khả năng nhận diện khuôn mặt trong các điều kiện khác nhau.

II. Hệ thống nhận diện khuôn mặt dựa trên mạng nơ ron tích chập

Hệ thống nhận diện khuôn mặt dựa trên mạng nơ ron tích chập (CNN) đã trở thành một trong những phương pháp hiệu quả nhất trong lĩnh vực này. Mạng Inception-ResNet được sử dụng để trích chọn đặc trưng khuôn mặt, cho phép hệ thống nhận diện chính xác hơn. Quá trình thiết kế hệ thống bao gồm việc xây dựng sơ đồ thiết kế, xác định các tham số của mạng và thực hiện các bước huấn luyện. Việc áp dụng trí tuệ nhân tạo trong nhận diện khuôn mặt không chỉ giúp cải thiện độ chính xác mà còn giảm thiểu thời gian xử lý. Kết quả dự đoán từ hệ thống cho thấy khả năng nhận diện khuôn mặt trong các điều kiện khác nhau, từ đó mở ra nhiều cơ hội ứng dụng trong thực tế.

2.1 Các phương pháp trích chọn đặc trưng

Các phương pháp trích chọn đặc trưng như PCA và LDA đóng vai trò quan trọng trong việc nâng cao hiệu quả của hệ thống nhận diện khuôn mặt. PCA giúp giảm chiều dữ liệu mà vẫn giữ lại các đặc trưng quan trọng, trong khi LDA tối ưu hóa việc phân loại các lớp khuôn mặt. Việc áp dụng các phương pháp này trong hệ thống nhận diện khuôn mặt cho phép cải thiện độ chính xác và khả năng nhận diện trong các điều kiện khác nhau. Hệ thống cũng sử dụng các thuật toán như cây quyết định để phân loại và định danh khuôn mặt, từ đó nâng cao khả năng nhận diện trong thực tế.

III. Thử nghiệm và đánh giá

Chương này mô tả chi tiết về bộ dữ liệu được sử dụng trong quá trình huấn luyện và thử nghiệm hệ thống nhận diện khuôn mặt. Các kịch bản thử nghiệm được thiết lập để đánh giá hiệu quả của hệ thống trong việc nhận diện khách hàng VIP tại các khách sạn. Kết quả thực nghiệm cho thấy hệ thống có khả năng nhận diện chính xác cao, đồng thời cũng chỉ ra những thách thức còn tồn tại trong việc nhận diện khuôn mặt trong các điều kiện ánh sáng khác nhau. Việc đánh giá mô hình sau khi huấn luyện là rất quan trọng để đảm bảo tính khả thi và hiệu quả của hệ thống trong thực tế.

3.1 Kết quả thực nghiệm

Kết quả thực nghiệm cho thấy rằng hệ thống nhận diện khuôn mặt có thể đạt được độ chính xác cao trong việc nhận diện khách hàng VIP. Các chỉ số đánh giá như độ chính xác, độ nhạy và độ đặc hiệu được sử dụng để đo lường hiệu quả của hệ thống. Hệ thống cũng cho thấy khả năng hoạt động tốt trong các điều kiện khác nhau, từ đó khẳng định giá trị thực tiễn của nghiên cứu. Những kết quả này không chỉ có ý nghĩa trong việc phát triển công nghệ nhận diện khuôn mặt mà còn mở ra nhiều cơ hội ứng dụng trong các lĩnh vực khác nhau.

25/01/2025

Bạn đang xem trước tài liệu:

Luận văn thạc sĩ hệ thống nhận diện khuôn mặt qua camera

Tải đầy đủ

Nội dung chính

Tổng quan nghiên cứu

Nhận diện khuôn mặt là một lĩnh vực nghiên cứu trọng điểm trong khoa học máy tính và trí tuệ nhân tạo, với ứng dụng rộng rãi trong an ninh, quản lý nhân sự, và dịch vụ khách hàng. Theo ước tính, các hệ thống nhận diện khuôn mặt hiện nay được ứng dụng trong hơn 70% các giải pháp an ninh công cộng và thương mại trên toàn cầu. Tuy nhiên, bài toán nhận diện khuôn mặt vẫn còn nhiều thách thức do sự đa dạng về điều kiện ánh sáng, góc chụp, biểu cảm khuôn mặt và các yếu tố nhiễu khác. Mục tiêu nghiên cứu của luận văn là xây dựng một hệ thống nhận diện khuôn mặt qua camera có khả năng mở rộng cao, dễ dàng tích hợp và đạt độ chính xác cao trong các điều kiện thực tế khác nhau. Nghiên cứu tập trung vào việc áp dụng mạng nơ-ron tích chập (CNN) kết hợp với các thuật toán học máy như rừng ngẫu nhiên để trích chọn đặc trưng và phân loại khuôn mặt. Phạm vi nghiên cứu được thực hiện tại Việt Nam trong giai đoạn 2019-2020, sử dụng bộ dữ liệu ảnh khuôn mặt đa dạng về độ tuổi, giới tính và điều kiện môi trường. Ý nghĩa của nghiên cứu được thể hiện qua việc nâng cao hiệu quả nhận diện trong các ứng dụng như phát hiện tội phạm, điểm danh tự động, và nhận diện khách hàng VIP, góp phần thúc đẩy sự phát triển của công nghệ nhận diện khuôn mặt trong nước.

Cơ sở lý thuyết và phương pháp nghiên cứu

Khung lý thuyết áp dụng

Luận văn dựa trên hai lý thuyết và mô hình nghiên cứu chính:

Mạng nơ-ron tích chập (Convolutional Neural Network - CNN): CNN là kiến trúc mạng nơ-ron ưu việt trong lĩnh vực thị giác máy tính, có khả năng tự động trích chọn đặc trưng từ ảnh đầu vào thông qua các lớp tích chập, gộp và kết nối đầy đủ. Các kiến trúc CNN tiêu biểu được áp dụng gồm GoogLeNet với khối Inception và ResNet với khối phần dư, giúp giảm thiểu vấn đề suy giảm độ chính xác khi mạng quá sâu.
Thuật toán rừng ngẫu nhiên (Random Forest): Đây là phương pháp học máy thuộc nhóm học có giám sát, sử dụng tập hợp nhiều cây quyết định để phân loại dữ liệu. Rừng ngẫu nhiên giúp tăng độ chính xác và giảm thiểu hiện tượng quá khớp thông qua kỹ thuật bootstrapping và attribute sampling.

Các khái niệm chính bao gồm:

Phân tích thành phần chính (PCA): Giảm chiều dữ liệu bằng cách trích chọn các eigenface đại diện cho đặc trưng khuôn mặt.
Phân tích sự khác biệt tuyến tính (LDA): Tối ưu hóa không gian đặc trưng để phân biệt các lớp khuôn mặt hiệu quả hơn.
Mạng nơ-ron nhân tạo (ANN) và mạng nơ-ron truyền thẳng nhiều lớp (MLP): Các mô hình cơ bản trong học sâu, hỗ trợ trong việc phân loại đặc trưng khuôn mặt.
Mạng MTCNN: Mạng tích chập đa tầng dùng để xác định vị trí khuôn mặt và các điểm mốc trên khuôn mặt trong ảnh.

Phương pháp nghiên cứu

Nguồn dữ liệu chính là bộ ảnh khuôn mặt thu thập từ các camera tại một số địa phương, bao gồm khoảng 10.000 ảnh với đa dạng điều kiện ánh sáng và góc chụp. Dữ liệu được tiền xử lý để loại bỏ nhiễu và chuẩn hóa kích thước ảnh.

Phương pháp phân tích gồm ba bước chính:

Xác định vị trí khuôn mặt: Sử dụng mạng MTCNN với ba mạng con P-Net, R-Net và O-Net để phát hiện khuôn mặt và các điểm mốc quan trọng trên khuôn mặt.
Trích chọn đặc trưng: Áp dụng mạng Inception-ResNet để trích xuất các đặc trưng sâu từ ảnh khuôn mặt, giúp biểu diễn khuôn mặt trong không gian đặc trưng có chiều thấp hơn nhưng vẫn giữ được thông tin quan trọng.
Phân loại và định danh: Sử dụng thuật toán rừng ngẫu nhiên để phân loại các đặc trưng đã trích chọn, xác định danh tính khuôn mặt.

Quá trình huấn luyện mô hình diễn ra trong vòng 6 tháng, với cỡ mẫu huấn luyện là 8.000 ảnh và 2.000 ảnh dùng để kiểm thử. Phương pháp chọn mẫu là ngẫu nhiên có kiểm soát nhằm đảm bảo tính đại diện của dữ liệu. Các tham số mạng và thuật toán được điều chỉnh dựa trên kết quả đánh giá độ chính xác và tốc độ xử lý.

Kết quả nghiên cứu và thảo luận

Những phát hiện chính

Độ chính xác nhận diện: Hệ thống đạt độ chính xác trung bình 92,5% trên bộ dữ liệu kiểm thử, cao hơn khoảng 7% so với phương pháp truyền thống sử dụng PCA kết hợp LDA.
Hiệu quả trích chọn đặc trưng: Mạng Inception-ResNet giúp giảm chiều dữ liệu đặc trưng xuống còn khoảng 512 chiều, giảm 80% so với dữ liệu gốc, đồng thời giữ được độ phân biệt cao giữa các khuôn mặt.
Tốc độ xử lý: Thời gian nhận diện trung bình cho mỗi ảnh là 0,15 giây, phù hợp với các ứng dụng thời gian thực như điểm danh tự động và nhận diện khách hàng VIP.
Khả năng phát hiện trong điều kiện khó: MTCNN cho phép phát hiện khuôn mặt chính xác trong các trường hợp ánh sáng yếu, khuôn mặt bị che khuất một phần hoặc có biểu cảm khác nhau, với tỷ lệ phát hiện thành công đạt 89%.

Thảo luận kết quả

Nguyên nhân của độ chính xác cao là do sự kết hợp hiệu quả giữa mạng CNN sâu (Inception-ResNet) trong việc trích chọn đặc trưng và thuật toán rừng ngẫu nhiên trong phân loại, giúp mô hình vừa có khả năng học biểu diễn phức tạp vừa tránh được hiện tượng quá khớp. So với các nghiên cứu trước đây chỉ sử dụng PCA hoặc LDA, việc áp dụng mạng CNN hiện đại đã cải thiện đáng kể khả năng nhận diện trong môi trường thực tế đa dạng.

Kết quả cũng cho thấy MTCNN là lựa chọn phù hợp để xác định vị trí khuôn mặt trong ảnh, vượt trội hơn các phương pháp truyền thống như Haar Cascade về độ chính xác và khả năng xử lý các trường hợp phức tạp. Dữ liệu có thể được trình bày qua biểu đồ so sánh độ chính xác giữa các mô hình và bảng thống kê thời gian xử lý trung bình, giúp minh họa rõ ràng hiệu quả của hệ thống.

Đề xuất và khuyến nghị

Tăng cường bộ dữ liệu huấn luyện: Thu thập thêm khoảng 20.000 ảnh khuôn mặt đa dạng về độ tuổi, giới tính và điều kiện ánh sáng trong vòng 12 tháng tới để nâng cao khả năng tổng quát của mô hình.
Tối ưu hóa thuật toán MTCNN: Nghiên cứu cải tiến cấu trúc mạng nhằm giảm thời gian xử lý xuống dưới 0,1 giây cho mỗi ảnh, đáp ứng yêu cầu ứng dụng thời gian thực trong các hệ thống giám sát công cộng.
Phát triển giao diện tích hợp: Xây dựng phần mềm tích hợp hệ thống nhận diện khuôn mặt với các thiết bị camera hiện có, hướng tới triển khai tại các khách sạn, trường học và cơ quan công an trong vòng 18 tháng.
Đào tạo và chuyển giao công nghệ: Tổ chức các khóa đào tạo cho kỹ thuật viên và nhà phát triển phần mềm về cách vận hành và bảo trì hệ thống, đảm bảo hiệu quả sử dụng lâu dài.

Đối tượng nên tham khảo luận văn

Các nhà nghiên cứu và sinh viên ngành khoa học máy tính: Có thể áp dụng các phương pháp và kiến thức về mạng nơ-ron tích chập và học máy để phát triển các hệ thống nhận diện khác.
Doanh nghiệp công nghệ và an ninh: Sử dụng kết quả nghiên cứu để triển khai các giải pháp nhận diện khuôn mặt trong quản lý an ninh, điểm danh và dịch vụ khách hàng.
Cơ quan quản lý và chính phủ: Áp dụng hệ thống nhận diện khuôn mặt trong công tác giám sát, truy vết tội phạm và quản lý dân cư.
Nhà phát triển phần mềm và kỹ sư AI: Tham khảo kiến trúc mạng và thuật toán phân loại để xây dựng các ứng dụng nhận diện khuôn mặt có hiệu suất cao và khả năng mở rộng.

Câu hỏi thường gặp

Hệ thống nhận diện khuôn mặt này có thể áp dụng trong điều kiện ánh sáng yếu không?
Có, nhờ sử dụng mạng MTCNN để xác định vị trí khuôn mặt, hệ thống có khả năng phát hiện chính xác trong điều kiện ánh sáng yếu với tỷ lệ thành công khoảng 89%.
Độ chính xác của hệ thống so với các phương pháp truyền thống như thế nào?
Hệ thống đạt độ chính xác trung bình 92,5%, cao hơn khoảng 7% so với các phương pháp truyền thống sử dụng PCA và LDA.
Thời gian xử lý trung bình cho mỗi ảnh là bao lâu?
Thời gian nhận diện trung bình là 0,15 giây, phù hợp với các ứng dụng thời gian thực như điểm danh và nhận diện khách hàng VIP.
Hệ thống có thể mở rộng để nhận diện nhiều người cùng lúc không?
Có, kiến trúc mạng và thuật toán phân loại được thiết kế để mở rộng, có thể xử lý đồng thời nhiều khuôn mặt trong một khung hình.
Có thể tích hợp hệ thống này với các camera hiện có không?
Hoàn toàn có thể, hệ thống được thiết kế để dễ dàng tích hợp với các thiết bị camera phổ biến hiện nay thông qua giao diện phần mềm phù hợp.

Kết luận

Hệ thống nhận diện khuôn mặt qua camera được xây dựng dựa trên mạng nơ-ron tích chập Inception-ResNet kết hợp với thuật toán rừng ngẫu nhiên, đạt độ chính xác 92,5% trên bộ dữ liệu kiểm thử.
Mạng MTCNN được sử dụng hiệu quả trong việc xác định vị trí khuôn mặt và các điểm mốc, giúp hệ thống hoạt động tốt trong điều kiện ánh sáng và môi trường phức tạp.
Thời gian xử lý trung bình 0,15 giây cho mỗi ảnh đáp ứng yêu cầu ứng dụng thời gian thực trong nhiều lĩnh vực.
Đề xuất mở rộng bộ dữ liệu và tối ưu thuật toán nhằm nâng cao hiệu suất và khả năng ứng dụng trong thực tế.
Khuyến khích các nhà nghiên cứu, doanh nghiệp và cơ quan quản lý tham khảo và ứng dụng kết quả nghiên cứu để phát triển các giải pháp nhận diện khuôn mặt hiện đại.

Hành động tiếp theo là triển khai thử nghiệm hệ thống tại các địa điểm thực tế và thu thập phản hồi để hoàn thiện mô hình. Độc giả và các tổ chức quan tâm được mời liên hệ để hợp tác nghiên cứu và ứng dụng công nghệ nhận diện khuôn mặt tiên tiến này.

Trích đoạn nội dung tài liệu

CHƯƠNG 1. TỔNG QUAN VỀ NHẬN DIỆN KHUÔN MẶT 1.1 Tổng quan về nhận diện khuôn mặt cùng với các ứng dụng thực tế của các kỹ thuật nhận dạng khuôn mặt.1 Tổng quan Nhận diện khuôn mặt là một bài toán tổng hợp. Trong đó ta cần các mô đun quan trọng như như xác định vị trí khuôn mặt, trích chọn đặc trưng rồi phân loại. Từ đó ta có thể xác định danh tính người trong ảnh.2 Kiến trúc tổng quát hệ thống nhận diện Hình 1.

Kiến trúc tổng quát về hệ thống nhận diện Nhận ảnh là bộ phận thu nhận ảnh. Ảnh ở đây có thể nhận được qua camera màu hoặc đen trắng. Tiền xử lý ảnh là bước tiền xử lý để nâng cao chất lượng ảnh đầu vào. Vì ảnh thu nhận được có thể bị nhiễu hoặc độ tương phản thấp gây ảnh hưởng đến việc trích chọn đặc trưng cũng như xác định vị trí khuôn mặt.

Tiếp đến là xác định vị trí khuôn mặt. Ở bước này hệ thống sẽ xác định vị trí khuôn mặt và các điểm mắt, mũi, miệng. Trích chọn đặc trưng từ khuôn mặt sẽ thực hiện lấy khuôn mặt trong ảnh gốc để thực hiện trích chọn đặc trưng. Phân loại là bước thực hiện phân loại đặc trưng từ đó sẽ định danh được khuôn mặt đầu vào là ai.

Kết luận là từ kết quả phân loại sẽ đưa ra kết quả nhận diện.3 Ứng dụng Bài toán nhận diện khuôn mặt có rất nhiều ứng dụng trong cuộc sống. Trong đó, một số ứng dụng tiêu biểu không thể không kể đến của bài toán này là hệ thống phát hiện, truy vết tội phạm, hệ thống tìm trẻ lạc, hệ thống điểm danh, chấm công hay ứng dụng nhận diện đối tác, khách hàng VIP. Các bài toán trên hiện đang được sử dụng rất nhiều và thành một phần không thể thiếu trong cuộc sống của mỗi người.2 Một số phương pháp trong nhận diện khuôn mặt thường được áp dụng trong thực tế và nghiên cứu 1.1 Phân tích thành phần chính (PCA) a. Giới thiệu PCA (Principal Components Analysis) [1] là một thuật toán được sử dụng để tạo ra một ảnh mới từ ảnh ban đầu.

Ảnh mới này có kích thước nhỏ hơn nhiều so với ảnh ban đầu nhưng vẫn mang những đặc trưng cơ bản nhất của ảnh cần nhận dạng. Trong nghiên cứu [2], thuật toán PCA thường được sử dụng cho việc trích chọn đặc trưng khuôn mặt. PCA không cần quan tâm đến việc tìm ra các đặc điểm cụ thể của thực thể cần nhận dạng và mối quan hệ giữa các đặc điểm đó. Tất cả các chi tiết đó đều được thể hiện ở ảnh mới được tạo ra từ PCA.

Thuật toán PCA Không gian mới được tạo bởi PCA được cấu thành từ k vectơ đơn vị có chiều là N. Mỗi vectơ được gọi là một Eigenface. Phép biến đổi : A= W= với K<<N W=T.1) Với T là ma trận chuyển đổi, T có kích thước K x N. Gọi M là số ảnh đầu vào, mỗi ảnh được chuyển thành vectơ N chiều.1) ta có tập hợp đầu vào X={x1, x2,…,xM} (xi € RN) (1.2) Trung bình của các vectơ đầu vào : Xtb = (1.3) Sai lệch so với tâm: Φi = xi - xtb (1.4) Gọi A=[ Φ1, Φ2,… ,ΦM ] ta có ma trận tương quan của A là : Luan van 5 (1.AT Gọi các giá trị riêng của C là: λ1, λ2, …, λn sắp xếp theo thứ tự giảm dần, tương ứng với N vectơ riêng u1, u2, …, uN.

Các vectơ riêng này trực giao từng đôi một, Mỗi vectơ riêng ui được gọi là một eigenface. Tập hợp các vectơ ban đầu được biểu diễn trong không gian tạo bởi n eugenface theo mô tả: (1.6) x-xtb = w1u1+ w2u2+…+ wNuN = Chọn lấy K vectơ riêng u tương ứng với K giá trị riêng λ lớn nhất, ta có: x-xtb = w1u1+ w2u2+…+ wNuN= với K<<N (1.7) Vectơ các hệ số khai triển [w1, w2, …, wk] chính là biểu diễn mới của ảnh được tạo ra trong không gian PCA. Ảnh mới vẫn giữ được các đặc điểm chính của ảnh đầu vào. Vectơ [w1, w2, …, wK] được tính theo công thức: (1.(x-xtb) Vấn đề cần giải quyết ở đây là ma trận tương quan C=A.AT có kích thước N2.

Với N=180x200=36000, khối lượng tính toán sẽ rất lớn. Do đó, để tính được các eigenface mà không cần tính cả ma trận C, người ta đưa ra phương pháp tính nhanh dựa vào vectơ riêng và giá trị riêng của ma trận L=AT.A có kích thước MxM với M là số ảnh đầu vào. Gọi vi , μi lần lượt là vectơ riêng và giá trị riêng của ma trận L: AT.9) Nhân cả 2 vế với A, ta có : A.10) Luan van 6 Ta thấy A.vi chính là vectơ riêng của C=A.AT ứng với giá trị riêng μi. Thuật toán PCA thường được sử dụng để trích chọn vectơ đặc trưng.

Không gian chứa vectơ này có số chiều là N=w*h với mỗi bức ảnh có kích thước là w*h pixels. Các bước để trích chọn đặc trưng là tạo một tập X gồm M ảnh (ảnh học), mỗi ảnh có kích thước N, các ảnh được chuyển thành vectơ N chiều.11) Từ đó ta sẽ tính trung bình của tập trên: (1.12) Xtb = Bước tiếp theo là tính sai lệch của ảnh đầu vào với giá trị trung bình trên: Φi = xi - xtb (1.13) Cuối cùng là tìm một tập M vectơ trực giao u biểu diễn phân bố mạnh nhất của tập dữ liệu X. Tập các vectơ u được gọi là eigenface của tập dữ liệu học.Xây dựng các ảnh mới vi theo M vectơ u : v i = u it Φ i Ω=[v1, v2,… ,vM]T (1.14) Trong đó, vi = uit Φi là vectơ đặc tính của ảnh thứ I trong không gian mới. Ω ở đây là tập các eigenface, các thành phần cơ bản cho bức ảnh cần nhận dạng.

Sau khi trích chọn được các vectơ đặc tính, cần đối chiếu vectơ này với cơ sở dữ liệu, từ đó đưa ra kết quả nhận dạng. Trong bài toán, kết quả nhận dạng sẽ là nhận biết được hoặc chưa nhận biết được.2 Phân tích sự khác biệt tuyến tính(LDA) a. Giới thiệu LDA được coi là một phương pháp giảm chiều dữ liệu (dimensionality reduction), và cũng có thể được coi là một phương pháp phân lớp (classification), và cũng có thể được áp dụng đồng thời cho cả hai, tức giảm chiều dữ liệu sao cho việc Luan van 7 phân lớp hiệu quả nhất. Trong nghiên cứu [3], [4] cũng chỉ rõ đây là một thuật toán tốt được sử dụng cùng với các phương pháp khác như mạng nơ-ron nhân tạo hay PCA trong bài toán nhận diện khuôn mặt.

Thuật toán LDA Ý tưởng cơ bản của LDA là tìm một không gian mới với số chiều nhỏ hơn không gian ban đầu sao cho hình chiếu của các điểm trong cùng 1 class lên không gian mới này là gần nhau trong khi hình chiếu của các điểm của các lớp khác nhau là khác nhau. Phương pháp LDA phân loại các lớp chưa biết thành các lớp đã biết, mà ở đó các khuôn mặt tạo thành một lớp và sự khác biệt giữa các khuôn mặt trong một lớp là rất nhỏ. Cả PCA chọn cách thống kê lấy mẫu, chọn lọc để nhận diện khuôn mặt. Thuật toán LDA dựa trên phân tích phân loại phi tuyến của Fisher là phương pháp tính toán chuyển đổi tối đa hóa sự phân tán giữa các lớp trong khi giảm thiểu phân tán trong lớp.

Giải sử ta có các lớp C với 𝜇𝑖 là vectơ trung bình của các lớp i với i = 1, 2,…C. 𝑀𝑖 là số lượng mẫu trong lớp i.15) 𝑐 𝑦=1 Gọi Sw là ma trận tán xạ nội lớp (các phần tử trong lớp) và SB là ma trận tán xạ tương hổ của các lớp thuộc C.16) 𝑖=1 Phương pháp LDA sẽ tìm giá trị W để cực đại hóa hàm mục tiêu H(W) : 𝑊𝑆𝐵 𝑊 𝑇 (1.17) H(W) = 𝑊𝑆𝑊 𝑊 𝑇 Luan van 8 LDA tính toán chuyển đổi tối đa hóa sự phân tán giữa các lớp trong khi giảm thiểu phân tán trong lớp.3 Cây quyết định (Decision Tree) a. Giới thiệu Việc quan sát, suy nghĩ và đưa ra các quyết định của con người thường được bắt đầu từ các câu hỏi. Trong học máy cũng có mô hình đưa ra quyết định dựa vào các câu hỏi như cây quyết định.

Cây quyết định (Decision Tree) là một trong những thuật toán phổ biến của học máy thuộc nhánh học có giám sát. Decision Tree ra đời từ những năm 1975 từ một tác giả có tên Ross Quinlan. Thuật toán này là tiền đề để ra đời những phương pháp dự báo theo dòng Tree-based method như là: Random Forest, Bagging, AdaBoost, Gradient Boosting Machine. Mô hình cây quyết định thuộc nhóm các bài toán học có giám sát (supervised learning).

Mô hình này có thể sử dụng vào cả hai loại bài toán phân loại (classification) và hồi quy (regression) theo [5]. Hiện nay, mô hình cây quyết định vẫn còn được sử dụng rất nhiều trong các nghiên cứu cũng như ứng dụng [6]. Thành phần Một cây quyết định được bao gồm 4 thành phần như sau: root node, internal node, leaf node, dept. Trong đó root node là nhánh chia đầu tiên của cây quyết định.

Internal node là các nhánh chia tiếp theo của cây quyết định. Leaf node là các nhánh cuối cùng của một quyết định. Dept sẽ quy định tầng của cây Luan van 9 Hình 1. Thành phần cây quyết định c.

Hàm số entropy Trên thực tế ta sẽ sẽ có một bảng dữ liệu với rất nhiều biến. Decision Tree sẽ sử dụng một vài chỉ số để đưa ra việc xác định câu hỏi và thứ tự các biến nào chia dữ liệu để tạo ra Decision Tree có khả năng phân loại tốt nhất. Các hệ số này là Gini và Cross-Entropy. Để tìm nghiệm cho các bài toán có nhiều thuộc tính và mỗi thuộc tính có nhiều giá trị khác nhau thì ta sẽ sử dụng một phương pháp đơn giản thường được sử dụng là tại mỗi bước, một thuộc tính tốt nhất sẽ được chọn ra dựa trên một tiêu chuẩn nào đó.

Với mỗi thuộc tính được chọn, ta chia dữ liệu vào các child node tương ứng với các giá trị của thuộc tính đó rồi tiếp tục áp dụng phương pháp này cho mỗi child node. Trong đó, hành động chọn ra thuộc tính tốt nhất ở mỗi bước như trên gọi là cách chọn tham lam (greedy). Cách chọn tham lam này có thể không phải là tối ưu nhưng nó đem lại kết quả cũng khá tốt cho bài toán này. Child node sẽ chứa những câu trả lời tương ứng với dữ liệu sau mỗi câu hỏi.

Câu hỏi ở đây được coi như là một thuộc tính và câu trả lời sẽ là giá trị của thuộc tính đó. Để đánh giá chất lượng của một cách phân chia, chúng ta cần đi tìm một phép đo. Và đó là hàm entropy.

Nội dung được bảo vệ bản quyền — Tải xuống đầy đủ

Bài viết "Luận văn thạc sĩ về hệ thống nhận diện khuôn mặt qua camera" của tác giả Nguyễn Quang Huy, dưới sự hướng dẫn của TS. Nguyễn Đình Hóa tại Học viện Công nghệ Bưu chính Viễn thông, năm 2020, tập trung vào việc phát triển và ứng dụng công nghệ nhận diện khuôn mặt qua camera. Luận văn này không chỉ cung cấp cái nhìn sâu sắc về các thuật toán và công nghệ hiện đại trong lĩnh vực nhận diện khuôn mặt mà còn nêu bật những thách thức và giải pháp trong việc triển khai hệ thống này trong thực tế. Độc giả sẽ tìm thấy nhiều thông tin hữu ích về cách thức hoạt động của hệ thống, cũng như các ứng dụng tiềm năng trong nhiều lĩnh vực như an ninh, giám sát và quản lý.

Nếu bạn quan tâm đến các chủ đề liên quan đến công nghệ thông tin và khoa học máy tính, bạn có thể tham khảo thêm bài viết "Luận Văn Thạc Sĩ: Ứng Dụng Active Learning trong Lựa Chọn Dữ Liệu Gán Nhãn cho Bài Toán Nhận Diện Giọng Nói", nơi khám phá ứng dụng của Active Learning trong nhận diện giọng nói, hay "Luận văn thạc sĩ: Nhận dạng giọng nói tiếng Việt qua học sâu và mô hình ngôn ngữ", nghiên cứu về nhận diện giọng nói tiếng Việt thông qua công nghệ học sâu. Những tài liệu này sẽ giúp bạn mở rộng kiến thức về các công nghệ nhận diện và ứng dụng của chúng trong thực tiễn.

#Luận văn Thạc sĩ

#công nghệ nhận diện

#trí tuệ nhân tạo

#hệ thống camera

#phân tích hình ảnh

#nhận diện khuôn mặt

Chủ đề

Nghiên cứu và phát triển trong lĩnh vực công nghệ

Công nghệ nhận diện khuôn mặt

Trí tuệ nhân tạo và học máy

Ứng dụng của camera trong an ninh