## Tổng quan nghiên cứu

Nhận diện khuôn mặt là một trong những phương thức xác thực sinh trắc học an toàn và hiệu quả nhất hiện nay, với hơn 13,000 hình ảnh khuôn mặt được thu thập và gán nhãn trong các bộ dữ liệu phổ biến như Labeled Faces in the Wild (LFW). Tuy nhiên, đại dịch Covid-19 đã tạo ra thách thức lớn khi việc đeo khẩu trang làm che khuất một phần khuôn mặt, gây khó khăn cho các kỹ thuật nhận diện truyền thống. Nghiên cứu này tập trung phát triển mô hình nhận diện khuôn mặt dựa trên học sâu, đặc biệt là ứng dụng Siamese Neural Network (SNN) để nhận diện khuôn mặt có và không có khẩu trang, đồng thời tích hợp hệ thống chấm công tự động tại các doanh nghiệp. Mục tiêu chính là xây dựng mô hình có độ chính xác cao, khả năng nhận diện linh hoạt trong điều kiện thực tế, và phát triển ứng dụng web thân thiện với người dùng. Phạm vi nghiên cứu tập trung tại Việt Nam, sử dụng dữ liệu từ các bộ dữ liệu quốc tế và thử nghiệm thực tế tại môi trường doanh nghiệp, với kỳ vọng cải thiện các chỉ số Precision và Recall trên 90%.

## Cơ sở lý thuyết và phương pháp nghiên cứu

### Khung lý thuyết áp dụng

- **Convolutional Neural Network (CNN):** Mạng nơ-ron tích chập được sử dụng để trích xuất các đặc trưng tiềm ẩn từ hình ảnh khuôn mặt, giúp mô hình nhận diện chính xác hơn trong các điều kiện khác nhau.
- **Siamese Neural Network (SNN):** Kiến trúc mạng song song với các tham số chia sẻ, chuyên dùng để so sánh và đánh giá độ tương đồng giữa hai ảnh khuôn mặt, phù hợp với bài toán nhận diện một lần (one-shot learning).
- **Ensemble Learning:** Kỹ thuật kết hợp nhiều mô hình để tăng cường độ chính xác và giảm thiểu rủi ro bảo mật, phân chia nhiệm vụ nhận diện khuôn mặt có khẩu trang và không khẩu trang riêng biệt.
- **Hàm mất mát Cross-Entropy và Triplet Loss:** Được sử dụng để tối ưu hóa quá trình huấn luyện, giúp mô hình học được sự khác biệt tinh vi giữa các khuôn mặt.
- **Các chỉ số đánh giá:** Precision, Recall, F1-score và Loss được sử dụng để đánh giá hiệu quả mô hình.

### Phương pháp nghiên cứu

- **Nguồn dữ liệu:** Sử dụng bộ dữ liệu LFW và MLFW (Masked Labeled Faces in the Wild) với hơn 13,000 ảnh khuôn mặt, trong đó có khoảng 1,680 người có nhiều ảnh khác nhau, bao gồm cả ảnh có khẩu trang.
- **Phương pháp phân tích:** Xây dựng mô hình SNN với kiến trúc CNN, huấn luyện trên bộ dữ liệu đã được tiền xử lý (resize về 100x100 pixels, chuẩn hóa màu sắc). Áp dụng kỹ thuật ensemble learning để tách riêng mô hình nhận diện khuôn mặt có và không khẩu trang.
- **Timeline nghiên cứu:** Bắt đầu từ tháng 2/2023, hoàn thành huấn luyện và thử nghiệm mô hình vào tháng 6/2023, triển khai ứng dụng chấm công và đánh giá thực tế trong tháng 7/2023.
- **Cỡ mẫu:** Hơn 13,000 ảnh khuôn mặt, trong đó khoảng 30% ảnh có khẩu trang, đảm bảo tính đa dạng và đại diện cho môi trường thực tế.

## Kết quả nghiên cứu và thảo luận

### Những phát hiện chính

- Mô hình SNN đạt độ chính xác trên 92% trong việc nhận diện khuôn mặt không khẩu trang và trên 88% với khuôn mặt có khẩu trang, vượt trội hơn các mô hình truyền thống.
- Áp dụng ensemble learning giúp tăng độ chính xác nhận diện khuôn mặt có khẩu trang lên khoảng 5% so với mô hình đơn lẻ.
- Thời gian huấn luyện mỗi epoch của mô hình SNN trung bình khoảng 120 giây, nhanh hơn so với các mô hình CNN truyền thống do sử dụng shared weights và kiến trúc song song.
- Ứng dụng chấm công dựa trên mô hình nhận diện khuôn mặt đã giảm thời gian xử lý thủ công xuống dưới 10%, tăng tính chính xác và tiện lợi cho doanh nghiệp.

### Thảo luận kết quả

Nguyên nhân chính của sự cải thiện độ chính xác là do mô hình SNN tận dụng được khả năng học đặc trưng sâu và so sánh trực tiếp giữa các ảnh khuôn mặt, phù hợp với bài toán nhận diện trong điều kiện dữ liệu hạn chế. Việc sử dụng ensemble learning giúp giảm thiểu rủi ro bảo mật và tăng khả năng thích ứng với các biến thể khuôn mặt có và không khẩu trang. So với các nghiên cứu trước đây chỉ tập trung vào nhận diện khuôn mặt không khẩu trang, nghiên cứu này mở rộng phạm vi ứng dụng trong bối cảnh đại dịch và hậu đại dịch Covid-19. Dữ liệu có thể được trình bày qua biểu đồ so sánh độ chính xác giữa các mô hình và bảng thống kê thời gian huấn luyện, giúp minh họa rõ ràng hiệu quả của phương pháp đề xuất.

## Đề xuất và khuyến nghị

- **Triển khai rộng rãi hệ thống nhận diện khuôn mặt tại các doanh nghiệp:** Tăng cường độ chính xác chấm công, giảm thiểu gian lận và sai sót, dự kiến hoàn thành trong 6 tháng tới, do phòng CNTT và quản lý nhân sự phối hợp thực hiện.
- **Nâng cấp mô hình với dữ liệu thực tế thu thập được:** Thu thập thêm dữ liệu khuôn mặt có khẩu trang từ môi trường làm việc để cải thiện độ chính xác trên 95%, thực hiện liên tục trong vòng 1 năm.
- **Phát triển giao diện người dùng thân thiện hơn:** Cải thiện trải nghiệm người dùng trên ứng dụng web bằng Flask và Streamlit, hoàn thiện trong 3 tháng, do nhóm phát triển phần mềm đảm nhiệm.
- **Tích hợp hệ thống với các thiết bị IoT và camera hiện đại:** Đảm bảo khả năng nhận diện nhanh và chính xác trong môi trường thực tế, triển khai thử nghiệm trong 9 tháng tới, phối hợp với nhà cung cấp thiết bị.
- **Đào tạo nhân viên và nâng cao nhận thức về bảo mật:** Tổ chức các khóa đào tạo về sử dụng hệ thống và bảo mật dữ liệu, nhằm tăng cường hiệu quả và an toàn thông tin, thực hiện định kỳ hàng năm.

## Đối tượng nên tham khảo luận văn

- **Các nhà nghiên cứu và sinh viên ngành Khoa học Máy tính:** Nắm bắt kiến thức về ứng dụng học sâu trong nhận diện khuôn mặt và các kỹ thuật mới như Siamese Neural Network, ensemble learning.
- **Doanh nghiệp và phòng nhân sự:** Áp dụng hệ thống chấm công tự động, nâng cao hiệu quả quản lý nhân sự và bảo mật thông tin.
- **Nhà phát triển phần mềm và kỹ sư AI:** Tham khảo mô hình và phương pháp triển khai ứng dụng thực tế, từ xây dựng mô hình đến phát triển giao diện người dùng.
- **Cơ quan quản lý và chính sách:** Hiểu rõ về xu hướng công nghệ nhận diện sinh trắc học trong bối cảnh đại dịch, hỗ trợ xây dựng các quy định và hướng dẫn phù hợp.

## Câu hỏi thường gặp

1. **Mô hình Siamese Neural Network là gì và tại sao lại phù hợp với bài toán nhận diện khuôn mặt có khẩu trang?**  
SNN là mạng nơ-ron song song dùng để so sánh độ tương đồng giữa hai ảnh. Nó phù hợp vì có thể học từ ít dữ liệu và nhận diện chính xác ngay cả khi khuôn mặt bị che khuất một phần như khi đeo khẩu trang.

2. **Ensemble learning giúp cải thiện hiệu quả mô hình như thế nào?**  
Bằng cách kết hợp nhiều mô hình chuyên biệt cho từng nhiệm vụ (nhận diện có khẩu trang và không khẩu trang), ensemble learning giảm thiểu sai sót và tăng độ chính xác tổng thể.

3. **Bộ dữ liệu MLFW có điểm gì đặc biệt?**  
MLFW là bộ dữ liệu mở rộng từ LFW với các ảnh khuôn mặt được thêm khẩu trang giả lập, giúp mô hình học và đánh giá khả năng nhận diện trong điều kiện thực tế sau đại dịch.

4. **Ứng dụng chấm công dựa trên mô hình này có ưu điểm gì so với phương pháp truyền thống?**  
Ứng dụng tự động, giảm thiểu sai sót do con người, tăng tốc độ xử lý và bảo mật thông tin, phù hợp với môi trường làm việc hiện đại.

5. **Làm thế nào để đảm bảo tính bảo mật khi sử dụng hệ thống nhận diện khuôn mặt?**  
Sử dụng mô hình riêng biệt cho từng loại dữ liệu, mã hóa dữ liệu đầu vào và đầu ra, cùng với các biện pháp bảo mật mạng và phần mềm để ngăn chặn truy cập trái phép.

## Kết luận

- Đã xây dựng thành công mô hình nhận diện khuôn mặt sử dụng Siamese Neural Network với độ chính xác trên 90% cho cả khuôn mặt có và không khẩu trang.  
- Áp dụng ensemble learning giúp tăng cường bảo mật và hiệu quả nhận diện trong môi trường thực tế.  
- Phát triển ứng dụng chấm công tích hợp mô hình, giảm thiểu thời gian và sai sót trong quản lý nhân sự.  
- Kết quả nghiên cứu mở ra hướng đi mới cho các ứng dụng sinh trắc học trong bối cảnh hậu đại dịch.  
- Đề xuất các bước tiếp theo bao gồm mở rộng dữ liệu, nâng cấp mô hình và triển khai thực tế rộng rãi nhằm tối ưu hóa hiệu quả và ứng dụng trong doanh nghiệp.

Hành động tiếp theo: Triển khai thử nghiệm mở rộng, thu thập phản hồi người dùng và hoàn thiện hệ thống để đưa vào sử dụng đại trà.