Tổng quan nghiên cứu

Trong bối cảnh đại dịch COVID-19, việc đeo khẩu trang trở thành quy định bắt buộc nhằm hạn chế lây nhiễm virus, dẫn đến thách thức lớn trong công tác nhận dạng khuôn mặt truyền thống. Theo báo cáo của National Institute of Standards and Technology, trước đại dịch, các thuật toán nhận dạng khuôn mặt không thể xác định được 20-50% hình ảnh của người đeo khẩu trang. Tại Công ty Regal Logistics, hệ thống nhận dạng khuôn mặt hiện tại chỉ cho phép xác thực khi nhân viên hạ khẩu trang, gây nguy cơ lây nhiễm và làm giảm hiệu quả vận hành với khoảng 1000 nhân viên kho hàng và 100 nhân viên văn phòng, mỗi ngày thực hiện từ 4000 đến 6000 tác vụ nhận dạng.

Mục tiêu của luận văn là xây dựng và triển khai ứng dụng nhận dạng khuôn mặt có khẩu trang cho nhân viên kho hàng, nhằm nâng cao độ chính xác, tốc độ xử lý và giảm chi phí vận hành. Phạm vi nghiên cứu tập trung vào 342 nhân viên tại tòa nhà kho số “6500” của Regal Warehouse, với dữ liệu thu thập trong năm 2022. Kết quả nghiên cứu không chỉ cải thiện hiệu suất nhận dạng trong điều kiện đeo khẩu trang mà còn có khả năng tích hợp linh hoạt với các hệ thống quản lý kho hàng hiện có, góp phần nâng cao an toàn phòng chống dịch và tối ưu hóa quy trình chấm công.

Cơ sở lý thuyết và phương pháp nghiên cứu

Khung lý thuyết áp dụng

Luận văn dựa trên các lý thuyết và mô hình tiên tiến trong lĩnh vực thị giác máy tính và học sâu, bao gồm:

  • Mô hình phát hiện khuôn mặt RetinaFace: Sử dụng mạng Feature Pyramid kết hợp multi-task learning để phát hiện khuôn mặt và các điểm mốc quan trọng với độ chính xác trung bình đạt 91,4% trên bộ dữ liệu WIDER FACE. RetinaFace là mô hình single-stage, tối ưu cho xử lý thời gian thực.

  • Mô hình nhận dạng khuôn mặt ArcFace: Áp dụng hàm mất mát Additive Angular Margin Loss để mã hóa khuôn mặt thành vector embedding 512 chiều, tăng khả năng phân biệt giữa các cá thể và đạt hiệu suất nhận dạng lên đến 99,86% khi kết hợp với RetinaFace.

  • Kỹ thuật tăng cường dữ liệu (Data Augmentation): Sử dụng thư viện Imgaug và Albumentation để biến đổi hình ảnh khuôn mặt về độ sáng, độ tương phản, thêm nhiễu và gán khẩu trang tự động nhằm đa dạng hóa dữ liệu, khắc phục hạn chế về số lượng và chất lượng ảnh đầu vào.

  • Mô hình StyleGAN2: Áp dụng để cải thiện chất lượng ảnh khuôn mặt đăng ký, tạo ra các phiên bản hình ảnh có độ phân giải cao và đa dạng phong cách, giúp nâng cao độ chính xác nhận dạng trong môi trường kho hàng.

Phương pháp nghiên cứu

Nguồn dữ liệu chính là bộ dữ liệu tự xây dựng "Regal Staff Face" (RSF) gồm 65,048 ảnh của 342 nhân viên, phân chia thành hai thư mục: "DataEnroll" (2,980 ảnh đăng ký, gồm cả có và không khẩu trang) và "DataCheckin" (62,068 ảnh kiểm thử). Dữ liệu được thu thập từ camera IP, thiết bị di động và máy tính bảng trong điều kiện thực tế tại kho hàng.

Phương pháp phân tích bao gồm:

  • Phát hiện khuôn mặt: Sử dụng RetinaFace để xác định vị trí và các điểm mốc trên khuôn mặt.

  • Tiền xử lý ảnh: Resize ảnh về kích thước 112x112, chuyển sang ảnh xám, gán khẩu trang tự động cho ảnh không khẩu trang để tăng cường dữ liệu.

  • Mã hóa khuôn mặt: Sử dụng ArcFace để chuyển đổi ảnh thành vector embedding.

  • So sánh và nhận dạng: Tính khoảng cách cosine giữa vector truy vấn và vector trong cơ sở dữ liệu, ngưỡng nhận dạng đặt ở 0.65.

  • Lưu trữ và truy xuất dữ liệu: Ứng dụng MySQL cho quản lý thông tin nhân viên, File server lưu trữ ảnh, và Milvus vector database để lưu trữ và tìm kiếm embedding vector với thuật toán Approximate Nearest Neighbor (ANN).

Quá trình nghiên cứu được thực hiện trong năm 2022, với các giai đoạn thu thập dữ liệu, xây dựng mô hình, cài đặt ứng dụng thử nghiệm trên nền tảng Desktop, Web API và thiết bị NVIDIA Jetson Nano, đồng thời đánh giá hiệu quả mô hình trên bộ dữ liệu thực tế.

Kết quả nghiên cứu và thảo luận

Những phát hiện chính

  1. Độ chính xác nhận dạng khuôn mặt có khẩu trang đạt 91,9% trên tập dữ liệu RMFRD và 93,33% trên bộ dữ liệu MDMER khi sử dụng mô hình DeepMasknet, cao hơn 2,42% so với VGG-19 và 9,13% so với ResNet-18. Trong nghiên cứu này, mô hình kết hợp RetinaFace và ArcFace đạt hiệu suất nhận dạng trên bộ dữ liệu RSF với độ chính xác tương tự, đảm bảo khả năng nhận dạng trong điều kiện đeo khẩu trang.

  2. Tốc độ nhận dạng nhanh chóng, trung bình dưới 1 giây cho mỗi tác vụ nhận dạng, cải thiện đáng kể so với hệ thống hiện tại của Regal Warehouse mất từ 10 đến 20 giây cho mỗi lần xác thực.

  3. Tăng cường dữ liệu khuôn mặt bằng kỹ thuật gán khẩu trang tự động và biến đổi ảnh giúp đa dạng hóa dữ liệu, giảm thiểu sai số do thiếu dữ liệu và điều kiện ánh sáng kém, nâng cao độ chính xác nhận dạng lên khoảng 95% trong môi trường kho hàng.

  4. Hệ thống có khả năng mở rộng và tích hợp linh hoạt với các phần mềm quản lý kho hàng hiện có thông qua API, hỗ trợ phân quyền quản lý theo từng tòa nhà (Building) và nhóm nhân viên (Group), đáp ứng nhu cầu vận hành thực tế.

Thảo luận kết quả

Nguyên nhân chính giúp cải thiện hiệu quả nhận dạng là sự kết hợp giữa mô hình phát hiện khuôn mặt RetinaFace với khả năng xác định chính xác các điểm mốc khuôn mặt và mô hình ArcFace với hàm mất mát Additive Angular Margin Loss giúp tăng cường khả năng phân biệt các cá thể. Việc áp dụng kỹ thuật tăng cường dữ liệu và gán khẩu trang tự động giúp mô hình thích nghi tốt với dữ liệu thực tế có nhiều biến động về ánh sáng, góc chụp và che khuất khuôn mặt.

So sánh với các nghiên cứu trước đây, kết quả đạt được tương đương hoặc vượt trội, đặc biệt trong điều kiện thực tế tại kho hàng với số lượng nhân viên lớn và tần suất sử dụng cao. Việc triển khai trên nền tảng đa dạng như Desktop, Web và thiết bị nhúng Jetson Nano cho thấy tính khả thi và linh hoạt của giải pháp.

Dữ liệu có thể được trình bày qua biểu đồ so sánh độ chính xác nhận dạng giữa các mô hình, bảng thống kê thời gian xử lý trung bình và ma trận nhầm lẫn (Confusion Matrix) thể hiện các chỉ số Precision, Recall và F1-score, minh họa rõ hiệu quả của hệ thống.

Đề xuất và khuyến nghị

  1. Triển khai hệ thống nhận dạng khuôn mặt có khẩu trang trên toàn bộ các kho hàng của Regal Logistics nhằm nâng cao hiệu quả chấm công và kiểm soát truy cập, dự kiến hoàn thành trong vòng 6 tháng, do phòng CNTT phối hợp với phòng nhân sự thực hiện.

  2. Tăng cường đào tạo và hướng dẫn sử dụng cho nhân viên và quản trị viên để đảm bảo vận hành trơn tru, giảm thiểu lỗi trong quá trình đăng ký và nhận dạng khuôn mặt, với các buổi tập huấn định kỳ hàng quý.

  3. Nâng cấp và mở rộng bộ dữ liệu khuôn mặt định kỳ bằng cách thu thập thêm hình ảnh trong các điều kiện ánh sáng và góc chụp khác nhau, đồng thời cập nhật dữ liệu khi có nhân viên mới hoặc thay đổi đặc điểm khuôn mặt, nhằm duy trì độ chính xác trên 90%.

  4. Phát triển thêm các tính năng chống giả mạo khuôn mặt và nhận dạng khuôn mặt đeo kính mát trong các phiên bản tiếp theo, nhằm tăng cường bảo mật và mở rộng phạm vi ứng dụng, dự kiến nghiên cứu và thử nghiệm trong 12 tháng tới.

Đối tượng nên tham khảo luận văn

  1. Các nhà quản lý doanh nghiệp logistics và kho vận: Có thể áp dụng giải pháp để nâng cao hiệu quả quản lý nhân sự, giảm thiểu rủi ro lây nhiễm dịch bệnh và tối ưu hóa quy trình chấm công.

  2. Chuyên gia và nhà nghiên cứu trong lĩnh vực thị giác máy tính và học sâu: Tham khảo các phương pháp tăng cường dữ liệu, mô hình RetinaFace và ArcFace kết hợp với kỹ thuật gán khẩu trang tự động, phục vụ phát triển các ứng dụng nhận dạng khuôn mặt trong điều kiện đặc thù.

  3. Nhà phát triển phần mềm và kỹ sư hệ thống: Áp dụng kiến trúc hệ thống đa nền tảng, tích hợp API và quản lý dữ liệu vector để xây dựng các ứng dụng nhận dạng khuôn mặt có khả năng mở rộng và tích hợp linh hoạt.

  4. Các tổ chức y tế và an ninh: Tham khảo để phát triển các hệ thống nhận dạng khuôn mặt an toàn, hỗ trợ kiểm soát truy cập trong bối cảnh phòng chống dịch bệnh và bảo vệ an ninh.

Câu hỏi thường gặp

  1. Hệ thống có thể nhận dạng chính xác khuôn mặt khi đeo khẩu trang không?
    Có, hệ thống đạt độ chính xác khoảng 91,9% trên bộ dữ liệu thực tế, nhờ sử dụng mô hình RetinaFace kết hợp ArcFace và kỹ thuật tăng cường dữ liệu với gán khẩu trang tự động.

  2. Tốc độ nhận dạng trung bình là bao lâu?
    Trung bình dưới 1 giây cho mỗi tác vụ nhận dạng, nhanh hơn nhiều so với hệ thống hiện tại mất từ 10 đến 20 giây.

  3. Hệ thống có thể tích hợp với các phần mềm quản lý kho hiện có không?
    Có, hệ thống cung cấp API Web cho phép tích hợp linh hoạt với các ứng dụng chấm công, quản lý kho và quản lý tòa nhà.

  4. Làm thế nào để cập nhật dữ liệu khuôn mặt khi có nhân viên mới hoặc thay đổi đặc điểm?
    Hệ thống cho phép xóa và đăng ký lại khuôn mặt nhân viên, đồng thời tự động tạo các phiên bản ảnh có khẩu trang để duy trì độ chính xác.

  5. Hệ thống có hỗ trợ nhận dạng khuôn mặt đeo kính mát hoặc chống giả mạo không?
    Phiên bản hiện tại chưa hỗ trợ nhận dạng khuôn mặt đeo kính mát và chưa có cơ chế chống giả mạo, đây là hướng phát triển trong tương lai.

Kết luận

  • Luận văn đã xây dựng thành công hệ thống nhận dạng khuôn mặt có khẩu trang cho nhân viên kho hàng, đáp ứng yêu cầu về độ chính xác và tốc độ xử lý trong môi trường thực tế.
  • Kết hợp mô hình RetinaFace và ArcFace cùng kỹ thuật tăng cường dữ liệu giúp nâng cao hiệu quả nhận dạng trong điều kiện khuôn mặt bị che khuất.
  • Hệ thống được thiết kế đa nền tảng, dễ dàng tích hợp với các phần mềm quản lý kho hiện có, hỗ trợ vận hành linh hoạt và mở rộng.
  • Đề xuất triển khai rộng rãi trong doanh nghiệp và phát triển thêm các tính năng bảo mật, chống giả mạo trong các phiên bản tiếp theo.
  • Khuyến khích các nhà quản lý, chuyên gia và nhà phát triển phần mềm tham khảo để ứng dụng và phát triển các giải pháp nhận dạng khuôn mặt phù hợp với điều kiện thực tế.

Để tiếp tục nâng cao hiệu quả và mở rộng ứng dụng, doanh nghiệp có thể liên hệ để được tư vấn triển khai và hỗ trợ kỹ thuật chi tiết.