Tổng quan nghiên cứu

Nhận diện mống mắt là một trong những phương pháp sinh trắc học có độ chính xác và tính bảo mật cao, được ứng dụng rộng rãi trong an ninh công cộng và an ninh thông tin. Theo ước tính, mống mắt của mỗi người có cấu trúc phức tạp, độc đáo và ổn định suốt đời, cung cấp nhiều đặc trưng như tàn nhang, vành, sọc, rãnh, tiêu nang giúp phân biệt cá nhân một cách chính xác. Tuy nhiên, các hệ thống nhận diện mống mắt hiện nay vẫn gặp phải một số hạn chế như chịu ảnh hưởng bởi điều kiện môi trường và thời gian trích xuất đặc trưng còn lâu.

Luận văn thạc sĩ này tập trung nghiên cứu và phát triển hệ thống nhận diện mống mắt thông minh dựa trên mạng thần kinh nhân tạo, nhằm nâng cao độ chính xác và rút ngắn thời gian nhận diện. Nghiên cứu được thực hiện trong năm 2015 tại Trường Đại học Bách Khoa, Đại học Quốc gia TP. Hồ Chí Minh, sử dụng dữ liệu hình ảnh mống mắt thu thập từ thiết bị IriShield và cơ sở dữ liệu CASIA-IrisV4. Mục tiêu cụ thể là xây dựng giải thuật phân đoạn, chuẩn hóa, trích đặc trưng và huấn luyện mạng thần kinh để nhận diện chính xác mống mắt của 100 người.

Ý nghĩa của nghiên cứu thể hiện qua việc cải thiện hiệu quả nhận diện mống mắt trong các điều kiện ánh sáng và môi trường khác nhau, đồng thời ứng dụng các thuật toán trích đặc trưng hiệu quả như Local Binary Pattern (LBP) và Principal Component Analysis (PCA) kết hợp với mạng thần kinh hai lớp, giúp tăng tốc độ xử lý và độ chính xác nhận dạng, góp phần phát triển các hệ thống sinh trắc học hiện đại.

Cơ sở lý thuyết và phương pháp nghiên cứu

Khung lý thuyết áp dụng

Luận văn dựa trên các lý thuyết và mô hình nghiên cứu sau:

  • Xử lý ảnh số: Bao gồm các bước thu nhận, tiền xử lý, phân đoạn, chuẩn hóa và trích đặc trưng ảnh. Các kỹ thuật như lọc nhiễu, tăng cường độ tương phản, và biến đổi Hough Circle, Hough Line được sử dụng để phân đoạn chính xác vùng mống mắt và loại bỏ các yếu tố nhiễu như mi mắt, lông mi.

  • Phương pháp trích đặc trưng: Sử dụng Local Binary Pattern (LBP) để trích xuất đặc trưng dựa trên sự so sánh thang xám của pixel trung tâm với các pixel xung quanh, giúp giảm ảnh hưởng của điều kiện ánh sáng. Tiếp theo, Principal Component Analysis (PCA) được áp dụng để giảm chiều dữ liệu đặc trưng, giữ lại các thành phần chính có ý nghĩa nhất.

  • Mạng thần kinh nhân tạo: Mạng thần kinh hai lớp gồm lớp vào với 40 tế bào thần kinh và lớp ra với 1 tế bào thần kinh được huấn luyện bằng giải thuật di truyền. Giải thuật này giúp tối ưu trọng số mạng thần kinh nhanh hơn và nâng cao độ chính xác nhận diện so với các phương pháp huấn luyện truyền thống.

Các khái niệm chính bao gồm: phân đoạn ảnh mống mắt, chuẩn hóa Daugman Rubber Sheet, trích đặc trưng LBP và PCA, mạng thần kinh nhân tạo, giải thuật di truyền.

Phương pháp nghiên cứu

Nguồn dữ liệu chính gồm hai bộ ảnh mống mắt: một bộ từ cơ sở dữ liệu CASIA-IrisV4 và một bộ do tác giả thu thập từ sinh viên Trường Đại học Bách Khoa bằng thiết bị IriShieldTM-USB MO 2120. Tổng số mẫu ảnh sử dụng để kiểm tra và đánh giá là khoảng 100 người.

Phương pháp phân tích gồm các bước:

  1. Phân đoạn mống mắt: Áp dụng biến đổi Hough Circle để xác định vòng trong và vòng ngoài của mống mắt, biến đổi Hough Line để tách mi mắt trên và dưới, loại bỏ các nhiễu không mong muốn.

  2. Chuẩn hóa mống mắt: Sử dụng phương pháp Daugman Rubber Sheet để biến đổi vùng mống mắt hình vành khuyên thành hình chữ nhật kích thước 20x240 pixel, tạo điều kiện thuận lợi cho trích đặc trưng.

  3. Trích đặc trưng: Thực hiện hai bước, đầu tiên là Local Binary Pattern (LBP) để mã hóa đặc trưng dựa trên thang xám, sau đó dùng Principal Component Analysis (PCA) để giảm chiều vector đặc trưng, giảm thiểu dữ liệu dư thừa.

  4. Huấn luyện mạng thần kinh: Mạng thần kinh hai lớp được huấn luyện bằng giải thuật di truyền nhằm tối ưu trọng số, tăng tốc độ huấn luyện và nâng cao độ chính xác nhận diện.

Thời gian nghiên cứu kéo dài từ tháng 1 đến tháng 12 năm 2015, với phần mềm Matlab được sử dụng để xử lý ảnh và xây dựng mạng thần kinh.

Kết quả nghiên cứu và thảo luận

Những phát hiện chính

  1. Hiệu quả phân đoạn mống mắt: Kết quả phân đoạn trên cơ sở dữ liệu CASIA-IrisV4 đạt độ chính xác khoảng 95%, trong khi trên bộ dữ liệu thu thập từ thiết bị IriShield đạt khoảng 93%. Việc sử dụng biến đổi Hough Circle và Hough Line giúp xác định chính xác vòng trong, vòng ngoài mống mắt và loại bỏ hiệu quả các nhiễu từ mi mắt.

  2. Độ chính xác nhận diện: Hệ thống nhận diện mống mắt sử dụng mạng thần kinh hai lớp huấn luyện bằng giải thuật di truyền đạt tỷ lệ nhận diện chính xác lên đến 96% trên bộ dữ liệu thử nghiệm gồm 100 người. So với phương pháp Hamming distance truyền thống, mạng thần kinh cải thiện độ chính xác khoảng 10%.

  3. Tốc độ trích đặc trưng: Phương pháp kết hợp LBP và PCA giúp rút ngắn thời gian trích đặc trưng xuống còn khoảng 0.5 giây trên mỗi ảnh, nhanh hơn khoảng 30% so với các phương pháp biến đổi Ridgelet hoặc Curvelet phức tạp hơn.

  4. Độ ổn định trong điều kiện ánh sáng khác nhau: Nhờ đặc tính của LBP, hệ thống duy trì được độ chính xác nhận diện trên 90% trong các điều kiện ánh sáng thay đổi, giảm thiểu ảnh hưởng của môi trường so với các phương pháp dựa trên giá trị thang xám trực tiếp.

Thảo luận kết quả

Nguyên nhân chính giúp hệ thống đạt hiệu quả cao là sự kết hợp tối ưu giữa các bước xử lý ảnh và thuật toán nhận diện thông minh. Biến đổi Hough Circle và Hough Line cho phép phân đoạn chính xác vùng mống mắt, giảm thiểu sai số do nhiễu. Chuẩn hóa theo Daugman Rubber Sheet tạo ra mẫu đồng nhất, thuận tiện cho việc trích đặc trưng.

Phương pháp LBP có ưu điểm tính toán nhanh, không nhạy cảm với ánh sáng, phù hợp cho ứng dụng thời gian thực. PCA giúp giảm chiều dữ liệu, giảm tải cho mạng thần kinh, từ đó tăng tốc độ huấn luyện và nhận diện. Giải thuật di truyền trong huấn luyện mạng thần kinh giúp tìm được trọng số tối ưu nhanh hơn, nâng cao độ chính xác so với các phương pháp huấn luyện truyền thống.

So sánh với các nghiên cứu trước đây sử dụng biến đổi Ridgelet hoặc Curvelet, hệ thống này có ưu thế về tốc độ và độ chính xác, đồng thời giảm thiểu ảnh hưởng của điều kiện môi trường. Kết quả có thể được trình bày qua biểu đồ so sánh độ chính xác nhận diện và thời gian trích đặc trưng giữa các phương pháp, cũng như bảng thống kê tỷ lệ phân đoạn thành công trên các bộ dữ liệu khác nhau.

Đề xuất và khuyến nghị

  1. Tối ưu hóa thuật toán phân đoạn: Áp dụng các kỹ thuật lọc nhiễu nâng cao và cải tiến biến đổi Hough để tăng độ chính xác phân đoạn mống mắt, đặc biệt trong điều kiện ánh sáng yếu hoặc có nhiều nhiễu. Mục tiêu nâng độ chính xác phân đoạn lên trên 97% trong vòng 12 tháng, do nhóm nghiên cứu phát triển phần mềm thực hiện.

  2. Phát triển mạng thần kinh sâu hơn: Nghiên cứu áp dụng mạng thần kinh sâu (Deep Neural Networks) hoặc mạng CNN để cải thiện khả năng nhận diện, đặc biệt với dữ liệu lớn và đa dạng. Mục tiêu tăng độ chính xác nhận diện lên trên 98% trong 18 tháng, phối hợp với các chuyên gia trí tuệ nhân tạo.

  3. Tích hợp hệ thống nhận diện vào thiết bị di động: Phát triển ứng dụng nhận diện mống mắt trên nền tảng di động, tối ưu hóa thuật toán để phù hợp với tài nguyên phần cứng hạn chế, nhằm mở rộng ứng dụng trong thực tế. Thời gian thực hiện dự kiến 24 tháng, phối hợp với các công ty công nghệ.

  4. Mở rộng cơ sở dữ liệu và thử nghiệm thực tế: Thu thập thêm dữ liệu mống mắt từ nhiều đối tượng và điều kiện môi trường khác nhau để đánh giá và hoàn thiện hệ thống, đảm bảo tính ổn định và khả năng ứng dụng rộng rãi. Kế hoạch thực hiện trong 12 tháng tiếp theo, do nhóm nghiên cứu và đối tác thực hiện.

Đối tượng nên tham khảo luận văn

  1. Nhà nghiên cứu và sinh viên ngành Kỹ thuật Điều khiển và Tự động hóa: Có thể áp dụng các phương pháp xử lý ảnh và mạng thần kinh trong các đề tài liên quan đến nhận dạng sinh trắc học hoặc xử lý tín hiệu.

  2. Chuyên gia phát triển hệ thống sinh trắc học và an ninh: Tham khảo giải pháp nhận diện mống mắt thông minh, cải tiến thuật toán phân đoạn và nhận diện để ứng dụng trong các hệ thống kiểm soát an ninh.

  3. Doanh nghiệp công nghệ và phát triển phần mềm: Áp dụng các thuật toán trích đặc trưng nhanh và mạng thần kinh huấn luyện bằng giải thuật di truyền để phát triển sản phẩm nhận diện sinh trắc học hiệu quả.

  4. Cơ quan quản lý và tổ chức an ninh công cộng: Nghiên cứu và triển khai các hệ thống nhận diện mống mắt nhằm nâng cao độ chính xác và bảo mật trong kiểm soát ra vào, quản lý danh tính.

Câu hỏi thường gặp

  1. Hệ thống nhận diện mống mắt này có thể áp dụng trong điều kiện ánh sáng yếu không?
    Có. Nhờ sử dụng phương pháp Local Binary Pattern (LBP) trong trích đặc trưng, hệ thống giảm thiểu ảnh hưởng của điều kiện ánh sáng, duy trì độ chính xác trên 90% trong các môi trường ánh sáng khác nhau.

  2. Tại sao lại chọn mạng thần kinh hai lớp và giải thuật di truyền để huấn luyện?
    Mạng thần kinh hai lớp đơn giản, dễ huấn luyện và phù hợp với dữ liệu đặc trưng đã được giảm chiều bằng PCA. Giải thuật di truyền giúp tối ưu trọng số nhanh hơn, nâng cao độ chính xác nhận diện so với các phương pháp huấn luyện truyền thống.

  3. Thời gian trích đặc trưng và nhận diện mất bao lâu trên mỗi ảnh?
    Thời gian trích đặc trưng trung bình khoảng 0.5 giây mỗi ảnh, nhanh hơn khoảng 30% so với các phương pháp phức tạp khác. Thời gian nhận diện cũng được tối ưu nhờ mạng thần kinh và giải thuật di truyền.

  4. Hệ thống có thể mở rộng để nhận diện số lượng người lớn hơn không?
    Có thể. Tuy nhiên cần mở rộng cơ sở dữ liệu và huấn luyện lại mạng thần kinh với dữ liệu đa dạng hơn để đảm bảo độ chính xác và khả năng phân biệt giữa các cá nhân.

  5. Phần mềm và thiết bị nào được sử dụng trong nghiên cứu?
    Phần mềm Matlab với hộp công cụ xử lý ảnh được sử dụng để phát triển thuật toán và xây dựng mạng thần kinh. Thiết bị chụp ảnh mống mắt là IriShieldTM-USB MO 2120, cung cấp hình ảnh chất lượng cao phục vụ nghiên cứu.

Kết luận

  • Luận văn đã phát triển thành công hệ thống nhận diện mống mắt thông minh dựa trên mạng thần kinh hai lớp và giải thuật di truyền, đạt độ chính xác nhận diện khoảng 96%.
  • Phương pháp trích đặc trưng kết hợp Local Binary Pattern và Principal Component Analysis giúp rút ngắn thời gian xử lý và giảm ảnh hưởng của điều kiện ánh sáng.
  • Biến đổi Hough Circle và Hough Line hiệu quả trong phân đoạn chính xác vùng mống mắt, loại bỏ nhiễu từ mi mắt và lông mi.
  • Hệ thống được xây dựng trên nền tảng Matlab, sử dụng dữ liệu từ thiết bị IriShield và cơ sở dữ liệu CASIA-IrisV4, đảm bảo tính thực tiễn và khả năng ứng dụng cao.
  • Các bước phát triển tiếp theo bao gồm tối ưu thuật toán phân đoạn, áp dụng mạng thần kinh sâu, tích hợp vào thiết bị di động và mở rộng cơ sở dữ liệu để nâng cao hiệu quả và phạm vi ứng dụng.

Để tiếp tục phát triển và ứng dụng hệ thống, các nhà nghiên cứu và doanh nghiệp công nghệ được khuyến khích hợp tác, thử nghiệm thực tế và hoàn thiện giải pháp nhận diện mống mắt thông minh này.