ỦY BAN NHÂN DÂN TP.HCM SỞ KHOA HỌC VÀ CÔNG NGHỆ BÁO CÁO NGHIỆM THU PHÁT TRIỂN MỘT SỐ HÌNH TÍNH TOÁN MỀM CHO BÀI TOÁN TRUY TÌM ẢNH MẶT NGƯỜI NHÌN THẲNG CHỦ NHIỆM ĐỀ TÀI Lê Hoàng Thái CƠ QUAN QUẢN LÝ CƠ QUAN CHỦ TRÌ THÀNH PHỐ HỒ CHÍ MINH THÁNG 06 / 2010 TÓM TẮT NỘI DUNG NGHIÊN CỨU 1. Tìm hiểu, nghiên cứu các kỹ thuật tính toán thông minh (NN, FL, GA, SVM,…) và các ứng dụng của nó. So sánh các kỹ thuật thông minh: nêu ưu khuyết điểm từng kỹ thuật, lớp bài toán mà kỹ thuật đó có thể giải quyết, sự thể hiện của từng kỹ thuật như thế nào trong từng lớp bài toán. Tìm hiểu về các nghiên cứu đã có về bài toán nhận dạng mặt người nhìn thẳng: mô hình thực hiện qua các bước, các kỹ thuật đã nghiên cứu và áp dụng. Phát triển các kỹ thuật tính toán thông minh ứng dụng cho từng khâu trong mô hình nhận dạng mặt người nhìn thẳng để có được những giải pháp tốt hơn cho từng khâu trong mô hình. Trong từng kỹ thuật đề xuất, đều có so sánh đánh giá với các kỹ thuật hiện có để chỉ ra tính ưu việt của kỹ thuật đề xuất. Kỹ thuật đề xuất ở đây có thể sử dụng một, nhiều hay phối hợp các kỹ thuật thông minh để có hiệu ứng tốt nhất. Xây dựng mô hình thông minh tổng quát cho bài toán nhận dạng mặt người nhìn thẳng. Cài đặt một chương trình ứng dụng thể hiện mô hình thông minh giải quyết bài toán nhận dạng mặt người nhìn thẳng. So sánh đối chiếu với các mô hình, ứng dụng đã có thông qua thực nghiệm để chứng minh tính ưu việt của mô hình đề xuất. SUMMARY OF RESEARCH CONTENT 1. Surveying, studying techniques of clever computing (NN, FL, GA, SVM,…) and its Applications. Compare some intelligent techniques: present advantage and disadvantage of each technique, the class of problem which the techniques can solve, the performance of each technique in each problem. Surveying the current research approach about frontal face recognition problem: model of processing steps, some techniques, some available techniques and applications. Developing the techniques of intelligent computing in applying for each processing stage in model of frontal face recognition in order to get better solution for each stage in the model. In each proposal technique, there is comparison and evaluation these techniques with available other techniques in order to point out the advantage of the proposal method. The proposal method can use one or many or combination of some intelligent technique in order to have the good performance. Constructing the general intelligent model for frontal face recognition. Implementing the application which demonstrates the intelligent model in solving the frontal face recognition problem. Comparing with the available models and applications by experimental results in order to demonstrate the feasibility of the proposal model. MỤC LỤC DANH MỤC BẢNG . 1 DANH MỤC HÌNH . 2 PHẦN MỞ ĐẦU . 7 CHƢƠNG 1: TÌM HIỂU VỀ CÁC KỸ THUẬT TÍNH TOÁN MỀM .1 Các kỹ thuật tính toán mềm ứng dụng trong đề tài .2 Các kỹ thuật trích chọn không gian biểu diễn mẫu .1 Phương pháp phân tích thành phần chính : .2 Phương pháp phân tích thành phần độc lập: .3 Phân tích tách lớp tuyến tính:.3 Các kỹ thuật phân lớp mẫu phổ cập .1 Phương pháp AdaBoost .2 Cơ sở lý thuyết mạng nơron .3 Support Vector Machine (SVM) .4 Các kỹ thuật tính toán gần đúng hỗ trợ cho bài toán nhận dạng .1 Tìm hiểu các kiến thức về GA .2 Lý thuyết về tập mờ .5 Ví dụ về mô hình lai hai kỹ thuật tính toán mềm .1 Mô hình lai GA-FL cho điều khiển trực thăng không người lái .6 Kết luận chương 1. 64 CHƢƠNG 2: TỔNG QUAN VỀ BÀI TOÁN TRUY TÌM ẢNH MẶT NGƢỜI .1 Khảo sát chung và giới hạn phạm vi nghiên cứu .1 Tổng quan tình hình nghiên cứu về truy tìm ảnh mặt người tự động 66 2.2 Tính cấp thiết của việc giải quyết bài toán .3 Phạm vi nghiên cứu .2 Khảo sát các nghiên cứu đã có cho từng giai đoạn của bài toán truy tìm ảnh mặt người nhìn thẳng .1 Các bước giải quyết bài toán truy tìm ảnh mặt người .2 Dò tìm và Phát hiện ảnh khuôn mặt .3 Chuẩn hóa khuôn mặt .4 Rút trích và so khớp không gian biểu diễn ảnh khuôn mặt .3 Kết luận chương 2. 104 CHƢƠNG 3: DÕ TÌM VÀ PHÁT HIỆN MẶT NGƢỜI BẰNG ADABOOST KẾT HỢP MẠNG NƠRON NHÂN TẠO .1 Đề xuất phương pháp xác định phạm vi nghiên cứu .2 Bài toán phân lớp mẫu (Pattern Classification) trong dò tìm mặt .3 Mô hình phân lớp Cascade of Boosted Classifiers.4 Mô hình phân lớp Artificial Neural Network .5 Mô hình phân lớp kết hợp Cascade of Boosted Classifiers + Artificial Neural Network .6 Phương thức dò tìm sử dụng cửa sổ tìm kiếm .7 Dữ liệu thực nghiệm .1 Dữ liệu huấn luyện: .2 Dữ liệu thử nghiệm .8 Kết quả và đánh giá .9 Nhận xét mô hình đề xuất .10 Kết luận chương 3. 118 CHƢƠNG 4: CHUẨN HÓA MẶT NGƢỜI BẰNG MẠNG PERCEPTRON ĐA LỚP .2 Thuật giải ASM tổng quát .1 Mô hình dáng điệu thống kê .2 Thuật giải ASM .3 Mô hình lấy vân ảnh cục bộ cổ điển .4 Mạng Perceptron đa lớp cho phân loại vân ảnh địa phương .1 Cấu trúc mạng Perceptron đa lớp [90][95] .2 Áp dụng mạng Perceptron đa lớp cho tìm kiếm các điểm đặc trưng 128 4.5 Các kết quả thử nghiệm .2 Thời gian thực hiện .6 Kết luận chương 4. 132 CHƢƠNG 5: RÖT TRÍCH VÀ SO KHỚP KHÔNG GIAN BIỂU DIỄN ẢNH KHUÔN MẶT.1 Trích chọn đặc trưng ảnh mặt người bằng phương pháp hình học kết hợp phân tích thành phần độc lập .1 Khảo sát và đề xuất.2 Sự kết hợp đặc trưng của các thành phần quan trọng của khuôn mặt134 5.3 Phương pháp phân tích thành phần độc lập trong rút trích đặc trưng mặt người .4 Sự kết hợp của phương pháp dựa trên đặc trưng hình học và ICA .5 Kết quả thực nghiệm và thảo luận .2 Kết hợp phân tích thành phần độc lập (ICA) và phân tích tách lớp tuyến tính (LDA) cho nhận dạng mặt người .1 Phân tích đánh giá các phương pháp trích chọn đặc trưng ảnh khuôn mặt .2 Phân tích đánh giá, đề xuất mô hình ICA+LDA cho rút trích và so khớp không gian biểu diễn ảnh khuôn mặt .3 Kết luận chương 5. 154 CHƢƠNG 6: XÂY DỰNG MÔ HÌNH TỔNG QUÁT CHO TRUY TÌM ẢNH MẶT NGƢỜI NHÌN THẲNG TRÊN ỨNG DỤNG THỰC TẾ156 6.1 Mô hình truy tìm ảnh mặt người nhìn thẳng 1 cho CSDL trường ĐHKHTN tp.1 Xây dựng cơ sở dữ liệu cho ứng dụng:.2 Mô hình nhận dạng trong ứng dụng thử nghiệm.3 Sử dụng ICA và LDA rút trích đặc trưng cho khuôn mặt .4 Sử dụng mô hình kết hợp cho quá trình nhận dạng: .6 Phân tích đề xuất mô hình.7 Đánh giá và kết luận .2 Mô hình truy tìm ảnh mặt người nhìn thẳng 2 cho CSDL ảnh hộ chiếu cục quản lý xuất nhập cảnh Q1 tp.1 Giới thiệu bài toán .2 Cơ sở dữ liệu thử nghiệm.3 Đề xuất mô hình truy tìm ảnh nhìn thẳng, không quay .4 Rút trích không gian đặc trưng trên sáu vùng phân chia hình học của ảnh mặt người.5 Các phương pháp tổng hợp kết quả so khớp.6 Xác định bộ hệ số tin cậy cho sáu vùng đặc trưng đã rút trích bằng Thuật giải di truyền .7 Tổng hợp kết quả thực nghiệm .8 Đánh giá và kết luận về mô hình đề xuất .3 Kết luận chương 6. 186 CHƢƠNG 7: ỨNG DỤNG THỰC NGHIỆM TẠI CỤC QUẢN LÝ XUẤT NHẬP CẢNH.1 Nhu cầu ứng dụng của Cục Quản lý xuất nhập cảnh Q1 tp.2 Bài toán đề nghị tương ứng .3 Giao diện chương trình .4 Phương pháp đề xuất .5 Các kết quả thực nghiệm.6 Phân tích đánh giá kết quả thực nghiệm .8 Kết luận chương 7. 200 TÀI LIỆU THAM KHẢO. 205 DANH MỤC BẢNG SỐ TÊN BẢNG SỐ LIỆU TRANG Bảng 1-1 Thuật toán AdaBoost . 22 Bảng 1-3 Bảng trị chân lý các phép toán . 50 Bảng 1-4 Quan hệ giữa T và S . 52 Bảng 3-1 Kết quả thực nghiệm dò tìm khuôn mặt . 117 Bảng 4-1 Thời gian thực hiện trung bình trên một lần lặp (xử lý hai giai đoạn) . 132 Bảng 5-1 Phần trăm tỉ lệ nhận dạng chính xác trên CSDL CalTech. 141 Bảng 5-2 Phần trăm tỉ lệ nhận dạng chính xác trên CSDL tự tạo. 142 Bảng 5-3 So sánh kết quả giữa PCA, ICA và LDA. 147 Bảng 5-4 Kết quả thống kê theo độ đo Euclidean . 152 Bảng 5-5 Kết quả thống kê theo độ đo Mahattan . 153 Bảng 5-6 Kết quả thống kê theo độ đo Cosin . 153 Bảng 5-7 Kết quả thống kê theo các độ đo . 153 Bảng 5-8 Kết quả thống kê theo các phương pháp kết hợp. 153 Bảng 6-1 Kết quả nhận dạng. 159 Bảng 6-2 Bảng công thức xác định các vùng hình học . 166 Bảng 6-3 Khoảng cách từ ảnh test đến các lớp 2, 3, 4 . 174 Bảng 6-4 Mức độ tin cậy của các vùng thuộc các lớp 2,3,4 . 175 Bảng 6-5 Kết quả thống kê theo độ đo Euclide . 183 Bảng 6-6 Kết quả thống kê theo độ đo Mahattan . 183 Bảng 6-7 Kết quả thống kê theo độ đo Cosin . 183 Bảng 6-8 Kết quả thống kê theo các độ đo . 184 Bảng 6-9 Kết quả thống kê theo các phương pháp kết hợp. 184 Bảng 7-1 Tỷ lệ so khớp ảnh trên ba bộ cơ sở dữ liệu (200 ảnh, 700 ảnh và 1800 ảnh) . 194 Bảng 7-2 Kết quả truy tìm trên ba bộ cơ sở dữ liệu (200, 700 và 1800 ảnh) . 195 -1- DANH MỤC HÌNH SỐ TÊN HÌNH ẢNH TRANG Hình 1-1 Hướng của vector riêng . 10 Hình 1-2 Sự phân phối dữ liệu, và các trục tương ứng của PCA & ICA . 12 Hình 1-3 Vector đặc trưng cho mỗi kĩ thuật. 13 Hình 1-4 Minh họa kiến trúc 1 trong mô hình ICA . 14 Hình 1-5 Minh họa kiến trúc 2 trong mô hình ICA . 14 Hình 1-6 Mô hình tổng hợp ảnh cho kiến trúc 2 của ICA . 15 Hình 1-7 Mô hình tổng hợp ảnh cho kiến trúc 2 của ICA trên pixel . 15 Hình 1-8 Không gian con của LDA . 16 Hình 1-9 Minh họa trường hợp phân biệt 2 lớp . 17 Hình 1-10 Minh họa trường hợp phân biệt 2 lớp . 17 Hình 1-11 Minh họa khái niệm ―bên trong‖ (within) và ―bên cạnh‖ (between) . 18 Hình 1-12 Strong classifier H(x) được xây dựng bằng AdaBoost . 20 Hình 1-13 Ví dụ minh hoạ sự kết hợp của 3 phân lớp tuyến tính. 22 Hình 1-14 Các đặc trưng Haar-like cơ sở . 24 Hình 1-15 Các miền hình học đặc trưng Haar – like . 24 Hình 1-16 Ý nghĩa hình học của đạo hàm ảnh . 25 Hình 1-17 Cách tính giá trị một ô đặc trưng . 25 Hình 1-18 Dò tìm bàn tay bằng đặc trưng Haar – like .
Phát Triển Mô Hình Tính Toán Mềm Cho Bài Toán Nhận Dạng Mặt Người Nhìn Thẳng
Tài liệu nghiên cứu Phát triển một số mô hình tính toán mềm cho bài toán truy tìm ảnh mặt người nhìn thẳng, tổng hợp lý thuyết và thực hành, cung cấp kiến thức chuyên sâu về toán
Phí lưu trữ
55 PointMục lục chi tiết
THÔNG TIN CHI TIẾT
Tác giả: Lê Hoàng Thái
Trường học: Trường Đại học Khoa học tự nhiên
Đề tài: Mô Hình Tính Toán Mềm Cho Nhận Dạng Mặt Người Nhìn Thẳng
Loại tài liệu: báo cáo nghiệm thu
Năm xuất bản: 2010
Địa điểm: Hồ Chí Minh
Trích đoạn nội dung tài liệu
Nội dung được bảo vệ bản quyền — Tải xuống đầy đủ