ĐẠI HỌC QUỐC GIA HÀ NỘI TRƢỜNG ĐẠI HỌC CÔNG NGHỆ CÙ VIỆT DŨNG NGHIÊN CỨU VÀ XÂY DỰNG HỆ THỐNG XÁC ĐỊNH KHUÔN MẶT CHUNG NHẤT TRONG TẬP ẢNH SỐ LUẬN VĂN THẠC SĨ KỸ THUẬT PHẦN MỀM Hà Nội – 2014 LUAN VAN CHAT LUONG download : add luanvanchat@agmail.com 1 ĐẠI HỌC QUỐC GIA HÀ NỘI TRƢỜNG ĐẠI HỌC CÔNG NGHỆ CÙ VIỆT DŨNG NGHIÊN CỨU VÀ XÂY DỰNG HỆ THỐNG XÁC ĐỊNH KHUÔN MẶT CHUNG NHẤT TRONG TẬP ẢNH SỐ Ngành: Công nghệ thông tin Chuyên ngành: Kỹ thuật phần mềm Mã số: 60480103 LUẬN VĂN THẠC SĨ KỸ THUẬT PHẦN MỀM NGƢỜI HƢỚNG DẪN KHOA HỌC: PGS.TS Bùi Thế Duy Hà Nội – 2014 LUAN VAN CHAT LUONG download : add luanvanchat@agmail.com 2 LỜI CẢM ƠN Trƣớc tiên, em xin gửi lời cảm ơn chân thành và sự biết ơn sâu sắc tới thầy giáo hƣớng dẫn, PGS.TS Bùi Thế Duy đã tận tình hƣớng dẫn em trong suốt quá trình thực hiện khoá luận tốt nghiệp, cách đặt ra các câu hỏi nghiên cứu, hiểu các vấn đề, và viết báo cáo một cách khoa học. Em xin chân thành cảm ơn sâu sắc tới các anh chị, thầy cô trong phòng tƣơng tác ngƣời máy đã luôn tận tình chỉ bảo, giải quyết những vấn đề vƣớng mắc. Em xin bày tỏ lời cảm ơn sâu sắc tới các thầy cô giáo trong trƣờng Đại học Công Nghệ, những ngƣời thầy, cô đã tận tình giảng dạy và truyền đạt cho em những kiến thức, những kinh nghiệm quý báu trong suốt quá trình học tập và rèn luyện ở Trƣờng. Con xin bày tỏ lòng chân thành và biết ơn tới cha mẹ, anh chị, những ngƣời trong gia đình và bạn bè đã luôn ở bên cạnh con những lúc khó khăn nhất, giúp con vƣợt qua khó khăn trong học tập cũng nhƣ trong cuộc sống. Hà nội, ngày 2 tháng 09 năm 2014 Học viên Cù Việt Dũng LUAN VAN CHAT LUONG download : add luanvanchat@agmail.com 3 Lời cam đoan Tôi xin cam đoan: Những kết quả nghiên cứu đƣợc trình bày trong luận văn là hoàn toàn trung thực, của tôi, không vi phạm bất cứ điều gì trong luật sở hữu trí tuệ và pháp luật Việt Nam. Nếu sai, tôi xin chịu hoàn toàn trách nhiệm trƣớc pháp luật. TÁC GIẢ LUẬN VĂN Cù Việt Dũng LUAN VAN CHAT LUONG download : add luanvanchat@agmail.com 4 MỤC LỤC Trang Lời cam đoan . 4 Danh mục các ký hiệu và chữ viết tắt . 6 Danh mục các bảng . 7 Danh mục các hình vẽ, đồ thị . 8 LỜI MỞ ĐẦU . 9 CHƢƠNG 1: TỔNG QUAN .2 Phát biểu bài toán .1 Quy trình xử lý .2 Những khó khăn, thách thức .3 Một số phƣơng pháp xác định khuôn mặt.1 Hƣớng tiếp cận dựa trên tri thức .2 Hƣớng tiếp cận dựa trên đặc trƣng không thay đổi.3 Hƣớng tiếp cận dựa trên so khớp mẫu .4 Hƣớng tiếp cận dựa trên diện mạo .4 Kết luận chƣơng 1 .17 CHƢƠNG 2: CƠ SỞ LÝ THUYẾT .1 Phát hiện khuôn mặt.1 Các đặc trƣng giống Haar.2 Phƣơng pháp Adaboost .2 Tổng quan về các phƣơng pháp trích rút đặc trƣng .1 Phƣơng pháp trích chọn đặc trƣng hình học .2 Phƣơng pháp trích chọn đặc trƣng diện mạo .3 Phƣơng pháp phân tích thành phần chính .1 Sơ lƣợc đại số tuyến tính .2 Phân tích thành phần chính - PCA .4 Mô hình diện mạo tích cực .28 LUAN VAN CHAT LUONG download : add luanvanchat@agmail.1 Hình dáng và các điểm mốc .2 Căn chỉnh hình dạng của tập huấn luyện .3 Huấn luyện mô hình .1 Huấn luyện mô hình hình dáng .2 Huấn luyện hình ảnh .5 Giới thiệu về phân cụm .2 Một số vấn đề trong phân cụm .3 Phân cụm phân cấp .6 Kết luận chƣơng 2 .37 CHƢƠNG 3: XÂY DỰNG HỆ THỐNG .1 Tổng quan hệ thống .2 Phát hiện khuôn mặt.3 Trích rút đặc trƣng .1 Phân tích thành phần chính .2 Mô hình diện mạo tích cực.4 Xác định khuôn mặt chung nhất .5 Kết luận chƣơng 3 .46 CHƢƠNG 4: THỬ NGHIỆM VÀ KẾT QUẢ ĐẠT ĐƢỢC .1 Cơ sở dữ liệu khuôn mặt thử nghiệm.2 Một số thực nghiệm .3 Kết luận chƣơng 4 .54 KẾT LUẬN VÀ HƢỚNG PHÁT TRIỂN . 55 TÀI LIỆU THAM KHẢO . 56 LUAN VAN CHAT LUONG download : add luanvanchat@agmail.com 6 Danh mục các ký hiệu và chữ viết tắt CSDL Cơ sở dữ liệu ASM Active Shape Model PCA Principal Component Analysis HAC Hierarchical Agglomerative Clustering LUAN VAN CHAT LUONG download : add luanvanchat@agmail.com 7 Danh mục các bảng Bảng 2.1: Tham số dữ liệu thuộc tính nhị phân .35 LUAN VAN CHAT LUONG download : add luanvanchat@agmail.com 8 Danh mục các hình vẽ, đồ thị Hình 2.1: Bốn đặc trƣng Haar-like cơ bản .2: Các đặc trƣng mở rộng của các đặc trƣng Haar-like cơ sở.3: Cách tính Integral Image của ảnh .4: Cách tính nhanh tổng các điểm ảnh của vùng D trên ảnh .5: Cách tính nhanh tổng điểm ảnh của vùng D trên ảnh với các đặc trƣng xoay 45o .6: Thuật toán Adaboost .7: Hình dạng và biểu diễn của hình dạng trong mô hình .8: Vị trí 68 điểm mốc trên khuôn mặt .9: Thuật toán gióng hàng tập huấn luyện .10: Quy trình huấn luyện mô hình hình dáng .11: Thuật toán so khớp hình dáng khuôn mặt.1: Sơ đồ tổng quát của hệ thống .2: Mã giả thuật toán tổng quát của hệ thống .3: Giao diện chính của hệ thống .4: Giao diện kết quả sau khi xác định đƣợc khuôn mặt chung nhất .5: Giao diện kết quả phát hiện khuôn mặt .6: Chuyển ảnh khuôn mặt sang vector .7: Tập ảnh khuôn mặt sau khi chuẩn hóa cùng kích thƣớc .8: Thuật toán so khớp khuôn mặt.9: Thuật toán phân cụm phân cấp .1: Ví dụ một tập cơ sở dữ liệu tự xây dựng .2: Tập ảnh đầu vào thực nghiệm 1 .3: Khuôn mặt chung nhất trong thực nghiệm 1 .4: Kết quả của hệ thống trong thực nghiệm 1 - PCA .5: Kết quả của hệ thống trong thực nghiệm 1 - ASM .6: Tập ảnh đầu vào thực nghiệm 2 .7: Khuôn mặt chung nhất trong thực nghiệm 2 .8: Kết quả của hệ thống trong thực nghiệm 2 - PCA .9: Kết quả của hệ thống trong thực nghiệm 2 - ASM .10: Tập ảnh đầu vào thực nghiệm 3 .11: Khuôn mặt chung nhất trong thực nghiệm 3 .12: Kết quả của hệ thống trong thực nghiệm 3 - PCA .13: Kết quả của hệ thống trong thực nghiệm 3 - ASM .53 LUAN VAN CHAT LUONG download : add luanvanchat@agmail.com 9 LỜI MỞ ĐẦU Hiện nay thế giới có hàng trăm mạng mạng xã hội khác nhau nhƣ MySpace và Facebook nổi tiếng trong thị trƣờng Bắc Mỹ và Tây Âu; Orkut và Hi5 tại Nam Mỹ; Friendster tại Châu Á và các đảo quốc Thái Bình Dƣơng. Một số mạng xã hội khác đã gặt hái đƣợc thành công đáng kể theo vùng miền nhƣ Bebo tại Anh Quốc, CyWorld tại Hàn Quốc, Mixi tại Nhật Bản. Ở Việt Nam xuất hiện rất nhiều các mạng xã hội nhƣ: Facebook, Zing Me, YuMe, Tamtay đƣợc đông đảo các bạn trẻ và mọi ngƣời trong nƣớc tin dùng. Với số lƣợng mạng xã hội đông đảo nhƣ thế, lƣợng thông tin dữ liệu thu đƣợc là khổng lồ. Trong lƣợng thông tin khổng lồ này, có một lƣợng lớn là hình ảnh. Một minh chứng rõ nhất là mạng xã hội facebook, cho đến nay đã có hàng trăm tỷ bức hình trong cơ sở dữ liệu. Việc tìm ra thông tin hữu ích trên lƣợng dữ liệu hình ảnh lớn nhƣ vậy sẽ rất cấp thiết. Nhiều thông tin đƣợc chia sẻ trên mạng xã hội thể hiện bằng các hình ảnh cung cấp cho ngƣời dùng về thông tin của ngƣời, phong cảnh mang nhiều phong cách của từng cá nhân. Mọi ngƣời thƣờng chia sẻ hình ảnh cá nhân trên các trang mạng xã hội để chia sẻ chúng với gia đình, ngƣời thân, bạn bè và ngƣời quen. Tuy nhiên, mỗi khi một ngƣời dùng muốn tìm hiểu thông tin về một ai đó gặp phải vấn đề phải tìm thông tin về ngƣời đó rất khó khăn (tốn thời gian và nhiều khi không tìm đƣợc). Lý do của việc này là lƣợng ảnh trên mạng xã hội quá nhiều và tăng nhanh hàng ngày. Với một tập ảnh cho trƣớc, mỗi bức ảnh có thể có một hay nhiều hơn một khuôn mặt gây ra nhiều khó khăn cho ngƣời dùng có thể xác định chủ thể trong tập ảnh đó một cách nhanh nhất. Do đó, chúng ta nên cần một hệ thống có thể giúp gom các đối tƣợng khuôn mặt về cùng một cụm (theo một độ đo tƣơng tự nào đó) trong một tập dữ liệu ảnh có một hay nhiều khuôn mặt trong bức ảnh là vô cùng cần thiết. Từ đó xác định đƣợc khuôn mặt chung nhất trong tập ảnh. Với sự cần thiết đó tác giả chọn đề tài “Nghiên cứu và xây dựng hệ thống xác định khuôn mặt chung nhất trong tập ảnh số”. Nội dung khóa luận gồm có 4 chƣơng: Chƣơng 1: Tổng quan, giới thiệu và phát biểu bài toán, nêu một số hƣớng tiếp cận trong việc phát hiện khuôn mặt trong ảnh Chƣơng 2: Cơ sở lý thuyết, giới thiệu cơ sở lý thuyết một số phƣơng pháp liên quan trong bài toán Chƣơng 3: Xây dựng hệ thống, trình bày về xây dựng hệ thống giải quyết bài toán. Chƣơng 4: Thử nghiệm và kết quả đạt đƣợc, trình bày về cơ sở dữ liệu thực nghiệm và kết quả thử nghiệm, đánh giá thử nghiệm LUAN VAN CHAT LUONG download : add luanvanchat@agmail.com 10 CHƢƠNG 1: TỔNG QUAN 1.1 Giới thiệu Thông thƣờng để lƣu trữ thông tin, dữ liệu về một nội dung, sự vật, sự việc nào đó thì ngƣời ta thƣờng chọn sử dụng dạng lƣu trữ kiểu văn bản. Nhƣng lƣu trữ dữ liệu bằng văn bản nhiều khi không thể phản ánh đầy đủ, chân thực về đối tƣợng đƣợc miêu tả và nhiều khi đó chỉ là do cảm nhận chủ quan của mình ngƣời viết. Vì vậy kết hợp với lƣu trữ dữ liệu dạng văn bản ngƣời ta còn sử dụng lƣu trữ dữ liệu dạng ảnh. Khối lƣợng dữ liệu dạng ảnh ngày càng trở nên khổng lồ nhất là khi hiện nay các thiết bị thu nhận ảnh số ngày càng trở nên phổ biến với giá cả phù hợp. Khi ta có nhu cầu tìm kiếm một vài bức ảnh trong một kho dữ liệu ảnh có thể lên tới vài trăm nghìn bức ảnh để minh họa cho một đề tài nào đó, thì tuyệt đối không phải là chuyện đơn giản nếu chúng ta tìm kiếm một cách thủ công tức là xem lần lƣợt từng bức ảnh cho tới khi ta tìm thấy đƣợc bức ảnh có nội dung cần tìm. Song song với sự phát triển của các phƣơng tiện kỹ thuật số trong tƣơng lai số lƣợng ảnh sẽ còn tăng hơn nữa nhiều hơn nữa. Nhu cầu chia sẻ hình ảnh cá nhân của đa số mọi ngƣời trên thế giới và Việt Nam là rất lớn làm cho lƣợng hình ảnh khuôn mặt ngày càng tăng nhanh.
Luận văn VNU: Hệ thống xác định khuôn mặt chung nhất - Cù Việt Dũng
Luận văn thạc sĩ VNU UET nghiên cứu xây dựng hệ thống xác định khuôn mặt trong tập ảnh số, ứng dụng công nghệ nhận diện tiên tiến.
Trường đại học
Trường Đại học Công nghệ - Đại học Quốc gia Hà NộiChuyên ngành
Công nghệ thông tinNgười đăng
Ẩn danhThể loại
Luận văn thạc sĩPhí lưu trữ
30 PointMục lục chi tiết
THÔNG TIN CHI TIẾT
Tác giả: Cù Việt Dũng
Người hướng dẫn: PGS.TS Bùi Thế Duy
Trường học: Trường Đại học Công nghệ - Đại học Quốc gia Hà Nội
Chuyên ngành: Công nghệ thông tin
Đề tài: Nghiên cứu và xây dựng hệ thống xác định khuôn mặt chung nhất trong tập ảnh số
Loại tài liệu: Luận văn thạc sĩ
Năm xuất bản: 2014
Địa điểm: Hà Nội
Trích đoạn nội dung tài liệu
Nội dung được bảo vệ bản quyền — Tải xuống đầy đủ