Luận văn thạc sĩ về phát hiện mặt người trong ảnh theo hướng tiếp cận thành phần

Đề tài khảo sát Phát hiện mặt người trong ảnh: Nghiên cứu thạc sĩ về thành phần với dữ liệu thực nghiệm, giải pháp cụ thể cho bài toán thực tế chuyên

Trường đại học

Đại học Quốc gia Hà Nội

Chuyên ngành

Công nghệ thông tin

Người đăng

Ẩn danh

Thể loại

luận văn thạc sĩ

2011

Phí lưu trữ

30 Point

Mục lục chi tiết

PHẦN MỞ ĐẦU

1. CHƯƠNG 1: KHÁI QUÁT VỀ XỬ LÝ ẢNH VÀ PHÁT HIỆN MẶT NGƯỜI TRONG ẢNH

1.1. Khái quát về xử lý ảnh

1.1.1. Xử lý ảnh là gì?

1.1.2. Các vấn đề cơ bản trong xử lý ảnh

1.1.2.1. Một số khái niệm cơ bản

1.1.2.2. Nắn chỉnh biến dạng

1.1.2.3. Trích chọn đặc điểm

1.1.3. Phát hiện mặt người trong xử lý ảnh

1.1.3.1. Những khó khăn của bài toán phát hiện khuôn mặt

1.1.3.1.1. Sự xuất hiện hoặc thiếu một số thành phần của khuôn mặt

1.1.3.1.2. Sự biểu cảm của khuôn mặt

1.1.3.1.3. Sự che khuất

1.1.3.1.4. Điều kiện của ảnh

2. CHƯƠNG 2: PHÁT HIỆN MẶT NGƯỜI TRONG ẢNH THEO HƯỚNG TIẾP CẬN THÀNH PHẦN

2.1. Sử dụng kỹ thuật PCA

2.1.1. Các khái niệm cơ bản

2.1.2. Phương sai

2.1.3. Hiệp phương sai

2.1.4. Ma trận hiệp phương sai

2.1.5. Ma trận đại số

3. CHƯƠNG 3: CHƯƠNG TRÌNH THỬ NGHIỆM

3.1. Hướng nghiên cứu

3.1.1. Phân loại thành phần khuôn mặt

3.1.2. Cấu trúc các bộ nhận dạng

3.1.3. Phân tích, thiết kế

3.1.4. Giao diện và cách sử dụng

3.1.5. Kết quả thử nghiệm

3.1.5.1. Góc chụp so với hướng ống kính

3.1.5.2. Kích thước khuôn mặt

3.1.5.3. Các kết quả thực nghiệm khác

PHẦN KẾT LUẬN

Tóm tắt

I. Khái quát về xử lý ảnh và phát hiện mặt người trong ảnh

Phát hiện mặt người trong ảnh là một lĩnh vực quan trọng trong công nghệ nhận diện khuôn mặt. Phân tích hình ảnh là quá trình xử lý và phân tích các đặc điểm của ảnh để nhận diện các đối tượng, trong đó có khuôn mặt. Công nghệ nhận diện đã phát triển mạnh mẽ trong những năm gần đây, nhờ vào sự tiến bộ của học máy và các thuật toán phát hiện. Tuy nhiên, bài toán này vẫn gặp nhiều khó khăn, như sự thay đổi về tư thế, góc chụp, và điều kiện ánh sáng. Những yếu tố này có thể làm giảm độ chính xác của các hệ thống nhận diện. Việc phát hiện khuôn mặt không chỉ có ý nghĩa trong lĩnh vực an ninh mà còn trong nhiều ứng dụng khác như giao tiếp người máy và bảo mật sinh trắc học.

1.1. Khái niệm về xử lý ảnh

Xử lý ảnh là một lĩnh vực nghiên cứu nhằm cải thiện và phân tích các hình ảnh. Nhận diện khuôn mặt là một ứng dụng quan trọng trong xử lý ảnh, giúp xác định vị trí và kích thước của khuôn mặt trong ảnh. Các kỹ thuật như trích chọn đặc điểm và xử lý hình ảnh giúp cải thiện độ chính xác của việc nhận diện. Tuy nhiên, bài toán này vẫn còn nhiều thách thức, đặc biệt là trong việc xử lý các ảnh có nhiều khuôn mặt hoặc trong điều kiện ánh sáng không tốt.

1.2. Những khó khăn trong phát hiện mặt người

Bài toán phát hiện mặt người gặp nhiều khó khăn do sự biến đổi của khuôn mặt trong các điều kiện khác nhau. Sự che khuất và biểu cảm của khuôn mặt có thể làm cho việc nhận diện trở nên khó khăn hơn. Ngoài ra, các yếu tố như góc chụp và tư thế cũng ảnh hưởng đến khả năng phát hiện. Các nghiên cứu hiện tại vẫn đang tìm kiếm các phương pháp hiệu quả hơn để giải quyết những vấn đề này.

II. Phát hiện mặt người trong ảnh theo hướng tiếp cận thành phần

Hướng tiếp cận thành phần trong phát hiện mặt người sử dụng các kỹ thuật như PCA (Phân tích thành phần chính) để giảm chiều dữ liệu và cải thiện độ chính xác. Kỹ thuật máy học như Adaboost kết hợp với đặc trưng Haar cũng được áp dụng để phát hiện khuôn mặt. Việc sử dụng các đặc trưng không thay đổi giúp tăng cường khả năng nhận diện trong các điều kiện khác nhau. Các phương pháp này đã cho thấy hiệu quả trong việc phát hiện khuôn mặt trong các ảnh phức tạp.

2.1. Sử dụng kỹ thuật PCA

Kỹ thuật PCA giúp giảm số lượng đặc trưng cần thiết cho việc nhận diện khuôn mặt. Bằng cách phân tích ma trận hiệp phương sai, PCA có thể xác định các đặc trưng quan trọng nhất của khuôn mặt. Điều này không chỉ giúp giảm thiểu khối lượng dữ liệu mà còn cải thiện tốc độ xử lý. Việc áp dụng PCA trong phát hiện mặt người đã cho thấy những kết quả khả quan, đặc biệt trong các bài toán có nhiều biến thể về khuôn mặt.

2.2. Kỹ thuật phân tích thành phần chính

Kỹ thuật phân tích thành phần chính (PCA) là một trong những phương pháp hiệu quả nhất trong việc phát hiện mặt người. PCA giúp xác định các đặc trưng chính của khuôn mặt và loại bỏ những thông tin không cần thiết. Việc sử dụng đặc trưng Haar kết hợp với Adaboost đã tạo ra một hệ thống phát hiện khuôn mặt mạnh mẽ, có khả năng nhận diện trong nhiều điều kiện khác nhau. Các nghiên cứu cho thấy rằng việc kết hợp nhiều phương pháp có thể nâng cao độ chính xác của hệ thống nhận diện.

III. Chương trình thử nghiệm

Chương trình thử nghiệm được thiết kế để đánh giá hiệu quả của các phương pháp phát hiện mặt người. Các yếu tố như góc chụp, kích thước khuôn mặt, và điều kiện ánh sáng được xem xét kỹ lưỡng. Kết quả thử nghiệm cho thấy rằng việc áp dụng các kỹ thuật hiện đại có thể cải thiện đáng kể độ chính xác trong việc phát hiện khuôn mặt. Các ứng dụng thực tế của hệ thống này bao gồm giám sát an ninh và giao tiếp người máy.

3.1. Hướng nghiên cứu

Hướng nghiên cứu tiếp theo sẽ tập trung vào việc cải thiện độ chính xác của các hệ thống phát hiện mặt người. Việc áp dụng các công nghệ mới như học sâu và trí tuệ nhân tạo có thể mở ra nhiều cơ hội mới trong lĩnh vực này. Các nghiên cứu cũng sẽ xem xét việc phát triển các thuật toán có khả năng nhận diện trong các điều kiện phức tạp hơn.

3.2. Kết quả thử nghiệm

Kết quả thử nghiệm cho thấy rằng các phương pháp hiện tại có thể đạt được độ chính xác cao trong việc phát hiện khuôn mặt. Tuy nhiên, vẫn còn nhiều thách thức cần phải vượt qua, đặc biệt là trong việc xử lý các ảnh có nhiều khuôn mặt hoặc trong điều kiện ánh sáng không tốt. Việc cải thiện các thuật toán và áp dụng các công nghệ mới sẽ là chìa khóa để nâng cao hiệu quả của hệ thống.

25/01/2025

Bạn đang xem trước tài liệu:

Luận văn thạc sĩ phát hiện mặt người trong ảnh theo hướng tiếp cận thành phần

Tải đầy đủ

Nội dung chính

Tổng quan nghiên cứu

Trong hơn một thập kỷ qua, phát hiện mặt người trong ảnh đã trở thành một lĩnh vực nghiên cứu trọng điểm trong ngành Công nghệ Thông tin, đặc biệt trong xử lý ảnh số. Theo ước tính, các hệ thống phát hiện khuôn mặt hiện nay được ứng dụng rộng rãi trong nhiều lĩnh vực như an ninh, giám sát, giao tiếp người-máy và tìm kiếm thông tin trên ảnh, video. Tuy nhiên, bài toán phát hiện mặt người vẫn còn nhiều thách thức do sự đa dạng về tư thế, biểu cảm, điều kiện ánh sáng và sự che khuất trong ảnh. Mục tiêu nghiên cứu của luận văn là phát triển phương pháp phát hiện mặt người trong ảnh dựa trên hướng tiếp cận thành phần, nhằm nâng cao độ chính xác và hiệu quả xử lý trong các môi trường phức tạp. Phạm vi nghiên cứu tập trung vào ảnh kỹ thuật số đa cấp xám và ảnh màu, với dữ liệu thu thập tại Việt Nam trong giai đoạn trước năm 2011. Ý nghĩa của nghiên cứu được thể hiện qua việc cải thiện các chỉ số như tỷ lệ phát hiện chính xác, giảm sai số và tăng tốc độ xử lý, góp phần ứng dụng trong các hệ thống an ninh, quản lý nhân sự và giao tiếp trực quan.

Cơ sở lý thuyết và phương pháp nghiên cứu

Khung lý thuyết áp dụng

Luận văn dựa trên hai lý thuyết và mô hình nghiên cứu chính:

Phân tích thành phần chính (PCA - Principal Components Analysis): PCA là phương pháp thống kê dùng để giảm số chiều dữ liệu bằng cách tìm các thành phần chính không tương quan, giúp biểu diễn dữ liệu phức tạp trong không gian thấp chiều hơn mà vẫn giữ được phần lớn thông tin. Các khái niệm chính bao gồm độ lệch chuẩn, phương sai, hiệp phương sai, ma trận hiệp phương sai, vector riêng (eigenvector) và giá trị riêng (eigenvalue). PCA được ứng dụng để trích xuất đặc trưng khuôn mặt (eigenface), từ đó phát hiện và nhận dạng khuôn mặt trong ảnh.
Thuật toán AdaBoost kết hợp đặc trưng Haar: AdaBoost là kỹ thuật tăng cường (boosting) nhằm kết hợp nhiều bộ phân loại yếu thành bộ phân loại mạnh, sử dụng trọng số để tập trung vào các mẫu khó phân loại. Đặc trưng Haar là các bộ lọc hình chữ nhật dùng để mô tả sự khác biệt cường độ sáng giữa các vùng ảnh, được tính toán nhanh nhờ ảnh tích phân (Integral Image) và biến thể RSAT (Rotated Summed Area Table). Sự kết hợp này tạo thành hệ thống phát hiện khuôn mặt hiệu quả, có khả năng xử lý nhanh và chính xác trong ảnh phức tạp.

Các khái niệm chuyên ngành quan trọng khác bao gồm: ma trận đại số, khoảng cách Mahalanobis, mạng neural, phân đoạn ảnh, và các mô hình xác suất thống kê.

Phương pháp nghiên cứu

Nguồn dữ liệu nghiên cứu bao gồm tập ảnh khuôn mặt đa dạng về tư thế, biểu cảm và điều kiện ánh sáng, được thu thập từ các bộ dữ liệu công khai và thực tế tại một số địa phương Việt Nam. Cỡ mẫu khoảng vài trăm ảnh, đảm bảo tính đại diện cho các trường hợp phổ biến.

Phương pháp phân tích chính là áp dụng PCA để trích xuất đặc trưng khuôn mặt, kết hợp với thuật toán AdaBoost và đặc trưng Haar để xây dựng bộ phân loại mạnh phát hiện mặt người trong ảnh. Quá trình nghiên cứu gồm các bước: chuẩn bị dữ liệu, tiền xử lý ảnh (khử nhiễu, chỉnh mức xám), tính toán ma trận hiệp phương sai, xác định vector và giá trị riêng, lựa chọn thành phần chính, xây dựng bộ phân loại AdaBoost với các đặc trưng Haar, và thử nghiệm trên tập dữ liệu kiểm định.

Timeline nghiên cứu kéo dài khoảng 12 tháng, bao gồm giai đoạn thu thập và xử lý dữ liệu (3 tháng), phát triển thuật toán (5 tháng), thử nghiệm và đánh giá (4 tháng).

Kết quả nghiên cứu và thảo luận

Những phát hiện chính

Hiệu quả trích xuất đặc trưng bằng PCA: Việc giữ lại khoảng 40 thành phần chính trong PCA đã giúp giữ được trên 95% thông tin của tập dữ liệu ảnh khuôn mặt kích thước 128x128 điểm ảnh. Điều này giảm đáng kể không gian đặc trưng từ 16.384 chiều xuống còn 40 chiều, giúp tăng tốc độ xử lý mà vẫn duy trì độ chính xác cao.
Độ chính xác phát hiện khuôn mặt: Hệ thống kết hợp đặc trưng Haar và AdaBoost đạt tỷ lệ phát hiện chính xác khoảng 87%-89% trên tập dữ liệu thử nghiệm, vượt trội so với các phương pháp truyền thống chỉ đạt khoảng 70%-80%. Tỷ lệ sai phát hiện thấp hơn 15%, thể hiện khả năng phân biệt tốt giữa khuôn mặt và các đối tượng nền.
Khả năng xử lý đa tư thế và điều kiện ánh sáng: Thuật toán phát hiện khuôn mặt có thể nhận diện chính xác các khuôn mặt với các tư thế nghiêng từ -20° đến 20°, cũng như trong các điều kiện ánh sáng khác nhau, bao gồm ảnh chụp trong nhà, ngoài trời và ngược sáng. Tỷ lệ chính xác trong các trường hợp này đạt trên 80%.
Tốc độ xử lý: Nhờ sử dụng ảnh tích phân và thuật toán AdaBoost, hệ thống có thể xử lý ảnh với tốc độ nhanh, phù hợp cho các ứng dụng thời gian thực như giám sát an ninh và chấm công tự động.

Thảo luận kết quả

Nguyên nhân của hiệu quả trên là do sự kết hợp giữa PCA giúp giảm chiều dữ liệu và trích xuất đặc trưng khuôn mặt hiệu quả, cùng với AdaBoost tăng cường khả năng phân loại dựa trên các đặc trưng Haar có tính phân biệt cao. So với các nghiên cứu trước đây, kết quả này cải thiện đáng kể tỷ lệ phát hiện và giảm sai số, đồng thời mở rộng phạm vi ứng dụng trong môi trường phức tạp hơn.

Dữ liệu có thể được trình bày qua biểu đồ so sánh tỷ lệ chính xác giữa các phương pháp, bảng thống kê tỷ lệ phát hiện theo từng tư thế và điều kiện ánh sáng, cũng như biểu đồ tốc độ xử lý trên các kích thước ảnh khác nhau.

Kết quả cũng cho thấy hạn chế khi khuôn mặt bị che khuất nặng hoặc có nhiều đối tượng trong ảnh, cần nghiên cứu thêm các kỹ thuật bổ trợ như nhận dạng khuôn mặt dựa trên đặc trưng sâu (deep features) hoặc mạng nơ-ron tích chập (CNN).

Đề xuất và khuyến nghị

Tăng cường dữ liệu huấn luyện: Thu thập thêm dữ liệu khuôn mặt đa dạng về tư thế, biểu cảm và điều kiện ánh sáng để cải thiện khả năng tổng quát của mô hình. Mục tiêu tăng tỷ lệ phát hiện chính xác lên trên 90% trong vòng 12 tháng, do nhóm nghiên cứu và đối tác thực hiện.
Kết hợp kỹ thuật học sâu: Áp dụng các mô hình học sâu như CNN để trích xuất đặc trưng khuôn mặt nâng cao, nhằm xử lý tốt hơn các trường hợp che khuất và phức tạp. Thử nghiệm và đánh giá trong 6 tháng tiếp theo, do nhóm nghiên cứu công nghệ thông tin đảm nhiệm.
Phát triển hệ thống thời gian thực: Tối ưu thuật toán để triển khai trên các thiết bị nhúng hoặc camera thông minh, đáp ứng yêu cầu xử lý nhanh trong các ứng dụng giám sát an ninh và quản lý nhân sự. Mục tiêu hoàn thành trong 9 tháng, phối hợp với các đơn vị phát triển phần cứng.
Xây dựng bộ dữ liệu chuẩn Việt Nam: Thiết lập bộ dữ liệu ảnh khuôn mặt tiêu chuẩn phù hợp với đặc điểm dân cư Việt Nam, hỗ trợ nghiên cứu và phát triển các hệ thống nhận dạng khuôn mặt chính xác hơn. Thời gian thực hiện dự kiến 1 năm, do các viện nghiên cứu và trường đại học phối hợp.

Đối tượng nên tham khảo luận văn

Nhà nghiên cứu và sinh viên ngành Công nghệ Thông tin: Đặc biệt những người quan tâm đến xử lý ảnh, thị giác máy tính và nhận dạng khuôn mặt sẽ tìm thấy cơ sở lý thuyết và phương pháp thực nghiệm chi tiết, hỗ trợ phát triển các đề tài nghiên cứu tiếp theo.
Chuyên gia phát triển hệ thống an ninh và giám sát: Các kỹ thuật phát hiện mặt người trong luận văn có thể ứng dụng trực tiếp vào thiết kế hệ thống camera giám sát, nhận dạng tội phạm, quản lý ra vào nhân sự, giúp nâng cao hiệu quả và độ chính xác.
Doanh nghiệp công nghệ và startup: Các công ty phát triển sản phẩm liên quan đến giao tiếp người-máy, bảo mật sinh trắc học, tìm kiếm thông tin trên ảnh và video có thể áp dụng các thuật toán và mô hình được đề xuất để cải tiến sản phẩm.
Cơ quan quản lý và tổ chức đào tạo: Các đơn vị quản lý an ninh, giáo dục và đào tạo có thể sử dụng luận văn làm tài liệu tham khảo để xây dựng chương trình đào tạo, nâng cao năng lực chuyên môn cho cán bộ kỹ thuật và sinh viên.

Câu hỏi thường gặp

Phân tích thành phần chính (PCA) là gì và tại sao lại quan trọng trong phát hiện khuôn mặt?
PCA là phương pháp giảm chiều dữ liệu bằng cách tìm các thành phần chính không tương quan, giúp trích xuất đặc trưng quan trọng của khuôn mặt. Ví dụ, giữ lại 40 thành phần chính có thể giữ trên 95% thông tin ảnh, giúp giảm chi phí tính toán mà vẫn duy trì độ chính xác.
AdaBoost hoạt động như thế nào trong việc phát hiện khuôn mặt?
AdaBoost kết hợp nhiều bộ phân loại yếu thành bộ phân loại mạnh bằng cách tăng trọng số cho các mẫu khó phân loại. Ví dụ, các đặc trưng Haar được chọn lọc qua AdaBoost giúp hệ thống tập trung vào các vùng ảnh quan trọng, nâng cao độ chính xác phát hiện.
Đặc trưng Haar là gì và tại sao nó được sử dụng?
Đặc trưng Haar là các bộ lọc hình chữ nhật đo sự khác biệt cường độ sáng giữa các vùng ảnh kề nhau. Chúng có thể được tính toán nhanh nhờ ảnh tích phân, giúp phát hiện các đặc điểm khuôn mặt như mắt, mũi, miệng hiệu quả.
Hệ thống có thể phát hiện khuôn mặt trong các điều kiện ánh sáng khác nhau không?
Có, hệ thống được thiết kế để xử lý ảnh trong nhà, ngoài trời, ngược sáng với tỷ lệ phát hiện chính xác trên 80%. Tuy nhiên, điều kiện ánh sáng quá yếu hoặc quá chói vẫn là thách thức cần cải tiến thêm.
Làm thế nào để xử lý các trường hợp khuôn mặt bị che khuất hoặc nhiều khuôn mặt trong ảnh?
Hiện tại, phương pháp thành phần và AdaBoost có hạn chế khi khuôn mặt bị che khuất nặng hoặc ảnh có nhiều khuôn mặt phức tạp. Giải pháp đề xuất là kết hợp với các kỹ thuật học sâu và mô hình nhận dạng nâng cao để cải thiện khả năng xử lý.

Kết luận

Luận văn đã phát triển thành công phương pháp phát hiện mặt người trong ảnh dựa trên phân tích thành phần chính (PCA) và thuật toán AdaBoost kết hợp đặc trưng Haar, đạt tỷ lệ phát hiện chính xác trên 87%.
Phương pháp cho phép xử lý hiệu quả các ảnh đa dạng về tư thế, biểu cảm và điều kiện ánh sáng, phù hợp với nhiều ứng dụng thực tế.
Nghiên cứu đã giảm đáng kể không gian đặc trưng từ hàng chục nghìn chiều xuống còn khoảng 40 chiều, giúp tăng tốc độ xử lý.
Các đề xuất nâng cao bao gồm mở rộng dữ liệu huấn luyện, áp dụng học sâu và phát triển hệ thống thời gian thực.
Các bước tiếp theo là triển khai thử nghiệm trên thiết bị thực tế và xây dựng bộ dữ liệu chuẩn Việt Nam để nâng cao độ chính xác và khả năng ứng dụng.

Các nhà nghiên cứu và doanh nghiệp trong lĩnh vực xử lý ảnh và nhận dạng khuôn mặt được khuyến khích áp dụng và phát triển tiếp các phương pháp trong luận văn nhằm nâng cao hiệu quả và mở rộng ứng dụng trong thực tế.

Trích đoạn nội dung tài liệu

PHẦN MỞ ĐẦU Hơn một thập kỷ vừa qua, thế giới đã chứng kiến sự xuất hiện của rất nhiều công trình nghiên cứu về bài toán xác định khuôn mặt ngƣời, từ ảnh đen trắng, xám đến ảnh màu, từ ảnh tĩnh đến những dữ liệu ảnh thu nhận đƣợc từ camera nhƣ ngày hôm nay. Phát hiện khuôn mặt trong ảnh số là vấn đề đang đƣợc quan tâm và phát triển. Nhiều hƣớng tiếp cận, nhiều phƣơng pháp đƣợc nghiên cứu và đề xuất để phát hiện khuôn mặt trong ảnh hoặc chuỗi ảnh. Các nghiên cứu đi từ bài toán đơn giản, mỗi ảnh chỉ có một khuôn mặt ngƣời nhìn thẳng vào thiết bị thu hình và đầu ở tƣ thế thẳng đứng trong ảnh đen trắng.

Cho đến ngày hôm nay bài toán mở rộng cho ảnh màu, có nhiều khuôn mặt trong cùng một ảnh, có nhiều tƣ thế thay đổi trong ảnh. Không những vậy mà còn mở rộng cả phạm vi từ môi trƣờng xung quanh khá đơn giản (trong phòng thí nghiệm) cho đến môi trƣờng xung quanh rất phức tạp (nhƣ trong tự nhiên) nhằm đáp ứng nhu cầu thật sự và rất nhiều của con ngƣời. Bài toán xác định khuôn mặt ngƣời (Face Detection) là một phần quan trọng trong bài toán nhận dạng mặt ngƣời, một bài toán liên quan đến rất nhiều ứng dụng trong thực tế đời sống. Sau đây là một số ứng dụng đã và đang đƣợc thiết kế:  Hệ thống phát hiện tội phạm: camera đƣợc đặt tại một số điểm công cộng nhƣ: siêu thị, nhà sách, trạm xe buýt, sân bay,.

Khi phát hiện đƣợc sự xuất hiện của các đối tƣợng là tội phạm, hệ thống sẽ gởi thông điệp về cho trung tâm xử lý.  Hệ thống theo dõi nhân sự trong một đơn vị: giám sát giờ ra vào của từng nhân viên và chấm công.  Hệ thống giao tiếp ngƣời máy: thay thế việc tƣơng tác giữa ngƣời và máy theo những cách truyền thống nhƣ: Bàn phím, chuột,.thay vào đó là sử dụng các giao tiếp trực quan: Biểu cảm khuôn mặt, dấu hiệu, cử chỉ bằng tay (visual input, visual interaction).  Hệ thống tìm kiếm thông tin trên ảnh, video dựa trên nội dung (chỉ mục theo ngƣời).

Chẳng hạn nhƣ: Đài truyền hình Việt Nam (VTV) có một kho dữ liệu video tin tức khá lớn cần tìm kiếm nhanh những đoạn video nào có G. Bush hoặc Bin Laden. 1 z  Các hệ thống bảo mật dựa trên thông tin trắc sinh học: Mặt ngƣời, vân tay,. thay vì xác nhận mật khẩu, khoá,.

Đề tài đƣợc tổ chức thành ba chƣơng với nội dung: Chƣơng 1. Khái quát về xử lý ảnh và phát phát hiện mặt ngƣời trong ảnh: Giới thiệu tổng quan về các khái niệm căn bản trong lĩnh vực xử lý ảnh và của bài toán phát hiện mặt ngƣời trong ảnh, xác định bài toán và những khó khăn gặp phải khi giải quyết bài toán này. Phát hiện mặt ngƣời trong ảnh theo hƣớng tiếp cận thành phần: Giới thiệu một số kĩ thuật phát hiện mặt ngƣời trong ảnh theo hƣớng tiếp cận thành phần. Chƣơng trình thử nghiệm: Xác định yêu cầu của bài toán, phân tích thiết kế và giới thiệu chức năng chính, cài đặt thử nghiệm một chƣơng trình phát hiện mặt ngƣời trong ảnh theo hƣớng tiếp cận thành phần.

2 z DANH SÁCH TỪ VIẾT TẮT PCA Principal Components Analysis SVM Support vector machine SAT Summed Area Table RSAT Rotated Summed Area Table CART Classification and Regression Trees SGLD Self-Guided Langevin Dynamics QMF Query Management Facility PDM Point Distribution Model ASM Active Shape Model 3 z CHƢƠNG 1 KHÁI QUÁT VỀ XỬ LÝ ẢNH VÀ PHÁT HIỆN MẶT NGƢỜI TRONG ẢNH 1.1 Khái quát về xử lý ảnh 1.1 Xử lý ảnh là gì? Con ngƣời thu nhận thông tin qua các giác quan, trong đó thị giác đóng vai trò quan trọng nhất. Những năm trở lại đây với sự phát triển của phần cứng máy tính, xử lý ảnh và đồ hoạ đó phát triển một cách mạnh mẽ và có nhiều ứng dụng trong cuộc sống. Xử lý ảnh và đồ hoạ đóng một vai trò quan trọng trong tƣơng tác ngƣời máy. Quá trình xử lý ảnh đƣợc xem nhƣ là quá trình thao tác ảnh đầu vào nhằm cho ra kết quả mong muốn.

Kết quả đầu ra của một quá trình xử lý ảnh có thể là một ảnh “tốt hơn” hoặc một kết luận.1: Mô hình quá trình xử lý ảnh Ảnh có thể xem là tập hợp các điểm ảnh và mỗi điểm ảnh đƣợc xem nhƣ là đặc trƣng cƣờng độ sáng hay một dấu hiệu nào đó tại một vị trí nào đó của đối tƣợng trong không gian và nó có thể xem nhƣ một hàm n biến P(c1, c2,. Do đó, ảnh trong xử lý có thể xem nhƣ n chiều.2 Các vấn đề cơ bản trong xử lý ảnh 1.1 Một số khái niệm cơ bản Ảnh và điểm ảnh: Điểm ảnh đƣợc xem nhƣ là dấu hiệu hay cƣờng độ sáng tại một toạ độ trong không gian của đối tƣợng và ảnh đƣợc xem nhƣ là một tập hợp các điểm ảnh. Mức xám, màu: Là số các giá trị có thể có của các điểm ảnh của ảnh.2 Nắn chỉnh biến dạng Ảnh thu nhận thƣờng bị biến dạng do các thiết bị quang học và điện tử.2: Mô hình việc nắn chỉnh biến dạng Để khắc phục ngƣời ta sử dụng các phép chiếu, các phép chiếu thƣờng đƣợc xây dựng trên tập các điểm điều khiển. Giả sử (P i , P i' ) in1 có n các tập điều khiển Tìm hàm f: P i  f(P i ) sao cho: Giả sử ảnh bị biến đổi chỉ bao gồm: Tịnh tiến, quay, tỷ lệ, biến dạng bậc nhất tuyến tính.

Khi đó hàm f có dạng: f (x, y) = (a1x + b1y + c1, a2x + b2y + c2) Ta có: Để cho φ → min 5 z Giải hệ phƣơng trình tuyến tính tìm đƣợc a1, b1, c1 Tƣơng tự tìm đƣợc a2, b2, c2  Xác định đƣợc hàm f 1.3 Khử nhiễu Có 2 loại nhiễu cơ bản trong quá trình thu nhận ảnh - Nhiễu hệ thống: Nhiễu có quy luật có thể khử bằng các phép biến đổi. - Nhiễu ngẫu nhiên: Vết bẩn không rõ nguyên nhân → khắc phục bằng các phép lọc.4 Chỉnh mức xám Nhằm khắc phục tính không đồng đều của hệ thống gây ra. Thông thƣờng có 2 hƣớng tiếp cận: - Giảm số mức xám: Thực hiện bằng cách nhóm các mức xám gần nhau thành một bó. Trƣờng hợp chỉ có hai mức xám thì chính là chuyển về ảnh đen trắng.

Ứng dụng: In ảnh màu ra máy in đen trắng. - Tăng số mức xám: Thực hiện nội suy ra các mức xám trung gian bằng kỹ thuật nội suy. Kỹ thuật này nhằm tăng cƣờng độ mịn cho ảnh 1.5 Trích chọn đặc điểm Các đặc điểm của đối tƣợng đƣợc trích chọn tuỳ theo mục đích nhận dạng trong quá trình xử lý ảnh. Có thể nêu ra một số đặc điểm của ảnh sau đây: - Đặc điểm không gian: Phân bố mức xám, phân bố xác suất, biên độ, điểm uốn.

6 z - Đặc điểm biến đổi: Các đặc điểm loại này đƣợc trích chọn bằng việc thực hiện lọc vùng (zonal filtering). Các bộ vùng đƣợc gọi là “mặt nạ đặc điểm” (feature mask) thƣờng là các khe hẹp với hình dạng khác nhau (chữ nhật, tam giác, cung tròn,.) - Đặc điểm biên và đƣờng biên: Đặc trƣng đƣờng biên của đối tƣợng rất hữu ích trong việc trích chọn các thuộc tính bất biến và đƣợc dùng khi nhận dạng đối tƣợng. Các đặc điểm này có thể đƣợc trích chọn nhờ toán tử gradient, toán tử la bàn, toán tử Laplace, toán tử “chéo không” (zero crossing),. Việc trích chọn hiệu quả các đặc điểm giúp cho việc nhận dạng các đối tƣợng ảnh chính xác, với tốc độ tính toán cao và dung lƣợng nhớ lƣu trữ giảm xuống.6 Nhận dạng Xét trên phƣơng diện tổng quát, nhận dạng đối tƣợng là một công việc đƣợc thực hiện hàng ngày của những sinh vật sống và là khả năng vốn có và cần thiết của sinh vật để thích nghi với môi trƣờng.

Công việc này đƣợc thực hiện trong trong những tình huống khác nhau nhƣ là tìm kiếm nguồn thức ăn, di trú, phát hiện ra thú dữ hay là để nhận biết những ngƣời bạn v. một cách rất hiệu quả. Nhận dạng đối tƣợng đƣợc xem nhƣ là một khái niệm nhận thức rộng nó có thể là một nhiệm vụ rất đơn giản, ví dụ nhƣ khi một vi sinh vật biến mất khỏi môi trƣờng không đủ độ pH, hay là những nhiệm vụ phức tạp đòi hỏi khả năng suy luận, mô tả và hiểu biết nhất định, ví dụ khi một ngƣời phải tìm một cái kéo từ ngăn thứ hai đếm từ dƣới lên của một cái tủ. Nhận dạng tự động (automatic recognition), mô tả đối tƣợng, phân loại và phân nhóm các mẫu là những vấn đề quan trọng trong thị giác máy, đƣợc ứng dụng trong nhiều ngành khoa học khác nhau.

Tuy nhiên, một câu hỏi đặt ra là: Mẫu (pattern) là gì? Watanabe, một trong những ngƣời đi đầu trong lĩnh vực này đã định nghĩa: “Ngƣợc lại với hỗn loạn (chaos), mẫu là một thực thể (entity), đƣợc xác định một cách ang áng (vaguely defined) và có thể gán cho nó một tên gọi nào đó”. Ví dụ mẫu có thể là ảnh của vân tay, ảnh của một vật nào đó đƣợc chụp, một chữ viết, khuôn mặt ngƣời hoặc một ký đồ tín hiệu tiếng nói. Khi có một mẫu nào đó, để nhận dạng hoặc phân loại mẫu đó có thể: 7 z  Hoặc phân loại có mẫu (supervised classification), chẳng hạn phân tích phân biệt (discriminant analyis), trong đó mẫu đầu vào đƣợc định danh nhƣ một thành phần của một lớp đã xác định.  Hoặc phân loại không có mẫu (unsupervised classification hay clustering) trong đó các mẫu đƣợc gán vào các lớp khác nhau dựa trên một tiêu chuẩn đồng dạng nào đó.

Các lớp này cho đến thời điểm phân loại vẫn chƣa biết hay chƣa đƣợc định danh. Những ứng dụng của các hệ thống nhận dạng mẫu nói chung và hệ thống nhận dạng trong xử lý ảnh với dữ liệu hình ảnh là rất lớn và bao trùm một phạm vi rộng lớn của cuộc sống. Sau đây là một số ví dụ trong một vài hoạt động chuyên ngành:  Nông nghiệp:  Phân tích cây trồng.  Đánh giá đất trồng.

 Thiên văn học:  Phân tích ảnh chụp từ kính viễn vọng.  Tự động hoá quang phổ học.  Sinh học:  Tự động hoá tế bào học.  Đặc trƣng của các nhiễm sắc thể.

 Các nghiên cứu di truyền học.  Quản lý công dân:  Phân tích và điều khiển luồng giao thông.  Định mức sự tăng trƣởng của thành phố.  Quản lý kinh tế:  Dự đoán thị trƣờng chứng khoán.

 Phân tích hiệu suất của doanh nghiệp.  Kỹ thuật:  Phát hiện lỗi trong những sản phẩm đƣợc chế tạo. 8 z  Nhận dạng ký tự.  Nhận dạng tiếng nói.

Nội dung được bảo vệ bản quyền — Tải xuống đầy đủ

Bài luận văn thạc sĩ mang tiêu đề "Luận văn thạc sĩ về phát hiện mặt người trong ảnh theo hướng tiếp cận thành phần" của tác giả Đào Vũ Chiến, dưới sự hướng dẫn của PGS. Đỗ Năng Toàn, được thực hiện tại Đại học Quốc gia Hà Nội vào năm 2011. Bài viết tập trung vào việc phát hiện khuôn mặt người trong ảnh thông qua các phương pháp tiếp cận thành phần, một lĩnh vực quan trọng trong công nghệ thông tin và nhận diện hình ảnh. Bài luận không chỉ cung cấp cái nhìn sâu sắc về các kỹ thuật hiện có mà còn mở ra hướng nghiên cứu mới cho các ứng dụng trong nhận diện khuôn mặt, bảo mật và nhiều lĩnh vực khác.

Để mở rộng thêm kiến thức về các ứng dụng công nghệ thông tin trong giáo dục và nhận diện hình ảnh, bạn có thể tham khảo các bài viết liên quan như "Luận Văn Thạc Sĩ: Ứng Dụng Active Learning trong Lựa Chọn Dữ Liệu Gán Nhãn cho Bài Toán Nhận Diện Giọng Nói", nơi nghiên cứu về việc áp dụng các phương pháp học máy trong nhận diện giọng nói, hay "Luận văn thạc sĩ: Nhận dạng giọng nói tiếng Việt qua học sâu và mô hình ngôn ngữ", bài viết này cũng khai thác các kỹ thuật học sâu trong lĩnh vực nhận diện âm thanh. Cuối cùng, bạn có thể tìm hiểu thêm về "Nghiên cứu ứng dụng học sâu vào dịch từ vựng mà không cần dữ liệu song ngữ", một nghiên cứu thú vị về ứng dụng học sâu trong ngôn ngữ học. Những tài liệu này sẽ giúp bạn có cái nhìn toàn diện hơn về các xu hướng và ứng dụng trong lĩnh vực công nghệ thông tin hiện nay.

#Nghiên cứu thạc sĩ

#xử lý ảnh

#nhận diện khuôn mặt

#phát hiện mặt người

#thành phần hình ảnh

#thuật toán phát hiện mặt

Chủ đề

Công nghệ nhận diện khuôn mặt

Xử lý và phân tích hình ảnh

Nghiên cứu và ứng dụng trong AI

Phát triển thuật toán trong học máy

Luận văn thạc sĩ về phát hiện mặt người trong ảnh theo hướng tiếp cận thành phần

PHẦN MỞ ĐẦU

1. CHƯƠNG 1: KHÁI QUÁT VỀ XỬ LÝ ẢNH VÀ PHÁT HIỆN MẶT NGƯỜI TRONG ẢNH

1.1. Khái quát về xử lý ảnh

1.1.1. Xử lý ảnh là gì?

1.1.2. Các vấn đề cơ bản trong xử lý ảnh

1.1.2.1. Một số khái niệm cơ bản

1.1.2.2. Nắn chỉnh biến dạng

1.1.2.3. Trích chọn đặc điểm

1.1.3. Phát hiện mặt người trong xử lý ảnh

1.1.3.1. Những khó khăn của bài toán phát hiện khuôn mặt

1.1.3.1.1. Sự xuất hiện hoặc thiếu một số thành phần của khuôn mặt

1.1.3.1.2. Sự biểu cảm của khuôn mặt

1.1.3.1.3. Sự che khuất

1.1.3.1.4. Điều kiện của ảnh

2. CHƯƠNG 2: PHÁT HIỆN MẶT NGƯỜI TRONG ẢNH THEO HƯỚNG TIẾP CẬN THÀNH PHẦN

2.1. Sử dụng kỹ thuật PCA

2.1.1. Các khái niệm cơ bản

2.1.2. Phương sai

2.1.3. Hiệp phương sai

2.1.4. Ma trận hiệp phương sai

2.1.5. Ma trận đại số

3. CHƯƠNG 3: CHƯƠNG TRÌNH THỬ NGHIỆM

3.1. Hướng nghiên cứu

3.1.1. Phân loại thành phần khuôn mặt

3.1.2. Cấu trúc các bộ nhận dạng

3.1.3. Phân tích, thiết kế

3.1.4. Giao diện và cách sử dụng

3.1.5. Kết quả thử nghiệm

3.1.5.1. Góc chụp so với hướng ống kính

3.1.5.2. Kích thước khuôn mặt

3.1.5.3. Các kết quả thực nghiệm khác

PHẦN KẾT LUẬN

I. Khái quát về xử lý ảnh và phát hiện mặt người trong ảnh

1.1. Khái niệm về xử lý ảnh

1.2. Những khó khăn trong phát hiện mặt người

II. Phát hiện mặt người trong ảnh theo hướng tiếp cận thành phần

2.1. Sử dụng kỹ thuật PCA

2.2. Kỹ thuật phân tích thành phần chính

III. Chương trình thử nghiệm

3.1. Hướng nghiên cứu

3.2. Kết quả thử nghiệm

Tài liệu liên quan

THÔNG TIN CHI TIẾT

Tác giả: Đào Vũ Chiến

Người hướng dẫn: PGS. Đỗ Năng Toàn

Trường học: Đại học Quốc gia Hà Nội

Chuyên ngành: Công nghệ thông tin

Đề tài: Phát hiện mặt người trong ảnh theo hướng tiếp cận thành phần

Loại tài liệu: luận văn thạc sĩ

Năm xuất bản: 2011

Địa điểm: Hà Nội

Tổng quan nghiên cứu

Cơ sở lý thuyết và phương pháp nghiên cứu

Khung lý thuyết áp dụng

Phương pháp nghiên cứu

Kết quả nghiên cứu và thảo luận

Những phát hiện chính

Thảo luận kết quả

Đề xuất và khuyến nghị

Đối tượng nên tham khảo luận văn

Câu hỏi thường gặp

Kết luận

Có thể bạn quan tâm