Luận văn thạc sĩ kỹ thuật điều khiển và tự động hóa phát hiện và theo dõi khuôn mặt trong thời gian trên smartphone

Luận văn thạc sĩ kỹ thuật điều khiển và tự động hóa tập trung vào phát hiện và theo dõi khuôn mặt thời gian thực trên smartphone, ứng dụng công nghệ AI tiên tiến.

Trường đại học

Trường Đại học Bách Khoa – ĐHQG - HCM

Chuyên ngành

Kỹ thuật điều khiển và tự động hóa

Người đăng

Ẩn danh

Thể loại

luận văn thạc sĩ

2015

Phí lưu trữ

30 Point

Mục lục chi tiết

LỜI CẢM ƠN

LỜI CAM ĐOAN

1. Chương 1: Giới thiệu đề tài

1.1. Đặt vấn đề

1.2. Mục tiêu đề tài

1.3. Tóm lược nội dung luận văn

2. Chương 2: Cơ sở lý thuyết liên quan

2.1. Giới thiệu mô hình Cascade của Viola và Jones

2.2. Phương pháp rút trích đặc trưng Haar-like

2.3. Thuật toán Adaboost

2.4. Mô hình Cascade của Viola và Jones sử dụng phát hiện khuôn mặt

2.5. Bộ lọc màu da

2.6. Đặc trưng LBP

2.7. Thuật toán CamShift

2.8. Bộ lọc Particle

3. Chương 3: Thuật Toán Theo Dõi Khuôn Mặt

3.1. Tính histogram của khuôn mặt

3.2. Cải tiến thuật toán Camshift

3.3. Chiến lược phân bố số mẫu Particle

3.4. Áp dụng thuật toán cải tiến CamShift cùng với bộ lọc Particle

4. Chương 4: Hệ Thống phát hiện và theo dõi khuôn mặt trên IOS

4.1. Giới thiệu thư viện Opencv

4.2. Tích hợp OpenCV lên Xcode

4.3. Giao diện sử dụng của hệ thống phát hiện và theo dõi khuôn mặt trên Smartphone

4.4. Thực hiện thuật toán đề xuất qua ứng dụng trên IOS

4.5. Kết quả của hệ thống phát hiện và theo dõi khuôn mặt trên điện thoại thông minh

5. Chương 5: Mô phỏng thuật toán trên Matlab

5.1. Mô phỏng Matlab

5.2. So sánh với các công trình nghiên cứu liên quan khác

6. Chương 6: Kết Luận

6.1. Kết luận

6.2. Hướng phát triển đề tài

Tài liệu tham khảo

Tóm tắt

I. Giới thiệu đề tài

Luận văn thạc sĩ này tập trung vào việc phát hiện và theo dõi khuôn mặt trên smartphone, một lĩnh vực quan trọng trong kỹ thuật điều khiển và tự động hóa. Đề tài nhằm giải quyết các thách thức trong việc tích hợp các thuật toán nhận diện khuôn mặt và theo dõi khuôn mặt trên thiết bị di động, đặc biệt là trong điều kiện thời gian thực. Công nghệ di động và hệ thống giám sát đang ngày càng phát triển, và việc ứng dụng trí tuệ nhân tạo cùng học máy vào xử lý hình ảnh trên smartphone là một hướng đi tiềm năng.

1.1 Đặt vấn đề

Phát hiện khuôn mặt và theo dõi khuôn mặt có ứng dụng rộng rãi trong các lĩnh vực như bảo mật, quân sự và giải trí. Tuy nhiên, việc triển khai các thuật toán này trên smartphone gặp nhiều thách thức do hạn chế về phần cứng. Đề tài này tập trung vào việc tối ưu hóa các thuật toán như Haar-like, CamShift, và bộ lọc Particle để đạt hiệu quả cao trên thiết bị di động.

1.2 Mục tiêu đề tài

Mục tiêu chính của đề tài là xây dựng một hệ thống phát hiện và theo dõi khuôn mặt thời gian thực trên smartphone. Hệ thống này sẽ tích hợp các thuật toán tiên tiến như Haar-like và CamShift để đảm bảo độ chính xác và tốc độ xử lý. Đề tài cũng hướng đến việc khắc phục các vấn đề như khuôn mặt bị che khuất hoặc nhiễu màu da.

II. Cơ sở lý thuyết

Chương này trình bày các lý thuyết nền tảng liên quan đến phát hiện khuôn mặt và theo dõi khuôn mặt. Các thuật toán như Haar-like, Adaboost, và CamShift được phân tích chi tiết, cùng với các phương pháp xử lý hình ảnh và học máy để tối ưu hóa hiệu suất.

2.1 Mô hình Cascade của Viola và Jones

Mô hình Cascade của Viola và Jones là một phương pháp hiệu quả để phát hiện khuôn mặt dựa trên các đặc trưng Haar-like và thuật toán Adaboost. Mô hình này sử dụng một chuỗi các bộ phân loại để loại bỏ nhanh các vùng không chứa khuôn mặt, giúp tăng tốc độ xử lý.

2.2 Thuật toán CamShift và bộ lọc Particle

CamShift là một thuật toán cải tiến từ MeanShift, được sử dụng để theo dõi khuôn mặt dựa trên màu sắc. Tuy nhiên, thuật toán này có nhược điểm là dễ bị sai lệch khi màu nền gần giống màu da. Để khắc phục, đề tài đề xuất kết hợp CamShift với bộ lọc Particle để dự đoán vị trí khuôn mặt chính xác hơn.

III. Thuật toán đề xuất

Chương này trình bày thuật toán đề xuất của đề tài, kết hợp CamShift và bộ lọc Particle để cải thiện hiệu quả theo dõi khuôn mặt. Thuật toán này được thiết kế để xử lý các tình huống khuôn mặt bị che khuất hoặc nhiễu màu da, đảm bảo độ chính xác cao trong điều kiện thời gian thực.

3.1 Cải tiến thuật toán CamShift

Thuật toán CamShift được cải tiến bằng cách tích hợp thêm bộ lọc Particle để dự đoán vị trí khuôn mặt dựa trên mô hình chuyển động. Phương pháp này giúp giảm thiểu sai lệch khi khuôn mặt bị che khuất hoặc khi màu nền gần giống màu da.

3.2 Tích hợp thuật toán trên smartphone

Thuật toán đề xuất được tích hợp vào hệ thống phát hiện và theo dõi khuôn mặt trên smartphone sử dụng nền tảng iOS. Thư viện OpenCV được sử dụng để triển khai các thuật toán xử lý hình ảnh và học máy, đảm bảo hiệu suất cao trên thiết bị di động.

IV. Kết quả và đánh giá

Chương này trình bày các kết quả thực nghiệm và đánh giá hiệu quả của thuật toán đề xuất. Các thử nghiệm được thực hiện trên smartphone với các điều kiện khác nhau, và kết quả được so sánh với các công trình nghiên cứu liên quan.

4.1 Kết quả thực nghiệm

Các thử nghiệm cho thấy thuật toán đề xuất đạt độ chính xác cao trong việc phát hiện và theo dõi khuôn mặt, ngay cả trong điều kiện khuôn mặt bị che khuất hoặc nhiễu màu da. Hệ thống cũng đáp ứng được yêu cầu thời gian thực trên smartphone.

4.2 So sánh với các công trình liên quan

Kết quả của đề tài được so sánh với các công trình nghiên cứu khác trong lĩnh vực nhận diện khuôn mặt và theo dõi khuôn mặt. Thuật toán đề xuất cho thấy ưu thế về độ chính xác và tốc độ xử lý, đặc biệt là trên nền tảng công nghệ di động.

V. Kết luận và hướng phát triển

Đề tài đã thành công trong việc xây dựng một hệ thống phát hiện và theo dõi khuôn mặt thời gian thực trên smartphone. Các kết quả nghiên cứu cho thấy tiềm năng ứng dụng của trí tuệ nhân tạo và học máy trong lĩnh vực công nghệ thông minh. Hướng phát triển tiếp theo bao gồm tối ưu hóa thuật toán và mở rộng ứng dụng vào các lĩnh vực khác như an ninh và giám sát.

5.1 Kết luận

Đề tài đã giải quyết được các vấn đề chính trong phát hiện và theo dõi khuôn mặt trên smartphone, bao gồm việc xử lý khuôn mặt bị che khuất và nhiễu màu da. Thuật toán đề xuất cho thấy hiệu quả cao trong điều kiện thời gian thực.

5.2 Hướng phát triển

Hướng phát triển tiếp theo của đề tài bao gồm việc tối ưu hóa thuật toán để giảm thiểu tài nguyên phần cứng và mở rộng ứng dụng vào các lĩnh vực như an ninh, giám sát và công nghệ thông minh.

21/02/2025

Bạn đang xem trước tài liệu:

Luận văn thạc sĩ kỹ thuật điều khiển và tự động hóa phát hiện và theo dõi khuôn mặt trong thời gian trên smartphone

Tải đầy đủ

Nội dung chính

Tổng quan nghiên cứu

Phát hiện và theo dõi khuôn mặt là một lĩnh vực quan trọng trong thị giác máy tính, có ứng dụng rộng rãi trong bảo mật, quân sự và giải trí đa phương tiện. Với sự phát triển nhanh chóng của điện thoại thông minh, việc ứng dụng các thuật toán phát hiện và theo dõi khuôn mặt trên nền tảng di động trở thành một thách thức lớn do hạn chế về phần cứng. Luận văn tập trung nghiên cứu và phát triển hệ thống phát hiện và theo dõi khuôn mặt thời gian thực trên smartphone, cụ thể là trên nền tảng iOS với thiết bị iPhone 5s, sử dụng camera trước 1.3MP và camera sau 8MP cùng chip Apple A7, Dual-core 1.3 GHz.

Mục tiêu chính của nghiên cứu là xây dựng chương trình phát hiện và theo dõi khuôn mặt qua camera trên điện thoại thông minh, đáp ứng thời gian thực, khắc phục các vấn đề sai lệch khi khuôn mặt bị che khuất hoặc bị ảnh hưởng bởi các vật thể có màu sắc gần giống màu da. Phạm vi nghiên cứu từ tháng 6/2014 đến tháng 12/2015, tập trung vào việc tích hợp các thuật toán phát hiện khuôn mặt Haar-like và thuật toán theo dõi Camshift kết hợp bộ lọc Particle, đồng thời xây dựng và đánh giá hệ thống trên Matlab và iOS.

Nghiên cứu có ý nghĩa lớn trong việc nâng cao hiệu quả tương tác người dùng với thiết bị di động, mở rộng ứng dụng trong các lĩnh vực an ninh và giải trí, đồng thời góp phần phát triển các thuật toán theo dõi đối tượng trên nền tảng phần cứng hạn chế.

Cơ sở lý thuyết và phương pháp nghiên cứu

Khung lý thuyết áp dụng

Mô hình Cascade của Viola và Jones: Sử dụng đặc trưng Haar-like kết hợp thuật toán Adaboost để phát hiện khuôn mặt với hiệu suất cao và thời gian tính toán thấp. Mô hình này xây dựng chuỗi các bộ phân loại (cascade) nhằm loại bỏ nhanh các vùng không phải khuôn mặt, tăng tốc độ nhận dạng.
Đặc trưng Haar-like và Integral Image: Haar-like là các đặc trưng hình chữ nhật dùng để mô tả sự khác biệt về mức xám giữa các vùng ảnh. Integral Image giúp tính toán nhanh các đặc trưng này, giảm thiểu chi phí tính toán.
Thuật toán Adaboost: Thuật toán máy học kết hợp các bộ phân loại yếu thành bộ phân loại mạnh, tập trung vào các mẫu khó nhận dạng bằng cách điều chỉnh trọng số trong quá trình huấn luyện.
Thuật toán Camshift và MeanShift: Thuật toán theo dõi dựa trên histogram màu sắc, Camshift cải tiến từ MeanShift bằng cách điều chỉnh kích thước cửa sổ theo dõi thích nghi với đối tượng.
Bộ lọc Particle: Phương pháp ước lượng trạng thái phi tuyến và phi Gaussian, giúp dự đoán vị trí khuôn mặt khi bị che khuất hoặc chuyển động nhanh, khắc phục nhược điểm của Camshift.
Bộ lọc màu da và đặc trưng LBP (Local Binary Pattern): Bộ lọc màu da dựa trên không gian màu YCrCb giúp loại bỏ nhiễu ánh sáng, đặc trưng LBP dùng để mô tả kết cấu vùng ảnh, hỗ trợ phân biệt khuôn mặt với nền.

Phương pháp nghiên cứu

Nguồn dữ liệu: Hình ảnh và video thu thập từ camera trước và sau của iPhone 5s, cùng với dữ liệu mô phỏng trên Matlab.
Phương pháp phân tích: Áp dụng mô hình Cascade của Viola và Jones để phát hiện khuôn mặt, sau đó sử dụng thuật toán cải tiến Camshift kết hợp bộ lọc Particle để theo dõi khuôn mặt trong thời gian thực. Các thuật toán được triển khai trên Matlab để mô phỏng và đánh giá, sau đó tích hợp vào ứng dụng iOS sử dụng OpenCV 3.0.
Cỡ mẫu và chọn mẫu: Sử dụng 30 mẫu particle trong bộ lọc Particle, điều chỉnh số lượng mẫu dựa trên tỷ lệ màu da trong cửa sổ theo dõi nhằm tối ưu hiệu quả theo dõi.
Timeline nghiên cứu: Từ tháng 6/2014 đến tháng 12/2015, bao gồm giai đoạn nghiên cứu lý thuyết, phát triển thuật toán, mô phỏng trên Matlab, tích hợp và thử nghiệm trên iOS.

Kết quả nghiên cứu và thảo luận

Những phát hiện chính

Hiệu quả phát hiện khuôn mặt: Thuật toán Viola và Jones với mô hình cascade sử dụng 6060 đặc trưng Haar-like, đạt độ chính xác 100% trong việc loại bỏ mẫu nền, với tốc độ nhanh hơn 15 lần so với các phương pháp mạng neural và nhanh hơn 600 lần so với phương pháp thống kê.
Cải tiến thuật toán Camshift: Thuật toán cải tiến giảm sai số xác định cửa sổ theo dõi, tăng tốc độ xử lý trên điện thoại, với hệ số điều chỉnh k=1.5 giúp thích nghi kích thước cửa sổ theo tỷ lệ màu da, đảm bảo theo dõi chính xác khi khuôn mặt thay đổi kích thước.
Ứng dụng bộ lọc Particle: Giúp duy trì theo dõi khuôn mặt khi bị che khuất hoặc có vật thể màu da gần đó, giảm sai lệch vị trí và kích thước cửa sổ theo dõi. Chiến lược phân bố số mẫu particle dựa trên tỷ lệ màu da giúp tối ưu hiệu quả và giảm tải tính toán.
Kết quả thử nghiệm trên iPhone 5s: Ứng dụng chạy với tốc độ khoảng 15 FPS, theo dõi chính xác nhiều khuôn mặt cùng lúc, không bị lệch trọng tâm khi có nhiều đối tượng, và duy trì theo dõi khi khuôn mặt bị che khuất một phần.

Thảo luận kết quả

Kết quả cho thấy sự kết hợp giữa mô hình Cascade của Viola và Jones với thuật toán cải tiến Camshift và bộ lọc Particle là giải pháp hiệu quả cho bài toán phát hiện và theo dõi khuôn mặt trên nền tảng smartphone với phần cứng hạn chế. Việc sử dụng bộ lọc màu da và đặc trưng LBP giúp giảm nhiễu và tăng độ chính xác trong môi trường thực tế có nhiều yếu tố gây nhiễu.

So sánh với các nghiên cứu trước đây, hệ thống này vượt trội về tốc độ và khả năng theo dõi trong điều kiện phức tạp như che khuất và nhiều đối tượng. Dữ liệu có thể được trình bày qua biểu đồ FPS theo thời gian và bảng so sánh độ chính xác giữa các thuật toán.

Đề xuất và khuyến nghị

Tối ưu hóa thuật toán theo dõi: Tiếp tục cải tiến thuật toán Camshift và bộ lọc Particle để giảm độ trễ và tăng độ chính xác, hướng tới hỗ trợ các thiết bị có cấu hình thấp hơn.
Mở rộng hỗ trợ đa nền tảng: Phát triển ứng dụng tương tự trên các hệ điều hành Android và Windows Phone để tăng phạm vi ứng dụng.
Tích hợp trí tuệ nhân tạo nâng cao: Áp dụng các mô hình học sâu để cải thiện khả năng nhận dạng và theo dõi trong điều kiện ánh sáng yếu hoặc phức tạp.
Phát triển giao diện người dùng thân thiện: Thiết kế giao diện đơn giản, dễ sử dụng, hỗ trợ các tính năng điều khiển dựa trên theo dõi khuôn mặt nhằm nâng cao trải nghiệm người dùng.
Thời gian thực hiện: Các giải pháp trên nên được triển khai trong vòng 1-2 năm tới, phối hợp giữa nhóm nghiên cứu và các nhà phát triển phần mềm.

Đối tượng nên tham khảo luận văn

Nhà nghiên cứu và sinh viên ngành thị giác máy tính: Nắm bắt các thuật toán phát hiện và theo dõi khuôn mặt hiện đại, áp dụng trong nghiên cứu và phát triển.
Lập trình viên phát triển ứng dụng di động: Áp dụng các kỹ thuật xử lý ảnh và theo dõi đối tượng trên nền tảng iOS, cải thiện hiệu suất ứng dụng.
Chuyên gia an ninh và giám sát: Ứng dụng công nghệ phát hiện và theo dõi khuôn mặt trong hệ thống giám sát an ninh, nâng cao độ chính xác và hiệu quả.
Doanh nghiệp công nghệ và giải trí: Phát triển các sản phẩm tương tác người dùng dựa trên nhận dạng khuôn mặt, như trò chơi, ứng dụng thực tế ảo.

Câu hỏi thường gặp

Thuật toán Viola và Jones có ưu điểm gì trong phát hiện khuôn mặt?
Viola và Jones sử dụng mô hình cascade với đặc trưng Haar-like và Adaboost, giúp phát hiện nhanh và chính xác, loại bỏ nhanh các vùng không phải khuôn mặt, phù hợp với ứng dụng thời gian thực.
Bộ lọc Particle giúp gì trong theo dõi khuôn mặt?
Bộ lọc Particle dự đoán vị trí khuôn mặt khi bị che khuất hoặc chuyển động nhanh, giảm sai lệch vị trí và kích thước cửa sổ theo dõi, cải thiện độ bền vững của hệ thống.
Tại sao cần cải tiến thuật toán Camshift?
Camshift gốc có sai số lớn khi màu nền gần giống màu da và tính toán kích thước cửa sổ chậm trên thiết bị di động. Cải tiến giúp tăng tốc độ và độ chính xác, phù hợp với phần cứng hạn chế.
Ứng dụng trên iPhone 5s đạt hiệu suất như thế nào?
Ứng dụng chạy với khoảng 15 FPS, theo dõi chính xác nhiều khuôn mặt cùng lúc, duy trì hiệu quả khi khuôn mặt bị che khuất hoặc có vật thể gây nhiễu.
Có thể áp dụng hệ thống này trên nền tảng khác không?
Có thể, nhưng cần điều chỉnh thuật toán và tối ưu hóa cho từng nền tảng do khác biệt về phần cứng và hệ điều hành.

Kết luận

Đã xây dựng thành công hệ thống phát hiện và theo dõi khuôn mặt thời gian thực trên smartphone iOS, sử dụng thuật toán Viola và Jones kết hợp Camshift cải tiến và bộ lọc Particle.
Thuật toán cải tiến giúp khắc phục sai lệch khi khuôn mặt bị che khuất hoặc có vật thể màu da gần đó, nâng cao độ chính xác và độ bền vững của theo dõi.
Ứng dụng trên iPhone 5s đạt tốc độ xử lý khoảng 15 FPS, theo dõi nhiều đối tượng đồng thời với độ chính xác cao.
Mô phỏng trên Matlab cho thấy thuật toán hoạt động hiệu quả trong các điều kiện khác nhau, so sánh tích cực với các công trình nghiên cứu liên quan.
Đề xuất mở rộng nghiên cứu, tối ưu thuật toán và phát triển đa nền tảng trong các bước tiếp theo nhằm ứng dụng rộng rãi hơn trong thực tế.

Hành động tiếp theo: Triển khai các đề xuất cải tiến thuật toán, phát triển ứng dụng đa nền tảng và tích hợp trí tuệ nhân tạo nâng cao để mở rộng ứng dụng trong các lĩnh vực an ninh và giải trí.

Trích đoạn nội dung tài liệu

Đặt vấn đề Phát hiện khuôn mặt và theo dõi khuôn mặt có những ứng dụng rất quan trọng nhất là trong các lĩnh vực liên quan đến bảo mật, quân sự và giải trí đa phương tiện. Đây là một lĩnh vực trong thị giác máy tính được quan tâm lớn vì nó vẫn tồn tại những thách thức. Ngày nay, điện thoại thông minh đóng một vai trò quan trọng, nó đang trở nên phổ biến hơn là máy tính đến với mọi tầng lớp trong xã hội. Trong một tương lai gần, điện thoại thông minh hứa hẹn sẽ thay thế cho máy tính cá nhân.

Tuy nhiên, tương tác của nó với người dùng vẫn có những hạn chế cho nên nó không phải đễ dàng trong việc sử dụng đối với mọi người. Sự phát triển việc phát hiện và theo dõi khuôn mặt trên nền tảng điện thoại thông minh là một hướng tiếp cận khác trong việc tương tác với người dung sẽ thân thiện hơn. Kết quả theo dõi có thể được sử dụng để điều khiển các thiết bị hoặc phân tích hành vi người dùng. Ưu điểm của phương pháp này là có thể tận dụng kết cầu phần cứng hiện có của tất cả các điện thoại thông minh và phần mềm.

Vấn đề đặt ra của bài toán phát hiện và theo dõi khuôn mặt được sự quan tâm rất nhiều và cũng có nhiều nghiên cứu tốt trên nền tảng máy tính cá nhân. Tuy nhiên, với nền tảng phần cứng hạn chế của điện thoại thì để tính toán các thuật toán phát hiện va theo doï khuôn mặt với thời gian thực là một thách thức lớn cho những nhà nghiên cứu và phát triển ứng dụng. Vì những vấn đề đặt ra như vậy cho nên đến bây giờ vẫn chưa có một hệ thống nào tỏ ra thực sự hiệu quả để giải quyết các yêu cầu bài toán đặt ra. Bài toán phát hiện mặt người được Viola và Jones [7] thực hiện dựa trên các đặc trưng Haar-like[1] và thuật toán máy học Adaboost [2] — là một thuật toán cải tiến của boosting [6] khá tốt về mặt chỉ phí giải thuật và độ chính xác trên máy tính Bài toán theo dõi đối tượng có nhiều hướng tiếp cận với các giải thuật MeanShift [4] và sau này được cải tiến thành CAMShift [3] với thời gian đáp ứng nhanh nhưng vẫn tồn tại một nhược điểm là sai lệch lớn khi những màu sắc của nền có màu gần giống với đối tượng được theo dõi.2 Mục tiêu đề tài Mục tiêu chính của đề tài là xây dựng một chương trình trên điện thoại có thê phát hiện và theo dõi các đối tượng là khuôn mặt qua camera đáp ứng theo thời gian thực.

Chương trình sẽ được xây dựng với hai phần chính là phát hiện khuôn mặt người và theo dõi khuôn mặt sau khi phát hiện. Với phần phát hiện khuôn mặt chọn những phương pháp phát hiện tốt nhất hiện nay để tích hợp trên platform là IOS. Bài toán theo dõi khuôn mặt sau khi phát hiện được thực hiện sao cho khắc phục được các vấn đề khi khuôn mặt bị che khuất. Nền tảng sử dụng là hệ điều hành ios trên iPhone 5s với camera trước 1.3M và camera sau 8M và chip Apple A7, Dual-core 1.3 Tóm lược nội dung luận văn Đề tài luận văn xây dựng một hệ thống phát hiện và theo dõi khuôn mặt trên điện thoại thông minh.

Các vấn đề nghiên cứu trong luận văn này được thê hiện qua 6 chương trong báo cáo này, tóm lược nội dung các chương như sau: Chương 2: Đề cập đến các lý thuyết trước đây liên quan đến vấn đề phát hiện khuôn mặt và theo dõi khuôn mặt. Về phần phát hiện khuôn mặt dùng những thuật toán Adaboost dùng đặc trưng Haar-like để phát hiện khuôn mặt. Về phần theo dõi khuôn mặt đề cập đến thuật toán Camshift, mô hình chuyên động và bộ lọc Particle. Ngoài ra sẽ có đề cập đến bộ lọc màu da và đặc trưng LBP.

Chương 3: Sẽ tập trung giải thuật của luận văn đề xuất và cũng là phần trọng tâm của luận văn. Phần này sẽ tập trung giải quyết vấn dé theo đõi khuôn mặt đạt được kết quả tốt hơn dựa vào 2 ý tưởng chính là cải tiễn lại thuật toán Camshift và kết hợp nó cùng với bộ lọc Particle để dự đoán được dựa trên mô hình chuyên động. Thuật toán phát hiện khuôn mặt sẽ sử dụng lại từ chương 2. Chương 4 trình bày phương pháp kết hợp ngôn ngữ C++ với thư viện openCV 3.0 được nhúng vào ngôn ngữ OJctive C và ứng dụng các thuật toán được trình bày trong chương 3 nhằm hiện thực hóa vấn đề phát hiện và theo dõi khuôn mặt trong trên smart phone và các kết quả sơ bộ thu được từ ứng dụng.

Chương 5 trình bày các kết quả mô phỏng khi sử dụng matlab và so sánh với các công trinh nghiên cứu liên quan khác để đánh giá về thuật toán đề xuất. Chương 6 kết luận về việc xây dựng chương trình phát hiện và theo dõi khuôn mặt trên thiết bị smart phone đồng thời nêu ra hướng phát triển đề tài. Chương 2: Cơ sở lý thuyết liên quan 2.1 Giới thiệu mô hình Cascade của Viola và Jones 2.1 Phương pháp rút trích đặc trưng Haar-like Đặc trưng Haar Like được tạo thành bằng việc kết hợp các hình chữ nhật đen, trắng với nhau theo một trật tự, một kích thước nào đó. Hình dưới đây mô tả 4 đặc trưng Haar Like cơ bản như sau: Cc D Hinh 2.1: Cac đặc trưng Haar-like duoc Paul Viola str dung Để phát hiện khuôn mặt các đặc trưng Haar Like cơ bản trên được mở rộng (Lienhart, Kuranov, & Pisarevky, 2002; Lienhart & Maydt, 2002) thành nhóm các đặc trưng cạnh, đặc trưng đường và đặc trưng tầm.

Edge features ined @ (b) © @ 2. Line features 0 oo SPQ ao. Center-surround features 7 (a) ‘ Hình 2.2: Các đặc trưng Haar-like mở rộng của Lienhart và Maydt Giá trị của đặc trưng Haar Like là sự chênh lệch giữa tông xám các điểm ảnh của các vùng đen và các vùng trắng. Đề có thể tính nhanh các đặc trưng này, Viola va Jones (2001; 2004) giới thiệu khái niệm ảnh tích phân (Integral Image).

Integral Image là một mảng hai chiều với kích thước bằng kích thước của ảnh cần tính giá trị đặc trưng Haar Like, với mỗi phần tử của mảng này được tính bằng cách tính tông của điểm ảnh phía trên (dòng-I) và bên trái (cột-1) của nó. Bắt đầu từ vị trí trên, bên trái đến vị trí dưới, phải của ảnh, việc tính toán này đơn thuần chỉ đựa trên phép cộng số nguyên đơn giản, do đó tốc độ thực hiện rất nhanh.3: Cach tinh Integral Image cua anh Giá trị của ảnh tích phân tại điểm P có tọa độ (x, y) được tính như sau: i(y)= LD i@&y) (2.4: Ví dụ dé tinh tong mire xám trong hình chữ nhật Đề tính tổng xám các điểm ảnh trong hình chữ nhật 1234 chỉ cần tính theo công thức : D=i4)+ ñ(1)- 1(2)- 1(3) (2.2) Bộ phân loại yếu được xây dựng như sau : 1 if PLÍ (x)< P,P, otherwise by ()= (2.3) Trong đó x là cửa số con cần xét, f„ là giá trị đặc trung Haar-like , 8. la mức ngưỡng, DỊ, là giá trị quyết định chiều 2.2 Thuật toán Adaboost Thuật toán Adaboost (Adative Boosting) được phát triển dựa trên Boosting là một thuật toán machine learning được đề xuất bởi Yoav Freund and Robert Schapire vào năm 1995. Adaboost với ý tưởng cơ bản sử dụng các bộ phân loại yếu để tạo nên một bộ phân loại mạnh.

A daboost cũng hoạt động trên nguyên tắc kết hợp tuyến tính các bộ phân loại yếu (weak classifiers) để hình thành một bộ phan loai manh (strong classifier). La một cải tiến của tiếp cận boosting, AdaBoost sử dụng thêm khái niệm trọng SỐ (weight) để đánh đấu các mẫu khó nhận dạng. Trong quá trình huấn luyện, cứ mỗi weak classifiers được xây dựng, thuật toán sẽ tiến hành cập nhật lại trọng số để chuẩn bị cho việc xây đựng weak classifier kế tiếp: tăng trọng số của các mẫu bị nhận dạng sai và giảm trọng số của các mẫu được nhận dạng đúng bởi weak classifier vừa xây dựng. Bằng cách này weak classifer sau có thể tập trung vào các mẫu mà các weak classifiers trước nó làm chưa tốt.

Sau cùng, cac weak classifers sé được kết hợp tùy theo mức độ tốt của chúng để tạo nên strong classifier.5 minh hoa cho một cách trực quan cho thuật toán adaboost. 10 Weak Weak Weak Strong Classifer1 Classifer2 Classifer3 Classifer @ !l@ \ ® \ !l@ ®“°@ ej| ®e!e|| ®!te se ®!t@ !e 4 \ \ 4 ®'.~~=_ GO ' ® \ ® )_-r- Le” ® ei? lọ ® mm.5: Phân lớp mạnh H dùng Adaboost từ các phân lớp yếu hị,hạ,hạ. Bài toán phân loại được xây dựng dựa trên thuật toán Adaboost: e Cho các mẫu (x.ŒXnsyn) Với y¡ =0,1 lần lượt là non-face và face. e Các trọng số được khởi động WIjE ` = với m là số mẫu non-face > m va 1 la sé mau face.

e Gia str co T bộ phân loại yéu thì vòng lặp sẽ thực hiện t=l,. Chuẩn hóa các trọng số tí W.:t«m—— LÊ SH, ÈEIY j sao cho w ti là một phân phối xác suất. Hệ số đánh giá lỗi được tính cho mỗi phân lớp hj e = LW; hiy)-y; 3. Chon phan lớp h, sao cho lỗi bé nhất và cập nhật £t.

Cap nhat trong SỐ : Le, Wei Mẹ iB 1I Với e= 0 néu x; được phân loại dung , ngoai ra e= 1 va e B6 phan loại mạnh được tính toán : T lot Dp > 5 Dea 0 otherwise h(x) = .3 Mô hình Cascade của Viola và Jones sử dụng phát hiện khuôn mặt Thuật toán để xây dựng một chuỗi các phân loại đạt hiệu suất cao trong khi thời gian tính toán thấp là hình thức tổng thê của quá trình nhận dạng tạo thành một cây quyết định được gọi là "cascade". Quá trình này gồm hai tập dữ liệu: dữ liệu dương (positive) và ảnh nền (background). Background là tập những bức ảnh không chứa đối tượng cần nhận dạng, ngược lại mẫu positive là tập những bức ảnh chứa đối tượng cần nhận dạng. Cascade of boosting classifiers là mô hình cascade of classifiers với mỗi classifier được xây dựng bằng Adaboost sử dung haar-like dé đánh giá kết quả dương ở mỗi lớp phân loại và cho ra kết quả nhận dạng mong muôn.

Ê AlI Sub-windows ) NT x TN T Z" T (Further N ) / J \ Processing) F FoF Hinh 2.6: Mo hinh Cascade cua Viola va Jones 12 Một kết quả đương từ lớp phân loại đầu tiên gây tiếp tục được đánh giá qua một lớp phân loại thứ hai để đạt được tỷ lệ phát hiện cao hơn.

Nội dung được bảo vệ bản quyền — Tải xuống đầy đủ

Luận Văn Thạc Sĩ: Phát Hiện Và Theo Dõi Khuôn Mặt Trên Smartphone - Kỹ Thuật Điều Khiển Và Tự Động Hóa là một nghiên cứu chuyên sâu về việc ứng dụng các kỹ thuật điều khiển và tự động hóa trong lĩnh vực nhận diện khuôn mặt trên thiết bị di động. Tài liệu này tập trung vào việc phát triển các giải thuật hiệu quả để phát hiện và theo dõi khuôn mặt trong thời gian thực, đồng thời tối ưu hóa hiệu suất trên nền tảng smartphone. Những kết quả nghiên cứu không chỉ mang lại giá trị học thuật mà còn có tiềm năng ứng dụng thực tiễn trong các hệ thống an ninh, giám sát và tương tác người-máy.

Để mở rộng kiến thức về các kỹ thuật nhận diện khuôn mặt, bạn có thể tham khảo Đồ án HCMUTE ứng dụng kit Raspberry nhận dạng mặt người, một nghiên cứu thực tế về việc triển khai nhận diện khuôn mặt trên phần cứng Raspberry Pi. Ngoài ra, nếu quan tâm đến các phương pháp học sâu trong xử lý hình ảnh, Luận văn thạc sĩ nghiên cứu và ứng dụng Deep Learning phát hiện người xâm nhập sẽ cung cấp thêm góc nhìn về cách áp dụng AI trong các hệ thống giám sát. Cuối cùng, để hiểu rõ hơn về các kỹ thuật trích xuất đặc trưng, HCMUTE ứng dụng giải thuật FastICA trong tách nguồn mù và trích đặc trưng là một tài liệu tham khảo hữu ích.

Mỗi liên kết trên là cơ hội để bạn khám phá sâu hơn về các chủ đề liên quan, từ đó nâng cao hiểu biết và kỹ năng trong lĩnh vực công nghệ và tự động hóa.

#tự động hóa

#Luận văn Thạc sĩ

#trí tuệ nhân tạo

#xử lý hình ảnh

#kỹ thuật điều khiển

#phát hiện khuôn mặt

Chủ đề

Trí tuệ nhân tạo

Điều Khiển Tự Động

Xử lý hình ảnh

Luận văn thạc sĩ kỹ thuật điều khiển và tự động hóa phát hiện và theo dõi khuôn mặt trong thời gian trên smartphone

LỜI CẢM ƠN

LỜI CAM ĐOAN

1. Chương 1: Giới thiệu đề tài

1.1. Đặt vấn đề

1.2. Mục tiêu đề tài

1.3. Tóm lược nội dung luận văn

2. Chương 2: Cơ sở lý thuyết liên quan

2.1. Giới thiệu mô hình Cascade của Viola và Jones

2.2. Phương pháp rút trích đặc trưng Haar-like

2.3. Thuật toán Adaboost

2.4. Mô hình Cascade của Viola và Jones sử dụng phát hiện khuôn mặt

2.5. Bộ lọc màu da

2.6. Đặc trưng LBP

2.7. Thuật toán CamShift

2.8. Bộ lọc Particle

3. Chương 3: Thuật Toán Theo Dõi Khuôn Mặt

3.1. Tính histogram của khuôn mặt

3.2. Cải tiến thuật toán Camshift

3.3. Chiến lược phân bố số mẫu Particle

3.4. Áp dụng thuật toán cải tiến CamShift cùng với bộ lọc Particle

4. Chương 4: Hệ Thống phát hiện và theo dõi khuôn mặt trên IOS

4.1. Giới thiệu thư viện Opencv

4.2. Tích hợp OpenCV lên Xcode

4.3. Giao diện sử dụng của hệ thống phát hiện và theo dõi khuôn mặt trên Smartphone

4.4. Thực hiện thuật toán đề xuất qua ứng dụng trên IOS

4.5. Kết quả của hệ thống phát hiện và theo dõi khuôn mặt trên điện thoại thông minh

5. Chương 5: Mô phỏng thuật toán trên Matlab

5.1. Mô phỏng Matlab

5.2. So sánh với các công trình nghiên cứu liên quan khác

6. Chương 6: Kết Luận

6.1. Kết luận

6.2. Hướng phát triển đề tài

Tài liệu tham khảo

I. Giới thiệu đề tài

1.1 Đặt vấn đề

1.2 Mục tiêu đề tài

II. Cơ sở lý thuyết

2.1 Mô hình Cascade của Viola và Jones

2.2 Thuật toán CamShift và bộ lọc Particle

III. Thuật toán đề xuất

3.1 Cải tiến thuật toán CamShift

3.2 Tích hợp thuật toán trên smartphone

IV. Kết quả và đánh giá

4.1 Kết quả thực nghiệm

4.2 So sánh với các công trình liên quan

V. Kết luận và hướng phát triển

5.1 Kết luận

5.2 Hướng phát triển

Tài liệu liên quan

THÔNG TIN CHI TIẾT

Tác giả: Cao Kỳ Hãn

Người hướng dẫn: PGS. Dương Hoài Nghĩa

Trường học: Trường Đại học Bách Khoa – ĐHQG - HCM

Chuyên ngành: Kỹ thuật điều khiển và tự động hóa

Đề tài: Phát hiện và theo dõi khuôn mặt trên smartphone

Loại tài liệu: luận văn thạc sĩ

Năm xuất bản: 2015

Địa điểm: Thành phố Hồ Chí Minh

Tổng quan nghiên cứu

Cơ sở lý thuyết và phương pháp nghiên cứu

Khung lý thuyết áp dụng

Phương pháp nghiên cứu

Kết quả nghiên cứu và thảo luận

Những phát hiện chính

Thảo luận kết quả

Đề xuất và khuyến nghị

Đối tượng nên tham khảo luận văn

Câu hỏi thường gặp

Kết luận

Có thể bạn quan tâm