Luận Văn Thạc Sĩ: Phân Vùng Bàn Tay Dựa Trên Phát Hiện Các Bộ Phận

Luận văn thạc sĩ phân tích hay phân vùng bàn tay dựa trên phát hiện các bộ phận, đánh giá thực trạng, chỉ ra hạn chế, đề xuất giải pháp khả thi cho thực tiễn.

Trường đại học

Đại học Thái Nguyên

Chuyên ngành

Khoa học máy tính

Người đăng

Ẩn danh

Thể loại

luận văn thạc sĩ

2017

Phí lưu trữ

30 Point

Mục lục chi tiết

LỜI CẢM ƠN

LỜI CAM ĐOAN

MỤC LỤC

DANH MỤC CÁC KÝ HIỆU, CÁC CHỮ VIẾT TẮT

DANH MỤC CÁC BẢNG

DANH MỤC CÁC HÌNH

MỞ ĐẦU

1. CHƯƠNG I: TỔNG QUAN VỀ BÀI TOÁN PHÂN VÙNG BÀN TAY

1.1. Giới thiệu bài toán

1.2. Một số nghiên cứu liên quan

2. CHƯƠNG II: PHÂN VÙNG BÀN TAY SỬ DỤNG ĐẶC TRƯNG HAAR-LIKE

2.1. Sơ đồ hệ thống phát hiện bàn tay

2.2. Trích chọn đặc trưng

2.2.1. Đặc trưng Haar-like

2.2.2. Tính toán nhanh các đặc trưng Haar-like sử dụng ảnh tích phân

2.2.3. Các đặc trưng Internal

2.2.4. Đặc trưng Internal Haar-like

2.3. Thuật toán Boosting

2.4. Cấu trúc Cascade của các bộ phân loại

2.5. Huấn luyện bộ phát hiện

3. CHƯƠNG III: PHƯƠNG PHÁP PHÁT HIỆN MÀU DA SỬ DỤNG CHO BÀI TOÁN PHÂN VÙNG BÀN TAY

3.1. Nội dung phương pháp

3.2. Chi tiết các bước

3.2.1. Phát hiện màu da

3.2.2. Công thức màu da

3.2.3. Xác định các vùng trắng

3.2.4. Phân loại các vùng trắng

3.3. Xây dựng hệ thống và thử nghiệm

3.3.1. Dữ liệu đầu vào

TÀI LIỆU THAM KHẢO

Tóm tắt

I. Tổng quan về phân vùng bàn tay và phát hiện các bộ phận

Phân vùng bàn tay là một trong những bước quan trọng trong nhận dạng cử chỉ tay. Quá trình này không chỉ giúp xác định vị trí bàn tay trong ảnh mà còn ảnh hưởng đến hiệu suất của toàn bộ hệ thống nhận dạng. Việc phát hiện các bộ phận của bàn tay như ngón tay, lòng bàn tay và cổ tay là rất cần thiết để cải thiện độ chính xác trong các ứng dụng thực tế.

1.1. Khái niệm phân vùng bàn tay trong nhận dạng cử chỉ

Phân vùng bàn tay là quá trình xác định vùng chứa bàn tay trong ảnh. Điều này giúp hệ thống nhận dạng cử chỉ hoạt động hiệu quả hơn.

1.2. Tầm quan trọng của phát hiện các bộ phận bàn tay

Việc phát hiện các bộ phận như ngón tay và lòng bàn tay giúp cải thiện độ chính xác trong nhận dạng cử chỉ, từ đó nâng cao trải nghiệm người dùng.

II. Những thách thức trong phân vùng bàn tay và phát hiện bộ phận

Phân vùng bàn tay gặp nhiều thách thức do sự thay đổi hình dạng và điều kiện ánh sáng khác nhau. Các yếu tố như nền phức tạp và sự biến dạng của bàn tay cũng gây khó khăn cho quá trình phát hiện. Những thách thức này cần được giải quyết để nâng cao hiệu suất của hệ thống.

2.1. Sự thay đổi hình dạng và điều kiện ánh sáng

Hình dạng bàn tay có thể thay đổi tùy thuộc vào tư thế và điều kiện ánh sáng, điều này làm cho việc phát hiện trở nên khó khăn.

2.2. Ảnh hưởng của nền phức tạp đến phát hiện

Nền phức tạp có thể làm giảm độ chính xác của các thuật toán phát hiện bàn tay, dẫn đến kết quả không chính xác.

III. Phương pháp phát hiện bàn tay sử dụng đặc trưng Haar like

Phương pháp Haar-like đã được chứng minh là hiệu quả trong việc phát hiện bàn tay. Đặc trưng Haar-like giúp giảm thiểu ảnh hưởng của nền phức tạp và cải thiện độ chính xác trong việc phát hiện các bộ phận của bàn tay.

3.1. Nguyên lý hoạt động của đặc trưng Haar like

Đặc trưng Haar-like sử dụng các mẫu hình ảnh để phát hiện các vùng đặc trưng của bàn tay, từ đó xác định vị trí bàn tay trong ảnh.

3.2. Lợi ích của việc sử dụng đặc trưng Haar like

Sử dụng đặc trưng Haar-like giúp cải thiện độ chính xác và tốc độ phát hiện bàn tay trong các ứng dụng thực tế.

IV. Ứng dụng thực tiễn của phân vùng bàn tay trong công nghệ

Phân vùng bàn tay có nhiều ứng dụng trong công nghệ hiện đại, từ nhận dạng cử chỉ trong thực tế ảo đến điều khiển robot. Những ứng dụng này không chỉ nâng cao trải nghiệm người dùng mà còn mở ra nhiều cơ hội mới trong lĩnh vực công nghệ.

4.1. Ứng dụng trong thực tế ảo

Trong môi trường thực tế ảo, phân vùng bàn tay cho phép người dùng tương tác với các đối tượng một cách tự nhiên và trực quan.

4.2. Ứng dụng trong điều khiển robot

Phân vùng bàn tay giúp robot hiểu và thực hiện các cử chỉ của con người, từ đó nâng cao khả năng tương tác giữa người và máy.

V. Kết luận và hướng phát triển tương lai của phân vùng bàn tay

Phân vùng bàn tay là một lĩnh vực nghiên cứu quan trọng với nhiều thách thức và cơ hội. Hướng phát triển tương lai có thể tập trung vào việc cải thiện độ chính xác và khả năng ứng dụng của các phương pháp phát hiện bàn tay.

5.1. Tóm tắt kết quả nghiên cứu

Nghiên cứu đã chỉ ra rằng việc phát hiện các bộ phận của bàn tay là rất quan trọng để nâng cao hiệu suất của hệ thống nhận dạng cử chỉ.

5.2. Hướng phát triển trong tương lai

Cần tiếp tục nghiên cứu và phát triển các phương pháp mới để cải thiện độ chính xác và khả năng ứng dụng của phân vùng bàn tay trong các lĩnh vực khác nhau.

17/07/2025

Bạn đang xem trước tài liệu:

Luận văn thạc sĩ hay phân vùng bàn tay dựa trên phát hiện các bộ phận

Tải đầy đủ

Nội dung chính

Tổng quan nghiên cứu

Phân vùng bàn tay là bước đầu tiên và quan trọng trong hệ thống nhận dạng cử chỉ tay, đóng vai trò quyết định đến hiệu suất toàn bộ hệ thống. Theo ước tính, việc phát hiện chính xác vùng bàn tay trong ảnh hoặc video vẫn là một thách thức lớn do sự biến đổi đa dạng về hình dạng bàn tay và điều kiện môi trường như ánh sáng và nền phức tạp. Mục tiêu nghiên cứu của luận văn là phát triển phương pháp phân vùng bàn tay dựa trên phát hiện các bộ phận, nhằm nâng cao độ chính xác và khả năng ứng dụng trong tương tác người-máy, đặc biệt trong môi trường trong nhà với nền phức tạp và điều kiện ánh sáng thay đổi.

Phạm vi nghiên cứu tập trung vào việc phát hiện vùng trung tâm bàn tay thông qua đặc trưng Internal Haar-like, kết hợp với thông tin màu da để giảm thiểu ảnh hưởng của nền và điều kiện ánh sáng. Bộ dữ liệu L3i-MICA được sử dụng trong nghiên cứu bao gồm 840 video thu thập từ 10 người với 21 hình trạng bàn tay khác nhau, trong môi trường phòng thí nghiệm với ánh sáng huỳnh quang tự nhiên và nền phức tạp. Nghiên cứu có ý nghĩa quan trọng trong việc cải thiện các hệ thống nhận dạng cử chỉ tay, hỗ trợ tương tác tự nhiên giữa người và máy tính, ứng dụng trong robot trợ lý, thực tại ảo, và các thiết bị thông minh.

Cơ sở lý thuyết và phương pháp nghiên cứu

Khung lý thuyết áp dụng

Luận văn dựa trên hai lý thuyết và mô hình nghiên cứu chính:

Phương pháp Viola-Jones và đặc trưng Haar-like: Đây là phương pháp phát hiện đối tượng phổ biến, sử dụng ảnh tích phân để tính toán nhanh các đặc trưng Haar-like, kết hợp với thuật toán AdaBoost để xây dựng bộ phân loại mạnh từ các bộ phân loại yếu. Đặc trưng Haar-like phản ánh mối quan hệ cường độ giữa các vùng hình chữ nhật trong ảnh, có tính bất biến với biến đổi về scale và ánh sáng.
Đặc trưng Internal Haar-like: Khái niệm mới được đề xuất trong luận văn, là các đặc trưng Haar-like được trích chọn từ vùng bên trong đối tượng quan tâm (vùng trung tâm bàn tay), không bao gồm nền. Điều này giúp giảm thiểu ảnh hưởng của nền phức tạp và tăng độ chính xác phát hiện.

Các khái niệm chuyên ngành quan trọng bao gồm:

Ảnh tích phân (Integral Image): kỹ thuật tính toán nhanh tổng giá trị pixel trong vùng hình chữ nhật.
Thuật toán AdaBoost Gentle: biến thể của AdaBoost, sử dụng hồi quy bình phương nhỏ nhất có trọng số để tối ưu bộ phân loại.
Cấu trúc Cascade: mô hình phân tầng các bộ phân loại mạnh nhằm tăng hiệu quả phát hiện và giảm sai số.

Phương pháp nghiên cứu

Nguồn dữ liệu chính là bộ dữ liệu L3i-MICA, gồm 840 video với 21 hình trạng bàn tay của 10 người, thu thập trong phòng thí nghiệm với điều kiện ánh sáng và nền phức tạp. Mỗi video dài khoảng 4 giây, độ phân giải 320x240 pixel, tốc độ 30 khung hình/giây.

Phương pháp phân tích gồm các bước:

Chuẩn bị dữ liệu huấn luyện và thử nghiệm, chia bộ dữ liệu thành hai phần bằng nhau (420 video mỗi phần).
Trích chọn đặc trưng Internal Haar-like từ vùng trung tâm bàn tay (AIRH) và đặc trưng Haar-like từ vùng toàn bộ bàn tay (ACRH) để so sánh.
Huấn luyện hai bộ phát hiện sử dụng thuật toán AdaBoost Gentle với cấu trúc Cascade, mỗi bộ gồm tối đa 25 tầng, tỷ lệ phát hiện nhầm tối đa 50% mỗi tầng, tỷ lệ phát hiện tối thiểu 99,5%.
Đánh giá hiệu suất bằng các chỉ số Precision, Recall, F-measure và Jaccard Index (phát hiện chính xác khi Jaccard ≥ 50%).

Cỡ mẫu huấn luyện gồm 10.000 mẫu đúng và 10.000 mẫu sai cho mỗi bộ phát hiện. Kích thước mẫu chuẩn được xác định lần lượt là 20x20 pixel cho vùng trung tâm bàn tay và 21x28 pixel cho toàn bộ bàn tay.

Kết quả nghiên cứu và thảo luận

Những phát hiện chính

Hiệu suất phát hiện vùng trung tâm bàn tay vượt trội hơn toàn bộ bàn tay: Bộ phát hiện sử dụng đặc trưng Internal Haar-like cho kết quả chính xác hơn, giảm sai số do ảnh hưởng nền. Ví dụ, tỷ lệ phát hiện nhầm (false alarm) giảm đáng kể so với bộ phát hiện toàn bộ bàn tay.
Số lượng bộ phân loại yếu trong mỗi tầng thấp hơn với bộ phát hiện vùng trung tâm: Bộ phát hiện vùng trung tâm bàn tay cần ít bộ phân loại yếu hơn, cho thấy mô hình đơn giản và hiệu quả hơn trong việc học đặc trưng.
Tần số xuất hiện các loại đặc trưng Haar-like tương tự nhau giữa hai bộ phát hiện: Các đặc trưng đơn giản như loại a và c được sử dụng nhiều nhất, trong khi một số loại đặc trưng ít quan trọng có thể loại bỏ để giảm độ phức tạp.
Độ đa dạng của bộ dữ liệu L3i-MICA tạo ra thách thức lớn: Sự thay đổi về ánh sáng, kích thước, độ nghiêng và cách thực hiện hình trạng bàn tay ảnh hưởng đến độ chính xác phát hiện. Ví dụ, màu da thay đổi đáng kể do ánh sáng huỳnh quang tự nhiên, và các hình trạng tương tự nhau gây khó khăn trong phân loại.

Thảo luận kết quả

Nguyên nhân chính của sự cải thiện hiệu suất là do đặc trưng Internal Haar-like chỉ tập trung vào vùng trung tâm bàn tay, loại bỏ ảnh hưởng của nền phức tạp và biến đổi ánh sáng. So với các nghiên cứu trước đây chỉ sử dụng đặc trưng Haar-like toàn bộ bàn tay, phương pháp này giảm thiểu sai sót do nền và tăng tính ổn định.

Kết quả cũng phù hợp với các nghiên cứu về phát hiện đối tượng sử dụng cấu trúc Cascade và AdaBoost, cho thấy khả năng phát hiện thời gian thực với độ chính xác cao. Việc sử dụng bộ dữ liệu đa dạng L3i-MICA giúp đánh giá thực tế hơn, phản ánh các thách thức trong môi trường ứng dụng thực tế.

Dữ liệu có thể được trình bày qua biểu đồ so sánh Precision-Recall và F-score giữa hai bộ phát hiện, cũng như bảng thống kê số lượng bộ phân loại yếu theo tầng, giúp minh họa rõ ràng ưu điểm của phương pháp đề xuất.

Đề xuất và khuyến nghị

Áp dụng phương pháp phân vùng bàn tay dựa trên đặc trưng Internal Haar-like trong các hệ thống nhận dạng cử chỉ tay nhằm nâng cao độ chính xác phát hiện, đặc biệt trong môi trường có nền phức tạp và ánh sáng thay đổi. Thời gian thực hiện: 6-12 tháng, chủ thể: các nhóm phát triển phần mềm nhận dạng hình ảnh.
Kết hợp thông tin màu da với đặc trưng Internal Haar-like để tăng cường khả năng phân biệt vùng bàn tay, giảm thiểu sai sót do biến đổi ánh sáng. Thời gian thực hiện: 3-6 tháng, chủ thể: nhóm nghiên cứu và phát triển thuật toán.
Tối ưu hóa bộ phát hiện bằng cách loại bỏ các đặc trưng Haar-like ít quan trọng dựa trên tần số xuất hiện, nhằm giảm độ phức tạp tính toán và tăng tốc độ xử lý. Thời gian thực hiện: 2-4 tháng, chủ thể: kỹ sư phần mềm.
Mở rộng bộ dữ liệu huấn luyện với các điều kiện ánh sáng và nền đa dạng hơn để tăng khả năng tổng quát hóa của bộ phát hiện, phù hợp với nhiều ứng dụng thực tế. Thời gian thực hiện: 12-18 tháng, chủ thể: các trung tâm nghiên cứu và tổ chức thu thập dữ liệu.

Đối tượng nên tham khảo luận văn

Nhà nghiên cứu và sinh viên ngành Khoa học máy tính, thị giác máy tính: Nghiên cứu về phát hiện đối tượng, nhận dạng cử chỉ tay, học máy và xử lý ảnh có thể ứng dụng các phương pháp và kết quả trong luận văn để phát triển các hệ thống tương tác người-máy.
Các kỹ sư phát triển phần mềm trong lĩnh vực thực tại ảo và robot trợ lý: Áp dụng phương pháp phân vùng bàn tay để cải thiện khả năng nhận dạng cử chỉ, nâng cao trải nghiệm người dùng trong môi trường tương tác tự nhiên.
Nhà thiết kế hệ thống giao tiếp người-máy trong nhà thông minh: Sử dụng kết quả nghiên cứu để phát triển các thiết bị điều khiển bằng cử chỉ tay, tăng tính tiện lợi và thân thiện cho người dùng.
Các tổ chức nghiên cứu về nhận dạng hình ảnh và trí tuệ nhân tạo: Tham khảo phương pháp huấn luyện bộ phân loại mạnh dựa trên AdaBoost Gentle và cấu trúc Cascade, cũng như cách xử lý dữ liệu phức tạp trong môi trường thực tế.

Câu hỏi thường gặp

Phân vùng bàn tay là gì và tại sao quan trọng?
Phân vùng bàn tay là quá trình xác định vùng chứa bàn tay trong ảnh hoặc video, là bước đầu tiên trong nhận dạng cử chỉ tay. Việc phân vùng chính xác giúp nâng cao hiệu suất nhận dạng và giảm sai sót trong các ứng dụng tương tác người-máy.
Đặc trưng Internal Haar-like khác gì so với đặc trưng Haar-like truyền thống?
Đặc trưng Internal Haar-like được trích chọn từ vùng bên trong đối tượng (vùng trung tâm bàn tay), không bao gồm nền, giúp giảm ảnh hưởng của nền phức tạp và biến đổi ánh sáng, trong khi đặc trưng Haar-like truyền thống tính trên toàn bộ vùng chứa bàn tay và nền.
Tại sao sử dụng thuật toán AdaBoost Gentle trong huấn luyện bộ phân loại?
AdaBoost Gentle cải thiện độ ổn định và hiệu suất bằng cách sử dụng hồi quy bình phương nhỏ nhất có trọng số, tập trung vào các mẫu khó phân loại, giúp xây dựng bộ phân loại mạnh với độ chính xác cao và khả năng tổng quát tốt.
Bộ dữ liệu L3i-MICA có đặc điểm gì nổi bật?
Bộ dữ liệu gồm 840 video với 21 hình trạng bàn tay của 10 người, thu thập trong môi trường phòng thí nghiệm với ánh sáng huỳnh quang tự nhiên và nền phức tạp, tạo ra thách thức thực tế cho việc phát hiện và nhận dạng bàn tay.
Phương pháp đề xuất có thể ứng dụng trong những lĩnh vực nào?
Phương pháp có thể ứng dụng trong tương tác người-máy, robot trợ lý, thực tại ảo, nhà thông minh, và các hệ thống điều khiển thiết bị bằng cử chỉ tay, giúp tăng tính tự nhiên và tiện lợi trong giao tiếp.

Kết luận

Đề xuất thành công phương pháp phân vùng bàn tay dựa trên đặc trưng Internal Haar-like, giảm thiểu ảnh hưởng của nền và điều kiện ánh sáng.
Áp dụng thuật toán AdaBoost Gentle và cấu trúc Cascade để huấn luyện bộ phân loại mạnh, đạt hiệu suất phát hiện cao với tốc độ thời gian thực.
Bộ dữ liệu L3i-MICA đa dạng về hình dạng, ánh sáng và nền giúp đánh giá thực tế và toàn diện phương pháp.
Kết quả nghiên cứu mở ra hướng phát triển các hệ thống nhận dạng cử chỉ tay chính xác và ổn định trong môi trường phức tạp.
Khuyến nghị tiếp tục mở rộng bộ dữ liệu và tối ưu hóa đặc trưng để nâng cao hiệu quả ứng dụng trong các lĩnh vực tương tác người-máy.

Hướng phát triển tiếp theo bao gồm tích hợp thêm thông tin màu da, mở rộng bộ dữ liệu huấn luyện và ứng dụng trong các hệ thống thực tế. Đề nghị các nhà nghiên cứu và kỹ sư quan tâm áp dụng và phát triển thêm dựa trên kết quả này để nâng cao chất lượng các hệ thống nhận dạng cử chỉ tay.

Trích đoạn nội dung tài liệu

CHƯƠNG I TỔNG QUAN VỀ BÀI TOÁN PHÂN VÙNG BÀN TAY 1.1 Giới thiệu bài toán Phân vùng bàn tay là một quá trình nhằm mục đích xác định vùng chứa bàn tay trong ảnh. Đây là bước đầu tiên và quan trọng trong việc nhận dạng cử chỉ tay vì chất lượng của bước này sẽ ảnh hưởng đến hiệu suất của toàn bộ hệ thống. Tuy nhiên, phân vùng chính xác bàn tay qua hình ảnh hoặc video vẫn là một vấn đề khó khăn do sự thay đổi về hình dạng bàn tay và môi trường.2 Một số nghiên cứu liên quan Trong phần này, tác giả sẽ trình bày một khảo sát về hệ thống nhận dạng tay. Luận văn này tập trung vào bài toán phân vùng bàn tay trong ngữ cảnh tương tác người-máy trong môi trường trong nhà.

Vì vậy, chúng tôi sẽ khảo sát các nghiên cứu liên quan đến phát hiện, phân vùng bàn tay phù hợp với môi trường đã nêu. Luận văn tập trung vào vấn đề trích chọn đặc trưng và biểu diễn bàn tay bởi vì đây là vấn đề quan trọng trong hệ thống phát hiện, nhận dạng đối tượng. Do đó, trong phần này tác giả sẽ tập trung vào việc phân tích các phương pháp trích chọn đặc trưng và biểu diễn bàn tay. Nhiều đặc trưng đã được đề xuất cho việc phát hiện, phân vùng bàn tay.

Căn cứ vào bản chất của thông tin được phản ánh trong các đặc trưng, tác giả chia các đặc trưng thành 5 loại: pixel value, shape, topography, context, và motion. Hầu hết các phương pháp có sự kết hợp sử dụng nhiều hơn một loại đặc trưng. Dưới đây, chúng tôi sẽ trình bày mô tả ngắn gọn về các đặc trưng này.1 Pixel value (intensity/color) Hầu hết các phương pháp phát hiện tay sử dụng các giá trị điểm ảnh. Giá trị điểm ảnh có thể là cường độ và/hoặc màu sắc.

Nhiều phương pháp sử dụng thông tin màu sắc để phát hiện các điểm ảnh có màu da trong khi một số phương pháp khác sử dụng cường độ điểm ảnh để quyết định một điểm ảnh có thuộc vùng tay hay không. Chúng ta có thể chia các đặc trưng dựa trên giá trị điểm ảnh thành hai loại chính: chỉ dựa trên giá trị điểm ảnh (Individual pixel) và dựa trên mối quan hệ 4 LUAN VAN CHAT LUONG download : add luanvanchat@agmail.com giữa các điểm ảnh (Relationship between pixels or regions). Loại thứ nhất chỉ dựa trên giá trị của bản thân các điểm ảnh. Hướng tiếp cận này thường dùng trong các phương pháp phát hiện điểm ảnh thuộc vùng bàn tay dựa trên màu da.

Trong khi đó, hướng tiếp cận thứ hai sử dụng mối quan hệ giữa các điểm ảnh hoặc giữa các vùng. (i) Chỉ dựa trên giá trị điểm ảnh (Individual pixel) Trong loại đầu tiên, giá trị của mỗi điểm ảnh trong ảnh được kết hợp với một mô hình màu da hoặc một tiêu chí để xác định đó có phải là điểm ảnh thuộc vùng da hay không. Màu da thường được sử dụng trong việc phát hiện, phân vùng bàn tay. Tuy nhiên, chỉ sử dụng màu da sẽ không đủ vì các ảnh hưởng của phông nền và ánh sáng (xem hình minh họa 1.

Vì lý do này, các phương pháp phát hiện, phân vùng bàn tay dựa trên màu da thường sử dụng thêm các thông tin ngữ cảnh như khuôn mặt và các bộ phận khác của người. Tiếp theo, tác giả sẽ giới thiệu chi tiết một số nghiên cứu tiêu biểu thuộc loại này.1: Sự thay đổi màu da trong các điều kiện ánh sáng khác nhau Một số phương pháp chỉ sử dụng màu da trong bước phát hiện tay: Zhu và các cộng sự [4] đề xuất một cách để xác định bàn tay trong trường hợp camera đeo trên người. Đối với mỗi ảnh, một mô hình màu tay và một mô hình màu nền được tạo ra sử dụng GMM (Gaussian Mixture Model) với các thuật toán EM. Sau đó, mỗi điểm ảnh được phân thành điểm ảnh tay hoặc nền dựa vào các mô hình đã có.

Phương pháp này dựa trên giả thiết rằng màu tay trong ảnh đưa ra là phù hợp để có thể được mô hình hóa bởi một phân phối Gaussian. Một điều kiện tiên quyết quan trọng là một số vị trí có xu hướng xuất hiện bàn tay với xác suất cao được xác định trước. Do đó, màu bàn tay trung bình trong một ảnh có thể được ước 5 LUAN VAN CHAT LUONG download : add luanvanchat@agmail.com tính một cách đáng tin cậy. Tuy nhiên, trên thực tế, trong nhiều ứng dụng (ví dụ như tương tác với robot trong môi trường thực tế), người sử dụng đứng xa máy ảnh; do đó những ràng buộc trên là không thỏa mãn.

Stergiopoulou và các cộng sự [5] áp dụng một kỹ thuật phân phân vùng màu dựa trên một thủ tục lọc màu da trong không gian màu YCbCr. Tuy nhiên, những ảnh đầu vào sử dụng trong nghiên cứu này là những ảnh đơn giản, chỉ chứa bàn tay trong một nền đồng nhất. Để nâng cao độ chính xác của việc phân vùng bàn tay, nhiều đặc trưng được bổ sung kết hợp với màu da. Trong nhiều nghiên cứu, các đặc trưng phản ánh mối quan hệ giữa các điểm ảnh được sử dụng kết hợp với màu da [6].

(ii) Mối quan hệ giữa các pixel hoặc vùng (Relationship between pixels or regions) Khác với cách tiếp cận thứ nhất (Individual pixel), các phương pháp trong hướng tiếp cận thứ hai sử dụng các đặc trưng phản ánh mối quan hệ giữa các điểm ảnh/vùng hoặc thông tin thống kê. Một số đặc trưng thuộc loại này là đặc trưng Local Binary Pattern (LBP), Histogram of Gradient (HOG), Scale Invariant Feature Transform (SIFT) và Haar-like. Trong [6], Francke và cộng sự kết hợp đặc trưng Haar và mLBP với mô hình da thích nghi được xây dựng từ vùng mặt để phát hiện tay trước khi theo dõi. Wang và cộng sự sử dụng các đặc trưng SIFT chung của các hình trạng bàn tay khác nhau để phát hiện tay.

Đặc trưng HOG cũng thường được sử dụng trong phát hiện bàn tay [7]. Mittal và cộng sự đề xuất một phương pháp phân vùng bàn tay sử dụng hướng tiếp cận kết hợp nhiều phương pháp. Trong hướng tiếp cận này, các mô hình có thể biến dạng (deformable models) dựa trên đặc trưng HOG được sử dụng để phát hiện bàn tay và phần cuối của cánh tay (cổ tay). Trong [6] một bộ phát hiện đã được thực hiện bằng cách sử dụng cấu trúc phân tầng của các bộ phân loại để phát hiện tay trong các blob màu da.

Các tác giả nhận xét rằng mặc dù các bộ phát hiện sử dụng cấu trúc phân tầng của các bộ phân 6 LUAN VAN CHAT LUONG download : add luanvanchat@agmail.com loại mạnh cho phép phát hiện hiệu quả khuôn mặt hoặc xe hơi, chúng ta không thể xây dựng một bộ phát hiện hiệu quả để phát hiện tay chung chung. Lý do: (i) tay là đối tượng phức tạp, có khả năng biến dạng cao, (ii) tay có thể có nhiều hình trạng thay đổi khác nhau, (iii) trong môi trường thực tế thì nền là thay đổi và phức tạp. Do đó, các tác giả đã thay đổi cách tiếp cận. Đầu tiên cần phát hiện tay sau đó bàn tay được theo dõi trong các frame liên tiếp.

Để phát hiện ra bàn tay, đầu tiên hệ thống yêu cầu người dùng thực hiện một cử chỉ cụ thể (hình trạng nắm tay). Để xác định hình trạng nào đang được thực hiện, họ áp dụng một cấu trúc cascade song song của các bộ phát hiện riêng cho từng hình trạng trên trên các vùng quan tâm (ROI) thu được từ đầu ra của mô-đun theo dõi. Các tác giả chỉ ra rằng các bộ phát hiện hoạt động kém hiệu quả trong trường hợp nền phức tạp.2 Hình dạng (shape) Đặc trưng hình dạng đã được sử dụng để phát hiện bàn tay trong ảnh. Đặc điểm hình dạng thường thu được bằng cách trích chọn các đường bao và cạnh.

Choi và cộng sự [8] đề xuất một phương pháp dựa trên giả định rằng bàn tay và cánh tay có độ sáng khác nhau do đó các vùng da có màu khác nhau. Trước tiên họ phân chia khu vực tay, cánh tay từ các vùng da khác nhau dựa trên độ sáng khác nhau. Việc phân biệt vùng tay và cánh tay được thực hiện bằng cách sử dụng đặc trưng hình dạng. Họ coi các blob dài là vùng tay-cánh tay.

Phương pháp này không thể phát hiện vùng tay mà không có cánh tay. Ràng buộc này thường không được thảo mãn trong các ứng dụng thực tế. Việc phát hiện tay từ vùng tay-cánh tay được thực hiện bằng cách tìm ra một điểm đặc trưng cho cổ tay. Chúng ta có thể nhận xét rằng nếu chúng ta có thể phát hiện đường bao một cách chính xác thì đường bao sẽ biểu diễn tốt hình dạng bàn tay.

Tuy nhiên, trong môi trường thực tế việc tìm đường bao của vùng bàn tay vẫn là một thách thức.3 Topography Đặc trưng topography của bàn tay là các blob, ngón tay, cổ tay, lòng bàn tay. Một số phương pháp sử dụng các đặc trưng topography bổ sung để quyết định một vùng da có phải là khu vùng bàn tay hay không. Le và cộng sự [9] xác định được lòng bàn tay và các vị trí đầu ngón tay dựa trên hình ảnh DT (distance transformation 7 LUAN VAN CHAT LUONG download : add luanvanchat@agmail. Phương pháp này yêu cầu phải thực hiện trên một kết quả phân vùng màu da tốt.

Sgouropoulos và cộng sự phát hiện các blob bàn tay từ các vùng da dựa trên kích thước của blob so với kích thước khuôn mặt. Trong [10], các blob màu và hình dạng ngón tay được trích chọn từ các vùng da phân đoạn, đặc trưng blob and rigde sẽ được sử dụng trong việc phát hiện, theo dõi và nhận dạng tay. Một số phương pháp [8] xác định vùng bàn tay từ vùng tay-cánh tay bằng cách phát hiện các đặc trưng cổ tay.4 Ngữ cảnh (Context) Thông tin ngữ cảnh được sử dụng trong một số nghiên cứu. Chúng thường kết hợp với các thông tin khác như màu sắc.

Marcel và cộng sự xác định nếu một blob màu da có phải vùng bàn tay hay không dựa vào cửa sổ hoạt động (actived window). Cửa sổ hoạt động được xác định trong vùng cơ thể-mặt. Mittal và cộng sự [11] sử dụng một bộ phát hiện dựa trên thông tin ngữ cảnh kết hợp với hai bộ phát hiện khác (một bộ phát hiện tay dạng cửa sổ trượt và một bộ phát hiện dựa trên da) để tạo ra một bộ phát hiện tay dựa trên nhiều đề xuất. Trong [12] Dardas và Georganas đã sử kỹ thuật loại trừ vùng khuôn mặt kết hợp với phát hiện vùng màu da và đường bao để phát hiện và theo dõi bàn tay trong môi trường nền phức tạp.5 Chuyển động (Motion) Chuyển động là đặc trưng phổ biến trong phát hiện tay.

Đặc trưng chuyển động thường kết hợp với màu da.

Nội dung được bảo vệ bản quyền — Tải xuống đầy đủ

Tài liệu có tiêu đề "Phân Vùng Bàn Tay Dựa Trên Phát Hiện Các Bộ Phận" cung cấp cái nhìn sâu sắc về cách phân vùng bàn tay thông qua việc phát hiện các bộ phận khác nhau. Nội dung chính của tài liệu tập trung vào các phương pháp và kỹ thuật hiện đại trong việc nhận diện và phân loại các bộ phận của bàn tay, từ đó giúp cải thiện độ chính xác trong các ứng dụng như robot, y tế và công nghệ nhận diện hình ảnh.

Độc giả sẽ tìm thấy nhiều lợi ích từ tài liệu này, bao gồm việc hiểu rõ hơn về các công nghệ tiên tiến trong lĩnh vực nhận diện hình ảnh và ứng dụng của chúng trong thực tiễn. Để mở rộng kiến thức, bạn có thể tham khảo thêm tài liệu "Luận văn thạc sĩ một số thuật toán bayes phân lớp đa nhãn và áp dụng vào phân lớp văn bản đa nhãn lĩnh vực điện tử", nơi bạn sẽ tìm thấy các thuật toán phân lớp có thể áp dụng trong nhiều lĩnh vực khác nhau.

Ngoài ra, tài liệu "Luận văn thạc sĩ công nghệ chuyển mạch nhãn đa giao thức và ứng dụng công nghệ này vào cung cấp dịch vụ mạng riêng ảo tại bưu điện hà nội" cũng sẽ cung cấp cho bạn cái nhìn về ứng dụng công nghệ trong việc cải thiện dịch vụ mạng.

Cuối cùng, bạn có thể khám phá thêm tài liệu "Cải cách thủ tục hành chính trên môi trường điện tử tại uỷ ban nhân dân tỉnh thái bình", nơi mà công nghệ được áp dụng để tối ưu hóa quy trình hành chính, tương tự như cách mà công nghệ nhận diện hình ảnh đang được phát triển. Những tài liệu này sẽ giúp bạn mở rộng hiểu biết và khám phá thêm nhiều khía cạnh khác nhau trong lĩnh vực công nghệ và ứng dụng của nó.

#Luận văn Thạc sĩ

#khoa học máy tính

#Đại học Thái Nguyên

#hệ thống nhận dạng

#nhận dạng cử chỉ tay

#phân vùng bàn tay

Chủ đề

Ứng Dụng Công Nghệ Thông Tin

Nghiên cứu về nhận dạng cử chỉ

Phương pháp phát hiện bàn tay

Tương tác người-máy trong công nghệ