I. Tổng Quan Mô Hình Nhận Dạng Tư Thế Võ Thuật Nghiên Cứu Bách Khoa
Nghiên cứu về ước lượng các khớp xương và hành động cơ thể người từ ảnh màu, ảnh độ sâu hoặc chuỗi ảnh đang thu hút sự quan tâm lớn. Hầu hết các nghiên cứu tập trung vào việc học các đặc trưng trên ảnh màu và độ sâu để xây dựng mô hình người, cách hành động, sau đó sử dụng các bộ phân lớp để dự đoán. Trước đây, các bộ phân lớp như SVM và RDF thường được sử dụng. Hiện nay, các phương thức ước lượng khung xương và tư thế người trong ảnh màu và không gian 3D thường sử dụng các mạng Nơ-ron tích chập mới để huấn luyện mô hình ước lượng. Nghiên cứu sinh nhận thấy hướng nghiên cứu ước lượng, khôi phục khung xương người từ ảnh độ sâu được nhiều nhóm nghiên cứu quan tâm.
1.1. Ứng Dụng Học Sâu Trong Ước Lượng Hành Động Võ Thuật
Các phương pháp học sâu đang được áp dụng rộng rãi trong việc ước lượng hành động trong các bài võ cổ truyền. Các mạng nơ-ron tích chập (CNNs) cho phép trích xuất các đặc trưng phức tạp từ ảnh, giúp cải thiện độ chính xác của việc nhận dạng tư thế và hành động. Việc sử dụng các bộ dữ liệu lớn và đa dạng cũng đóng vai trò quan trọng trong việc huấn luyện các mô hình học sâu hiệu quả. Các nghiên cứu gần đây đã chứng minh tiềm năng của học sâu trong việc tự động hóa quá trình phân tích và đánh giá kỹ thuật võ thuật.
1.2. Ước Lượng Khung Xương 2D và 3D So Sánh Các Phương Pháp
Nghiên cứu so sánh các phương pháp ước lượng khung xương trong không gian 2D và 3D là rất quan trọng để xác định phương pháp nào phù hợp nhất cho việc nhận dạng tư thế võ thuật. Các phương pháp dựa trên ảnh màu thường gặp khó khăn trong điều kiện ánh sáng yếu hoặc khi có sự che khuất. Trong khi đó, các phương pháp dựa trên ảnh độ sâu có thể cung cấp thông tin về hình dạng và khoảng cách, giúp cải thiện độ chính xác trong việc ước lượng tư thế. Việc kết hợp cả hai loại thông tin có thể mang lại kết quả tốt nhất.
II. Thách Thức Nhận Dạng Tư Thế Võ Góc Khuất và Che Khuất
Để bảo tồn và duy trì các bài võ cổ truyền đặc sắc và có giá trị văn hóa là một vấn đề quan trọng. Trước kia, việc lưu trữ là truyền miệng, qua hình vẽ, nên các thế võ có thể bị biến tướng. Ngày nay, việc ghi lại thành video là một hướng tiếp cận tốt. Ở Việt Nam, từ năm 2016, các bài võ cổ truyền được đưa vào giảng dạy trong các trường phổ thông. Vì vậy, việc xây dựng một mô hình chấm điểm các bài võ được truyền dạy trên lớp là điều cần thiết. Tuy nhiên, các thế võ là các hành động nhanh, quay bốn hướng mà các thiết bị ghi hình thường chỉ nằm ở một vị trí nên có nhiều tư thế bị che khuất.
2.1. Giải Pháp Xây Dựng Mô Hình 3D Trực Quan Hóa Võ Thuật
Để giải quyết vấn đề che khuất, việc xây dựng mô hình 3D để trực quan hóa việc đào tạo và dạy võ cổ truyền là một giải pháp cần thiết. Mô hình 3D giúp giảm thời gian, chi phí, công sức của các võ sư, đồng thời tăng tính tự giác chủ động trong luyện tập và đánh giá luyện tập của học sinh phổ thông. Mô hình này cho phép người học quan sát các tư thế võ từ nhiều góc độ khác nhau, giúp họ hiểu rõ hơn về kỹ thuật và cải thiện hiệu quả luyện tập.
2.2. Ứng Dụng Cảm Biến Độ Sâu Kinect và Bài Toán Che Khuất
Để thu thập video phục vụ cho việc bảo tồn và duy trì các thế võ, người ta thường sử dụng các cảm biến hình ảnh như camera trên điện thoại thông minh hoặc camera chuyên dụng. Đặc biệt, để xây dựng khung cảnh 3D, người ta thường sử dụng các cảm biến có ảnh độ sâu như Kinect V1, Kinect V2, Realscene D435. Cảm biến Kinect V1 là một lựa chọn giá rẻ và chất lượng ảnh chấp nhận được, phù hợp với khả năng phổ dụng cao.
III. Phương Pháp Ước Lượng Khung Xương 3D Kết Hợp Ảnh Màu
Trên ảnh độ sâu chứa thông tin trong không gian thực (giá trị độ sâu) của người nên có thể ước lượng được các khớp xương trong trường hợp bị che khuất. Do đó, trước khi thực hiện xây dựng các mô hình đánh giá và chấm điểm các động tác võ được truyền dạy trên lớp thì cần thực hiện các nghiên cứu về ước lượng, khôi phục khung xương của người trong các video võ thuật cổ truyền. Luận án thực hiện kết hợp kết quả ước lượng trên ảnh màu và chiếu kết quả ước lượng vào không gian 3D để có được kết quả ước lượng các điểm đại diện và các khớp xương tốt hơn.
3.1. Chiếu Ước Lượng 2D Sang 3D Tăng Độ Chính Xác
Việc chiếu ước lượng 2D sang 3D giúp tăng độ chính xác của việc ước lượng khung xương, đặc biệt trong các trường hợp bị che khuất. Bằng cách kết hợp thông tin từ ảnh màu và ảnh độ sâu, có thể tạo ra một mô hình 3D đầy đủ và chính xác hơn về tư thế của người. Điều này đặc biệt quan trọng trong võ thuật, nơi mà các tư thế có thể rất phức tạp và khó nhận diện từ một góc nhìn duy nhất.
3.2. Ước Lượng Khớp Xương Bị Che Khuất Giải Pháp
Khi ước lượng khung xương, tư thế người trong không gian 3D có thể ước lượng được các khớp xương bị che khuất do dữ liệu thu được một phía nhìn thấy của người. Từ khớp xương đầy đủ có thể thể hiện được đầy đủ các động tác võ trong các video võ cổ truyền. Đây là một bước quan trọng trong việc tái tạo và ghi lại các tư thế võ cổ truyền của các võ sư và thực hành các động tác được truyền dạy của các em học sinh phổ thông.
IV. Ứng Dụng Chấm Điểm Động Tác Võ Thuật và Nhận Dạng Tấn Công
Hệ thống chấm điểm các động tác võ là một ứng dụng quan trọng trong đánh giá việc biểu diễn các tư thế, động tác võ đúng và chuẩn hay không. Trong võ thuật, việc thể hiện đúng và chuẩn làm cho võ thuật phát huy được hết sức mạnh: tấn công mạnh, phòng thủ chắc chắn. Mục đích của luận án là đề xuất hướng tiếp cận để ước lượng và phục hồi khung xương trong không gian 3D và để xây dựng một hệ thống tái tạo môi trường 3D của các video biểu diễn võ thuật và ước lượng khung xương, tư thế của người trong video.
4.1. Xây Dựng Mô Hình Chấm Điểm Tự Đánh Giá Kỹ Năng
Từ khung xương của người được ước lượng và khôi phục đầy đủ, xây dựng một mô hình chấm điểm các động tác võ trên các video thu được từ lớp võ hoặc các bài biểu diễn võ thuật của các em học sinh phổ thông, giúp các em tự đánh giá được các bài võ thuật đã được truyền dạy. Mô hình này giúp học sinh tự kiểm tra và cải thiện kỹ năng của mình, đồng thời cung cấp cho giáo viên một công cụ để đánh giá hiệu quả giảng dạy.
4.2. Nhận Dạng Động Tác Tấn Công Phân Tích Điểm Mạnh Yếu
Việc nhận dạng động tác tấn công phục vụ cho việc phân tích điểm mạnh điểm yếu của các tư thế võ thuật cổ truyền. Điều này giúp các võ sư và học viên hiểu rõ hơn về hiệu quả của từng động tác và điều chỉnh kỹ thuật để đạt được kết quả tốt nhất. Hệ thống nhận dạng động tác tấn công cũng có thể được sử dụng để phát triển các bài tập và chương trình huấn luyện phù hợp với từng cá nhân.