Luận văn thạc sĩ: Nghiên cứu nhân bản chuyển động khuôn mặt trên các mô hình khuôn mặt 3D

Nghiên cứu nhân bản chuyển động khuôn mặt trên các mô hình 3D khác nhau trong luận văn thạc sĩ VNU UET, khám phá công nghệ tiên tiến.

Trường đại học

Đại học Quốc gia Hà Nội

Chuyên ngành

Công nghệ Thông tin

Người đăng

Ẩn danh

Thể loại

luận văn thạc sĩ

2008

Phí lưu trữ

30 Point

Mục lục chi tiết

MỞ ĐẦU

1. CHƯƠNG 1: TỔNG QUAN VỀ KHUÔN MẶT VÀ HOẠT ẢNH CỦA KHUÔN MẶT 3D

1.1. Giới thiệu

1.2. Các kỹ thuật hiện có được sử dụng để tạo mô hình và làm hoạt ảnh khuôn mặt 3D

1.2.1. Tạo mô hình khuôn mặt

1.2.2. Tạo mô hình hoạt ảnh của khuôn mặt

1.2.3. Một mô hình khuôn mặt 3D cho ứng dụng thời gian thực

1.3. Mô hình môi

1.4. Các cơ làm khuôn mặt hoạt ảnh

1.4.1. Xoay quai hàm

1.4.2. Xoay tròng mắt

1.5. Kết quả thực nghiệm

1.6. Kết luận chương

2. CHƯƠNG 2: CƠ SỞ LÝ THUYẾT NỀN TẢNG

2.1. Các nghiên cứu trước đây về việc chuyển hoạt ảnh khuôn mặt

2.1.1. Nhân bản biểu hiện

2.1.2. Dịch chuyển các bảng hoạt ảnh khuôn mặt MPEG-4

2.1.3. Chuyển một cấu trúc khuôn mặt nhiều lớp

2.2. Mạng RBF và các thuật toán di truyền học

2.2.1. Các thuật toán di truyền học

3. CHƯƠNG 3: XÂY DỰNG MÔ HÌNH KHUÔN MẶT 3D TỪ MỘT KHUÔN MẶT GỐC

3.1. Mô tả phương pháp biến đổi khuôn mặt 3D

3.2. Hàm sai số

3.3. Sử dụng GA điều chỉnh các điểm đánh dấu

3.3.1. Nhiễm sắc thể

3.3.2. Hàm thích nghi (Fitness function)

3.3.3. Phép lai ghép (Crossover)

3.3.4. Phép toán bổ sung (Additional Operation)

3.4. Quy trình biến đổi khuôn mặt 3D

3.5. Một công cụ biến đổi khuôn mặt 3D

3.5.1. Tạo mô hình khuôn mặt 3D bằng Poser 5

3.5.2. Công cụ biến đổi

TÀI LIỆU THAM KHẢO

Tóm tắt

I. Tổng quan về nghiên cứu nhân bản chuyển động khuôn mặt 3D

Nghiên cứu về nhân bản chuyển động khuôn mặt trên mô hình 3D đang trở thành một lĩnh vực quan trọng trong công nghệ thông tin. Việc tạo ra các mô hình khuôn mặt 3D không chỉ giúp cải thiện trải nghiệm người dùng trong các ứng dụng giải trí mà còn có ứng dụng trong giáo dục và y tế. Các nghiên cứu hiện tại tập trung vào việc phát triển các phương pháp hiệu quả để tạo ra các biểu hiện khuôn mặt chân thực và sống động.

1.1. Khái niệm về mô hình khuôn mặt 3D

Mô hình khuôn mặt 3D là một bản sao số hóa của khuôn mặt con người, cho phép thể hiện các biểu cảm và chuyển động. Các mô hình này thường được sử dụng trong các ứng dụng như game, phim hoạt hình và thực tế ảo.

1.2. Tầm quan trọng của nghiên cứu nhân bản khuôn mặt

Nghiên cứu này không chỉ giúp cải thiện khả năng nhận diện và tương tác của máy tính với con người mà còn mở ra nhiều cơ hội mới trong lĩnh vực công nghệ thực tế ảo và trí tuệ nhân tạo.

II. Thách thức trong việc chuyển động khuôn mặt 3D

Việc tạo ra các mô hình 3D khuôn mặt với chuyển động tự nhiên gặp nhiều thách thức. Các vấn đề như độ chính xác trong việc nhận diện biểu cảm, khả năng xử lý thời gian thực và yêu cầu về tài nguyên tính toán là những yếu tố cần được giải quyết. Các nhà nghiên cứu đang tìm kiếm các giải pháp để tối ưu hóa quy trình này.

2.1. Độ chính xác trong nhận diện biểu cảm

Độ chính xác trong việc nhận diện biểu cảm là một yếu tố quan trọng. Các mô hình cần phải có khả năng nhận diện và tái tạo các biểu cảm phức tạp như vui, buồn, giận dữ một cách chính xác.

2.2. Yêu cầu về tài nguyên tính toán

Việc xử lý các mô hình khuôn mặt 3D yêu cầu một lượng lớn tài nguyên tính toán. Điều này có thể gây khó khăn cho việc triển khai trên các thiết bị có cấu hình thấp.

III. Phương pháp tạo mô hình khuôn mặt 3D hiệu quả

Để giải quyết các thách thức trong việc tạo ra mô hình khuôn mặt 3D, nhiều phương pháp đã được phát triển. Các phương pháp này bao gồm việc sử dụng công nghệ nhân bản khuôn mặt và các thuật toán học máy để tối ưu hóa quy trình tạo mô hình.

3.1. Công nghệ nhân bản khuôn mặt

Công nghệ nhân bản khuôn mặt cho phép tái sử dụng các mô hình đã có để tạo ra các biểu cảm mới mà không cần phải xây dựng lại từ đầu. Điều này giúp tiết kiệm thời gian và tài nguyên.

3.2. Thuật toán học máy trong mô hình hóa

Sử dụng các thuật toán học máy giúp cải thiện độ chính xác và hiệu quả trong việc tạo ra các mô hình khuôn mặt 3D. Các thuật toán này có khả năng học từ dữ liệu và tối ưu hóa quy trình tạo mô hình.

IV. Ứng dụng thực tiễn của mô hình khuôn mặt 3D

Mô hình khuôn mặt 3D có nhiều ứng dụng thực tiễn trong các lĩnh vực khác nhau. Từ game đến giáo dục, các mô hình này giúp nâng cao trải nghiệm người dùng và tạo ra các sản phẩm sáng tạo hơn.

4.1. Ứng dụng trong ngành game

Trong ngành game, mô hình khuôn mặt 3D giúp tạo ra các nhân vật sống động và tương tác hơn, mang lại trải nghiệm thú vị cho người chơi.

4.2. Ứng dụng trong giáo dục

Mô hình khuôn mặt 3D cũng được sử dụng trong giáo dục để tạo ra các bài học tương tác, giúp học sinh dễ dàng tiếp thu kiến thức hơn.

V. Kết luận và tương lai của nghiên cứu nhân bản khuôn mặt

Nghiên cứu về chuyển động khuôn mặt 3D đang mở ra nhiều cơ hội mới trong công nghệ. Với sự phát triển của công nghệ, tương lai của nghiên cứu này hứa hẹn sẽ mang lại nhiều đột phá trong việc tạo ra các mô hình khuôn mặt chân thực và sống động hơn.

5.1. Xu hướng phát triển công nghệ

Công nghệ sẽ tiếp tục phát triển, giúp cải thiện khả năng tạo ra các mô hình khuôn mặt 3D với độ chính xác cao hơn và thời gian xử lý nhanh hơn.

5.2. Tác động đến các lĩnh vực khác

Nghiên cứu này không chỉ ảnh hưởng đến ngành công nghệ thông tin mà còn có thể tác động đến các lĩnh vực như y tế, tâm lý học và nghệ thuật.

Tóm tắt và mô tả trên trang này được tạo với sự hỗ trợ của AI từ nội dung tài liệu gốc; tài liệu do người dùng đóng góp và được kiểm duyệt trước khi xuất bản. Báo lỗi nội dung.

22/07/2025

Bạn đang xem trước tài liệu:

Luận văn thạc sĩ vnu uet nghiên cứu nhân bản chuyển động khuôn mặt trên các mô hình khuôn mặt 3d khác nhau

Tải đầy đủ

Nội dung chính

Tổng quan nghiên cứu

Trong bối cảnh phát triển nhanh chóng của công nghệ đồ họa máy tính và tương tác người-máy, việc tạo dựng mô hình khuôn mặt 3D với hoạt ảnh chân thực và thời gian thực trở thành một thách thức lớn. Theo báo cáo của ngành, các mô hình khuôn mặt 3D truyền thống thường gặp khó khăn trong việc cân bằng giữa chất lượng biểu hiện khuôn mặt và hiệu suất hoạt ảnh thời gian thực trên các máy tính cá nhân thông thường. Mục tiêu nghiên cứu của luận văn là phát triển một phương pháp biến đổi mô hình khuôn mặt 3D nguồn sang các mô hình khuôn mặt mới, đồng thời giữ được các biểu hiện khuôn mặt chân thực và khả năng hoạt ảnh thời gian thực. Phạm vi nghiên cứu tập trung vào các mô hình khuôn mặt 3D được xây dựng dựa trên hệ thống cơ giản đơn, áp dụng cho các mô hình khuôn mặt có số đa giác từ khoảng 2.000 đến 30.000, với dữ liệu thu thập từ máy quét 3D và phần mềm tạo mô hình như Poser. Ý nghĩa nghiên cứu được thể hiện qua việc nâng cao hiệu quả tạo hoạt ảnh khuôn mặt 3D, giảm thiểu công sức thủ công trong việc điều chỉnh mô hình mới, đồng thời mở rộng ứng dụng trong các lĩnh vực giải trí, giáo dục và tương tác ảo.

Cơ sở lý thuyết và phương pháp nghiên cứu

Khung lý thuyết áp dụng

Luận văn dựa trên hai lý thuyết và mô hình nghiên cứu chính:

Mô hình cơ vectơ của Waters: Đây là mô hình cơ bản để mô phỏng các cơ mặt dưới dạng vectơ có tính định hướng, cho phép tạo ra các biến dạng chân thực trên bề mặt khuôn mặt. Mô hình này được mở rộng để xử lý sự tương tác đa cơ, tạo ra các chỗ phình và nếp nhăn trên da trong thời gian thực.
Mạng Radial Basis Function (RBF): Mạng RBF được sử dụng để biến đổi mô hình khuôn mặt nguồn sang mô hình mục tiêu dựa trên các điểm đánh dấu tương ứng. Mạng này cho phép ánh xạ phi tuyến giữa các tập điểm 3D, hỗ trợ việc chuyển hoạt ảnh khuôn mặt một cách tự động và chính xác.

Các khái niệm chuyên ngành quan trọng bao gồm:

Tham số hoạt ảnh mặt (FAP) và Bảng hoạt ảnh khuôn mặt (FAT) theo tiêu chuẩn MPEG-4, dùng để điều khiển hoạt ảnh khuôn mặt.
Hàm nếp nhăn: hàm parabol mô phỏng các nếp nhăn trên da do sự co cơ tạo ra.
Phép nội suy cosin và phi tuyến trong hoạt ảnh khung cơ sở để mô phỏng chuyển động mềm mại.
Thuật toán di truyền học (GA): được dùng để tự động xác định và điều chỉnh các điểm đánh dấu trên mô hình khuôn mặt mục tiêu.

Phương pháp nghiên cứu

Nguồn dữ liệu chính bao gồm các mô hình khuôn mặt 3D thu thập từ máy quét laze và phần mềm Poser 5, với số lượng đa giác dao động từ khoảng 2.000 đến 30.000. Cỡ mẫu nghiên cứu là một bộ mô hình khuôn mặt nguồn và nhiều mô hình khuôn mặt mục tiêu khác nhau để kiểm thử phương pháp biến đổi.

Phương pháp phân tích gồm:

Xây dựng mô hình cơ vectơ mở rộng dựa trên Waters để mô phỏng các cơ mặt và biểu hiện khuôn mặt.
Áp dụng thuật toán di truyền để tự động xác định vị trí các điểm đánh dấu trên mô hình mục tiêu, giảm thiểu sự can thiệp thủ công.
Sử dụng mạng RBF để biến đổi mô hình khuôn mặt nguồn sang mô hình mục tiêu dựa trên các điểm đánh dấu đã xác định.
Kiểm tra hiệu quả hoạt ảnh thông qua các biểu hiện cảm xúc như ngạc nhiên, hạnh phúc, buồn bã với tốc độ hoạt ảnh đạt khoảng 35 khung hình/giây trên máy tính cá nhân cấu hình Pentium II 800 MHz.

Timeline nghiên cứu kéo dài trong khoảng một năm, bao gồm các giai đoạn thu thập dữ liệu, xây dựng mô hình, phát triển thuật toán, thử nghiệm và đánh giá kết quả.

Kết quả nghiên cứu và thảo luận

Những phát hiện chính

Hiệu quả mô hình cơ vectơ mở rộng: Mô hình cơ vectơ được cải tiến cho phép xử lý sự tương tác đa cơ, tạo ra các chỗ phình và nếp nhăn chân thực trên khuôn mặt. Tốc độ hoạt ảnh đạt khoảng 35 khung hình/giây trên máy tính cá nhân cấu hình Pentium III 800 MHz, tăng 70% so với trước khi áp dụng kỹ thuật kiểm tra vùng ảnh hưởng cơ (từ 20.5 lên 35 fps).
Phương pháp chia vùng mô hình khuôn mặt: Việc chia mô hình khuôn mặt thành 11 vùng giúp giảm đáng kể số đỉnh cần kiểm tra khi tính toán ảnh hưởng của cơ, từ đó tăng tốc độ xử lý hoạt ảnh. Ví dụ, vùng mặt dưới bên phải chứa khoảng 160 đỉnh, giúp tập trung tính toán chính xác và hiệu quả.
Ứng dụng mạng RBF và thuật toán di truyền: Thuật toán di truyền tự động xác định vị trí các điểm đánh dấu trên mô hình mục tiêu, giảm thiểu sự can thiệp thủ công và tăng tính tổng quát của phương pháp. Mạng RBF biến đổi mô hình nguồn sang mô hình mục tiêu chính xác, giữ nguyên các biểu hiện khuôn mặt và chuyển động phức tạp.
Biểu hiện cảm xúc chân thực: Các biểu hiện ngạc nhiên, hạnh phúc và buồn bã được mô phỏng với các nếp nhăn và chỗ phình rõ ràng, làm tăng độ diễn cảm và tính tự nhiên của khuôn mặt. So sánh hình ảnh có và không có nếp nhăn cho thấy sự khác biệt rõ rệt về mức độ chân thực.

Thảo luận kết quả

Nguyên nhân thành công của phương pháp nằm ở việc kết hợp mô hình cơ vectơ đơn giản nhưng hiệu quả với kỹ thuật chia vùng và thuật toán tối ưu hóa tự động. So với các nghiên cứu trước đây, phương pháp này giảm thiểu đáng kể công sức thủ công trong việc điều chỉnh mô hình mới, đồng thời duy trì tốc độ hoạt ảnh thời gian thực trên các máy tính phổ thông.

Kết quả cũng cho thấy việc xử lý đa cơ song song với mức co cơ nhỏ (δc = 0.2) giúp mô phỏng chính xác hơn các biểu hiện phức tạp, tránh hiện tượng biến dạng giả tạo. Việc sử dụng hàm nếp nhăn parabol đơn giản nhưng hiệu quả giúp mô hình duy trì tốc độ cao mà vẫn tạo ra các chi tiết biểu cảm quan trọng.

Dữ liệu có thể được trình bày qua biểu đồ so sánh tốc độ hoạt ảnh trước và sau khi áp dụng kỹ thuật chia vùng, cũng như bảng thống kê số lượng đỉnh trong từng vùng và mức độ ảnh hưởng của các cơ. Hình ảnh minh họa các biểu hiện cảm xúc với và không có nếp nhăn cũng làm rõ sự khác biệt về chất lượng biểu hiện.

Đề xuất và khuyến nghị

Phát triển mô hình lưỡi 3D: Động từ hành động: xây dựng; Target metric: tăng tính chân thực của hoạt ảnh miệng; Timeline: 6-12 tháng; Chủ thể thực hiện: nhóm nghiên cứu đồ họa máy tính. Mô hình lưỡi sẽ bổ sung cho biểu hiện miệng, nâng cao khả năng truyền tải ngôn ngữ và cảm xúc.
Tích hợp kỹ thuật tạo chất liệu nâng cao: Động từ hành động: áp dụng; Target metric: cải thiện chất lượng bề mặt da và nếp nhăn; Timeline: 3-6 tháng; Chủ thể thực hiện: chuyên gia đồ họa và lập trình viên. Việc này giúp tăng tính chân thực của mô hình khuôn mặt mà không làm giảm tốc độ hoạt ảnh.
Tối ưu thuật toán mạng RBF và GA: Động từ hành động: tối ưu; Target metric: giảm thời gian xử lý và tăng độ chính xác điểm đánh dấu; Timeline: 6 tháng; Chủ thể thực hiện: nhà nghiên cứu AI và học máy. Mục tiêu là nâng cao hiệu quả chuyển đổi mô hình khuôn mặt mới.
Mở rộng ứng dụng vào môi trường thực tế ảo và trò chơi điện tử: Động từ hành động: triển khai; Target metric: tăng trải nghiệm người dùng; Timeline: 12 tháng; Chủ thể thực hiện: các công ty phát triển phần mềm và trò chơi. Phương pháp này có thể tạo ra các nhân vật ảo biểu cảm và tương tác tự nhiên hơn.

Đối tượng nên tham khảo luận văn

Nhà nghiên cứu đồ họa máy tính và hoạt ảnh 3D: Luận văn cung cấp phương pháp mới trong mô hình hóa và hoạt ảnh khuôn mặt, giúp họ phát triển các mô hình biểu cảm chân thực và hiệu quả.
Chuyên gia phát triển trò chơi điện tử và thực tế ảo: Các kỹ thuật mô hình và hoạt ảnh khuôn mặt 3D trong luận văn hỗ trợ tạo ra nhân vật ảo sống động, tăng tính tương tác và trải nghiệm người chơi.
Giảng viên và sinh viên ngành Công nghệ Thông tin, Công nghệ Phần mềm: Đây là tài liệu tham khảo quý giá về ứng dụng mạng RBF, thuật toán di truyền và mô hình cơ học trong đồ họa máy tính.
Các nhà phát triển phần mềm tương tác người-máy: Phương pháp chuyển hoạt ảnh khuôn mặt tự động giúp giảm thiểu công sức thiết kế giao diện người dùng với các agent hiện thân, nâng cao tính tự nhiên trong giao tiếp.

Câu hỏi thường gặp

Phương pháp này có thể áp dụng cho các mô hình khuôn mặt có số đa giác lớn không?
Phương pháp được thiết kế để xử lý hiệu quả các mô hình từ khoảng 2.000 đến 30.000 đa giác. Việc chia vùng và tối ưu thuật toán giúp duy trì tốc độ hoạt ảnh thời gian thực ngay cả với số đa giác lớn.
Thuật toán di truyền được sử dụng như thế nào trong việc xác định điểm đánh dấu?
Thuật toán di truyền tự động tìm vị trí tối ưu của các điểm đánh dấu trên mô hình mục tiêu, giảm thiểu sự can thiệp thủ công và tăng độ chính xác trong việc ánh xạ mô hình nguồn sang mô hình mới.
Mạng RBF có ưu điểm gì so với các phương pháp ánh xạ khác?
Mạng RBF cho phép ánh xạ phi tuyến chính xác giữa các tập điểm 3D, hỗ trợ chuyển đổi mô hình khuôn mặt phức tạp mà không cần nhiều điều chỉnh thủ công, đồng thời duy trì tính tổng quát cao.
Làm thế nào để mô hình tạo ra các nếp nhăn và chỗ phình trên khuôn mặt?
Mô hình sử dụng hàm nếp nhăn parabol đơn giản, tính toán biên độ nếp nhăn dựa trên khoảng cách đến điểm trung tâm cơ, kết hợp với mô hình cơ vectơ để tạo ra các chi tiết biểu cảm chân thực trong thời gian thực.
Phương pháp này có thể áp dụng cho các ứng dụng thời gian thực như trò chơi điện tử không?
Có, với tốc độ hoạt ảnh khoảng 35 khung hình/giây trên máy tính cá nhân phổ thông, phương pháp phù hợp để tích hợp vào các ứng dụng thời gian thực như trò chơi điện tử và môi trường thực tế ảo.

Kết luận

Phương pháp biến đổi mô hình khuôn mặt 3D dựa trên mô hình cơ vectơ mở rộng và mạng RBF cho phép tạo hoạt ảnh khuôn mặt chân thực và thời gian thực trên máy tính cá nhân.
Việc chia vùng mô hình khuôn mặt giúp tăng tốc độ xử lý hoạt ảnh lên đến 35 khung hình/giây, cải thiện 70% so với phương pháp truyền thống.
Thuật toán di truyền tự động xác định điểm đánh dấu giảm thiểu công sức thủ công và tăng tính tổng quát của phương pháp.
Các biểu hiện cảm xúc như ngạc nhiên, hạnh phúc và buồn bã được mô phỏng với các nếp nhăn và chỗ phình rõ nét, nâng cao độ diễn cảm.
Các bước tiếp theo bao gồm phát triển mô hình lưỡi 3D, tích hợp kỹ thuật tạo chất liệu nâng cao và tối ưu thuật toán để mở rộng ứng dụng trong thực tế ảo và trò chơi điện tử.

Khuyến khích các nhà nghiên cứu và phát triển phần mềm ứng dụng phương pháp này để nâng cao chất lượng hoạt ảnh khuôn mặt 3D, đồng thời tiếp tục nghiên cứu mở rộng các thành phần mô hình nhằm tăng tính chân thực và hiệu quả.

Trích đoạn nội dung tài liệu

MỞ ĐẦU Hiện nay, phần lớn tƣơng tác giữa con ngƣời và máy tính đƣợc thực hiện thông qua chuột và bàn phím. Cùng với sự phát triển nhanh chóng của đồ họa máy tính và công nghệ ngôn ngữ, các nhà nghiên cứu ngày càng chú ý tới việc đƣa sự tƣơng tác này trở nên linh hoạt, thích ứng và hƣớng tới con ngƣời hơn. Một cách thực hiện điều này là qua việc tạo ra các agent hiện thân (embodied agent). Các agent hiện thân đã từng đƣợc sử dụng làm giao diện cho tƣơng tác con ngƣời – máy tính [11].

Ngƣời ta cho rằng những agent hội thoại hiện thân (embodied conversational agents) cho phép ngƣời sử dụng tƣơng tác tự nhiên hơn với máy tính. Với xu thế phát triển của thế giới ảo, công nghệ agent hiện thân cho phép tạo dựng những nhân vật ảo với nhiều mục đích khác nhau nhƣ giải trí, giáo dục. Khả năng nói chuyện, biểu hiện gƣơng mặt và các cử chỉ của agent hiện thân khiến chúng rất phù hợp với các ứng dụng giải trí. Ngƣời kể chuyện ảo tại Đại học Twente là một ví dụ về agent hiện thân [38].

Đây là một agent nói chuyện hiện thân, kể lại những câu chuyện đƣợc sáng tác ra, với những ngôn điệu và cử chỉ thích hợp. Agent này đƣợc đặt trong một mô hình - bản sao nhà hát địa phƣơng: Virtual Music Center. Bên cạnh dạng kể chuyện truyền thống này, ngƣời ta cũng dự định phát triển các vở kịch ảo, trong đó các nhân vật hiện thân diễn trên sân khấu ảo, dựa trên cốt truyện đã sáng tác. Còn có nhiều ví dụ khác về các agent hiện thân phục vụ lĩnh vực giải trí, nhƣ các nhân vật nhân tạo ở phòng thí nghiệm truyền thông MIT [4], các nhà bình luận bóng đá robot [2].

Các agent hiện thân có thể làm ngƣời hƣớng dẫn các thủ tục, trả lời câu hỏi thắc mắc, và kiểm soát hành động của sinh viên. Agent hiện thân cũng có thể trở thành đồng đội trong những nhiệm vụ đòi hỏi sự tham gia của nhiều ngƣời. Một ví dụ về những agent nhƣ vậy là Steve - chuyên gia luyện bay trong môi trƣờng ảo tại Đại học Nam California [35]. Steve đƣợc xây dựng nhằm hỗ trợ việc tập luyện của đội trong một mô hình môi trƣờng làm việc ảo tƣơng tác ba chiều của một sinh viên, khi mà việc luyện tập dựa trên các thiết bị thật không có trên thực tế.

Các agent hiện thân cũng đƣợc dùng để phát triển các trò chơi trên máy tính. Các trò chơi máy tính truyền thống thƣờng có những nhân vật thụ động, cứng nhắc, máy móc. So với trò chơi một ngƣời chơi (một ngƣời chơi với các nhân vật máy tính), thì các trò chơi nhiều ngƣời chơi vẫn đƣợc ƣa chuộng hơn. Chơi với ngƣời thật thú vị hơn vì cách phản ứng của con ngƣời luôn đƣa đến những diễn biến mới mẻ, ngay cả khi chơi nhiều lần với cùng một ngƣời.

Còn trò chơi chỉ chơi với nhân vật máy tính sẽ không có đƣợc điều đó. Các agent hiện thân (hay các nhân vật ảo có thể cử động) có mục tiêu, kiến thức và khả năng riêng của chúng, đây có thể là lời giải đáp cho vấn đề này [23], đặc biệt là đối với những loại trò chơi sử dụng máy tính để tạo nên thế giới và các nhân vật ảo có thể tƣơng tác động với ngƣời chơi, ví dụ nhƣ Quake, Half-Life 2, Diablo 3,. Do đó, các nhân vật ảo có thể cử động đang đƣợc phát triển và đƣa vào LUAN VAN CHAT LUONG download : add luanvanchat@agmail.com 2 nhiều loại trò chơi máy tính. Chúng cũng có tiềm năng dẫn đến việc ra đời những loại trò chơi hoàn toàn mới [23].

Một agent hiện thân điển hình gồm các thành phần sau: - Một cái đầu nói chuyện có khả năng nói, thể hiện các cử động môi trong khi nói, có các biểu cảm trên gƣơng mặt và thể hiện đƣợc các tín hiệu hội thoại. - Một cơ thể có khả năng thể hiện các cử chỉ. - Một mô hình trí não có thể bao gồm lòng tin, cảm xúc, kế hoạch hành vi, động thái và tính cách… Đối tƣợng nghiên cứu của luận văn này là các agent hiện thân đƣợc thể hiện dƣới dạng một khuôn mặt 3D. Trong bài toán xây dựng một mô hình khuôn mặt 3D, thông thƣờng ta phải trải qua các bƣớc sau: - Bƣớc 1: Sử dụng đồ hoạ máy tính để tạo dựng một mô hình khuôn mặt 3D.

- Bƣớc 2: Tạo dựng mô hình cơ mặt có thể đạt đƣợc những biểu hiện khuôn mặt chân thực trong thời gian thực trên một máy tính thông thƣờng. Các nghiên cứu trƣớc đây đã cho thấy bƣớc 2 đòi hỏi rất nhiều công sức và thời gian. Và việc này lặp lại mỗi khi chúng ta xây dựng một mô hình khuôn mặt 3D mới. Đây là lý do để luận văn nghiên cứu một phƣơng pháp tạo dựng mô hình cơ mặt cho một khuôn mặt 3D mới bằng cách biến đổi mô hình khuôn mặt nguồn đã có mô hình cơ mặt.

Trên cơ sở nghiên cứu và thử nghiệm phƣơng pháp nhân bản của Bùi Thế Duy và cộng sự [9], tôi đƣa ra một quy trình và xây dựng một công cụ tạo ra hoạt ảnh trên các khuôn mặt 3D. Công cụ này đƣợc xây dựng để kết nối với phần mềm tạo khuôn mặt Poser. Có một số ƣu điểm khi sử dụng mô hình khuôn mặt biến đổi để thể hiện một mô hình khuôn mặt mới thay cho việc sử dụng chính bản thân mô hình mới. Thứ nhất, khi tạo hoạt ảnh với những mô hình khuôn mặt khác nhau, chúng ta có thể giữ đƣợc một mô hình khuôn mặt cố định với số đỉnh và số đa giác đƣợc xác định trƣớc.

Thứ hai, ta có thể tái sử dụng các thông số trên mô hình khuôn mặt cố định trƣớc, ví dụ nhƣ các thông số xoay quai hàm và đảo mắt. Thứ ba, ta có thể sử dụng lại những thông tin về các vùng trên mô hình khuôn mặt để nâng cao hiệu quả của cơ vectơ và điều khiển hoạt ảnh. Luận văn đƣợc cấu trúc nhƣ sau. Chƣơng 1 giới thiệu một mô hình khuôn mặt 3D dựa trên hệ thống cơ đơn giản, có thể đáp ứng các mục tiêu sau: nó vừa có thể tạo nên những biểu hiện khuôn mặt chân thực, đồng thời lại đạt đƣợc hoạt ảnh thời gian thực trên những máy tính cá nhân thông thƣờng.

Chƣơng 2 trình bày cơ sở lý thuyết để xây dựng một phƣơng pháp truyền hoạt ảnh khuôn mặt từ một mô hình khuôn mặt cho trƣớc tới một mô hình mới đƣợc tạo ra mà không cần nhiều thao tác của con ngƣời. Chƣơng 3 trình bày một phƣơng pháp truyền hoạt ảnh khuôn mặt từ một mô hình khuôn mặt cho trƣớc tới một mô hình mới đƣợc tạo ra mà không cần nhiều thao tác của con ngƣời. Chƣơng này mô tả quy trình và một công cụ do tác giả phát triển để thử nghiệm phƣơng pháp đƣợc đƣa ra trong luận văn. LUAN VAN CHAT LUONG download : add luanvanchat@agmail.com 3 CHƢƠNG 1.

TỔNG QUAN VỀ KHUÔN MẶT VÀ HOẠT ẢNH CỦA KHUÔN MẶT 3D 1.1 Giới thiệu Khuôn mặt của con ngƣời rất đặc biệt. Đó là bộ phận cơ thể quan trọng để giúp nhận diện một ngƣời bằng mắt thƣờng. Trong hàng trăm khuôn mặt quen thuộc, chúng ta vẫn có thể nhận ra một khuôn mặt cụ thể. Ta cũng có khả năng phát hiện ra từng cử động tinh tế của khuôn mặt.

Khả năng này phát triển từ thời thơ ấu của chúng ta và nhờ nó ta có đƣợc công cụ giao tiếp cơ bản nhất của con ngƣời. Theo một số nghiên cứu, trẻ em 9 tháng tuổi bắt đầu hiểu đƣợc những phản ứng của khuôn mặt ngƣời khác. Ngay khi 1 tuổi, trẻ em phát triển bình thƣờng có thể phân biệt các biểu hiện cảm xúc và chúng tiếp tục hoàn thiện khả năng này trong quá trình trƣởng thành. Hoạt ảnh của khuôn mặt con ngƣời giữ vai trò quan trọng trong giao tiếp mặt đối mặt.

Cử động môi trong khi nói chuyện giúp đoán biết đƣợc bằng mắt ngƣời đó đang nói gì. Cohen and Massaro [13] đã chứng minh rằng tỷ lệ nhận biết âm vị từ những đoạn video vừa có hình ảnh ngƣời nói vừa có âm thanh cao hơn hẳn so với từ những đoạn băng chỉ có âm thanh. Đối với ngƣời điếc, cử động môi là điều thiết yếu để họ hiểu đƣợc các hội thoại. Trong giao tiếp bằng cử chỉ, biểu hiện của khuôn mặt thƣờng ngụ ý sự biến đổi của khuôn mặt theo thời gian.

Tuy nhiên, ngay cả một bức tranh chân dung cũng thể hiện cảm xúc, nghĩa là biểu hiện của khuôn mặt có thể ở chế độ tĩnh, mặc dù những biểu hiện đó không rõ ràng nếu không đƣợc đặt trong hoàn cảnh cụ thể. Biểu hiện của khuôn mặt diễn ra liên tục trong suốt quá trình nói chuyện. Chúng là sự minh họa và bổ sung cho những thông tin từ lời nói. Chúng có thể diễn đạt cảm xúc, tâm trạng, và truyền đạt các thông tin về tính cách của ngƣời nói.

Những thông tin này có thể làm lộ ra phần ẩn giấu bên trong một con ngƣời, mà lời nói không toát lên đƣợc. Bài toán tạo mô hình khuôn mặt con ngƣời và tạo ra các hoạt ảnh mặt bằng máy tính là một thách thức lớn trong cộng đồng khoa học nghiên cứu về đồ họa vi tính. Một nhu cầu mới nảy sinh là thể hiện đƣợc khuôn mặt chân thực, chất lƣợng cao và đồng thời đạt đƣợc hoạt ảnh thời gian thực của khuôn mặt. Nhìn chung, trƣớc nghiên cứu của Bùi Thế Duy và cộng sự [7, 8], các cách tiếp cận đều chƣa thể đạt đƣợc cả hai mục tiêu này.

Hoạt ảnh khung cơ sở (key-frame animation) [29], hoạt ảnh đƣợc tham số hoá (parameterized animation) [30] và hoạt ảnh dựa trên hệ thống cơ giả (pseudo- muscle-based animation) [21] là các cách thức đơn giản để đạt đƣợc hoạt ảnh thời gian thực, tuy nhiên chúng không thể tạo ra các biểu hiện khuôn mặt chân thực, do không tạo đƣợc các chỗ phình và nếp nhăn trên da, cũng nhƣ không xử lý đƣợc các tƣơng tác đa tham số (đa cơ). Mặt khác, hoạt ảnh dựa trên hệ thống cơ đa lớp với nhiều lớp thuộc cấu trúc khuôn mặt có thể tạo đƣợc sự biểu đạt chân thực, nhƣng việc xử lý hoạt ảnh LUAN VAN CHAT LUONG download : add luanvanchat@agmail.com 4 thời gian thực bằng phƣơng pháp này đòi hỏi dung lƣợng tính toán khổng lồ, mà các máy tính cá nhân thông thƣờng không đáp ứng đƣợc. Trong chƣơng này, tôi sẽ xem xét một mô hình khuôn mặt 3D dựa trên hệ thống cơ giản đơn, mà có thể tạo ra nét mặt chân thực cũng nhƣ các hoạt ảnh thời gian thực trên máy tính cá nhân thông thƣờng.

Nội dung được bảo vệ bản quyền — Tải xuống đầy đủ

Chủ đề

Công nghệ thông tin ứng dụng

đồ họa máy tính và hoạt ảnh 3D

xử lý hình ảnh khuôn mặt

trí tuệ nhân tạo và thuật toán tối ưu