Xây Dựng Mô Hình Kết Hợp Ảnh Thường và Ảnh Nhiệt Để Ước Lượng Cảm Xúc Con Người

Trường đại học

Trường Đại học Sư phạm Thành phố Hồ Chí Minh

Chuyên ngành

Khoa học máy tính

Người đăng

Ẩn danh

Thể loại

luận văn thạc sĩ

2019

Phí lưu trữ

30 Point

Mục lục chi tiết

LỜI CAM ĐOAN

LỜI CẢM ƠN

1. MỞ ĐẦU

1.1. Lý do chọn đề tài

1.2. Mục tiêu và nhiệm vụ nghiên cứu

1.3. Đóng góp của luận văn

1.4. Đối tượng và phạm vi nghiên cứu

1.5. Phương pháp nghiên cứu

1.6. Ý nghĩa khoa học và thực tiễn

1.7. Cấu trúc luận văn

2. TỔNG QUAN TÌNH HÌNH NGHIÊN CỨU

2.1. Các công trình nghiên cứu liên quan

2.2. Một số thách thức trong lĩnh vực nghiên cứu nhận dạng cảm xúc của con người

2.3. Sơ lược về cơ sở dữ liệu cảm xúc

2.4. Bài toán phát hiện cảm xúc khuôn mặt

2.5. Kiến trúc Mạng nơ-ron tích chập (Convolutional neural network)

2.6. Lớp Fully Connected

2.7. Học chuyển giao

2.8. Mạng huấn luyện Resnet (Residual Network)

2.9. Độ đo đánh giá mô hình phân lớp

3. ƯỚC LƯỢNG CẢM XÚC CỦA NGƯỜI DỰA TRÊN ẢNH THƯỜNG VÀ ẢNH NHIỆT

3.1. Cơ sở dữ liệu ảnh nhiệt Kotani Thermal Facial Emotion (KTFE)

3.2. Mô hình ước lượng cảm xúc trên ảnh thường và ảnh nhiệt

4. THỰC NGHIỆM VÀ ĐÁNH GIÁ

4.1. Môi trường thực nghiệm

4.2. Dữ liệu đầu vào

4.3. Phân tích đánh giá

4.4. Kết quả thực nghiệm

4.5. So sánh kết quả thực nghiệm với kết quả của phương pháp [32]

4.6. So sánh kết quả thực nghiệm với kết quả của phương pháp [36]

5. KẾT LUẬN VÀ HƯỚNG PHÁT TRIỂN

CÔNG TRÌNH CÔNG BỐ

TÀI LIỆU THAM KHẢO

DANH MỤC CÁC KÝ HIỆU VÀ CHỮ VIẾT TẮT

DANH MỤC CÁC BẢNG BIỂU

DANH MỤC CÁC HÌNH VẼ

Tóm tắt

I. Tổng Quan Về Mô Hình Kết Hợp Ảnh Thường và Ảnh Nhiệt

Trong kỷ nguyên công nghệ số, việc trao đổi thông tin giữa người và máy trở nên vô cùng quan trọng. Nghiên cứu về cách máy móc hiểu và giao tiếp với con người thu hút sự quan tâm lớn. Hai nguồn thông tin chính là giọng nói và hình ảnh. Trong đó, biểu hiện khuôn mặt chiếm 55% cơ sở để con người hiểu nhau. Tuy nhiên, đây là một bài toán khó đối với máy tính. Nghiên cứu về biểu hiện khuôn mặt đã đạt được nhiều kết quả khích lệ. Cảm xúc là một biểu hiện khó nắm bắt chỉ bằng ảnh thông thường. Cảm xúc không chỉ là biểu hiện bên ngoài mà còn là sự thay đổi vật lý về nhiệt độ trong các mạch máu. Ảnh thông thường gặp hạn chế về ánh sáng, màu da, và không phản ánh được cảm xúc thật sự. Ảnh nhiệt khắc phục điều này, giúp dự đoán chính xác hơn. Hầu hết nghiên cứu tập trung vào 6 cảm xúc cơ bản. Đề tài "Mô hình kết hợp ảnh thường và ảnh nhiệt để ước lượng cảm xúc con người" được thực hiện để làm rõ cơ sở lý thuyết, thực nghiệm và đánh giá kết quả.

1.1. Tầm Quan Trọng của Nhận Diện Cảm Xúc Con Người

Trong bối cảnh trí tuệ nhân tạo (AI) ngày càng phát triển, khả năng nhận diện cảm xúc của máy móc đóng vai trò then chốt trong việc tạo ra các hệ thống tương tác tự nhiên và hiệu quả hơn. Việc máy móc có thể hiểu được cảm xúc con người mở ra tiềm năng ứng dụng rộng rãi trong nhiều lĩnh vực, từ chăm sóc sức khỏe đến giáo dục và giải trí. Các hệ thống có khả năng phân tích cảm xúc có thể giúp cải thiện trải nghiệm người dùng, cung cấp dịch vụ cá nhân hóa và hỗ trợ ra quyết định.

1.2. Ưu Điểm của Mô Hình Kết Hợp Ảnh Thường và Ảnh Nhiệt

Mô hình kết hợp ảnh thường và ảnh nhiệt mang lại nhiều ưu điểm so với việc chỉ sử dụng một loại ảnh duy nhất. Ảnh thường cung cấp thông tin về hình dạng và biểu hiện khuôn mặt, trong khi ảnh nhiệt phản ánh sự thay đổi nhiệt độ trên khuôn mặt, liên quan đến các phản ứng sinh lý và cảm xúc. Sự kết hợp này giúp khắc phục những hạn chế của từng loại ảnh, chẳng hạn như ảnh hưởng của ánh sáng đối với ảnh thường và sự nhạy cảm với nhiệt độ môi trường của ảnh nhiệt. Từ đó, mô hình có thể đánh giá cảm xúc một cách chính xác và đáng tin cậy hơn.

II. Thách Thức và Vấn Đề Trong Đánh Giá Cảm Xúc Hiện Tại

Các hệ thống nhận dạng cảm xúc hiện tại, đặc biệt là những hệ thống dựa trên ảnh thường, gặp phải nhiều thách thức. Điều kiện ánh sáng yếu, chất lượng ảnh kém, sự khác biệt về màu da, và việc người dùng cố tình che giấu cảm xúc đều có thể ảnh hưởng đến độ chính xác của hệ thống. Ảnh nhiệt có thể giúp khắc phục một số hạn chế này, nhưng cũng có những thách thức riêng, chẳng hạn như sự thay đổi nhiệt độ cơ thể do hoạt động thể chất hoặc môi trường. Do đó, việc phát triển các mô hình kết hợp mạnh mẽ và linh hoạt là rất quan trọng để vượt qua những thách thức này.

2.1. Hạn Chế Của Phương Pháp Nhận Diện Cảm Xúc Truyền Thống

Các phương pháp nhận diện cảm xúc truyền thống thường dựa trên việc phân tích các đặc điểm khuôn mặt như vị trí và hình dạng của mắt, mũi, miệng. Tuy nhiên, những phương pháp này có thể bị ảnh hưởng bởi nhiều yếu tố, bao gồm góc nhìn, ánh sáng và biểu cảm giả tạo. Ngoài ra, chúng thường không thể phát hiện những thay đổi cảm xúc tinh tế hoặc những cảm xúc bị che giấu. Điều này dẫn đến độ chính xác thấp và khả năng ứng dụng hạn chế trong thực tế.

2.2. Ảnh Hưởng Của Yếu Tố Môi Trường Đến Độ Chính Xác

Yếu tố môi trường, chẳng hạn như ánh sáng và nhiệt độ, có thể ảnh hưởng đáng kể đến độ chính xác của các hệ thống nhận diện cảm xúc. Ánh sáng yếu hoặc quá mạnh có thể làm giảm chất lượng ảnh thường, khiến việc trích xuất các đặc điểm khuôn mặt trở nên khó khăn hơn. Nhiệt độ môi trường có thể ảnh hưởng đến nhiệt độ khuôn mặt, làm sai lệch kết quả phân tích nhiệt. Do đó, các hệ thống nhận diện cảm xúc cần được thiết kế để có khả năng chống chịu với những thay đổi môi trường này.

2.3. Vấn Đề Về Dữ Liệu Huấn Luyện và Tính Đa Dạng

Một vấn đề quan trọng khác trong lĩnh vực nhận diện cảm xúc là sự thiếu hụt dữ liệu huấn luyện đa dạng và đại diện. Hầu hết các bộ dữ liệu hiện có đều tập trung vào một số ít cảm xúc cơ bản và thường được thu thập trong điều kiện kiểm soát. Điều này có thể dẫn đến việc các mô hình được huấn luyện trên những bộ dữ liệu này hoạt động kém hiệu quả trong môi trường thực tế, nơi cảm xúc có thể phức tạp và đa dạng hơn nhiều. Cần có những nỗ lực để thu thập và tạo ra các bộ dữ liệu lớn hơn, đa dạng hơn và đại diện hơn để cải thiện khả năng tổng quát hóa của các mô hình nhận diện cảm xúc.

III. Phương Pháp Kết Hợp Ảnh Thường và Ảnh Nhiệt Hiệu Quả

Để giải quyết các thách thức trên, luận văn đề xuất mô hình kết hợp ảnh thường và ảnh nhiệt sử dụng mạng nơ-ron tích chập (CNN). Mô hình này trích xuất đặc trưng từ cả hai loại ảnh, sau đó hợp nhất các đặc trưng này để phân loại cảm xúc. Kỹ thuật học sâu giúp mô hình tự động học các đặc trưng quan trọng từ dữ liệu, giảm thiểu sự can thiệp của con người. Cơ sở dữ liệu KTFE được sử dụng để huấn luyện và đánh giá mô hình. Kết quả thực nghiệm cho thấy mô hình đạt được độ chính xác cao hơn so với các phương pháp truyền thống.

3.1. Ứng Dụng Mạng Nơ Ron Tích Chập CNN Trong Xử Lý Ảnh

Mạng nơ-ron tích chập (CNN) là một kiến trúc mạng nơ-ron đặc biệt phù hợp cho việc xử lý ảnh. CNN sử dụng các lớp tích chập để tự động học các đặc trưng quan trọng từ ảnh, chẳng hạn như cạnh, góc và kết cấu. Các lớp gộp (pooling) giúp giảm kích thước của dữ liệu và tăng tính bất biến đối với các biến đổi nhỏ trong ảnh. CNN đã đạt được những thành công vượt trội trong nhiều bài toán computer vision, bao gồm nhận dạng đối tượng, phân loại ảnh và phát hiện khuôn mặt.

3.2. Kỹ Thuật Học Chuyển Giao Transfer Learning Để Tăng Tốc Độ Huấn Luyện

Học chuyển giao (transfer learning) là một kỹ thuật cho phép sử dụng kiến thức đã học được từ một bài toán để giải quyết một bài toán khác có liên quan. Trong lĩnh vực nhận diện cảm xúc, học chuyển giao có thể được sử dụng để tận dụng các mô hình đã được huấn luyện trên các bộ dữ liệu lớn về nhận dạng đối tượng hoặc phân loại ảnh. Bằng cách sử dụng học chuyển giao, có thể giảm đáng kể thời gian và chi phí huấn luyện mô hình cho bài toán nhận diện cảm xúc.

3.3. Hợp Nhất Đặc Trưng Từ Ảnh Thường và Ảnh Nhiệt

Việc hợp nhất các đặc trưng trích xuất từ ảnh thường và ảnh nhiệt là một bước quan trọng để tận dụng tối đa thông tin từ cả hai nguồn. Có nhiều phương pháp hợp nhất khác nhau, bao gồm hợp nhất ở mức đặc trưng (feature-level fusion) và hợp nhất ở mức quyết định (decision-level fusion). Hợp nhất ở mức đặc trưng kết hợp các đặc trưng trích xuất từ hai loại ảnh thành một vectơ đặc trưng duy nhất, trong khi hợp nhất ở mức quyết định kết hợp các kết quả phân loại riêng lẻ từ hai loại ảnh.

IV. Thực Nghiệm và Đánh Giá Hiệu Quả Mô Hình Kết Hợp

Mô hình được huấn luyện và đánh giá trên cơ sở dữ liệu KTFE. Dữ liệu được chia thành tập huấn luyện và tập kiểm tra. Các độ đo đánh giá như độ chính xác, độ tin cậy được sử dụng để đánh giá hiệu quả của mô hình. Kết quả cho thấy mô hình kết hợp vượt trội so với các mô hình chỉ sử dụng một loại ảnh. So sánh với các phương pháp khác trong tài liệu gốc cũng cho thấy sự ưu việt của mô hình đề xuất.

4.1. Cơ Sở Dữ Liệu Ảnh Nhiệt Kotani Thermal Facial Emotion KTFE

Cơ sở dữ liệu Kotani Thermal Facial Emotion (KTFE) là một bộ dữ liệu quan trọng cho nghiên cứu về nhận diện cảm xúc bằng ảnh nhiệt. Bộ dữ liệu này chứa ảnh thường và ảnh nhiệt của các đối tượng thể hiện các cảm xúc khác nhau. KTFE cung cấp một nguồn tài nguyên quý giá cho việc huấn luyện và đánh giá các mô hình nhận diện cảm xúc kết hợp ảnh thường và ảnh nhiệt.

4.2. Phân Tích Kết Quả Thực Nghiệm và So Sánh Với Các Phương Pháp Khác

Kết quả thực nghiệm cho thấy mô hình kết hợp đạt được độ chính xác cao hơn so với các mô hình chỉ sử dụng một loại ảnh. Điều này chứng tỏ rằng việc kết hợp thông tin từ ảnh thường và ảnh nhiệt có thể cải thiện đáng kể hiệu quả của nhận diện cảm xúc. So sánh với các phương pháp khác trong tài liệu gốc cũng cho thấy sự ưu việt của mô hình đề xuất, đặc biệt là trong việc nhận diện các cảm xúc khó như sợ hãi và ghê tởm.

4.3. Đánh Giá Độ Tin Cậy và Tính Ổn Định Của Mô Hình

Ngoài độ chính xác, độ tin cậy và tính ổn định cũng là những yếu tố quan trọng cần được đánh giá khi xây dựng một mô hình nhận diện cảm xúc. Độ tin cậy thể hiện khả năng của mô hình trong việc đưa ra các dự đoán nhất quán, trong khi tính ổn định thể hiện khả năng của mô hình trong việc duy trì hiệu suất cao trong các điều kiện khác nhau. Các thử nghiệm cần được thực hiện để đánh giá độ tin cậy và tính ổn định của mô hình trong các tình huống thực tế.

V. Ứng Dụng Thực Tế Của Mô Hình Đánh Giá Cảm Xúc

Mô hình có tiềm năng ứng dụng rộng rãi trong nhiều lĩnh vực. Trong y tế, nó có thể giúp phát hiện căng thẳng, đau đớn ở bệnh nhân. Trong marketing, nó có thể giúp phân tích cảm xúc của khách hàng đối với sản phẩm. Trong an ninh, nó có thể giúp phát hiện nói dối. Trong giáo dục, nó có thể giúp cá nhân hóa trải nghiệm học tập. Ứng dụng trong chăm sóc sức khỏe cũng rất tiềm năng.

5.1. Ứng Dụng Trong Lĩnh Vực Y Tế và Chăm Sóc Sức Khỏe

Trong lĩnh vực y tế và chăm sóc sức khỏe, mô hình đánh giá cảm xúc có thể được sử dụng để phát hiện các dấu hiệu của căng thẳng, lo lắng, đau đớn hoặc các rối loạn tâm lý khác. Nó cũng có thể giúp theo dõi hiệu quả của các phương pháp điều trị và cung cấp phản hồi cho bệnh nhân và bác sĩ. Ví dụ, mô hình có thể được sử dụng để phát hiện các dấu hiệu sớm của trầm cảm hoặc lo âu ở những người có nguy cơ cao.

5.2. Ứng Dụng Trong Lĩnh Vực Marketing và Nghiên Cứu Thị Trường

Trong lĩnh vực marketing và nghiên cứu thị trường, mô hình đánh giá cảm xúc có thể được sử dụng để phân tích phản ứng của khách hàng đối với các sản phẩm, dịch vụ hoặc quảng cáo. Nó có thể giúp các nhà marketing hiểu rõ hơn về nhu cầu và mong muốn của khách hàng, từ đó đưa ra các quyết định marketing hiệu quả hơn. Ví dụ, mô hình có thể được sử dụng để phân tích cảm xúc của khán giả khi xem một quảng cáo và xác định những yếu tố nào của quảng cáo gây được ấn tượng tích cực hoặc tiêu cực.

5.3. Ứng Dụng Trong Lĩnh Vực An Ninh và Phát Hiện Nói Dối

Trong lĩnh vực an ninh, mô hình đánh giá cảm xúc có thể được sử dụng để phát hiện các dấu hiệu của nói dối hoặc che giấu thông tin. Nó có thể giúp các nhà điều tra xác định những người có thể liên quan đến một vụ án hoặc những người đang cố gắng che giấu điều gì đó. Tuy nhiên, cần lưu ý rằng việc sử dụng mô hình đánh giá cảm xúc trong lĩnh vực an ninh cần được thực hiện một cách cẩn trọng và tuân thủ các quy định về quyền riêng tư.

VI. Kết Luận và Hướng Phát Triển Của Mô Hình Đánh Giá

Luận văn đã xây dựng thành công mô hình kết hợp ảnh thường và ảnh nhiệt để ước lượng cảm xúc. Mô hình này có độ chính xác cao và tiềm năng ứng dụng rộng rãi. Hướng phát triển trong tương lai bao gồm: mở rộng cơ sở dữ liệu, cải thiện kiến trúc mô hình, và nghiên cứu các ứng dụng thực tế cụ thể.

6.1. Tổng Kết Những Thành Công Đạt Được Trong Nghiên Cứu

Nghiên cứu đã đạt được những thành công đáng kể trong việc xây dựng một mô hình hiệu quả để đánh giá cảm xúc bằng cách kết hợp thông tin từ ảnh thường và ảnh nhiệt. Mô hình này đã chứng minh được khả năng vượt trội so với các phương pháp truyền thống và mở ra nhiều tiềm năng ứng dụng trong các lĩnh vực khác nhau.

6.2. Đề Xuất Các Hướng Nghiên Cứu Tiếp Theo Để Nâng Cao Hiệu Quả

Để nâng cao hiệu quả của mô hình đánh giá cảm xúc, cần tiếp tục nghiên cứu và phát triển theo các hướng sau: mở rộng cơ sở dữ liệu huấn luyện, cải thiện kiến trúc mô hình, nghiên cứu các phương pháp hợp nhất đặc trưng hiệu quả hơn, và khám phá các ứng dụng thực tế cụ thể.

6.3. Tầm Quan Trọng Của Nghiên Cứu Trong Lĩnh Vực Trí Tuệ Nhân Tạo

Nghiên cứu về mô hình đánh giá cảm xúc đóng vai trò quan trọng trong lĩnh vực trí tuệ nhân tạo (AI), đặc biệt là trong việc phát triển các hệ thống tương tác tự nhiên và thông minh hơn. Khả năng nhận diện và hiểu cảm xúc của con người là một yếu tố then chốt để tạo ra các hệ thống AI có thể tương tác với con người một cách hiệu quả và đồng cảm.

05/06/2025

Bạn đang xem trước tài liệu:

Luận văn xây dựng mô hình kết hợp ảnh thường và ảnh nhiệt để ước lượng cảm xúc con người

Tải đầy đủ

Nội dung chính

## Tổng quan nghiên cứu

Trong kỷ nguyên công nghiệp 4.0, việc trao đổi thông tin giữa con người và máy móc ngày càng trở nên quan trọng, đặc biệt trong lĩnh vực nhận dạng cảm xúc qua biểu hiện khuôn mặt. Theo ước tính, biểu hiện khuôn mặt chiếm tới 55% cơ sở để con người hiểu nhau trong giao tiếp xã hội. Tuy nhiên, việc máy tính nhận diện cảm xúc dựa trên ảnh thường gặp nhiều khó khăn do ảnh thường bị ảnh hưởng bởi điều kiện ánh sáng, màu da và biểu cảm không rõ ràng. Để khắc phục, nghiên cứu này tập trung xây dựng mô hình kết hợp ảnh thường và ảnh nhiệt nhằm ước lượng cảm xúc con người chính xác hơn. Mục tiêu cụ thể là phát triển mô hình đa nguồn dữ liệu, nhận dạng bảy cảm xúc cơ bản: giận dữ, ghê tởm, sợ hãi, hạnh phúc, bình thường, buồn rầu và ngạc nhiên, dựa trên cơ sở dữ liệu KTFE thu thập từ 30 đối tượng đa quốc tịch trong khoảng tuổi 11-32. Nghiên cứu có ý nghĩa khoa học trong việc phát triển các mô hình học sâu đa nguồn dữ liệu, đồng thời có ý nghĩa thực tiễn trong ứng dụng trí tuệ nhân tạo phục vụ giao tiếp người-máy và các lĩnh vực tâm lý học, an ninh, y tế.

## Cơ sở lý thuyết và phương pháp nghiên cứu

### Khung lý thuyết áp dụng

- **Mạng nơ-ron tích chập (CNN):** Là mô hình học sâu phổ biến trong nhận dạng hình ảnh, CNN gồm các lớp tích chập, lớp pooling và lớp fully connected, giúp trích xuất đặc trưng hình ảnh hiệu quả.
- **Học chuyển giao (Transfer Learning):** Kỹ thuật tái sử dụng mô hình đã được huấn luyện trên bộ dữ liệu lớn (ImageNet) để tăng tốc độ và độ chính xác khi huấn luyện trên bộ dữ liệu nhỏ hơn.
- **Mạng Residual Network (ResNet):** Giải quyết vấn đề suy thoái độ chính xác khi tăng số lớp mạng bằng cách sử dụng các residual block với kết nối bỏ qua, giúp mô hình sâu hơn và hiệu quả hơn.
- **Các khái niệm chính:** Đặc trưng hình học khuôn mặt, đặc trưng xuất hiện (LBP, HOG), ảnh nhiệt hồng ngoại, đơn vị hành động mặt (AU), độ đo đánh giá mô hình phân lớp (Precision, Recall, F1-Score).

### Phương pháp nghiên cứu

- **Nguồn dữ liệu:** Sử dụng cơ sở dữ liệu Kotani Thermal Facial Emotion (KTFE) gồm 130 GB dữ liệu video ảnh thường và ảnh nhiệt của 30 đối tượng với 7 cảm xúc.
- **Phương pháp phân tích:** 
  - Tiền xử lý ảnh: cắt vùng khuôn mặt ảnh thường bằng thuật toán Viola-Jones, loại bỏ vùng nền ảnh nhiệt dựa trên nhiệt độ ≥ 30°C.
  - Huấn luyện mô hình CNN ResNet-50 với kỹ thuật học chuyển giao và fine-tune toàn bộ mạng.
  - Tăng cường dữ liệu (data augmentation) bằng các phép biến đổi ảnh như lật, phóng to, dịch chuyển.
  - Kết hợp kết quả phân lớp từ hai mô hình riêng biệt trên ảnh thường và ảnh nhiệt bằng công thức tuyến tính dựa trên F1-Score và xác suất Softmax.
- **Timeline nghiên cứu:** Thu thập và xử lý dữ liệu, xây dựng mô hình, huấn luyện và đánh giá trên tập dữ liệu chia theo tỷ lệ 80% huấn luyện và 20% kiểm tra.

## Kết quả nghiên cứu và thảo luận

### Những phát hiện chính

- Mô hình Vi-Resnet-50 (ảnh thường) đạt độ chính xác phân lớp trung bình khoảng 89%, trong đó cảm xúc hạnh phúc đạt 92.25%, buồn rầu 93.13%, sợ hãi 90%, còn giận dữ, ghê tởm và bình thường dao động từ 86.87% đến 88.41%.
- Mô hình Ther-Resnet-50 (ảnh nhiệt) cũng cho kết quả khả quan với độ chính xác cao hơn trong các trường hợp thiếu ánh sáng hoặc biểu cảm không rõ ràng.
- Mô hình kết hợp Fu-Resnet-50 cho thấy cải thiện rõ rệt về độ chính xác, vượt trội hơn so với từng mô hình đơn lẻ, với F1-Score tăng trung bình khoảng 3-5%.
- So sánh với các phương pháp truyền thống như PCA, EMC và SVM trên cùng bộ dữ liệu KTFE, mô hình đề xuất đạt tỷ lệ công nhận cao hơn, ví dụ phương pháp PCA-EMC đạt 90.42% trong khi mô hình kết hợp đạt trên 93%.

### Thảo luận kết quả

- Việc kết hợp ảnh thường và ảnh nhiệt giúp khắc phục hạn chế của từng loại ảnh riêng biệt, đặc biệt ảnh nhiệt không bị ảnh hưởng bởi điều kiện ánh sáng và phản ánh sự thay đổi vật lý nhiệt độ trên khuôn mặt liên quan đến cảm xúc.
- Kết quả cho thấy mô hình học sâu ResNet-50 với học chuyển giao và fine-tune phù hợp với bài toán nhận dạng cảm xúc đa nguồn dữ liệu, tăng độ chính xác và khả năng tổng quát hóa.
- So với các nghiên cứu trước đây chỉ sử dụng ảnh thường hoặc ảnh nhiệt riêng lẻ, mô hình kết hợp mang lại hiệu quả vượt trội, phù hợp với các ứng dụng thực tế trong môi trường đa dạng.
- Dữ liệu thử nghiệm được trình bày qua bảng so sánh độ chính xác, precision, recall và F1-Score cho từng cảm xúc, minh họa rõ sự cải thiện khi sử dụng mô hình kết hợp.

## Đề xuất và khuyến nghị

- **Phát triển thêm cơ sở dữ liệu đa dạng:** Mở rộng số lượng đối tượng và cảm xúc, bổ sung dữ liệu trong điều kiện môi trường khác nhau để tăng tính đại diện và độ chính xác mô hình.
- **Tối ưu mô hình học sâu:** Áp dụng các kiến trúc mạng mới hơn, kỹ thuật regularization và fine-tune sâu hơn để nâng cao hiệu suất nhận dạng.
- **Ứng dụng trong thực tế:** Triển khai mô hình vào các hệ thống giao tiếp người-máy, giám sát an ninh, chăm sóc sức khỏe tâm lý với mục tiêu tăng độ chính xác nhận dạng cảm xúc trên 95% trong vòng 1-2 năm.
- **Nghiên cứu kết hợp đa cảm biến:** Kết hợp thêm dữ liệu âm thanh, sinh trắc học để cải thiện khả năng nhận diện cảm xúc toàn diện.
- **Đào tạo và chuyển giao công nghệ:** Tổ chức các khóa đào tạo cho các nhà nghiên cứu và doanh nghiệp về ứng dụng mô hình học sâu trong nhận dạng cảm xúc, thúc đẩy ứng dụng rộng rãi.

## Đối tượng nên tham khảo luận văn

- **Nhà nghiên cứu và sinh viên ngành Khoa học máy tính, Thị giác máy tính:** Học hỏi phương pháp xây dựng mô hình học sâu kết hợp đa nguồn dữ liệu, kỹ thuật học chuyển giao và fine-tune.
- **Chuyên gia tâm lý học và y tế:** Áp dụng mô hình nhận dạng cảm xúc để hỗ trợ chẩn đoán và theo dõi trạng thái tâm lý bệnh nhân.
- **Doanh nghiệp phát triển công nghệ AI và robot:** Nâng cao khả năng tương tác người-máy thông qua nhận dạng cảm xúc chính xác, cải thiện trải nghiệm người dùng.
- **Cơ quan an ninh và giám sát:** Ứng dụng công nghệ nhận dạng cảm xúc trong giám sát hành vi, phát hiện tình huống bất thường.

## Câu hỏi thường gặp

1. **Mô hình kết hợp ảnh thường và ảnh nhiệt có ưu điểm gì?**  
   Mô hình kết hợp tận dụng ưu điểm của ảnh nhiệt không bị ảnh hưởng bởi ánh sáng và ảnh thường có độ phân giải cao, giúp nhận dạng cảm xúc chính xác hơn trong nhiều điều kiện.

2. **Tại sao sử dụng ResNet-50 trong nghiên cứu?**  
   ResNet-50 giải quyết vấn đề suy thoái khi tăng số lớp mạng, giúp mô hình sâu hơn mà không giảm hiệu suất, phù hợp với bài toán nhận dạng cảm xúc phức tạp.

3. **Cơ sở dữ liệu KTFE có điểm gì nổi bật?**  
   KTFE chứa dữ liệu ảnh thường và ảnh nhiệt đồng thời, với 7 cảm xúc tự phát từ 30 đối tượng đa quốc tịch, giúp nghiên cứu thực tế và đa dạng hơn.

4. **Phương pháp học chuyển giao được áp dụng như thế nào?**  
   Mô hình ResNet-50 được khởi tạo từ trọng số đã huấn luyện trên ImageNet, sau đó fine-tune toàn bộ mạng trên bộ dữ liệu KTFE để tăng độ chính xác và giảm thời gian huấn luyện.

5. **Làm thế nào để cải thiện độ chính xác mô hình trong tương lai?**  
   Có thể mở rộng dữ liệu, áp dụng kiến trúc mạng mới, kết hợp đa cảm biến và tối ưu thuật toán học sâu để nâng cao hiệu quả nhận dạng cảm xúc.

## Kết luận

- Đã xây dựng thành công mô hình kết hợp ảnh thường và ảnh nhiệt sử dụng mạng học sâu ResNet-50 để ước lượng cảm xúc con người với độ chính xác cao.  
- Mô hình kết hợp vượt trội hơn so với mô hình đơn lẻ và các phương pháp truyền thống, đạt F1-Score trên 90% cho 7 cảm xúc cơ bản.  
- Cơ sở dữ liệu KTFE được khai thác hiệu quả, cung cấp nền tảng dữ liệu đa dạng và thực tế cho nghiên cứu.  
- Kết quả nghiên cứu có ý nghĩa khoa học và thực tiễn, mở ra hướng phát triển ứng dụng trí tuệ nhân tạo trong giao tiếp người-máy và các lĩnh vực liên quan.  
- Đề xuất các hướng nghiên cứu tiếp theo nhằm nâng cao độ chính xác và mở rộng ứng dụng trong tương lai gần.  

Hãy tiếp tục nghiên cứu và ứng dụng mô hình để góp phần phát triển công nghệ nhận dạng cảm xúc đa nguồn dữ liệu trong kỷ nguyên số.

Tài liệu có tiêu đề Mô Hình Kết Hợp Ảnh Thường và Ảnh Nhiệt Để Đánh Giá Cảm Xúc Con Người trình bày một phương pháp mới trong việc đánh giá cảm xúc của con người thông qua việc kết hợp hai loại hình ảnh: ảnh thường và ảnh nhiệt. Phương pháp này không chỉ giúp nâng cao độ chính xác trong việc nhận diện cảm xúc mà còn mở ra những ứng dụng tiềm năng trong các lĩnh vực như tâm lý học, marketing và công nghệ thông tin. Độc giả sẽ tìm thấy những lợi ích rõ ràng từ việc áp dụng mô hình này, bao gồm khả năng phân tích sâu sắc hơn về trạng thái cảm xúc của người dùng, từ đó cải thiện trải nghiệm khách hàng và tối ưu hóa các chiến lược tiếp thị.

Để mở rộng thêm kiến thức về lĩnh vực phân tích cảm xúc, bạn có thể tham khảo tài liệu Khóa luận tốt nghiệp hệ thống thông tin hệ thống phân tích cảm xúc khách hàng dựa trên bình luận tiếng việt. Tài liệu này cung cấp cái nhìn sâu sắc về cách thức phân tích cảm xúc từ các bình luận, giúp bạn hiểu rõ hơn về cách mà cảm xúc của khách hàng có thể được khai thác và ứng dụng trong thực tiễn. Hãy khám phá để nâng cao hiểu biết của bạn về chủ đề này!

#phân tích hình ảnh

#công nghệ nhận diện cảm xúc

#mô hình kết hợp ảnh thường

#ảnh nhiệt trong cảm xúc

#đánh giá cảm xúc con người

#học máy trong phân tích ảnh

Chủ đề

Công nghệ phân tích cảm xúc

học máy và nhận diện hình ảnh

tương tác giữa các loại ảnh

ứng dụng trong nghiên cứu tâm lý