I. Nghiên Cứu Phân Loại Cảm Xúc Tổng Quan và Tầm Quan Trọng
Cảm xúc đóng vai trò then chốt trong cuộc sống, ảnh hưởng đến tương tác xã hội, ra quyết định và nhận thức thế giới. Việc nghiên cứu phân loại cảm xúc ngày càng trở nên quan trọng, đặc biệt trong bối cảnh phát triển giao diện người-máy tính (HCI). Nhận diện cảm xúc có thể thực hiện qua tự đánh giá, đo lường tự động hoặc dựa vào sinh lý thần kinh. Điện não đồ (EEG) nổi lên như một phương pháp tiềm năng, cung cấp giải pháp đơn giản, chi phí thấp và khách quan. Tuy nhiên, các nghiên cứu hiện tại gặp thách thức về dữ liệu, độ chính xác và độ phức tạp của mô hình. Luận văn này tập trung vào việc phát triển hệ thống phát hiện cảm xúc dựa trên tín hiệu não sử dụng mạng nơ-ron tích chập (CNN), nhằm cải thiện độ chính xác với ít đặc trưng phân loại hơn. Mục tiêu là khai thác tiềm năng của EEG như một công cụ hỗ trợ đắc lực trong nghiên cứu cảm xúc.
1.1. Vì Sao Phân Loại Cảm Xúc Quan Trọng
1.2. Các Phương Pháp Nhận Diện Cảm Xúc Phổ Biến
Hiện nay, có nhiều phương pháp được sử dụng để ghi nhận cảm xúc bao gồm tự báo cáo, phản ứng giật mình, phản ứng hành vi, đo lường tự chủ và đo lường sinh lý thần kinh. Mỗi phương pháp có ưu và nhược điểm riêng. Tự báo cáo, tuy đơn giản, lại chủ quan và khó theo dõi biến động cảm xúc nhanh. Phản ứng giật mình chỉ đánh giá một phần khía cạnh của cảm xúc. Đo lường sinh lý thần kinh, như EEG, cung cấp phương tiện trực tiếp và toàn diện nhất để nhận diện cảm xúc bằng cách tiếp cận cấu trúc cơ bản trong não. Điện não đồ (EEG) đang trở thành một hướng nghiên cứu tiềm năng. Nghiên cứu từ năm 2013 đến 2021 cho thấy sự gia tăng đáng kể về ứng dụng điện não trong nhận diện cảm xúc, khẳng định tiềm năng phát triển của nó.
II. Thách Thức Nghiên Cứu Phân Loại Cảm Xúc Bằng EEG
Mặc dù EEG hứa hẹn nhiều tiềm năng, việc phân loại cảm xúc dựa trên tín hiệu não vẫn đối mặt với nhiều thách thức. Dữ liệu EEG thường nhiễu và biến đổi lớn giữa các cá nhân. Các mô hình hiện tại chưa đạt độ chính xác cao hoặc quá phức tạp, đòi hỏi nhiều đặc trưng phân loại. Việc lựa chọn và trích xuất các đặc trưng phù hợp từ tín hiệu não là một bài toán khó. Hơn nữa, thiếu các bộ dữ liệu EEG lớn và đa dạng gây khó khăn cho việc huấn luyện và đánh giá các mô hình học sâu. Luận văn này tập trung giải quyết những thách thức này bằng cách đề xuất một hệ thống sử dụng mạng nơ-ron tích chập (CNN) và ít đặc trưng phân loại hơn, nhằm cải thiện hiệu suất và tính khả thi của việc phân loại cảm xúc dựa trên EEG.
2.1. Khó Khăn Về Dữ Liệu EEG Nhiễu và Biến Động
2.2. Giới Hạn Về Độ Chính Xác Của Mô Hình Phân Loại
Các mô hình phân loại cảm xúc hiện tại thường chưa đạt độ chính xác đủ cao để ứng dụng trong thực tế. Một số mô hình phức tạp và đòi hỏi nhiều đặc trưng phân loại, gây khó khăn cho việc triển khai trên các thiết bị di động hoặc trong thời gian thực. Việc lựa chọn các đặc trưng phù hợp từ tín hiệu não là một bài toán quan trọng. Các đặc trưng thường được sử dụng bao gồm đặc trưng miền thời gian, miền tần số và miền không gian. Tuy nhiên, không phải tất cả các đặc trưng đều hữu ích cho việc phân loại cảm xúc. Cần các phương pháp lựa chọn đặc trưng hiệu quả để giảm độ phức tạp của mô hình và cải thiện độ chính xác.
III. Mạng Nơ ron Tích Chập CNN Giải Pháp Phân Loại Cảm Xúc
Luận văn này đề xuất sử dụng mạng nơ-ron tích chập (CNN) để phân loại cảm xúc dựa trên tín hiệu não. CNN là một loại mô hình học sâu đặc biệt hiệu quả trong việc xử lý dữ liệu có cấu trúc không gian, như ảnh và chuỗi thời gian. CNN có khả năng tự động học các đặc trưng quan trọng từ dữ liệu, giảm thiểu sự can thiệp thủ công. Trong bối cảnh phân loại cảm xúc dựa trên EEG, CNN có thể được sử dụng để học các mẫu đặc trưng trong tín hiệu não tương ứng với các trạng thái cảm xúc khác nhau. Việc sử dụng CNN kết hợp với các kỹ thuật tiền xử lý dữ liệu và lựa chọn đặc trưng phù hợp hứa hẹn cải thiện đáng kể độ chính xác và tính khả thi của hệ thống.
3.1. Tại Sao Chọn CNN Cho Phân Loại Tín Hiệu Não
3.2. Biến Đổi Wavelet và CNN Kết Hợp Tối Ưu
Luận văn này sử dụng biến đổi wavelet để tách dải tần của tín hiệu EEG trước khi đưa vào CNN. Biến đổi wavelet là một kỹ thuật mạnh mẽ để phân tích tín hiệu không dừng như EEG. Bằng cách tách tín hiệu thành các dải tần khác nhau (ví dụ, alpha, beta, gamma), biến đổi wavelet giúp làm nổi bật các đặc trưng liên quan đến cảm xúc trong từng dải tần. Việc kết hợp biến đổi wavelet và CNN cho phép mô hình tập trung vào các đặc trưng tần số quan trọng và cải thiện khả năng phân loại cảm xúc. Như Đỗ Văn Quân đã thực hiện, kết quả cho thấy hệ thống phân loại đạt độ chính xác tương đối khả quan (82% Arousal và 81% Valence).
IV. Ứng Dụng Thực Tế và Kết Quả Nghiên Cứu Phân Loại Cảm Xúc
Nghiên cứu này xây dựng một hệ thống phân loại cảm xúc và thử nghiệm trên bộ dữ liệu DEAP. Kết quả cho thấy hệ thống đạt độ chính xác tương đối khả quan (82% Arousal và 81% Valence). Điều này chứng minh tiềm năng của EEG và CNN trong việc nhận diện cảm xúc. Hệ thống có thể được ứng dụng trong nhiều lĩnh vực, bao gồm phát triển giao diện người-máy tính (HCI), hỗ trợ chẩn đoán và điều trị các rối loạn tâm lý, và cải thiện trải nghiệm người dùng trong trò chơi điện tử và các ứng dụng giải trí.
4.1. Xây Dựng Hệ Thống và Thử Nghiệm trên Bộ Dữ Liệu DEAP
4.2. Độ Chính Xác và Tiềm Năng Ứng Dụng của Hệ Thống
Kết quả nghiên cứu cho thấy hệ thống phân loại cảm xúc đạt độ chính xác 82% cho Arousal và 81% cho Valence trên bộ dữ liệu DEAP. Điều này cho thấy hệ thống có khả năng nhận diện khá tốt hai chiều cảm xúc quan trọng. Hệ thống có thể được ứng dụng trong nhiều lĩnh vực, ví dụ: cải thiện trải nghiệm người dùng trong trò chơi điện tử bằng cách điều chỉnh độ khó hoặc nội dung dựa trên trạng thái cảm xúc của người chơi; hỗ trợ người khuyết tật giao tiếp bằng cách nhận diện cảm xúc của họ; và giúp các bác sĩ chẩn đoán và điều trị các rối loạn tâm lý. Cần có thêm nghiên cứu để cải thiện độ chính xác và tính ổn định của hệ thống, cũng như để khám phá các ứng dụng tiềm năng khác.
V. Kết Luận và Hướng Phát Triển Nghiên Cứu Phân Loại Cảm Xúc
Luận văn đã trình bày một nghiên cứu về hệ thống phân loại cảm xúc dựa trên tín hiệu não sử dụng mạng nơ-ron tích chập (CNN). Nghiên cứu đã chứng minh tiềm năng của EEG và CNN trong việc nhận diện cảm xúc. Tuy nhiên, vẫn còn nhiều thách thức và cơ hội để cải thiện. Các hướng phát triển tiềm năng bao gồm sử dụng các kiến trúc CNN tiên tiến hơn, kết hợp với các kỹ thuật học sâu khác, và thu thập các bộ dữ liệu EEG lớn hơn và đa dạng hơn. Nghiên cứu sâu hơn về các cơ chế thần kinh đằng sau cảm xúc cũng sẽ giúp cải thiện các mô hình phân loại.
5.1. Tóm Tắt Những Đóng Góp Chính Của Luận Văn
5.2. Hướng Nghiên Cứu Tương Lai Trong Lĩnh Vực Này
Trong tương lai, có nhiều hướng nghiên cứu tiềm năng trong lĩnh vực phân loại cảm xúc dựa trên EEG. Một hướng là khám phá các kiến trúc CNN tiên tiến hơn, chẳng hạn như CNN 3D hoặc mạng đối nghịch sinh (GAN). Một hướng khác là kết hợp CNN với các kỹ thuật học sâu khác, chẳng hạn như mạng LSTM (Long Short-Term Memory) để xử lý chuỗi thời gian EEG. Việc thu thập các bộ dữ liệu EEG lớn hơn và đa dạng hơn cũng là rất quan trọng để huấn luyện và đánh giá các mô hình học sâu. Cuối cùng, nghiên cứu sâu hơn về các cơ chế thần kinh đằng sau cảm xúc sẽ giúp cải thiện các mô hình phân loại và hiểu rõ hơn về mối liên hệ giữa tín hiệu não và cảm xúc.