Trường đại học
Đại học Bách Khoa Hà NộiChuyên ngành
Kỹ thuật y sinhNgười đăng
Ẩn danhThể loại
luận văn thạc sĩ2023
Phí lưu trữ
30.000 VNĐMục lục chi tiết
Tóm tắt
Cảm xúc đóng vai trò then chốt trong cuộc sống, ảnh hưởng đến tương tác xã hội, ra quyết định và nhận thức thế giới. Việc nghiên cứu phân loại cảm xúc ngày càng trở nên quan trọng, đặc biệt trong bối cảnh phát triển giao diện người-máy tính (HCI). Nhận diện cảm xúc có thể thực hiện qua tự đánh giá, đo lường tự động hoặc dựa vào sinh lý thần kinh. Điện não đồ (EEG) nổi lên như một phương pháp tiềm năng, cung cấp giải pháp đơn giản, chi phí thấp và khách quan. Tuy nhiên, các nghiên cứu hiện tại gặp thách thức về dữ liệu, độ chính xác và độ phức tạp của mô hình. Luận văn này tập trung vào việc phát triển hệ thống phát hiện cảm xúc dựa trên tín hiệu não sử dụng mạng nơ-ron tích chập (CNN), nhằm cải thiện độ chính xác với ít đặc trưng phân loại hơn. Mục tiêu là khai thác tiềm năng của EEG như một công cụ hỗ trợ đắc lực trong nghiên cứu cảm xúc.
Hiện nay, có nhiều phương pháp được sử dụng để ghi nhận cảm xúc bao gồm tự báo cáo, phản ứng giật mình, phản ứng hành vi, đo lường tự chủ và đo lường sinh lý thần kinh. Mỗi phương pháp có ưu và nhược điểm riêng. Tự báo cáo, tuy đơn giản, lại chủ quan và khó theo dõi biến động cảm xúc nhanh. Phản ứng giật mình chỉ đánh giá một phần khía cạnh của cảm xúc. Đo lường sinh lý thần kinh, như EEG, cung cấp phương tiện trực tiếp và toàn diện nhất để nhận diện cảm xúc bằng cách tiếp cận cấu trúc cơ bản trong não. Điện não đồ (EEG) đang trở thành một hướng nghiên cứu tiềm năng. Nghiên cứu từ năm 2013 đến 2021 cho thấy sự gia tăng đáng kể về ứng dụng điện não trong nhận diện cảm xúc, khẳng định tiềm năng phát triển của nó.
Mặc dù EEG hứa hẹn nhiều tiềm năng, việc phân loại cảm xúc dựa trên tín hiệu não vẫn đối mặt với nhiều thách thức. Dữ liệu EEG thường nhiễu và biến đổi lớn giữa các cá nhân. Các mô hình hiện tại chưa đạt độ chính xác cao hoặc quá phức tạp, đòi hỏi nhiều đặc trưng phân loại. Việc lựa chọn và trích xuất các đặc trưng phù hợp từ tín hiệu não là một bài toán khó. Hơn nữa, thiếu các bộ dữ liệu EEG lớn và đa dạng gây khó khăn cho việc huấn luyện và đánh giá các mô hình học sâu. Luận văn này tập trung giải quyết những thách thức này bằng cách đề xuất một hệ thống sử dụng mạng nơ-ron tích chập (CNN) và ít đặc trưng phân loại hơn, nhằm cải thiện hiệu suất và tính khả thi của việc phân loại cảm xúc dựa trên EEG.
Các mô hình phân loại cảm xúc hiện tại thường chưa đạt độ chính xác đủ cao để ứng dụng trong thực tế. Một số mô hình phức tạp và đòi hỏi nhiều đặc trưng phân loại, gây khó khăn cho việc triển khai trên các thiết bị di động hoặc trong thời gian thực. Việc lựa chọn các đặc trưng phù hợp từ tín hiệu não là một bài toán quan trọng. Các đặc trưng thường được sử dụng bao gồm đặc trưng miền thời gian, miền tần số và miền không gian. Tuy nhiên, không phải tất cả các đặc trưng đều hữu ích cho việc phân loại cảm xúc. Cần các phương pháp lựa chọn đặc trưng hiệu quả để giảm độ phức tạp của mô hình và cải thiện độ chính xác.
Luận văn này đề xuất sử dụng mạng nơ-ron tích chập (CNN) để phân loại cảm xúc dựa trên tín hiệu não. CNN là một loại mô hình học sâu đặc biệt hiệu quả trong việc xử lý dữ liệu có cấu trúc không gian, như ảnh và chuỗi thời gian. CNN có khả năng tự động học các đặc trưng quan trọng từ dữ liệu, giảm thiểu sự can thiệp thủ công. Trong bối cảnh phân loại cảm xúc dựa trên EEG, CNN có thể được sử dụng để học các mẫu đặc trưng trong tín hiệu não tương ứng với các trạng thái cảm xúc khác nhau. Việc sử dụng CNN kết hợp với các kỹ thuật tiền xử lý dữ liệu và lựa chọn đặc trưng phù hợp hứa hẹn cải thiện đáng kể độ chính xác và tính khả thi của hệ thống.
Luận văn này sử dụng biến đổi wavelet để tách dải tần của tín hiệu EEG trước khi đưa vào CNN. Biến đổi wavelet là một kỹ thuật mạnh mẽ để phân tích tín hiệu không dừng như EEG. Bằng cách tách tín hiệu thành các dải tần khác nhau (ví dụ, alpha, beta, gamma), biến đổi wavelet giúp làm nổi bật các đặc trưng liên quan đến cảm xúc trong từng dải tần. Việc kết hợp biến đổi wavelet và CNN cho phép mô hình tập trung vào các đặc trưng tần số quan trọng và cải thiện khả năng phân loại cảm xúc. Như Đỗ Văn Quân đã thực hiện, kết quả cho thấy hệ thống phân loại đạt độ chính xác tương đối khả quan (82% Arousal và 81% Valence).
Nghiên cứu này xây dựng một hệ thống phân loại cảm xúc và thử nghiệm trên bộ dữ liệu DEAP. Kết quả cho thấy hệ thống đạt độ chính xác tương đối khả quan (82% Arousal và 81% Valence). Điều này chứng minh tiềm năng của EEG và CNN trong việc nhận diện cảm xúc. Hệ thống có thể được ứng dụng trong nhiều lĩnh vực, bao gồm phát triển giao diện người-máy tính (HCI), hỗ trợ chẩn đoán và điều trị các rối loạn tâm lý, và cải thiện trải nghiệm người dùng trong trò chơi điện tử và các ứng dụng giải trí.
Kết quả nghiên cứu cho thấy hệ thống phân loại cảm xúc đạt độ chính xác 82% cho Arousal và 81% cho Valence trên bộ dữ liệu DEAP. Điều này cho thấy hệ thống có khả năng nhận diện khá tốt hai chiều cảm xúc quan trọng. Hệ thống có thể được ứng dụng trong nhiều lĩnh vực, ví dụ: cải thiện trải nghiệm người dùng trong trò chơi điện tử bằng cách điều chỉnh độ khó hoặc nội dung dựa trên trạng thái cảm xúc của người chơi; hỗ trợ người khuyết tật giao tiếp bằng cách nhận diện cảm xúc của họ; và giúp các bác sĩ chẩn đoán và điều trị các rối loạn tâm lý. Cần có thêm nghiên cứu để cải thiện độ chính xác và tính ổn định của hệ thống, cũng như để khám phá các ứng dụng tiềm năng khác.
Luận văn đã trình bày một nghiên cứu về hệ thống phân loại cảm xúc dựa trên tín hiệu não sử dụng mạng nơ-ron tích chập (CNN). Nghiên cứu đã chứng minh tiềm năng của EEG và CNN trong việc nhận diện cảm xúc. Tuy nhiên, vẫn còn nhiều thách thức và cơ hội để cải thiện. Các hướng phát triển tiềm năng bao gồm sử dụng các kiến trúc CNN tiên tiến hơn, kết hợp với các kỹ thuật học sâu khác, và thu thập các bộ dữ liệu EEG lớn hơn và đa dạng hơn. Nghiên cứu sâu hơn về các cơ chế thần kinh đằng sau cảm xúc cũng sẽ giúp cải thiện các mô hình phân loại.
Trong tương lai, có nhiều hướng nghiên cứu tiềm năng trong lĩnh vực phân loại cảm xúc dựa trên EEG. Một hướng là khám phá các kiến trúc CNN tiên tiến hơn, chẳng hạn như CNN 3D hoặc mạng đối nghịch sinh (GAN). Một hướng khác là kết hợp CNN với các kỹ thuật học sâu khác, chẳng hạn như mạng LSTM (Long Short-Term Memory) để xử lý chuỗi thời gian EEG. Việc thu thập các bộ dữ liệu EEG lớn hơn và đa dạng hơn cũng là rất quan trọng để huấn luyện và đánh giá các mô hình học sâu. Cuối cùng, nghiên cứu sâu hơn về các cơ chế thần kinh đằng sau cảm xúc sẽ giúp cải thiện các mô hình phân loại và hiểu rõ hơn về mối liên hệ giữa tín hiệu não và cảm xúc.
Bạn đang xem trước tài liệu:
Nghiên cứu hệ thống phân loại các trạng thái cảm xúc dựa trên tín hiệu não ở người
Tài liệu "Nghiên Cứu Phân Loại Cảm Xúc Dựa Trên Tín Hiệu Não Bằng Mạng Nơ-ron Tích Chập" khám phá cách mà các tín hiệu não có thể được phân loại để nhận diện cảm xúc thông qua công nghệ mạng nơ-ron tích chập. Nghiên cứu này không chỉ cung cấp cái nhìn sâu sắc về cơ chế hoạt động của não bộ trong việc xử lý cảm xúc mà còn mở ra những ứng dụng tiềm năng trong lĩnh vực công nghệ thông tin và trí tuệ nhân tạo. Độc giả sẽ được trang bị kiến thức về cách mà các mô hình học sâu có thể cải thiện khả năng nhận diện cảm xúc, từ đó nâng cao trải nghiệm người dùng trong nhiều lĩnh vực khác nhau.
Để mở rộng thêm kiến thức của bạn về chủ đề này, bạn có thể tham khảo tài liệu Luận văn tốt nghiệp khoa học máy tính phát triển hệ thống nhận diện cảm xúc qua giọng nói, nơi nghiên cứu về việc nhận diện cảm xúc thông qua giọng nói. Ngoài ra, tài liệu Đề tài nhận dạng cảm xúc thông qua khuôn mặt dùng mạng nơ ron tích chập cnn sẽ giúp bạn hiểu rõ hơn về cách nhận diện cảm xúc qua hình ảnh khuôn mặt. Cuối cùng, tài liệu Phân tích biểu cảm mặt người dùng mạng nơ ron tích chập 2 cung cấp cái nhìn sâu sắc về biểu cảm khuôn mặt và cách mà nó có thể được phân tích bằng công nghệ hiện đại. Những tài liệu này sẽ giúp bạn có cái nhìn toàn diện hơn về lĩnh vực nghiên cứu cảm xúc và ứng dụng của nó trong cuộc sống.