Tổng quan nghiên cứu

Cảm xúc đóng vai trò thiết yếu trong các hoạt động xã hội và giao tiếp phi ngôn ngữ của con người, góp phần làm phong phú cuộc sống hàng ngày. Theo ước tính, rối loạn tâm lý và cảm xúc đứng thứ hai về độ phổ biến trên thế giới, chỉ sau chứng đau đầu. Việc nhận biết và phân loại cảm xúc không chỉ giúp hiểu rõ hơn về hành vi con người mà còn có tiềm năng ứng dụng rộng rãi trong các lĩnh vực như tương tác người-máy, tiếp thị, giáo dục và chăm sóc sức khỏe tâm thần. Trong bối cảnh đó, tín hiệu điện não đồ (EEG) được xem là công cụ tiềm năng để phát hiện cảm xúc do khả năng ghi nhận trực tiếp các hoạt động điện trong não bộ.

Mục tiêu của luận văn là nghiên cứu và đề xuất một mô hình nhận biết, phân loại cảm xúc và tính cách dựa trên tín hiệu EEG, tập trung vào hai trạng thái cảm xúc chính: tích cực (valence) và tiêu cực (not valence). Mô hình hướng tới tối ưu hóa, giảm độ phức tạp và nâng cao độ chính xác so với các nghiên cứu trước đây. Nghiên cứu sử dụng bộ dữ liệu EEG DEAP với 32 đối tượng tham gia, thu thập tín hiệu từ 32 điện cực trong quá trình xem các video kích thích cảm xúc. Kết quả mô hình đạt độ chính xác phân loại lên tới 72%, cho thấy tiềm năng ứng dụng của EEG trong nhận biết cảm xúc.

Phạm vi nghiên cứu tập trung vào phân tích tín hiệu EEG thu thập trong môi trường phòng thí nghiệm tại Việt Nam trong năm 2023, sử dụng các kỹ thuật xử lý tín hiệu hiện đại như biến đổi wavelet và thuật toán học máy Support Vector Machine (SVM). Nghiên cứu có ý nghĩa quan trọng trong việc phát triển các hệ thống hỗ trợ theo dõi sức khỏe tâm thần, cải thiện tương tác người-máy và ứng dụng trong giáo dục, giải trí.

Cơ sở lý thuyết và phương pháp nghiên cứu

Khung lý thuyết áp dụng

Luận văn dựa trên hai khung lý thuyết chính:

  1. Lý thuyết cảm xúc đa chiều (Circumplex Model of Affect): Mô hình này phân loại cảm xúc theo hai chiều chính là giá trị (valence) và kích thích (arousal). Valence biểu thị mức độ tích cực hoặc tiêu cực của cảm xúc, trong khi arousal thể hiện mức độ kích thích hoặc bình tĩnh. Mô hình giúp đơn giản hóa việc phân loại cảm xúc thành các trạng thái dễ nhận biết.

  2. Lý thuyết sinh lý thần kinh về tín hiệu EEG: EEG ghi lại các hoạt động điện của não bộ thông qua các điện cực đặt trên da đầu. Các sóng não chính gồm delta, theta, alpha, beta và gamma có liên quan mật thiết đến các trạng thái cảm xúc khác nhau. Đặc biệt, sự bất đối xứng năng lượng sóng alpha và beta ở vùng vỏ não trước trán được xem là chỉ số quan trọng để phân biệt cảm xúc tích cực và tiêu cực.

Các khái niệm chuyên ngành quan trọng bao gồm: Differential Entropy (DE), Asymmetry feature (ASM), hệ số tương quan, biến đổi wavelet rời rạc (DWT), và thuật toán Support Vector Machine (SVM) với kernel Gaussian.

Phương pháp nghiên cứu

Nguồn dữ liệu chính là bộ dữ liệu EEG DEAP, thu thập từ 32 đối tượng (17 nam, 15 nữ) trong độ tuổi 19-33, sử dụng 40 video kích thích cảm xúc với thời gian xem mỗi video là 63 giây (bao gồm 3 giây baseline). Tín hiệu EEG được ghi lại từ 32 điện cực, đã qua xử lý lọc thông dải 4-45 Hz và lấy mẫu xuống 128 Hz.

Phương pháp phân tích gồm các bước:

  • Tiền xử lý dữ liệu: Loại bỏ nhiễu sinh lý và phi sinh lý, chuẩn hóa tín hiệu.
  • Tách băng tần bằng biến đổi wavelet rời rạc (DWT): Phân tích tín hiệu EEG thành các dải tần alpha, beta, gamma để trích xuất đặc trưng cảm xúc.
  • Trích chọn đặc trưng: Sử dụng các đặc trưng entropy vi phân (DE), hệ số tương quan và đặc trưng bất đối xứng (ASM) tại các vị trí điện cực Fp1, Fp2, F3, F4.
  • Phân loại cảm xúc: Áp dụng thuật toán Support Vector Machine (SVM) với kernel Gaussian, sử dụng kỹ thuật xác thực chéo k-fold (k=5) để đánh giá mô hình.

Thời gian nghiên cứu kéo dài trong năm 2023, với các giai đoạn thu thập dữ liệu, xử lý, xây dựng mô hình và đánh giá kết quả.

Kết quả nghiên cứu và thảo luận

Những phát hiện chính

  1. Độ chính xác phân loại cảm xúc đạt 72% khi sử dụng tổ hợp các đặc trưng DE, ASM và hệ số tương quan tại các điện cực vùng trán (Fp1, Fp2, F3, F4). So với các nghiên cứu trước đây, kết quả này cải thiện khoảng 5-10% độ chính xác trong phân loại nhị phân valence và not valence.

  2. Đặc trưng Differential Entropy (DE) đóng vai trò quan trọng nhất, riêng đặc trưng này đạt độ chính xác khoảng 68%, trong khi kết hợp với ASM và hệ số tương quan nâng cao hiệu quả phân loại lên đáng kể.

  3. Vùng điện cực trước trán (Fp1, Fp2) và trán giữa (F3, F4) cung cấp thông tin cảm xúc rõ rệt hơn so với các vùng khác, với sự khác biệt năng lượng sóng alpha và beta giữa trạng thái tích cực và tiêu cực đạt trên 15%.

  4. Mô hình SVM với kernel Gaussian và k-fold = 5 cho kết quả ổn định, sai số tổng quát hóa thấp hơn so với các thuật toán khác như Naïve Bayes hay K-Nearest Neighbors (KNN) trong cùng điều kiện thử nghiệm.

Thảo luận kết quả

Nguyên nhân chính của sự cải thiện độ chính xác là do việc lựa chọn đặc trưng phù hợp và tập trung vào các vùng não liên quan mật thiết đến cảm xúc, đồng thời sử dụng biến đổi wavelet để tách băng tần giúp giảm nhiễu và tăng cường tín hiệu đặc trưng. Kết quả phù hợp với các nghiên cứu trước đây cho thấy sóng alpha và beta ở vùng trán có liên quan mật thiết đến trạng thái cảm xúc.

So sánh với các nghiên cứu sử dụng bộ dữ liệu DEAP, mô hình này có độ chính xác cao hơn khoảng 5-10%, đồng thời giảm bớt độ phức tạp khi chỉ sử dụng một số đặc trưng chính thay vì nhiều đặc trưng phức tạp. Điều này giúp mô hình dễ dàng triển khai trong các ứng dụng thực tế.

Dữ liệu có thể được trình bày qua biểu đồ so sánh độ chính xác giữa các đặc trưng và các vùng điện cực, cũng như bảng tổng hợp kết quả phân loại của các thuật toán khác nhau. Ngoài ra, bản đồ nhiệt năng lượng sóng alpha và beta tại các vùng trán minh họa sự khác biệt rõ rệt giữa cảm xúc tích cực và tiêu cực.

Đề xuất và khuyến nghị

  1. Phát triển hệ thống nhận biết cảm xúc dựa trên EEG cho ứng dụng chăm sóc sức khỏe tâm thần: Triển khai mô hình trong các thiết bị đeo không dây để theo dõi trạng thái cảm xúc người dùng, giúp phát hiện sớm các rối loạn tâm lý. Thời gian thực hiện trong 1-2 năm, chủ thể là các trung tâm y tế và công ty công nghệ y sinh.

  2. Tích hợp mô hình vào các hệ thống tương tác người-máy: Sử dụng nhận biết cảm xúc để cải thiện trải nghiệm người dùng trong giáo dục, giải trí và tiếp thị. Mục tiêu nâng cao chỉ số hài lòng người dùng (user satisfaction) trên 80% trong vòng 12 tháng.

  3. Mở rộng nghiên cứu với đa dạng đối tượng và môi trường thực tế: Thu thập dữ liệu EEG từ nhiều nhóm tuổi, giới tính và điều kiện môi trường khác nhau để tăng tính tổng quát của mô hình. Thời gian nghiên cứu 2-3 năm, phối hợp với các viện nghiên cứu và trường đại học.

  4. Nâng cao độ chính xác mô hình bằng cách kết hợp các phương pháp học sâu (deep learning): Áp dụng mạng nơ-ron tích chập (CNN) hoặc mạng nơ-ron hồi tiếp (RNN) để khai thác sâu hơn các đặc trưng tín hiệu EEG. Mục tiêu đạt độ chính xác trên 80% trong vòng 2 năm.

Đối tượng nên tham khảo luận văn

  1. Nhà nghiên cứu và sinh viên ngành kỹ thuật y sinh: Tài liệu cung cấp kiến thức nền tảng về xử lý tín hiệu EEG và ứng dụng trong nhận biết cảm xúc, hỗ trợ phát triển các đề tài nghiên cứu liên quan.

  2. Chuyên gia phát triển công nghệ chăm sóc sức khỏe tâm thần: Tham khảo mô hình và phương pháp để xây dựng các thiết bị theo dõi cảm xúc, hỗ trợ chẩn đoán và điều trị các rối loạn tâm lý.

  3. Nhà phát triển phần mềm tương tác người-máy và giáo dục: Áp dụng mô hình nhận biết cảm xúc để cải thiện trải nghiệm người dùng, cá nhân hóa nội dung và nâng cao hiệu quả học tập.

  4. Chuyên gia tiếp thị và phân tích hành vi khách hàng: Sử dụng kết quả nghiên cứu để đánh giá phản ứng cảm xúc của khách hàng, từ đó tối ưu hóa chiến lược tiếp thị và nâng cao doanh thu.

Câu hỏi thường gặp

  1. Tại sao chọn tín hiệu EEG để nhận biết cảm xúc thay vì các tín hiệu sinh lý khác?
    EEG ghi nhận trực tiếp hoạt động điện của não bộ, cung cấp thông tin chính xác về trạng thái cảm xúc. So với ECG hay EMG, EEG ít bị ảnh hưởng bởi các yếu tố ngoại cảnh và có khả năng phân biệt các trạng thái cảm xúc tinh vi hơn.

  2. Mô hình SVM có ưu điểm gì trong phân loại cảm xúc?
    SVM có khả năng phân loại nhị phân hiệu quả, tối ưu khoảng cách lề giữa các lớp dữ liệu, giúp giảm sai số tổng quát hóa. Kernel Gaussian cho phép xử lý dữ liệu phi tuyến, phù hợp với tín hiệu EEG phức tạp.

  3. Biến đổi wavelet giúp gì trong xử lý tín hiệu EEG?
    Biến đổi wavelet cho phép phân tích tín hiệu trên cả miền thời gian và tần số, giúp tách các băng tần đặc trưng cảm xúc như alpha, beta một cách chính xác, đồng thời giảm nhiễu và giữ nguyên đặc trưng quan trọng.

  4. Độ chính xác 72% có ý nghĩa như thế nào trong ứng dụng thực tế?
    Độ chính xác này cho thấy mô hình có khả năng phân biệt cảm xúc tích cực và tiêu cực với hiệu quả tốt, đủ để ứng dụng trong các hệ thống hỗ trợ theo dõi sức khỏe tâm thần hoặc tương tác người-máy, tuy nhiên vẫn cần cải tiến để đạt mức độ tin cậy cao hơn.

  5. Có thể mở rộng mô hình để nhận biết nhiều trạng thái cảm xúc hơn không?
    Có thể, bằng cách sử dụng phân loại đa lớp và kết hợp thêm các đặc trưng khác hoặc áp dụng các thuật toán học sâu. Tuy nhiên, việc này đòi hỏi dữ liệu lớn hơn và phức tạp hơn trong xử lý.

Kết luận

  • Luận văn đã đề xuất thành công mô hình nhận biết cảm xúc tích cực và tiêu cực dựa trên tín hiệu EEG với độ chính xác đạt 72%, cải thiện so với các nghiên cứu trước.
  • Sử dụng các đặc trưng Differential Entropy, Asymmetry feature và hệ số tương quan tại vùng điện cực trước trán giúp tăng hiệu quả phân loại.
  • Phương pháp biến đổi wavelet rời rạc kết hợp với thuật toán Support Vector Machine (kernel Gaussian) là lựa chọn phù hợp cho bài toán nhận biết cảm xúc.
  • Kết quả nghiên cứu mở ra hướng phát triển các ứng dụng trong chăm sóc sức khỏe tâm thần, tương tác người-máy và giáo dục.
  • Các bước tiếp theo bao gồm mở rộng dữ liệu, áp dụng học sâu và triển khai thử nghiệm thực tế để nâng cao độ chính xác và tính ứng dụng của mô hình.

Hành động tiếp theo: Các nhà nghiên cứu và chuyên gia công nghệ nên phối hợp triển khai thử nghiệm mô hình trong môi trường thực tế, đồng thời phát triển các giải pháp tích hợp để ứng dụng rộng rãi trong các lĩnh vực liên quan.