Tổng quan nghiên cứu

Trong những năm gần đây, nghiên cứu về tín hiệu điện não (EEG) và ứng dụng trong nhận dạng cảm xúc đã trở thành lĩnh vực khoa học công nghệ mũi nhọn, thu hút sự quan tâm của nhiều nhà khoa học trên thế giới. EEG là điện thế hoạt động của vỏ não, phản ánh các trạng thái tâm lý và cảm xúc của con người thông qua các dạng sóng đặc trưng như alpha, beta, theta, delta. Theo ước tính, tần số lấy mẫu tối thiểu cho tín hiệu EEG là 200 mẫu/s, đảm bảo thu thập đầy đủ thông tin cần thiết. Tuy nhiên, việc trích chọn đặc trưng từ tín hiệu EEG vẫn là thách thức lớn do tính phi tuyến và biến đổi phức tạp của tín hiệu.

Mục tiêu nghiên cứu của luận văn là ứng dụng biến đổi wavelet rời rạc (DWT) để trích chọn đặc trưng tín hiệu EEG nhằm nâng cao hiệu quả nhận dạng cảm xúc. Phạm vi nghiên cứu tập trung trên các bộ cơ sở dữ liệu EEG chuẩn quốc tế, với các tín hiệu thu thập từ thiết bị Emotiv Epoc gồm 14 điện cực, được sử dụng phổ biến trong các nghiên cứu tương tác não-máy (BCI). Nghiên cứu được thực hiện trong giai đoạn 2017-2018 tại Trường Đại học Kỹ thuật Công nghiệp, Đại học Thái Nguyên.

Ý nghĩa của nghiên cứu thể hiện qua việc cải thiện độ chính xác nhận dạng cảm xúc, góp phần phát triển các ứng dụng trong y tế, giáo dục, an ninh quốc phòng và giải trí. Việc áp dụng DWT giúp khai thác đặc trưng phi tuyến của tín hiệu EEG trên cả miền thời gian và tần số, vượt trội hơn các phương pháp truyền thống như PCA, ICA hay mô hình tự hồi quy (AR).

Cơ sở lý thuyết và phương pháp nghiên cứu

Khung lý thuyết áp dụng

Luận văn dựa trên hai lý thuyết chính: lý thuyết tín hiệu EEG và lý thuyết biến đổi wavelet. EEG là tín hiệu điện sinh học thu được từ hoạt động điện thế của các tế bào pyramidal ở vỏ não, phản ánh các trạng thái cảm xúc và nhận thức. Các dạng sóng EEG cơ bản gồm:

  • Sóng Alpha (8-13 Hz): biểu hiện trạng thái thư giãn, chiếm ưu thế khi nhắm mắt.
  • Sóng Beta (13-35 Hz): liên quan đến trạng thái hưng phấn, tập trung.
  • Sóng Theta (4-8 Hz): xuất hiện khi buồn ngủ hoặc ngủ nông.
  • Sóng Delta (0.5-4 Hz): sóng chậm, xuất hiện trong giấc ngủ sâu hoặc bệnh lý.

Biến đổi wavelet, đặc biệt là biến đổi wavelet rời rạc (DWT), là công cụ phân tích tín hiệu đa phân giải, cho phép trích xuất đặc trưng tín hiệu trên cả miền thời gian và tần số. DWT sử dụng các bộ lọc thông thấp và thông cao để phân tích tín hiệu thành các thành phần chi tiết và xấp xỉ ở nhiều mức độ phân giải khác nhau. Lý thuyết phân tích đa phân giải (MRA) là nền tảng cho DWT, giúp biểu diễn tín hiệu trong không gian con với các hàm cơ sở wavelet và hàm tỷ lệ.

Các khái niệm chuyên ngành quan trọng bao gồm:

  • Mô hình cảm xúc Russell: mô hình cảm xúc liên tục với hai trục valence (tiêu cực - tích cực) và arousal (bình tĩnh - kích thích).
  • Thuật toán Higuchi Fractal Dimension (HFD): phương pháp tính chiều fractal của tín hiệu EEG để trích xuất đặc trưng phi tuyến.
  • Các phương pháp trích chọn đặc trưng truyền thống: PCA, ICA, AR.
  • Hệ thống nhận dạng cảm xúc dựa trên EEG sử dụng mạng nơ-ron đa lớp (MPL) và phương pháp phân loại SVM.

Phương pháp nghiên cứu

Nguồn dữ liệu chính là các bộ cơ sở dữ liệu EEG chuẩn quốc tế, thu thập bằng thiết bị Emotiv Epoc với 14 điện cực đặt theo chuẩn 10-20. Tín hiệu EEG được số hóa với tần số lấy mẫu 128 Hz hoặc cao hơn, đảm bảo độ phân giải thời gian và tần số phù hợp.

Phương pháp phân tích chính là áp dụng biến đổi wavelet rời rạc (DWT) để trích chọn đặc trưng tín hiệu EEG. Thuật toán Mallat được sử dụng để thực hiện phân tích đa phân giải, phân tách tín hiệu thành các thành phần tần số khác nhau qua các bộ lọc FIR thông thấp và thông cao. Các tham số đặc trưng như hệ số wavelet chi tiết và xấp xỉ được tính toán ở nhiều mức phân tích.

Quá trình nghiên cứu gồm các bước:

  1. Tiền xử lý dữ liệu EEG: lọc nhiễu, chuẩn hóa tín hiệu.
  2. Phân tích DWT để trích chọn đặc trưng.
  3. Áp dụng thuật toán HFD để tính chiều fractal của tín hiệu.
  4. Sử dụng mạng nơ-ron đa lớp (MPL) và SVM để phân loại cảm xúc dựa trên đặc trưng trích chọn.
  5. Mô phỏng và đánh giá hiệu quả trên phần mềm Matlab với giao diện GUI thiết kế riêng.

Cỡ mẫu nghiên cứu bao gồm hàng trăm mẫu tín hiệu EEG từ các bộ dữ liệu chuẩn, được chọn ngẫu nhiên theo phương pháp chọn mẫu thuận tiện. Thời gian nghiên cứu kéo dài khoảng 12 tháng, từ khâu thu thập dữ liệu đến phân tích và đánh giá kết quả.

Kết quả nghiên cứu và thảo luận

Những phát hiện chính

  1. Hiệu quả trích chọn đặc trưng bằng DWT vượt trội hơn các phương pháp truyền thống: Độ chính xác nhận dạng cảm xúc đạt trung bình khoảng 81% khi sử dụng DWT kết hợp mạng nơ-ron MPL, so với 54-67% của các phương pháp PCA, ICA và AR. Ví dụ, mô hình SVM với đặc trưng DWT đạt 82.37% chính xác cho các cảm xúc vui, buồn, tức giận và thoải mái.

  2. DWT cho phép phân tích tín hiệu EEG đa phân giải, khai thác đặc trưng phi tuyến hiệu quả: Các hệ số chi tiết ở các mức phân tích khác nhau cung cấp thông tin tần số và thời gian phong phú, giúp nhận dạng cảm xúc chính xác hơn. Số lượng mức phân tích tối ưu được xác định là khoảng 4-5 mức, tương ứng với dải tần số từ 0.5 Hz đến 64 Hz.

  3. Thuật toán Higuchi Fractal Dimension (HFD) hỗ trợ tăng độ nhạy trong nhận dạng cảm xúc: HFD giúp mô hình hóa đặc tính fractal của tín hiệu EEG, tăng khả năng phân biệt các trạng thái cảm xúc khác nhau. Mô hình kết hợp DWT và HFD đạt độ chính xác cao hơn khoảng 5-7% so với chỉ dùng DWT.

  4. Phần mềm mô phỏng trên Matlab với giao diện GUI giúp trực quan hóa và kiểm thử hiệu quả thuật toán: Giao diện cho phép lựa chọn bộ dữ liệu, mức phân tích DWT, họ wavelet và hiển thị kết quả phân tích chi tiết. Thời gian xử lý trung bình cho mỗi mẫu EEG khoảng 0.5 giây, phù hợp với ứng dụng thời gian thực.

Thảo luận kết quả

Nguyên nhân chính của sự vượt trội trong hiệu quả nhận dạng cảm xúc khi sử dụng DWT là do khả năng biểu diễn tín hiệu EEG trên cả miền thời gian và tần số, giúp khai thác các đặc trưng phi tuyến và biến đổi nhanh của sóng não. So với các phương pháp truyền thống như PCA hay ICA chỉ phân tích trên không gian tuyến tính, DWT cung cấp thông tin đa chiều và đa phân giải.

Kết quả này phù hợp với các nghiên cứu quốc tế đã công bố, trong đó DWT được đánh giá là phương pháp trích chọn đặc trưng hiệu quả nhất cho tín hiệu EEG trong nhận dạng cảm xúc. Việc kết hợp thêm HFD càng làm tăng khả năng phân biệt các trạng thái cảm xúc phức tạp.

Dữ liệu có thể được trình bày qua biểu đồ so sánh độ chính xác nhận dạng giữa các phương pháp, bảng thống kê các tham số đặc trưng DWT ở các mức phân tích, và biểu đồ phân bố các giá trị HFD theo từng cảm xúc. Điều này giúp minh họa rõ ràng sự khác biệt và ưu điểm của phương pháp đề xuất.

Đề xuất và khuyến nghị

  1. Triển khai hệ thống nhận dạng cảm xúc dựa trên DWT trong các ứng dụng y tế và giáo dục: Tập trung phát triển phần mềm tích hợp với thiết bị thu tín hiệu EEG để hỗ trợ chẩn đoán bệnh lý thần kinh và theo dõi trạng thái tâm lý học viên. Thời gian thực hiện dự kiến 12-18 tháng, do các trung tâm nghiên cứu và bệnh viện phối hợp thực hiện.

  2. Nâng cao chất lượng dữ liệu đầu vào bằng cải tiến thiết bị thu thập EEG: Sử dụng các điện cực có trở kháng thấp (<1 kΩ) và tăng số lượng điện cực để thu thập tín hiệu đa kênh chi tiết hơn, giúp tăng độ chính xác nhận dạng. Chủ thể thực hiện là các nhà sản xuất thiết bị y sinh và phòng thí nghiệm nghiên cứu.

  3. Phát triển thuật toán kết hợp DWT với các phương pháp học sâu (deep learning): Áp dụng mạng nơ-ron tích chập (CNN) hoặc mạng hồi tiếp (RNN) để tự động trích chọn đặc trưng và phân loại cảm xúc, hướng tới cải thiện độ chính xác trên 90%. Thời gian nghiên cứu 2-3 năm, do các nhóm nghiên cứu AI và kỹ thuật điện tử thực hiện.

  4. Xây dựng bộ cơ sở dữ liệu EEG đa dạng về đối tượng và cảm xúc: Thu thập dữ liệu từ nhiều nhóm tuổi, giới tính và tình trạng sức khỏe khác nhau để tăng tính tổng quát và khả năng áp dụng rộng rãi của hệ thống nhận dạng cảm xúc. Chủ thể thực hiện là các viện nghiên cứu và trường đại học.

Đối tượng nên tham khảo luận văn

  1. Nhà nghiên cứu và sinh viên ngành kỹ thuật điện tử, công nghệ thông tin: Luận văn cung cấp kiến thức chuyên sâu về xử lý tín hiệu EEG và ứng dụng biến đổi wavelet, hỗ trợ phát triển các đề tài nghiên cứu liên quan.

  2. Chuyên gia phát triển hệ thống Brain-Computer Interface (BCI): Tham khảo các thuật toán trích chọn đặc trưng và mô hình nhận dạng cảm xúc để cải tiến sản phẩm tương tác não-máy.

  3. Bác sĩ chuyên khoa thần kinh và tâm lý học: Hiểu rõ cơ sở khoa học và công nghệ hỗ trợ chẩn đoán và theo dõi bệnh lý liên quan đến não bộ thông qua phân tích tín hiệu EEG.

  4. Doanh nghiệp công nghệ y tế và thiết bị điện tử: Áp dụng kết quả nghiên cứu để phát triển các thiết bị thu thập và phân tích tín hiệu EEG phục vụ thị trường y tế, giáo dục và giải trí.

Câu hỏi thường gặp

  1. Biến đổi wavelet rời rạc (DWT) là gì và tại sao lại phù hợp cho trích chọn đặc trưng tín hiệu EEG?
    DWT là phương pháp phân tích tín hiệu đa phân giải, phân tách tín hiệu thành các thành phần tần số khác nhau theo thời gian. DWT phù hợp với EEG vì tín hiệu EEG có tính phi tuyến và biến đổi nhanh, DWT giúp khai thác đặc trưng trên cả miền thời gian và tần số, cải thiện độ chính xác nhận dạng cảm xúc.

  2. Thiết bị Emotiv Epoc có ưu điểm gì trong thu thập tín hiệu EEG?
    Emotiv Epoc có 14 điện cực đặt theo chuẩn quốc tế, dễ sử dụng, giá thành hợp lý và hỗ trợ truyền dữ liệu không dây qua Wifi. Thiết bị này được ứng dụng rộng rãi trong nghiên cứu BCI và nhận dạng cảm xúc nhờ khả năng thu thập tín hiệu chất lượng cao.

  3. Mô hình cảm xúc Russell được áp dụng như thế nào trong nghiên cứu này?
    Mô hình Russell biểu diễn cảm xúc trong không gian hai chiều gồm valence (tiêu cực - tích cực) và arousal (bình tĩnh - kích thích). Nghiên cứu sử dụng mô hình này để phân loại các trạng thái cảm xúc dựa trên đặc trưng EEG, giúp nhận dạng đa lớp cảm xúc hiệu quả.

  4. So sánh hiệu quả của DWT với các phương pháp truyền thống như PCA, ICA?
    DWT cho phép phân tích tín hiệu phi tuyến và đa phân giải, trong khi PCA và ICA chủ yếu phân tích trên không gian tuyến tính. Kết quả nghiên cứu cho thấy DWT đạt độ chính xác nhận dạng cảm xúc trung bình 81%, cao hơn đáng kể so với 54-67% của PCA và ICA.

  5. Phần mềm mô phỏng Matlab có vai trò gì trong nghiên cứu?
    Phần mềm mô phỏng giúp thực hiện các bước xử lý tín hiệu, trích chọn đặc trưng và phân loại cảm xúc một cách trực quan và hiệu quả. Giao diện GUI hỗ trợ người dùng lựa chọn tham số, xem kết quả phân tích và đánh giá thuật toán, từ đó chứng minh tính khả thi và ứng dụng thực tế của phương pháp.

Kết luận

  • Luận văn đã chứng minh hiệu quả vượt trội của phương pháp trích chọn đặc trưng tín hiệu EEG sử dụng biến đổi wavelet rời rạc trong hệ thống nhận dạng cảm xúc, với độ chính xác trung bình đạt 81%.
  • Kết hợp thuật toán Higuchi Fractal Dimension giúp tăng khả năng phân biệt các trạng thái cảm xúc phức tạp.
  • Phần mềm mô phỏng Matlab với giao diện GUI được xây dựng thành công, hỗ trợ trực quan hóa và kiểm thử thuật toán.
  • Nghiên cứu mở ra hướng phát triển các ứng dụng tương tác não-máy, hỗ trợ y tế và giáo dục tại Việt Nam.
  • Các bước tiếp theo bao gồm mở rộng bộ dữ liệu, áp dụng học sâu và triển khai thực tế trong các hệ thống BCI.

Để tiếp tục phát triển lĩnh vực này, các nhà nghiên cứu và doanh nghiệp được khuyến khích áp dụng và mở rộng các kết quả nghiên cứu nhằm nâng cao hiệu quả và tính ứng dụng của hệ thống nhận dạng cảm xúc dựa trên tín hiệu EEG.