## Tổng quan nghiên cứu

Trong bối cảnh phát triển nhanh chóng của công nghệ trí tuệ nhân tạo và Internet vạn vật (AIoT), việc ứng dụng các phương pháp phân tích tín hiệu não điện (EEG) để tăng tốc đào tạo nhận thức trở thành một lĩnh vực nghiên cứu quan trọng. Theo ước tính, EEG có thể cung cấp dữ liệu điện não với tần số lấy mẫu lên đến 4000 Hz, cho phép thu thập thông tin chi tiết về trạng thái nhận thức và cảm xúc của con người. Vấn đề nghiên cứu tập trung vào việc cải thiện độ chính xác và hiệu quả của các hệ thống phân tích và phân loại tín hiệu EEG thông qua phương pháp biến đổi sóng con (Wavelet Transform), nhằm phát triển các thiết bị neurofeedback dựa trên AIoT có khả năng tự điều chỉnh và hỗ trợ đào tạo nhận thức.

Mục tiêu cụ thể của nghiên cứu là xây dựng và đánh giá các mô hình xử lý tín hiệu EEG sử dụng biến đổi sóng con rời rạc (DWT) và biến đổi sóng con liên tục (CWT), kết hợp với các thuật toán học máy như Random Forest, XGBoost, SVM và mạng nơ-ron sâu (DNN) để phân loại trạng thái tập trung, mất tập trung và buồn ngủ. Phạm vi nghiên cứu bao gồm dữ liệu EEG thu thập từ 5 đối tượng trong khoảng thời gian 25 giờ, với các thí nghiệm được thực hiện trong môi trường mô phỏng điều khiển tàu và tàu thủy. Ý nghĩa của nghiên cứu được thể hiện qua việc nâng cao độ chính xác phân loại lên đến khoảng 72%, góp phần phát triển các hệ thống neurofeedback hiệu quả, hỗ trợ cải thiện khả năng tập trung và đào tạo nhận thức trong thực tế.

## Cơ sở lý thuyết và phương pháp nghiên cứu

### Khung lý thuyết áp dụng

Nghiên cứu dựa trên hai lý thuyết chính: lý thuyết biến đổi sóng con (Wavelet Transform) và lý thuyết học máy (Machine Learning). Biến đổi sóng con, bao gồm DWT và CWT, cho phép phân tích tín hiệu EEG trong miền thời gian-tần số, giúp tách biệt các thành phần tần số khác nhau của tín hiệu phi tĩnh. DWT phân chia tín hiệu thành các dải tần số riêng biệt, trong khi CWT tạo ra phổ thời gian-tần số dạng ảnh, hỗ trợ việc trích xuất đặc trưng chi tiết hơn. Các khái niệm chính bao gồm: tần số sóng não (delta, theta, alpha, beta, gamma), neurofeedback (NF) và neuroplasticity – khả năng thay đổi của mạng lưới thần kinh.

Trong lĩnh vực học máy, các thuật toán được áp dụng gồm Random Forest (RF), eXtreme Gradient Boosting (XGB), Support Vector Machine (SVM), và các kiến trúc mạng nơ-ron sâu như DNN, CNN, LSTM. Các thuật toán này được lựa chọn dựa trên khả năng xử lý dữ liệu đa chiều, tính linh hoạt và độ chính xác cao trong phân loại trạng thái nhận thức.

### Phương pháp nghiên cứu

Nguồn dữ liệu chính là bộ dữ liệu EEG thu thập từ 5 người tham gia, mỗi người thực hiện 7 phiên thí nghiệm với tổng thời gian khoảng 25 giờ. Dữ liệu được ghi nhận qua 7 điện cực theo hệ thống quốc tế 10-20, với tần số lấy mẫu 128 Hz và băng thông 0.2-43 Hz. Phương pháp phân tích bao gồm:

- Tiền xử lý tín hiệu EEG bằng biến đổi sóng con rời rạc (DWT) và liên tục (CWT) để trích xuất đặc trưng.
- Sử dụng cửa sổ trượt với độ dài từ 4 đến 40 giây để phân đoạn tín hiệu.
- Áp dụng các thuật toán học máy (RF, XGB, SVM, DNN) để huấn luyện và phân loại trạng thái nhận thức (tập trung, mất tập trung, buồn ngủ).
- Chia dữ liệu thành tập huấn luyện, tập kiểm tra và tập xác thực theo các mô hình Subject-Specific, Common Subject và Leave-One-Out (LOO).
- Thời gian nghiên cứu kéo dài trong suốt quá trình thu thập và phân tích dữ liệu, với các bước đánh giá hiệu quả mô hình qua các chỉ số độ chính xác và mất mát.

## Kết quả nghiên cứu và thảo luận

### Những phát hiện chính

- Mô hình sử dụng DWT kết hợp với thuật toán Random Forest và XGBoost đạt độ chính xác phân loại cao nhất, khoảng 69.2% trong mô hình Subject-Specific và 72.2% trong mô hình Leave-One-Out.
- Độ dài cửa sổ trượt 40 giây cho kết quả tốt nhất, giúp mô hình nắm bắt được đặc trưng tín hiệu ổn định và đầy đủ hơn.
- Mức phân giải phân tích tín hiệu ở cấp độ phân rã 4 trở lên cho hiệu quả cao hơn, giảm thiểu sai số và tăng khả năng phân biệt các trạng thái nhận thức.
- Mạng nơ-ron sâu (DNN) với 6 lớp cho kết quả phân loại tốt hơn so với các mô hình DNN đơn giản, tuy nhiên vẫn chưa vượt trội so với các thuật toán RF và SVM trong một số trường hợp.

### Thảo luận kết quả

Nguyên nhân của các kết quả trên có thể giải thích do phương pháp biến đổi sóng con giúp trích xuất đặc trưng tín hiệu EEG hiệu quả hơn so với các phương pháp truyền thống như STFT hay FFT, nhờ khả năng phân tích tín hiệu phi tĩnh trong miền thời gian-tần số. Việc sử dụng cửa sổ trượt dài 40 giây giúp giảm thiểu ảnh hưởng của nhiễu và biến động ngắn hạn trong tín hiệu. So sánh với các nghiên cứu trước đây, kết quả đạt được tương đương hoặc vượt trội, đặc biệt trong việc áp dụng mô hình Leave-One-Out, cho thấy tính khả thi của hệ thống trong việc áp dụng cho người dùng mới. Dữ liệu có thể được trình bày qua biểu đồ độ chính xác theo từng mô hình và bảng so sánh kết quả phân loại giữa các thuật toán.

## Đề xuất và khuyến nghị

- Phát triển thêm các mô hình học sâu kết hợp với kỹ thuật tăng cường dữ liệu để nâng cao độ chính xác phân loại trên các tập dữ liệu đa dạng hơn.
- Triển khai hệ thống neurofeedback dựa trên AIoT với khả năng xử lý tín hiệu thời gian thực, ưu tiên tối ưu hóa năng lượng và độ trễ thấp.
- Tăng cường thu thập dữ liệu EEG đa kênh với tần số lấy mẫu cao hơn để cải thiện chất lượng đặc trưng và khả năng phân loại.
- Đào tạo và hướng dẫn người dùng trong việc sử dụng thiết bị EEG di động để đảm bảo thu thập dữ liệu chính xác và giảm thiểu nhiễu.
- Thời gian thực hiện các giải pháp trên dự kiến trong vòng 1-2 năm, phối hợp giữa các nhóm nghiên cứu và đơn vị phát triển công nghệ.

## Đối tượng nên tham khảo luận văn

- Các nhà nghiên cứu trong lĩnh vực kỹ thuật truyền thông và xử lý tín hiệu, nhằm áp dụng phương pháp biến đổi sóng con trong phân tích dữ liệu EEG.
- Chuyên gia phát triển thiết bị neurofeedback và hệ thống AIoT, để thiết kế các sản phẩm hỗ trợ đào tạo nhận thức hiệu quả.
- Bác sĩ và nhà khoa học thần kinh, quan tâm đến việc ứng dụng EEG trong chẩn đoán và điều trị các rối loạn thần kinh.
- Sinh viên và học viên cao học chuyên ngành kỹ thuật điện tử, truyền thông và trí tuệ nhân tạo, làm tài liệu tham khảo cho các đề tài nghiên cứu liên quan.

## Câu hỏi thường gặp

1. **Phương pháp biến đổi sóng con có ưu điểm gì so với FFT và STFT?**  
Biến đổi sóng con cho phép phân tích tín hiệu phi tĩnh trong miền thời gian-tần số với độ phân giải linh hoạt, giúp trích xuất đặc trưng chính xác hơn so với FFT và STFT.

2. **Tại sao lại chọn cửa sổ trượt 40 giây trong phân tích tín hiệu EEG?**  
Cửa sổ 40 giây giúp cân bằng giữa độ chi tiết và ổn định của tín hiệu, giảm thiểu ảnh hưởng của nhiễu và biến động ngắn hạn, nâng cao độ chính xác phân loại.

3. **Mô hình Leave-One-Out có ý nghĩa gì trong nghiên cứu?**  
Mô hình này kiểm tra khả năng tổng quát hóa của mô hình trên dữ liệu người dùng mới, giúp đánh giá tính ứng dụng thực tế của hệ thống.

4. **Các thuật toán học máy nào phù hợp nhất cho phân loại tín hiệu EEG?**  
Random Forest, XGBoost và SVM được đánh giá cao về độ chính xác và khả năng xử lý dữ liệu đa chiều trong nghiên cứu này.

5. **Làm thế nào để giảm thiểu nhiễu trong tín hiệu EEG khi thu thập?**  
Sử dụng điện cực chất lượng cao, thiết bị đo hiện đại, và áp dụng các thuật toán lọc nhiễu tự động như Artifact Subspace Reconstruction (ASR) giúp cải thiện chất lượng dữ liệu.

## Kết luận

- Nghiên cứu đã chứng minh hiệu quả của phương pháp biến đổi sóng con trong tiền xử lý và trích xuất đặc trưng tín hiệu EEG.  
- Các mô hình học máy như Random Forest và XGBoost đạt độ chính xác phân loại trạng thái nhận thức lên đến 72.2%.  
- Cửa sổ trượt 40 giây và cấp độ phân rã 4 trở lên là lựa chọn tối ưu cho phân tích tín hiệu EEG.  
- Kết quả nghiên cứu mở ra hướng phát triển các thiết bị neurofeedback AIoT hỗ trợ đào tạo nhận thức hiệu quả.  
- Các bước tiếp theo bao gồm mở rộng dữ liệu, cải tiến mô hình học sâu và triển khai ứng dụng thực tế trong 1-2 năm tới.  

Hãy bắt đầu áp dụng các phương pháp này để nâng cao hiệu quả đào tạo nhận thức và phát triển các giải pháp neurofeedback tiên tiến.