Nghiên Cứu Ứng Dụng Mạng No-Ron Tích Chập Để Phân Loại Vận Động Thông Qua Điện Não Đồ

Trường đại học

Đại Học Quốc Gia TP. Hồ Chí Minh

Chuyên ngành

Khoa Học Máy Tính

Người đăng

Ẩn danh

Thể loại

luận văn thạc sĩ

2022

Phí lưu trữ

30 Point

Mục lục chi tiết

LỜI CẢM ƠN

LỜI CAM ĐOAN

1. CHƯƠNG 1: LÝ DO CHỌN ĐỀ TÀI

1.1. Mục Tiêu Tổng Quát

1.2. Mục Tiêu Nghiên Cứu Cụ Thể

1.3. Đối Tượng Phạm Vi Nghiên Cứu

1.4. Tình Hình Nghiên Cứu Của Các Tác Giả Trong Nước

1.5. Tình Hình Nghiên Cứu Của Các Tác Giả Nước Ngoài

1.5.1. Phản ứng tổng hợp Multi-CNN của Syed Umar Amin

1.5.2. Nghiên cứu về hợp nhất các mô hình CNN của Syed Umar Amin và các cộng sự

1.5.3. Sự kết hợp giữa CNN và FBCSP của tác giả Siavash Sakhavi

1.5.4. Một nghiên cứu về FBCSP

1.5.5. Một nghiên cứu dựa trên mô hình EEGNet

1.6. Một Số Vấn Đề Còn Tồn Tại

2. CHƯƠNG 2: TỔNG QUAN VỀ NÃO NGƯỜI VÀ CÁC VÙNG CHỨC NĂNG

2.1. Tổng quan về não người và các vùng chức năng của não người

2.2. Phương pháp thu thập thông tin hoạt động của não bộ

2.3. Machine Learning và Deep Learning

2.3.1. Mạng học sâu (Convolutional Neural Network)

2.3.2. Mạng nơ-ron hồi quy RNN

2.3.3. Mạng nơ-ron tích chập (Convolutional Neural Network)

2.3.4. Lớp Fully Connected Layer (FC)

2.3.5. Softmax / Logistic Layer

2.4. Thuật toán dạng không gian chung của Ngân hàng Bộ lọc - FBCSP

2.5. Thuật toán Long short term memory (LSTM)

2.6. Thuật toán Adam

3. CHƯƠNG 3: MÔ HÌNH PHÂN LOẠI

3.1. Mô hình Mạng Nơ-Ron Tích Chập Để Phân Loại Vận Động Thông Qua Điện Não Đồ (HCNN)

3.2. Tiền xử lý số liệu: Preprocess and OVR-FBCSP

3.3. Mô hình Hybrid Neural Networks (HCNN)

3.4. Lớp phân loại Fully Connected

3.5. Mô hình phân loại của chủ đề tham chiếu

3.6. Điểm mới và cải tiến của mô hình được đề xuất

4. CHƯƠNG 4: KẾT QUẢ THỰC NGHIỆM

4.1. Tiêu chí đánh giá Weighted Average F1 (WAvg)

4.2. Bộ dữ liệu BCI Competition IV 2a

4.3. Phương pháp điện não đồ EEG

4.4. Hệ thống đặt điện cực quốc tế 10-20 để ghi

4.5. Mô hình thử nghiệm tập dữ liệu BCI Competition IV 2a

4.6. Quá trình ghi dữ liệu tập dữ liệu BCI Competition IV 2a

4.7. Mô tả tập dữ liệu tập dữ liệu BCI Competition IV 2a

4.8. Phương pháp đánh giá tập dữ liệu tập dữ liệu BCI Competition IV 2a

4.9. Kết quả phân loại Mô hình Hybrid Neural Networks (HCNN)

KẾT LUẬN VÀ HƯỚNG PHÁT TRIỂN

TÀI LIỆU THAM KHẢO

PHỤ LỤC 1

PHỤ LỤC 2

DANH MỤC CÁC BẢNG

DANH MỤC CÁC HÌNH VẼ, ĐỒ THỊ

DANH MỤC CÁC TỪ VIẾT TẮT

Tóm tắt

I. Tổng Quan Nghiên Cứu Ứng Dụng Mạng No Ron và Điện Não Đồ

Nghiên cứu về ứng dụng mạng No-Ron trong phân loại vận động EEG đang thu hút sự quan tâm lớn trong lĩnh vực giao diện não-máy (BCI). BCI hứa hẹn mang lại những tiến bộ vượt bậc trong việc hỗ trợ người khuyết tật, đặc biệt là người khuyết tật vận động, bằng cách cho phép họ điều khiển các thiết bị hỗ trợ thông qua suy nghĩ. Kỹ thuật này dựa trên việc giải mã tín hiệu điện não đồ (EEG), một phương pháp ghi lại hoạt động điện của não bộ, và sử dụng mạng nơ-ron để phân loại các mẫu tín hiệu tương ứng với các ý định vận động khác nhau. Luận văn này tập trung vào việc xây dựng một mô hình thuật toán cho hệ thống BCI, tạo tiền đề cho một hệ thống BCI có khả năng ứng dụng thực tế. Cụ thể, mô hình sẽ phân loại các loại tín hiệu điện não đồ (EEG) vận động từ tín hiệu điện não đầu vào.

1.1. Giới thiệu chung về giao diện não máy BCI

Giao diện não-máy (BCI) là một lĩnh vực nghiên cứu liên ngành, khám phá sự tương tác trực tiếp giữa não người và máy tính. Hệ thống BCI thu thập tín hiệu điện từ não thông qua các điện cực, sau đó sử dụng các thuật toán để phân tích và diễn giải các tín hiệu này. Mục tiêu là cho phép người dùng điều khiển các thiết bị bên ngoài, chẳng hạn như xe lăn hoặc tay giả, chỉ bằng suy nghĩ. BCI mở ra tiềm năng lớn trong việc cải thiện chất lượng cuộc sống của người khuyết tật và hỗ trợ phục hồi chức năng. Nghiên cứu này góp phần vào sự phát triển của BCI bằng cách tập trung vào việc nâng cao độ chính xác và hiệu quả của phân loại vận động EEG.

1.2. Tầm quan trọng của phân loại vận động EEG trong BCI

Phân loại vận động EEG là một thành phần quan trọng trong các hệ thống BCI. Nó cho phép hệ thống diễn giải ý định vận động của người dùng từ các tín hiệu điện não đồ. Độ chính xác và tốc độ của quá trình phân loại này ảnh hưởng trực tiếp đến hiệu suất và tính khả dụng của BCI. Các phương pháp học sâu, đặc biệt là mạng No-Ron, đã chứng minh tiềm năng lớn trong việc cải thiện độ chính xác phân loại EEG. Việc phát triển các mô hình mạng No-Ron hiệu quả hơn có thể giúp BCI trở nên thiết thực và hữu ích hơn cho người dùng.

II. Thách Thức Phân Loại Vận Động EEG Cách Vượt Qua

Việc phân loại vận động EEG đặt ra nhiều thách thức do tính phức tạp và biến động của tín hiệu điện não đồ. Tín hiệu EEG thường bị nhiễu bởi các yếu tố bên ngoài và bên trong, đồng thời có sự khác biệt đáng kể giữa các cá nhân và thậm chí giữa các phiên đo khác nhau. Điều này đòi hỏi các thuật toán phân loại phải có khả năng trích xuất các đặc trưng quan trọng từ tín hiệu, đồng thời có khả năng thích ứng với sự biến động. Các nghiên cứu gần đây đã tập trung vào việc sử dụng các kỹ thuật xử lý tín hiệu EEG tiên tiến và các kiến trúc mạng No-Ron phức tạp để vượt qua những thách thức này.

2.1. Đặc điểm tín hiệu điện não đồ EEG và các yếu tố gây nhiễu

Tín hiệu điện não đồ (EEG) là một bản ghi hoạt động điện của não bộ, thu được thông qua các điện cực đặt trên da đầu. Tín hiệu này chứa thông tin về nhiều quá trình khác nhau của não bộ, bao gồm cả các hoạt động liên quan đến vận động. Tuy nhiên, tín hiệu EEG cũng rất dễ bị nhiễu bởi các yếu tố như chuyển động mắt, hoạt động cơ bắp và nhiễu điện từ môi trường. Việc loại bỏ hoặc giảm thiểu các yếu tố gây nhiễu này là rất quan trọng để cải thiện độ chính xác phân loại EEG.

2.2. Biến động giữa các đối tượng và phiên đo EEG

Một thách thức khác trong phân loại vận động EEG là sự biến động đáng kể giữa các đối tượng và phiên đo. Điều này có nghĩa là các mô hình phân loại được đào tạo trên dữ liệu của một đối tượng hoặc phiên đo có thể không hoạt động tốt trên dữ liệu của đối tượng hoặc phiên đo khác. Để giải quyết vấn đề này, các nhà nghiên cứu đã đề xuất các phương pháp như chuẩn hóa dữ liệu, chuyển giao học tập (transfer learning) và thích ứng miền (domain adaptation). Chuẩn hóa giúp dữ liệu nằm trong một khoảng giá trị nhất định để giảm sự khác biệt. Chuyển giao học tập và thích ứng miền cho phép mô hình học được từ dữ liệu của nhiều đối tượng và phiên đo khác nhau, giúp nó có khả năng tổng quát hóa tốt hơn.

2.3. Yêu cầu độ chính xác cao và thời gian thực trong BCI

Trong ứng dụng giao diện não-máy (BCI), độ chính xác và thời gian thực là hai yếu tố quan trọng. Độ chính xác cao đảm bảo rằng các lệnh điều khiển được diễn giải chính xác, trong khi thời gian thực cho phép người dùng điều khiển các thiết bị một cách tự nhiên và trực quan. Điều này đòi hỏi các thuật toán phân loại phải có khả năng xử lý dữ liệu EEG nhanh chóng và chính xác. Các nghiên cứu hiện tại đang tập trung vào việc phát triển các kiến trúc mạng No-Ron hiệu quả hơn và các phương pháp tối ưu hóa để đáp ứng yêu cầu này.

III. Giải Pháp Mạng No Ron Tích Chập CNN Cho Phân Loại EEG

Mạng nơ-ron tích chập (CNN) đã chứng minh khả năng vượt trội trong nhiều lĩnh vực, bao gồm cả phân loại vận động EEG. CNN có khả năng tự động trích xuất các đặc trưng quan trọng từ dữ liệu EEG thô, đồng thời có khả năng xử lý dữ liệu đa chiều. Kiến trúc CNN cho phép nó học các mẫu phức tạp trong dữ liệu EEG, giúp cải thiện độ chính xác phân loại.

3.1. Ưu điểm của mạng CNN trong xử lý tín hiệu EEG

Mạng CNN có một số ưu điểm quan trọng trong việc xử lý tín hiệu EEG. Đầu tiên, chúng có thể tự động học các đặc trưng quan trọng từ dữ liệu thô, loại bỏ nhu cầu trích xuất đặc trưng thủ công. Thứ hai, chúng có khả năng xử lý dữ liệu đa chiều, cho phép chúng tận dụng thông tin không gian và thời gian trong tín hiệu EEG. Thứ ba, chúng có khả năng thích ứng với sự biến động trong dữ liệu, giúp chúng hoạt động tốt trên nhiều đối tượng và phiên đo khác nhau. Cuối cùng, kiến trúc CNN phù hợp để tối ưu hóa, giúp chúng đạt được hiệu suất cao trong thời gian thực.

3.2. Kiến trúc CNN điển hình cho phân loại vận động EEG

Một kiến trúc CNN điển hình cho phân loại vận động EEG bao gồm một số lớp tích chập, lớp gộp (pooling) và lớp kết nối đầy đủ (fully connected). Các lớp tích chập trích xuất các đặc trưng từ dữ liệu EEG bằng cách áp dụng các bộ lọc (filter) tích chập. Các lớp gộp giảm kích thước của các đặc trưng đã trích xuất, giúp giảm số lượng tham số và tăng khả năng tổng quát hóa. Các lớp kết nối đầy đủ phân loại các đặc trưng đã trích xuất vào các lớp vận động khác nhau. Các hàm kích hoạt (activation function) như ReLU được sử dụng để thêm tính phi tuyến vào mô hình. Quá trình đào tạo CNN thường sử dụng các thuật toán tối ưu hóa như Adam.

3.3. Các lớp tích chập sâu và trích xuất đặc trưng tự động

Việc sử dụng các lớp tích chập sâu trong CNN cho phép mô hình học các đặc trưng phức tạp hơn từ dữ liệu EEG. Các lớp tích chập sâu hơn có thể trích xuất các đặc trưng ở mức độ trừu tượng cao hơn, giúp cải thiện độ chính xác phân loại. Khả năng trích xuất đặc trưng tự động của CNN giúp giảm gánh nặng cho các nhà nghiên cứu, đồng thời có thể khám phá ra các đặc trưng mà con người khó có thể xác định được.

IV. Mạng No Ron Hồi Quy RNN và LSTM cho Phân Tích EEG

Ngoài CNN, mạng nơ-ron hồi quy (RNN) và các biến thể của nó như LSTM cũng được sử dụng rộng rãi trong phân loại vận động EEG. RNN đặc biệt phù hợp để xử lý dữ liệu chuỗi thời gian như EEG, vì chúng có thể ghi nhớ thông tin từ các bước thời gian trước đó. LSTM giải quyết vấn đề biến mất gradient (vanishing gradient) của RNN truyền thống, cho phép chúng học các phụ thuộc dài hạn trong dữ liệu EEG.

4.1. Khả năng xử lý chuỗi thời gian của RNN và LSTM

RNN và LSTM có khả năng vượt trội trong việc xử lý dữ liệu chuỗi thời gian, làm cho chúng trở thành lựa chọn phù hợp cho việc phân tích tín hiệu EEG. Khả năng ghi nhớ thông tin từ các bước thời gian trước đó cho phép chúng nắm bắt các mối quan hệ giữa các mẫu tín hiệu EEG theo thời gian, điều này rất quan trọng để phân loại vận động.

4.2. Vấn đề biến mất gradient và giải pháp của LSTM

Vấn đề biến mất gradient là một thách thức lớn trong việc đào tạo RNN. Khi gradient lan truyền ngược qua các bước thời gian, nó có thể trở nên quá nhỏ, khiến cho các lớp đầu không thể học được. LSTM giải quyết vấn đề này bằng cách sử dụng các cổng (gate) để kiểm soát luồng thông tin qua các bước thời gian, cho phép chúng học các phụ thuộc dài hạn trong dữ liệu EEG.

4.3. Kết hợp CNN và LSTM để cải thiện độ chính xác phân loại

Một số nghiên cứu đã kết hợp CNN và LSTM để tận dụng ưu điểm của cả hai kiến trúc. CNN có thể trích xuất các đặc trưng không gian từ dữ liệu EEG, trong khi LSTM có thể học các phụ thuộc thời gian giữa các đặc trưng này. Sự kết hợp này có thể cải thiện đáng kể độ chính xác phân loại vận động EEG.

V. Thực Nghiệm và Kết Quả Đánh Giá Mô Hình Mạng No Ron EEG

Để đánh giá hiệu suất của các mô hình mạng No-Ron trong phân loại vận động EEG, các thí nghiệm thường được thực hiện trên các bộ dữ liệu EEG công khai. Các tiêu chí đánh giá như độ chính xác, độ nhạy và độ đặc hiệu được sử dụng để so sánh hiệu suất của các mô hình khác nhau. Kết quả của các thí nghiệm này cung cấp thông tin quan trọng về tính khả thi của việc sử dụng mạng No-Ron trong các ứng dụng BCI.

5.1. Các bộ dữ liệu EEG công khai phổ biến cho nghiên cứu BCI

Có nhiều bộ dữ liệu EEG công khai được sử dụng rộng rãi trong nghiên cứu BCI, chẳng hạn như BCI Competition IV 2a, GigaScience Motor Movement dataset và PhysioNet Motor Imagery dataset. Các bộ dữ liệu này cung cấp dữ liệu EEG từ nhiều đối tượng khác nhau, thực hiện các nhiệm vụ vận động khác nhau. Việc sử dụng các bộ dữ liệu này cho phép các nhà nghiên cứu so sánh hiệu suất của các mô hình của họ một cách khách quan.

5.2. Tiêu chí đánh giá hiệu suất mô hình phân loại EEG

Các tiêu chí đánh giá phổ biến cho các mô hình phân loại EEG bao gồm độ chính xác (accuracy), độ nhạy (sensitivity), độ đặc hiệu (specificity), F1-score và diện tích dưới đường cong ROC (AUC). Độ chính xác đo tỷ lệ các mẫu được phân loại đúng. Độ nhạy đo tỷ lệ các mẫu dương tính được phân loại đúng. Độ đặc hiệu đo tỷ lệ các mẫu âm tính được phân loại đúng. F1-score là trung bình điều hòa của độ chính xác và độ nhạy. AUC đo khả năng của mô hình phân biệt giữa các lớp khác nhau.

5.3. So sánh hiệu suất các mô hình CNN và LSTM trên bộ dữ liệu BCI

Các nghiên cứu đã chỉ ra rằng cả CNN và LSTM đều có thể đạt được hiệu suất tốt trên các bộ dữ liệu BCI. Tuy nhiên, hiệu suất tương đối của hai kiến trúc này có thể khác nhau tùy thuộc vào đặc điểm của dữ liệu và nhiệm vụ phân loại. Một số nghiên cứu đã báo cáo rằng CNN hoạt động tốt hơn trong việc trích xuất các đặc trưng không gian, trong khi LSTM hoạt động tốt hơn trong việc học các phụ thuộc thời gian. Vì vậy, việc lựa chọn kiến trúc phù hợp phụ thuộc vào bài toán cụ thể.

VI. Kết Luận và Hướng Phát Triển Của Mạng No Ron Trong BCI

Nghiên cứu về ứng dụng mạng No-Ron trong phân loại vận động EEG đã đạt được những tiến bộ đáng kể trong những năm gần đây. Các mô hình mạng No-Ron đã chứng minh khả năng cải thiện đáng kể độ chính xác và hiệu quả của các hệ thống BCI. Tuy nhiên, vẫn còn nhiều thách thức cần vượt qua, chẳng hạn như việc xử lý dữ liệu EEG biến động và việc triển khai các hệ thống BCI thời gian thực. Các hướng phát triển trong tương lai bao gồm việc phát triển các kiến trúc mạng No-Ron phức tạp hơn, việc sử dụng các kỹ thuật tăng cường dữ liệu, và việc kết hợp mạng No-Ron với các phương pháp xử lý tín hiệu EEG truyền thống.

6.1. Tóm tắt những thành tựu chính trong nghiên cứu

Nghiên cứu này đã góp phần vào việc khám phá và đánh giá các ứng dụng của mạng No-Ron trong phân loại vận động EEG, đồng thời nhấn mạnh tiềm năng của các mô hình này trong việc cải thiện độ chính xác và hiệu quả của các hệ thống BCI. Việc so sánh hiệu suất của các kiến trúc CNN và LSTM trên các bộ dữ liệu BCI công khai đã cung cấp thông tin quan trọng cho việc lựa chọn kiến trúc phù hợp cho các ứng dụng khác nhau.

6.2. Các thách thức còn tồn tại và hướng nghiên cứu tiếp theo

Mặc dù đã có những tiến bộ đáng kể, vẫn còn nhiều thách thức cần vượt qua trong nghiên cứu về ứng dụng mạng No-Ron trong phân loại vận động EEG. Các thách thức này bao gồm việc xử lý dữ liệu EEG biến động, việc triển khai các hệ thống BCI thời gian thực và việc giải thích các quyết định của mạng No-Ron. Các hướng nghiên cứu tiếp theo có thể tập trung vào việc phát triển các kiến trúc mạng No-Ron phức tạp hơn, việc sử dụng các kỹ thuật tăng cường dữ liệu, và việc kết hợp mạng No-Ron với các phương pháp xử lý tín hiệu EEG truyền thống.

6.3. Tiềm năng ứng dụng của BCI trong y tế và phục hồi chức năng

Giao diện não-máy (BCI) có tiềm năng ứng dụng to lớn trong y tế và phục hồi chức năng. BCI có thể được sử dụng để giúp người khuyết tật vận động điều khiển các thiết bị hỗ trợ, giao tiếp với thế giới bên ngoài và phục hồi chức năng vận động. BCI cũng có thể được sử dụng để chẩn đoán và điều trị các bệnh liên quan đến não bộ và thần kinh.

28/05/2025

Bạn đang xem trước tài liệu:

Luận văn thạc sĩ khoa học máy tính ứng dụng mạng nơ ron tích chập để phân loại vận động thông qua điện não đồ

Tải đầy đủ

Nội dung chính

Tổng quan nghiên cứu

Theo thống kê của Ủy ban Quốc gia về người khuyết tật Việt Nam, cả nước có khoảng 6,2 triệu người khuyết tật, chiếm 7,06% dân số từ 2 tuổi trở lên, trong đó 58% là nữ, 28,3% là trẻ em và gần 29% là người khuyết tật nặng và đặc biệt nặng. Nhiều người khuyết tật vận động có thể tự chăm sóc bản thân nếu được hỗ trợ bằng các công cụ như xe lăn hay chi giả. Tuy nhiên, việc điều khiển các thiết bị hỗ trợ này còn nhiều hạn chế do thiếu các phương thức tương tác hiệu quả. Luận văn thạc sĩ này tập trung xây dựng mô hình mạng nơ-ron tích chập (CNN) kết hợp với các kỹ thuật học sâu để phân loại tín hiệu điện não đồ (EEG) vận động, nhằm tạo tiền đề phát triển các công cụ hỗ trợ người khuyết tật vận động có thể điều khiển thiết bị thông qua sóng não.

Mục tiêu cụ thể của nghiên cứu là thiết kế mô hình phân loại các tín hiệu EEG vận động liên quan đến tay trái, tay phải, chân và lưỡi, sử dụng bộ dữ liệu BCI Competition IV 2a gồm dữ liệu EEG của 9 đối tượng với 22 điện cực đặt trên da đầu. Nghiên cứu được thực hiện trong phạm vi dữ liệu chuẩn quốc tế, nhằm cải thiện độ chính xác nhận dạng tín hiệu EEG vận động so với các mô hình hiện có. Ý nghĩa của nghiên cứu không chỉ nằm ở việc hỗ trợ người khuyết tật mà còn mở rộng ứng dụng trong y khoa, dự đoán trạng thái thần kinh và điều khiển rô-bốt.

Cơ sở lý thuyết và phương pháp nghiên cứu

Khung lý thuyết áp dụng

Luận văn dựa trên các lý thuyết và mô hình sau:

Mạng nơ-ron tích chập (Convolutional Neural Network - CNN): CNN được sử dụng để trích xuất đặc trưng không gian từ tín hiệu EEG, với các lớp convolution, pooling và fully connected. CNN giúp giảm số lượng tham số đầu vào trong khi vẫn giữ được đặc trưng quan trọng.
Mạng nơ-ron hồi quy dài ngắn hạn (Long Short-Term Memory - LSTM): LSTM là một dạng mạng hồi quy có khả năng ghi nhớ thông tin trong chuỗi thời gian dài, phù hợp để trích xuất đặc trưng thời gian của tín hiệu EEG.
Thuật toán Ngân hàng Bộ lọc Dạng Không gian Chung (Filter Bank Common Spatial Pattern - FBCSP): FBCSP được sử dụng để lọc và trích xuất các đặc trưng không gian phân biệt các lớp tín hiệu EEG vận động, giúp tăng hiệu quả phân loại.

Các khái niệm chính bao gồm: tín hiệu điện não đồ (EEG), phân loại đa lớp, mạng nơ-ron tích chập, mạng hồi quy LSTM, thuật toán FBCSP, và kỹ thuật tiền xử lý tín hiệu.

Phương pháp nghiên cứu

Nguồn dữ liệu chính là bộ dữ liệu BCI Competition IV 2a, gồm dữ liệu EEG của 9 đối tượng, mỗi đối tượng thực hiện 4 loại vận động (tay trái, tay phải, chân, lưỡi) trong 2 phiên, mỗi phiên có 288 lần thử nghiệm. Dữ liệu được thu thập qua hệ thống điện cực quốc tế 10-20 với 22 kênh.

Phương pháp phân tích gồm các bước:

Tiền xử lý dữ liệu EEG bằng ngân hàng bộ lọc Chebyshev loại II với 9 băng tần từ 4 Hz, bước nhảy 4 Hz.
Áp dụng thuật toán OVR-FBCSP để trích xuất đặc trưng không gian cho từng lớp vận động.
Xây dựng mô hình Hybrid Neural Network (HCNN) kết hợp 4 mô hình CNN đơn lớp (CNN_1) xử lý từng luồng dữ liệu, tiếp theo là mô hình CNN đa lớp (CNN_2) và mạng LSTM để trích xuất đặc trưng không gian và thời gian.
Lớp fully connected 3 tầng với hàm kích hoạt ReLU và softmax được sử dụng để phân loại tín hiệu thành 4 lớp vận động.

Cỡ mẫu gồm toàn bộ 9 đối tượng với tổng số mẫu thử nghiệm khoảng 5184 (2 phiên x 288 lần thử nghiệm x 9 đối tượng). Phương pháp chọn mẫu là sử dụng toàn bộ dữ liệu chuẩn quốc tế để đảm bảo tính khách quan và khả năng so sánh với các nghiên cứu khác. Phân tích được thực hiện bằng Python với thư viện PyTorch, sử dụng thuật toán Adam để tối ưu hóa mô hình.

Timeline nghiên cứu kéo dài trong năm 2022, bao gồm các giai đoạn thu thập dữ liệu, tiền xử lý, xây dựng mô hình, huấn luyện và đánh giá kết quả.

Kết quả nghiên cứu và thảo luận

Những phát hiện chính

Hiệu suất phân loại của mô hình HCNN đạt Weighted Average F1-score khoảng 85%, cao hơn khoảng 7% so với mô hình tham chiếu Multi-CNN Feature Fusion trên cùng bộ dữ liệu BCI Competition IV 2a.
Mô hình HCNN cải thiện đáng kể độ chính xác phân loại các lớp vận động tay trái và chân, với tỷ lệ chính xác lần lượt là 87% và 83%, so với mức trung bình 78% của các mô hình trước đó.
Việc kết hợp CNN và LSTM giúp trích xuất hiệu quả đặc trưng không gian và thời gian, làm tăng khả năng phân biệt các tín hiệu EEG vận động phức tạp.
Tiền xử lý bằng OVR-FBCSP và kỹ thuật tăng cường dữ liệu (data augmentation) giúp giảm nhiễu và cải thiện khả năng tổng quát hóa của mô hình, đặc biệt khi dữ liệu huấn luyện hạn chế.

Thảo luận kết quả

Nguyên nhân chính của sự cải thiện hiệu suất là do mô hình HCNN tận dụng đồng thời đặc trưng không gian và thời gian của tín hiệu EEG, trong khi các mô hình trước chủ yếu tập trung vào một trong hai miền này. Việc áp dụng OVR-FBCSP giúp lọc các băng tần tần số đặc trưng cho từng lớp vận động, giảm thiểu ảnh hưởng của nhiễu và tăng tính phân biệt.

So sánh với các nghiên cứu quốc tế, kết quả của luận văn tương đương hoặc vượt trội hơn các mô hình CNN đa cấp và kết hợp CNN-FBCSP đã được công bố, cho thấy tính khả thi và hiệu quả của phương pháp đề xuất. Kết quả có thể được trình bày qua biểu đồ so sánh độ chính xác và F1-score giữa các mô hình, cũng như bảng thống kê chi tiết hiệu suất phân loại từng lớp vận động.

Ý nghĩa của kết quả không chỉ giúp nâng cao hiệu quả phân loại tín hiệu EEG vận động mà còn mở rộng ứng dụng trong phát triển giao diện não-máy (BCI) hỗ trợ người khuyết tật vận động, góp phần cải thiện chất lượng cuộc sống và khả năng hòa nhập xã hội.

Đề xuất và khuyến nghị

Triển khai mô hình HCNN vào hệ thống BCI thực tế để hỗ trợ người khuyết tật vận động điều khiển thiết bị ngoại vi, với mục tiêu đạt độ chính xác trên 85% trong vòng 12 tháng, do các trung tâm nghiên cứu và phát triển công nghệ y sinh thực hiện.
Mở rộng bộ dữ liệu thu thập tín hiệu EEG với số lượng đối tượng lớn hơn và đa dạng hơn, nhằm nâng cao khả năng tổng quát hóa của mô hình, dự kiến hoàn thành trong 18 tháng, phối hợp giữa các viện nghiên cứu và bệnh viện.
Phát triển các thuật toán tiền xử lý và tăng cường dữ liệu nâng cao để giảm thiểu nhiễu và biến đổi tín hiệu EEG, giúp cải thiện độ ổn định của mô hình trong môi trường thực tế, thực hiện trong 12 tháng tiếp theo bởi nhóm nghiên cứu AI và xử lý tín hiệu.
Tích hợp mô hình HCNN với các thiết bị hỗ trợ vận động như xe lăn thông minh, chi giả điều khiển bằng sóng não, nhằm tạo ra sản phẩm công nghệ thân thiện và tiện dụng cho người dùng, với kế hoạch thử nghiệm trong 24 tháng, do các công ty công nghệ y tế và trung tâm nghiên cứu phối hợp thực hiện.

Đối tượng nên tham khảo luận văn

Nhà nghiên cứu và sinh viên ngành khoa học máy tính, trí tuệ nhân tạo và học máy: Luận văn cung cấp kiến thức chuyên sâu về ứng dụng mạng nơ-ron tích chập và LSTM trong xử lý tín hiệu EEG, giúp phát triển các mô hình học sâu cho bài toán phân loại đa lớp.
Chuyên gia và kỹ sư phát triển hệ thống giao diện não-máy (BCI): Nghiên cứu cung cấp phương pháp và mô hình mới để cải thiện độ chính xác nhận dạng tín hiệu vận động, hỗ trợ phát triển các thiết bị điều khiển bằng sóng não.
Bác sĩ và nhà khoa học y sinh: Luận văn giúp hiểu rõ hơn về kỹ thuật phân tích tín hiệu EEG vận động, có thể ứng dụng trong chẩn đoán và điều trị các bệnh liên quan đến thần kinh và vận động.
Doanh nghiệp công nghệ y tế và thiết bị hỗ trợ người khuyết tật: Nghiên cứu cung cấp cơ sở khoa học để phát triển các sản phẩm công nghệ hỗ trợ vận động thông minh, nâng cao chất lượng cuộc sống cho người khuyết tật.

Câu hỏi thường gặp

Mô hình HCNN có thể áp dụng cho các loại tín hiệu EEG khác ngoài vận động không?
Mô hình có thể được điều chỉnh để xử lý các tín hiệu EEG khác như nhận dạng cảm xúc hoặc giấc ngủ, tuy nhiên cần huấn luyện lại với dữ liệu phù hợp để đảm bảo hiệu quả.
Tại sao lại kết hợp CNN và LSTM trong mô hình?
CNN trích xuất đặc trưng không gian hiệu quả, trong khi LSTM xử lý tốt các chuỗi thời gian, sự kết hợp giúp mô hình nắm bắt đầy đủ đặc trưng không gian-thời gian của tín hiệu EEG.
Bộ dữ liệu BCI Competition IV 2a có giới hạn gì không?
Bộ dữ liệu có số lượng đối tượng hạn chế (9 người) và được thu thập năm 2008, do đó có thể không phản ánh đầy đủ sự đa dạng tín hiệu EEG trong thực tế hiện nay.
Các kỹ thuật tiền xử lý nào được sử dụng để giảm nhiễu tín hiệu EEG?
Nghiên cứu sử dụng ngân hàng bộ lọc Chebyshev loại II, kỹ thuật khử nhiễu như Uniform-Noise, Random Frequency Shift và chuẩn hóa dữ liệu để cải thiện chất lượng tín hiệu đầu vào.
Mô hình có thể ứng dụng thực tế trong bao lâu?
Với kết quả hiện tại, mô hình có thể được tích hợp thử nghiệm trong các thiết bị hỗ trợ người khuyết tật trong vòng 1-2 năm, tùy thuộc vào việc mở rộng dữ liệu và tối ưu hóa hệ thống.

Kết luận

Luận văn đã xây dựng thành công mô hình Hybrid Neural Network (HCNN) kết hợp CNN và LSTM để phân loại tín hiệu EEG vận động với độ chính xác cải thiện khoảng 7% so với mô hình tham chiếu.
Phương pháp tiền xử lý OVR-FBCSP và kỹ thuật tăng cường dữ liệu giúp giảm nhiễu và nâng cao hiệu quả trích xuất đặc trưng.
Kết quả nghiên cứu có ý nghĩa quan trọng trong phát triển giao diện não-máy hỗ trợ người khuyết tật vận động và ứng dụng trong y khoa.
Đề xuất mở rộng dữ liệu và tích hợp mô hình vào thiết bị thực tế nhằm nâng cao chất lượng cuộc sống cho người dùng.
Các bước tiếp theo bao gồm thu thập dữ liệu đa dạng hơn, tối ưu mô hình và thử nghiệm ứng dụng thực tế; các nhà nghiên cứu và doanh nghiệp công nghệ y tế được khuyến khích hợp tác phát triển.

Tài liệu "Nghiên Cứu Ứng Dụng Mạng No-Ron Trong Phân Loại Vận Động Qua Điện Não Đồ" khám phá cách mà mạng nơ ron có thể được áp dụng để phân loại các hoạt động vận động thông qua tín hiệu điện não đồ (EEG). Nghiên cứu này không chỉ cung cấp cái nhìn sâu sắc về công nghệ mạng nơ ron mà còn mở ra những cơ hội mới trong việc phát triển các ứng dụng y tế và công nghệ hỗ trợ cho người khuyết tật.

Độc giả sẽ tìm thấy nhiều lợi ích từ tài liệu này, bao gồm việc hiểu rõ hơn về cách mà các mô hình học máy có thể cải thiện khả năng phân tích và nhận diện các mẫu hoạt động não, từ đó nâng cao chất lượng cuộc sống cho những người cần hỗ trợ.

Nếu bạn muốn tìm hiểu thêm về các ứng dụng của mạng nơ ron trong các lĩnh vực khác, hãy tham khảo tài liệu Ứng dụng mạng nơ ron trong nhận dạng và điều khiển, nơi bạn sẽ thấy cách mà công nghệ này được áp dụng trong nhận diện và điều khiển. Ngoài ra, tài liệu Luận văn thạc sĩ hcmute dự báo phụ tải cho tỉnh kiên giang sử dụng neural network cũng sẽ cung cấp cho bạn cái nhìn về việc dự báo và phân tích dữ liệu bằng mạng nơ ron. Những tài liệu này sẽ giúp bạn mở rộng kiến thức và khám phá thêm nhiều khía cạnh thú vị của công nghệ mạng nơ ron.

#điện não đồ

#phân tích tín hiệu não

#học sâu trong y học

#ứng dụng mạng nơ-ron

#phân loại vận động

#tích chập trong học máy

Chủ đề

Ứng dụng trong y học

Công nghệ mạng nơ-ron

phân loại tín hiệu sinh học

học máy và điện não đồ