Tổng quan nghiên cứu
Theo thống kê của Ủy ban Quốc gia về người khuyết tật Việt Nam, cả nước có khoảng 6,2 triệu người khuyết tật, chiếm 7,06% dân số từ 2 tuổi trở lên, trong đó 58% là nữ, 28,3% là trẻ em và gần 29% là người khuyết tật nặng và đặc biệt nặng. Nhiều người khuyết tật vận động có thể tự chăm sóc bản thân nếu được hỗ trợ bằng các công cụ như xe lăn hay chi giả. Tuy nhiên, việc điều khiển các thiết bị hỗ trợ này còn nhiều hạn chế do thiếu các phương thức tương tác hiệu quả. Luận văn thạc sĩ này tập trung xây dựng mô hình mạng nơ-ron tích chập (CNN) kết hợp với các kỹ thuật học sâu để phân loại tín hiệu điện não đồ (EEG) vận động, nhằm tạo tiền đề phát triển các công cụ hỗ trợ người khuyết tật vận động có thể điều khiển thiết bị thông qua sóng não.
Mục tiêu cụ thể của nghiên cứu là thiết kế mô hình phân loại các tín hiệu EEG vận động liên quan đến tay trái, tay phải, chân và lưỡi, sử dụng bộ dữ liệu BCI Competition IV 2a gồm dữ liệu EEG của 9 đối tượng với 22 điện cực đặt trên da đầu. Nghiên cứu được thực hiện trong phạm vi dữ liệu chuẩn quốc tế, nhằm cải thiện độ chính xác nhận dạng tín hiệu EEG vận động so với các mô hình hiện có. Ý nghĩa của nghiên cứu không chỉ nằm ở việc hỗ trợ người khuyết tật mà còn mở rộng ứng dụng trong y khoa, dự đoán trạng thái thần kinh và điều khiển rô-bốt.
Cơ sở lý thuyết và phương pháp nghiên cứu
Khung lý thuyết áp dụng
Luận văn dựa trên các lý thuyết và mô hình sau:
Mạng nơ-ron tích chập (Convolutional Neural Network - CNN): CNN được sử dụng để trích xuất đặc trưng không gian từ tín hiệu EEG, với các lớp convolution, pooling và fully connected. CNN giúp giảm số lượng tham số đầu vào trong khi vẫn giữ được đặc trưng quan trọng.
Mạng nơ-ron hồi quy dài ngắn hạn (Long Short-Term Memory - LSTM): LSTM là một dạng mạng hồi quy có khả năng ghi nhớ thông tin trong chuỗi thời gian dài, phù hợp để trích xuất đặc trưng thời gian của tín hiệu EEG.
Thuật toán Ngân hàng Bộ lọc Dạng Không gian Chung (Filter Bank Common Spatial Pattern - FBCSP): FBCSP được sử dụng để lọc và trích xuất các đặc trưng không gian phân biệt các lớp tín hiệu EEG vận động, giúp tăng hiệu quả phân loại.
Các khái niệm chính bao gồm: tín hiệu điện não đồ (EEG), phân loại đa lớp, mạng nơ-ron tích chập, mạng hồi quy LSTM, thuật toán FBCSP, và kỹ thuật tiền xử lý tín hiệu.
Phương pháp nghiên cứu
Nguồn dữ liệu chính là bộ dữ liệu BCI Competition IV 2a, gồm dữ liệu EEG của 9 đối tượng, mỗi đối tượng thực hiện 4 loại vận động (tay trái, tay phải, chân, lưỡi) trong 2 phiên, mỗi phiên có 288 lần thử nghiệm. Dữ liệu được thu thập qua hệ thống điện cực quốc tế 10-20 với 22 kênh.
Phương pháp phân tích gồm các bước:
Tiền xử lý dữ liệu EEG bằng ngân hàng bộ lọc Chebyshev loại II với 9 băng tần từ 4 Hz, bước nhảy 4 Hz.
Áp dụng thuật toán OVR-FBCSP để trích xuất đặc trưng không gian cho từng lớp vận động.
Xây dựng mô hình Hybrid Neural Network (HCNN) kết hợp 4 mô hình CNN đơn lớp (CNN_1) xử lý từng luồng dữ liệu, tiếp theo là mô hình CNN đa lớp (CNN_2) và mạng LSTM để trích xuất đặc trưng không gian và thời gian.
Lớp fully connected 3 tầng với hàm kích hoạt ReLU và softmax được sử dụng để phân loại tín hiệu thành 4 lớp vận động.
Cỡ mẫu gồm toàn bộ 9 đối tượng với tổng số mẫu thử nghiệm khoảng 5184 (2 phiên x 288 lần thử nghiệm x 9 đối tượng). Phương pháp chọn mẫu là sử dụng toàn bộ dữ liệu chuẩn quốc tế để đảm bảo tính khách quan và khả năng so sánh với các nghiên cứu khác. Phân tích được thực hiện bằng Python với thư viện PyTorch, sử dụng thuật toán Adam để tối ưu hóa mô hình.
Timeline nghiên cứu kéo dài trong năm 2022, bao gồm các giai đoạn thu thập dữ liệu, tiền xử lý, xây dựng mô hình, huấn luyện và đánh giá kết quả.
Kết quả nghiên cứu và thảo luận
Những phát hiện chính
Hiệu suất phân loại của mô hình HCNN đạt Weighted Average F1-score khoảng 85%, cao hơn khoảng 7% so với mô hình tham chiếu Multi-CNN Feature Fusion trên cùng bộ dữ liệu BCI Competition IV 2a.
Mô hình HCNN cải thiện đáng kể độ chính xác phân loại các lớp vận động tay trái và chân, với tỷ lệ chính xác lần lượt là 87% và 83%, so với mức trung bình 78% của các mô hình trước đó.
Việc kết hợp CNN và LSTM giúp trích xuất hiệu quả đặc trưng không gian và thời gian, làm tăng khả năng phân biệt các tín hiệu EEG vận động phức tạp.
Tiền xử lý bằng OVR-FBCSP và kỹ thuật tăng cường dữ liệu (data augmentation) giúp giảm nhiễu và cải thiện khả năng tổng quát hóa của mô hình, đặc biệt khi dữ liệu huấn luyện hạn chế.
Thảo luận kết quả
Nguyên nhân chính của sự cải thiện hiệu suất là do mô hình HCNN tận dụng đồng thời đặc trưng không gian và thời gian của tín hiệu EEG, trong khi các mô hình trước chủ yếu tập trung vào một trong hai miền này. Việc áp dụng OVR-FBCSP giúp lọc các băng tần tần số đặc trưng cho từng lớp vận động, giảm thiểu ảnh hưởng của nhiễu và tăng tính phân biệt.
So sánh với các nghiên cứu quốc tế, kết quả của luận văn tương đương hoặc vượt trội hơn các mô hình CNN đa cấp và kết hợp CNN-FBCSP đã được công bố, cho thấy tính khả thi và hiệu quả của phương pháp đề xuất. Kết quả có thể được trình bày qua biểu đồ so sánh độ chính xác và F1-score giữa các mô hình, cũng như bảng thống kê chi tiết hiệu suất phân loại từng lớp vận động.
Ý nghĩa của kết quả không chỉ giúp nâng cao hiệu quả phân loại tín hiệu EEG vận động mà còn mở rộng ứng dụng trong phát triển giao diện não-máy (BCI) hỗ trợ người khuyết tật vận động, góp phần cải thiện chất lượng cuộc sống và khả năng hòa nhập xã hội.
Đề xuất và khuyến nghị
Triển khai mô hình HCNN vào hệ thống BCI thực tế để hỗ trợ người khuyết tật vận động điều khiển thiết bị ngoại vi, với mục tiêu đạt độ chính xác trên 85% trong vòng 12 tháng, do các trung tâm nghiên cứu và phát triển công nghệ y sinh thực hiện.
Mở rộng bộ dữ liệu thu thập tín hiệu EEG với số lượng đối tượng lớn hơn và đa dạng hơn, nhằm nâng cao khả năng tổng quát hóa của mô hình, dự kiến hoàn thành trong 18 tháng, phối hợp giữa các viện nghiên cứu và bệnh viện.
Phát triển các thuật toán tiền xử lý và tăng cường dữ liệu nâng cao để giảm thiểu nhiễu và biến đổi tín hiệu EEG, giúp cải thiện độ ổn định của mô hình trong môi trường thực tế, thực hiện trong 12 tháng tiếp theo bởi nhóm nghiên cứu AI và xử lý tín hiệu.
Tích hợp mô hình HCNN với các thiết bị hỗ trợ vận động như xe lăn thông minh, chi giả điều khiển bằng sóng não, nhằm tạo ra sản phẩm công nghệ thân thiện và tiện dụng cho người dùng, với kế hoạch thử nghiệm trong 24 tháng, do các công ty công nghệ y tế và trung tâm nghiên cứu phối hợp thực hiện.
Đối tượng nên tham khảo luận văn
Nhà nghiên cứu và sinh viên ngành khoa học máy tính, trí tuệ nhân tạo và học máy: Luận văn cung cấp kiến thức chuyên sâu về ứng dụng mạng nơ-ron tích chập và LSTM trong xử lý tín hiệu EEG, giúp phát triển các mô hình học sâu cho bài toán phân loại đa lớp.
Chuyên gia và kỹ sư phát triển hệ thống giao diện não-máy (BCI): Nghiên cứu cung cấp phương pháp và mô hình mới để cải thiện độ chính xác nhận dạng tín hiệu vận động, hỗ trợ phát triển các thiết bị điều khiển bằng sóng não.
Bác sĩ và nhà khoa học y sinh: Luận văn giúp hiểu rõ hơn về kỹ thuật phân tích tín hiệu EEG vận động, có thể ứng dụng trong chẩn đoán và điều trị các bệnh liên quan đến thần kinh và vận động.
Doanh nghiệp công nghệ y tế và thiết bị hỗ trợ người khuyết tật: Nghiên cứu cung cấp cơ sở khoa học để phát triển các sản phẩm công nghệ hỗ trợ vận động thông minh, nâng cao chất lượng cuộc sống cho người khuyết tật.
Câu hỏi thường gặp
Mô hình HCNN có thể áp dụng cho các loại tín hiệu EEG khác ngoài vận động không?
Mô hình có thể được điều chỉnh để xử lý các tín hiệu EEG khác như nhận dạng cảm xúc hoặc giấc ngủ, tuy nhiên cần huấn luyện lại với dữ liệu phù hợp để đảm bảo hiệu quả.Tại sao lại kết hợp CNN và LSTM trong mô hình?
CNN trích xuất đặc trưng không gian hiệu quả, trong khi LSTM xử lý tốt các chuỗi thời gian, sự kết hợp giúp mô hình nắm bắt đầy đủ đặc trưng không gian-thời gian của tín hiệu EEG.Bộ dữ liệu BCI Competition IV 2a có giới hạn gì không?
Bộ dữ liệu có số lượng đối tượng hạn chế (9 người) và được thu thập năm 2008, do đó có thể không phản ánh đầy đủ sự đa dạng tín hiệu EEG trong thực tế hiện nay.Các kỹ thuật tiền xử lý nào được sử dụng để giảm nhiễu tín hiệu EEG?
Nghiên cứu sử dụng ngân hàng bộ lọc Chebyshev loại II, kỹ thuật khử nhiễu như Uniform-Noise, Random Frequency Shift và chuẩn hóa dữ liệu để cải thiện chất lượng tín hiệu đầu vào.Mô hình có thể ứng dụng thực tế trong bao lâu?
Với kết quả hiện tại, mô hình có thể được tích hợp thử nghiệm trong các thiết bị hỗ trợ người khuyết tật trong vòng 1-2 năm, tùy thuộc vào việc mở rộng dữ liệu và tối ưu hóa hệ thống.
Kết luận
- Luận văn đã xây dựng thành công mô hình Hybrid Neural Network (HCNN) kết hợp CNN và LSTM để phân loại tín hiệu EEG vận động với độ chính xác cải thiện khoảng 7% so với mô hình tham chiếu.
- Phương pháp tiền xử lý OVR-FBCSP và kỹ thuật tăng cường dữ liệu giúp giảm nhiễu và nâng cao hiệu quả trích xuất đặc trưng.
- Kết quả nghiên cứu có ý nghĩa quan trọng trong phát triển giao diện não-máy hỗ trợ người khuyết tật vận động và ứng dụng trong y khoa.
- Đề xuất mở rộng dữ liệu và tích hợp mô hình vào thiết bị thực tế nhằm nâng cao chất lượng cuộc sống cho người dùng.
- Các bước tiếp theo bao gồm thu thập dữ liệu đa dạng hơn, tối ưu mô hình và thử nghiệm ứng dụng thực tế; các nhà nghiên cứu và doanh nghiệp công nghệ y tế được khuyến khích hợp tác phát triển.