Tổng quan nghiên cứu
Trong những thập kỷ gần đây, lĩnh vực giao tiếp não - máy (Brain-Computer Interface - BCI) đã có nhiều bước tiến vượt bậc, đặc biệt trong việc chẩn đoán và phục hồi chức năng cho người khuyết tật. Một trong những kỹ thuật đo tín hiệu não không xâm nhập được ứng dụng phổ biến là quang phổ cận hồng ngoại chức năng (functional Near-Infrared Spectroscopy - fNIRS). Kỹ thuật này đo sự thay đổi nồng độ oxy-hemoglobin (oxy-Hb) và deoxy-hemoglobin (deoxy-Hb) trên bề mặt não, phản ánh hoạt động huyết động của các vùng não tương ứng.
Luận văn tập trung nghiên cứu nhận dạng hoạt động gõ tay trái hoặc tay phải dựa trên tín hiệu fNIRS thu thập từ vùng điều khiển chuyển động (motor cortex) của não người. Mục tiêu chính là xây dựng giải thuật phân tích và nhận dạng chính xác hoạt động gõ tay thông qua xử lý tín hiệu và mô hình học máy. Dữ liệu được thu thập từ 3 chủ thể thuận tay phải, với giao thức thí nghiệm gồm các chu kỳ nghỉ và gõ tay xen kẽ, sử dụng thiết bị FOIRE-3000 của Shimadzu tại Đại học Quốc tế, TP. Hồ Chí Minh.
Nghiên cứu có ý nghĩa quan trọng trong việc phát triển các hệ thống BCI không xâm nhập, hỗ trợ giao tiếp và phục hồi chức năng vận động cho người khuyết tật. Độ chính xác nhận dạng hoạt động gõ tay được kỳ vọng cải thiện qua việc áp dụng bộ lọc Savitzky-Golay, hồi quy đa thức để trích đặc trưng, kết hợp với các thuật toán nhận dạng như Support Vector Machine (SVM) và mạng nơ-ron nhân tạo (ANN). Phạm vi nghiên cứu giới hạn trong xử lý dữ liệu offline, tập trung trên vùng motor cortex, với dữ liệu thu thập trong năm 2012 tại TP. Hồ Chí Minh.
Cơ sở lý thuyết và phương pháp nghiên cứu
Khung lý thuyết áp dụng
Nghiên cứu dựa trên ba nền tảng lý thuyết chính:
Kỹ thuật fNIRS: Sử dụng ánh sáng cận hồng ngoại (650-950 nm) để đo sự thay đổi oxy-Hb và deoxy-Hb trong não, dựa trên phổ hấp thụ của hemoglobin và luật Beer-Lambert. Tín hiệu fNIRS phản ánh hoạt động huyết động não, đặc biệt tại vùng motor cortex khi thực hiện các hoạt động vận động như gõ tay.
Bộ lọc Savitzky-Golay: Là bộ lọc làm phẳng tín hiệu theo đa thức bậc d trên cửa sổ mẫu N, giúp loại bỏ nhiễu và artifacts trong tín hiệu fNIRS mà vẫn giữ được đặc trưng hình dạng tín hiệu. Bộ lọc này được thiết kế tối ưu theo phương pháp bình phương tối thiểu, cho phép làm mượt dữ liệu mà không làm mất thông tin quan trọng.
Giải thuật hồi quy đa thức và mô hình học máy: Hồi quy đa thức được sử dụng để trích xuất các hệ số đặc trưng từ tín hiệu đã lọc, phản ánh sự thay đổi nồng độ oxy-Hb trong quá trình gõ tay. Các hệ số này làm đầu vào cho các thuật toán nhận dạng:
- Support Vector Machine (SVM): Thuật toán phân loại dựa trên siêu phẳng tối ưu, phân biệt hai lớp dữ liệu (gõ tay trái và phải) dựa trên đặc trưng hồi quy.
- Mạng nơ-ron nhân tạo (ANN): Mạng lan truyền ngược 3 lớp được sử dụng để huấn luyện và nhận dạng hoạt động gõ tay, so sánh hiệu quả với SVM.
Các khái niệm chính bao gồm: oxy-Hb, deoxy-Hb, bộ lọc Savitzky-Golay, hồi quy đa thức, siêu phẳng SVM, mạng nơ-ron lan truyền ngược.
Phương pháp nghiên cứu
Nguồn dữ liệu: Dữ liệu fNIRS được thu thập từ 3 chủ thể nam, tuổi trung bình khoảng 23 tuổi, thuận tay phải. Tín hiệu oxy-Hb được đo trên 20 kênh tại vùng motor cortex hai bán cầu não bằng thiết bị FOIRE-3000 (Shimadzu, Nhật Bản) với bước sóng 780 nm, 805 nm và 830 nm. Trong đó, 8 kênh (4 kênh mỗi bán cầu) được chọn để phân tích do độ tin cậy cao.
Phương pháp thu thập: Chủ thể thực hiện gõ tay trái và phải theo giao thức gồm 20 giây nghỉ, 20 giây gõ tay, 20 giây nghỉ, lặp lại nhiều lần. Tín hiệu được ghi lại với chu kỳ lấy mẫu phù hợp, lưu dưới dạng file text để xử lý.
Tiền xử lý dữ liệu: Áp dụng bộ lọc Savitzky-Golay với cửa sổ lọc N=11 và đa thức bậc 3 để loại bỏ nhiễu và artifacts, làm mượt tín hiệu oxy-Hb mà vẫn giữ được đặc trưng sinh lý.
Trích đặc trưng: Sử dụng hồi quy đa thức để tính các hệ số hồi quy từ tín hiệu đã lọc, các hệ số này biểu diễn sự thay đổi nồng độ oxy-Hb trong quá trình gõ tay.
Phân loại và nhận dạng: Huấn luyện và kiểm thử mô hình SVM và ANN với các đặc trưng hồi quy để phân biệt hoạt động gõ tay trái và phải. Phương pháp kiểm tra chéo được sử dụng để đánh giá độ chính xác.
Timeline nghiên cứu: Thu thập dữ liệu và tiền xử lý trong giai đoạn đầu, tiếp theo là trích đặc trưng và xây dựng mô hình nhận dạng, cuối cùng là đánh giá kết quả trên các chủ thể tham gia.
Kết quả nghiên cứu và thảo luận
Những phát hiện chính
Hiệu quả của bộ lọc Savitzky-Golay: Bộ lọc với cửa sổ 11 mẫu và đa thức bậc 3 đã loại bỏ hiệu quả các gai nhiễu (artifacts) trong tín hiệu fNIRS, làm mượt đường cong oxy-Hb mà không làm mất các đặc trưng sinh lý quan trọng. Tín hiệu sau lọc thể hiện rõ sự tăng giảm oxy-Hb theo chu kỳ gõ tay, phù hợp với lý thuyết huyết động não.
Đặc trưng hồi quy đa thức phân biệt gõ tay trái và phải: Các hệ số hồi quy đa thức trích từ tín hiệu oxy-Hb cho thấy sự khác biệt rõ ràng giữa hoạt động gõ tay trái và phải trên các kênh não trái và phải. Ví dụ, hệ số góc hồi quy trên não trái khi gõ tay trái lớn hơn khi gõ tay phải, và ngược lại trên não phải, phản ánh sự chi phối vận động của bán cầu não đối diện.
Độ chính xác nhận dạng với SVM và ANN:
- Thuật toán PR-SVM đạt độ chính xác trung bình khoảng 85-90% trên 3 chủ thể trong việc phân biệt gõ tay trái và phải.
- Mạng nơ-ron nhân tạo PR-ANN cũng cho kết quả tương tự, với độ chính xác trung bình khoảng 83-88%.
- Kết quả cho thấy SVM có phần nhỉnh hơn về độ chính xác và ổn định.
So sánh với các nghiên cứu khác: Kết quả phù hợp với các báo cáo trong ngành về việc sử dụng fNIRS và các thuật toán học máy để nhận dạng hoạt động vận động. Việc kết hợp hồi quy đa thức với SVM và ANN là một hướng tiếp cận hiệu quả, khắc phục hạn chế của các phương pháp chỉ dùng hồi quy tuyến tính hoặc xử lý tín hiệu thô.
Thảo luận kết quả
Nguyên nhân chính của hiệu quả nhận dạng là do việc áp dụng bộ lọc Savitzky-Golay giúp loại bỏ nhiễu và artifacts, làm rõ đặc trưng sinh lý trong tín hiệu oxy-Hb. Việc trích đặc trưng bằng hồi quy đa thức cho phép mô hình hóa chính xác sự biến đổi tín hiệu theo thời gian, từ đó cung cấp dữ liệu đầu vào chất lượng cho các thuật toán phân loại.
So với các nghiên cứu sử dụng hồi quy tuyến tính đơn giản hoặc xử lý tín hiệu thô, phương pháp này giảm thiểu sự biến thiên của hệ số đặc trưng giữa các lần gõ tay, nâng cao độ tin cậy nhận dạng. SVM thể hiện ưu thế nhờ khả năng tìm siêu phẳng tối ưu phân tách hai lớp dữ liệu, trong khi ANN cung cấp khả năng học phi tuyến nhưng đòi hỏi cấu trúc mạng và tham số được tối ưu kỹ lưỡng.
Dữ liệu có thể được trình bày qua biểu đồ so sánh độ chính xác của hai thuật toán trên từng chủ thể, cũng như bảng thống kê các hệ số hồi quy đặc trưng trên các kênh não trái và phải trong các lần gõ tay. Điều này giúp minh họa rõ ràng sự khác biệt đặc trưng và hiệu quả phân loại.
Đề xuất và khuyến nghị
Mở rộng quy mô nghiên cứu: Tăng số lượng chủ thể tham gia, bao gồm cả người thuận tay trái và người có các đặc điểm vận động khác để nâng cao tính tổng quát của giải thuật. Thời gian thực hiện: 6-12 tháng, chủ thể thực hiện: nhóm nghiên cứu tại các trung tâm y sinh.
Phát triển hệ thống nhận dạng thời gian thực: Áp dụng giải thuật đã xây dựng vào hệ thống BCI thời gian thực, tích hợp với thiết bị fNIRS để hỗ trợ giao tiếp và phục hồi chức năng vận động. Mục tiêu cải thiện độ trễ và độ chính xác nhận dạng trên 90%. Thời gian thực hiện: 12 tháng, chủ thể thực hiện: nhóm kỹ thuật và phát triển phần mềm.
Tối ưu hóa bộ lọc và trích đặc trưng: Nghiên cứu các bộ lọc nâng cao hơn hoặc kết hợp nhiều phương pháp xử lý tín hiệu để tăng cường loại bỏ nhiễu mà vẫn giữ được đặc trưng sinh lý. Thời gian thực hiện: 6 tháng, chủ thể thực hiện: nhóm xử lý tín hiệu.
So sánh và kết hợp các mô hình học máy khác: Thử nghiệm các mô hình học sâu (deep learning), mô hình Markov ẩn (HMM) hoặc các thuật toán ensemble để nâng cao độ chính xác và khả năng thích ứng với dữ liệu đa dạng. Thời gian thực hiện: 9 tháng, chủ thể thực hiện: nhóm trí tuệ nhân tạo.
Đối tượng nên tham khảo luận văn
Nhà nghiên cứu và sinh viên ngành kỹ thuật điện tử, y sinh: Nghiên cứu về xử lý tín hiệu sinh học, phát triển hệ thống BCI, ứng dụng kỹ thuật fNIRS trong y học và công nghệ.
Chuyên gia phát triển công nghệ phục hồi chức năng: Áp dụng giải thuật nhận dạng hoạt động vận động để thiết kế các thiết bị hỗ trợ người khuyết tật, cải thiện giao tiếp và vận động.
Bác sĩ và nhà khoa học thần kinh: Hiểu rõ hơn về mối liên hệ giữa hoạt động huyết động não và vận động tay, hỗ trợ chẩn đoán và theo dõi điều trị các bệnh lý thần kinh.
Nhà phát triển phần mềm và kỹ sư AI: Tham khảo phương pháp trích đặc trưng và mô hình học máy trong xử lý tín hiệu não, phát triển các ứng dụng trí tuệ nhân tạo trong lĩnh vực y tế.
Câu hỏi thường gặp
fNIRS là gì và tại sao được chọn trong nghiên cứu này?
fNIRS là kỹ thuật đo tín hiệu não không xâm nhập dựa trên ánh sáng cận hồng ngoại, phản ánh sự thay đổi oxy-Hb và deoxy-Hb. Ưu điểm là an toàn, chi phí thấp và dễ sử dụng so với MRI hay EEG, phù hợp cho nghiên cứu nhận dạng hoạt động vận động.Bộ lọc Savitzky-Golay có vai trò gì trong xử lý tín hiệu?
Bộ lọc này làm mượt tín hiệu bằng cách áp dụng hồi quy đa thức trên cửa sổ mẫu, giúp loại bỏ nhiễu và artifacts mà không làm mất đặc trưng sinh lý quan trọng, từ đó nâng cao chất lượng dữ liệu đầu vào cho mô hình nhận dạng.Tại sao sử dụng hồi quy đa thức để trích đặc trưng?
Hồi quy đa thức mô hình hóa chính xác sự biến đổi tín hiệu theo thời gian, cung cấp các hệ số đặc trưng phản ánh đặc điểm sinh lý của hoạt động gõ tay, giúp phân biệt hiệu quả giữa tay trái và tay phải.SVM và ANN khác nhau thế nào trong nhận dạng?
SVM tìm siêu phẳng tối ưu phân tách dữ liệu hai lớp, thường cho kết quả ổn định và dễ huấn luyện với dữ liệu kích thước vừa phải. ANN có khả năng học phi tuyến phức tạp hơn nhưng đòi hỏi cấu trúc mạng và tham số được tối ưu kỹ, có thể phù hợp với dữ liệu lớn và đa dạng.Giải pháp này có thể áp dụng cho các hoạt động vận động khác không?
Có thể, với việc điều chỉnh giao thức thu thập dữ liệu và huấn luyện lại mô hình, phương pháp này có tiềm năng nhận dạng các hoạt động vận động khác dựa trên tín hiệu fNIRS, mở rộng ứng dụng trong phục hồi chức năng và giao tiếp não - máy.
Kết luận
- Đã xây dựng thành công giải thuật nhận dạng hoạt động gõ tay trái và phải dựa trên tín hiệu fNIRS, kết hợp bộ lọc Savitzky-Golay, hồi quy đa thức và mô hình SVM, ANN.
- Bộ lọc Savitzky-Golay với cửa sổ 11 mẫu và đa thức bậc 3 hiệu quả trong việc loại bỏ nhiễu và giữ đặc trưng sinh lý.
- Đặc trưng hồi quy đa thức phản ánh rõ sự khác biệt hoạt động giữa hai tay, làm đầu vào chất lượng cho mô hình nhận dạng.
- Thuật toán PR-SVM đạt độ chính xác nhận dạng trung bình trên 85%, vượt trội so với ANN trong nghiên cứu này.
- Hướng phát triển tiếp theo là mở rộng quy mô, phát triển hệ thống nhận dạng thời gian thực và áp dụng các mô hình học máy tiên tiến hơn.
Để tiếp tục nghiên cứu và ứng dụng, các nhà khoa học và kỹ sư được khuyến khích triển khai thử nghiệm trên nhiều đối tượng hơn, tối ưu hóa thuật toán và tích hợp vào các thiết bị hỗ trợ phục hồi chức năng. Hành động tiếp theo là xây dựng hệ thống demo thời gian thực và đánh giá hiệu quả trong môi trường thực tế.