Tổng quan nghiên cứu
Rối loạn suy giảm thần kinh vận động là nhóm bệnh lý ảnh hưởng nghiêm trọng đến khả năng kiểm soát các cơ mặt, lưỡi, thân và chi, gây khó khăn trong sinh hoạt hàng ngày của người bệnh. Tại Hoa Kỳ, theo Hiệp hội Chấn thương Tuỷ sống, hiện có khoảng 450,000 người mắc chấn thương tuỷ sống (SCI), với trung bình 17,000 ca mới mỗi năm, gây tổn thất kinh tế lên đến 9,7 triệu USD. Tại Việt Nam, từ năm 2020 đến 2024, đã ghi nhận hơn 10,000 vụ tai nạn giao thông, dẫn đến hơn 5,000 người tử vong và hơn 7,000 người bị thương, trong đó nhiều trường hợp liên quan đến tổn thương tuỷ sống. Việc chẩn đoán chính xác và kịp thời các bệnh rối loạn suy giảm thần kinh vận động như đa xơ cứng (MS) và chấn thương tuỷ sống là rất cần thiết để đưa ra phác đồ điều trị phù hợp, giảm thiểu chi phí và nâng cao chất lượng cuộc sống người bệnh.
Mục tiêu nghiên cứu tập trung vào việc xây dựng hệ thống hỗ trợ chẩn đoán rối loạn suy giảm thần kinh vận động dựa trên tín hiệu điện não đồ (EEG) sử dụng các mô hình mạng nơ-ron tích chập (CNN) như LeNet và AlexNet. Nghiên cứu khai thác dữ liệu EEG thu thập từ trường Đại học Bang Colorado, phân tích tín hiệu bằng các phương pháp biến đổi tần số-thời gian như Short-Time Fourier Transform (STFT) và Wavelet Transform (WT), nhằm trích xuất đặc trưng phục vụ cho việc phân loại bệnh. Phạm vi nghiên cứu bao gồm xử lý tín hiệu EEG, xây dựng và đánh giá mô hình CNN trên dữ liệu thực nghiệm với 13 đối tượng, trong đó có người bình thường và người mắc bệnh.
Ý nghĩa nghiên cứu không chỉ góp phần nâng cao độ chính xác và hiệu quả chẩn đoán bệnh rối loạn thần kinh vận động mà còn giảm thiểu chi phí xét nghiệm, đặc biệt trong bối cảnh thiết bị MRI đắt đỏ và hạn chế tại nhiều cơ sở y tế. Kết quả nghiên cứu có thể ứng dụng trong các hệ thống y tế thông minh, hỗ trợ bác sĩ trong quá trình chẩn đoán và điều trị.
Cơ sở lý thuyết và phương pháp nghiên cứu
Khung lý thuyết áp dụng
Nghiên cứu dựa trên các lý thuyết và mô hình sau:
Bệnh rối loạn suy giảm thần kinh vận động: Bao gồm các bệnh như đa xơ cứng (MS) và chấn thương tuỷ sống (SCI), với cơ chế tổn thương bao myelin và dây thần kinh dẫn đến suy giảm chức năng vận động.
Phân tích tín hiệu EEG: Sử dụng các phương pháp biến đổi tín hiệu trong miền tần số-thời gian như Short-Time Fourier Transform (STFT) và Wavelet Transform (WT) để chuyển đổi tín hiệu EEG dạng chuỗi thời gian thành hình ảnh đặc trưng (Spectrogram và Scalogram). STFT thích hợp với tín hiệu dạng sóng sin, trong khi WT linh hoạt hơn với tín hiệu không đồng bộ và nhất thời.
Mạng nơ-ron tích chập (CNN): Mô hình học sâu được sử dụng để phân loại hình ảnh đặc trưng từ tín hiệu EEG. Hai kiến trúc chính được áp dụng là:
- LeNet: Mạng CNN cổ điển với các lớp convolution, pooling, fully connected và softmax, phù hợp với ảnh kích thước nhỏ (384x384 px).
- AlexNet: Mạng CNN sâu hơn, có khả năng xử lý ảnh lớn (227x227 px), sử dụng các kỹ thuật như ReLU, dropout, batch normalization để tăng hiệu quả học và giảm overfitting.
Các khái niệm chính bao gồm: sóng delta và theta trong EEG (0-8 Hz), convolution, pooling, activation function (ReLU), softmax, precision, sensitivity, specificity và F1-score trong đánh giá mô hình.
Phương pháp nghiên cứu
Nguồn dữ liệu: Dữ liệu EEG được thu thập từ trường Đại học Bang Colorado, gồm 13 đối tượng (1 SCI, 3 MS, 9 bình thường), với 8 kênh EEG (C3, F3, O1, P3, C4, F4, O2, P4), thời gian ghi nhận 3 phút mỗi đối tượng, tần số lấy mẫu 256 Hz.
Tiền xử lý dữ liệu: Tín hiệu EEG được lọc bandpass từ 0.5 Hz đến 15 Hz để lấy sóng delta và theta, chia thành các đoạn dài 3.84 giây với tỷ lệ chồng lấp 20%, tạo ra khoảng 754 mẫu hình ảnh.
Chuyển đổi tín hiệu: Sử dụng STFT với cửa sổ Hann và WT với hàm Morlet để tạo ảnh Spectrogram và Scalogram làm dữ liệu đầu vào cho mô hình CNN.
Mô hình học sâu: Triển khai và huấn luyện hai mô hình LeNet và AlexNet với các tham số:
- LeNet: learning rate 10^-4 và 10^-5, sử dụng hàm Adam, ảnh đầu vào 384x384 px.
- AlexNet: learning rate 10^-4 và 10^-5, sử dụng SGD với momentum Nesterov 0.9, ảnh đầu vào 227x227 px.
Phân chia dữ liệu: 80% dữ liệu dùng để huấn luyện, 20% để kiểm tra, trong đó 20% ảnh của mỗi kênh được chọn ngẫu nhiên làm validation.
Đánh giá mô hình: Sử dụng các chỉ số độ chính xác (accuracy), precision, sensitivity, specificity và F1-score dựa trên ma trận nhầm lẫn (confusion matrix) với các giá trị TP, TN, FP, FN.
Timeline nghiên cứu: Quá trình thu thập, xử lý dữ liệu và huấn luyện mô hình diễn ra trong khoảng thời gian học tập tại trường Đại học Công nghệ Thông tin, Đại học Quốc gia TP. Hồ Chí Minh, năm 2022.
Kết quả nghiên cứu và thảo luận
Những phát hiện chính
Hiệu quả của hình ảnh Scalogram vượt trội so với Spectrogram: Mô hình AlexNet sử dụng ảnh Scalogram đạt độ chính xác 71.65%, cao hơn 7.69% so với LeNet với cùng loại ảnh. Điều này cho thấy WT phù hợp hơn trong việc trích xuất đặc trưng tín hiệu EEG không đồng bộ.
Mô hình AlexNet cho kết quả tốt hơn LeNet: AlexNet với ảnh Scalogram đạt F1-score 71.65%, sensitivity 25%, specificity 100%, trong khi LeNet chỉ đạt độ chính xác khoảng 69.64%. AlexNet có khả năng phân loại chính xác hơn các đối tượng bệnh và không bệnh.
Ảnh Spectrogram ít hiệu quả hơn: Cả hai mô hình LeNet và AlexNet khi sử dụng ảnh Spectrogram đều cho kết quả kém hơn so với ảnh Scalogram, đặc biệt LeNet không thể chẩn đoán chính xác các đối tượng bệnh.
Ảnh hưởng của learning rate: Tăng learning rate từ 10^-5 lên 10^-4 giúp cải thiện kết quả chẩn đoán, tuy nhiên mức cải thiện không lớn, cần điều chỉnh thêm các tham số khác để tối ưu mô hình.
Thảo luận kết quả
Kết quả cho thấy việc sử dụng phương pháp biến đổi Wavelet để tạo ảnh Scalogram làm dữ liệu đầu vào cho mạng CNN giúp mô hình học sâu nhận diện đặc trưng tín hiệu EEG hiệu quả hơn so với phương pháp STFT tạo ảnh Spectrogram. Điều này phù hợp với đặc tính tín hiệu EEG không đồng bộ và biến đổi theo thời gian.
Mô hình AlexNet với kiến trúc sâu và các kỹ thuật như batch normalization, dropout giúp tránh overfitting và tăng khả năng tổng quát hóa, từ đó đạt hiệu suất cao hơn so với LeNet. Tuy nhiên, độ nhạy (sensitivity) còn thấp, chỉ đạt 25%, cho thấy mô hình vẫn còn hạn chế trong việc phát hiện chính xác các trường hợp bệnh, cần cải tiến thêm.
So sánh với các nghiên cứu trước đây, mô hình đề xuất đã cải thiện độ chính xác và F1-score so với các phương pháp truyền thống như LDA, CART và các mô hình CNN trước đó. Kết quả này khẳng định tiềm năng ứng dụng của học sâu trong chẩn đoán bệnh rối loạn thần kinh vận động dựa trên tín hiệu EEG.
Dữ liệu có thể được trình bày qua các biểu đồ so sánh độ chính xác, F1-score giữa các mô hình và loại ảnh đầu vào, cũng như bảng ma trận nhầm lẫn thể hiện chi tiết kết quả phân loại từng kênh EEG.
Đề xuất và khuyến nghị
Tối ưu tham số mô hình CNN: Tiếp tục điều chỉnh learning rate, số epoch, batch size và các kỹ thuật regularization như dropout để nâng cao độ nhạy và độ chính xác của mô hình, hướng tới mục tiêu sensitivity trên 50% trong vòng 6-12 tháng, do nhóm nghiên cứu AI y tế thực hiện.
Mở rộng bộ dữ liệu thực nghiệm: Thu thập thêm dữ liệu EEG từ nhiều đối tượng bệnh và bình thường tại các bệnh viện trong nước, tăng cỡ mẫu lên khoảng 50-100 người trong 1-2 năm để cải thiện khả năng tổng quát hóa của mô hình.
Phát triển hệ thống hỗ trợ chẩn đoán trực tuyến: Xây dựng và triển khai ứng dụng web tích hợp mô hình AI, cho phép bác sĩ tải lên dữ liệu EEG và nhận kết quả chẩn đoán nhanh chóng, dự kiến hoàn thành trong 12 tháng, phối hợp với các cơ sở y tế và đơn vị công nghệ.
Nghiên cứu kết hợp đa mô thức dữ liệu: Kết hợp tín hiệu EEG với hình ảnh MRI và các dữ liệu lâm sàng khác để xây dựng mô hình đa kênh, nâng cao độ chính xác chẩn đoán, dự kiến nghiên cứu trong 2-3 năm tới, do nhóm nghiên cứu liên ngành y học và công nghệ thông tin thực hiện.
Đối tượng nên tham khảo luận văn
Bác sĩ chuyên khoa thần kinh và y học phục hồi chức năng: Nghiên cứu giúp hiểu rõ phương pháp chẩn đoán mới dựa trên tín hiệu EEG và AI, hỗ trợ trong việc ra quyết định điều trị chính xác hơn.
Nhà nghiên cứu và sinh viên ngành công nghệ thông tin, trí tuệ nhân tạo: Tham khảo mô hình CNN ứng dụng trong y học, kỹ thuật xử lý tín hiệu EEG và phương pháp đánh giá mô hình học sâu.
Chuyên gia phát triển phần mềm y tế và hệ thống hỗ trợ chẩn đoán: Áp dụng kết quả nghiên cứu để phát triển các ứng dụng AI trong y tế, đặc biệt là hệ thống chẩn đoán bệnh thần kinh vận động.
Quản lý và hoạch định chính sách y tế: Hiểu được tiềm năng và lợi ích của công nghệ AI trong chẩn đoán bệnh, từ đó có chính sách hỗ trợ phát triển và ứng dụng công nghệ mới trong hệ thống y tế quốc gia.
Câu hỏi thường gặp
Tại sao chọn tín hiệu EEG để chẩn đoán rối loạn thần kinh vận động?
EEG phản ánh hoạt động điện của não bộ, đặc biệt các sóng delta và theta chứa thông tin đặc trưng liên quan đến các bệnh thần kinh vận động. So với MRI, EEG có chi phí thấp hơn và có thể cung cấp dữ liệu thời gian thực.Phương pháp biến đổi Wavelet có ưu điểm gì so với Fourier?
Wavelet linh hoạt trong phân tích tín hiệu không đồng bộ và biến đổi theo thời gian, giúp trích xuất đặc trưng chính xác hơn cho tín hiệu EEG phức tạp, trong khi Fourier chỉ phù hợp với tín hiệu tuần hoàn.Mô hình AlexNet có ưu điểm gì so với LeNet trong nghiên cứu này?
AlexNet có kiến trúc sâu hơn, sử dụng các kỹ thuật hiện đại như batch normalization và dropout, giúp mô hình học được nhiều đặc trưng phức tạp hơn, từ đó nâng cao độ chính xác và khả năng phân loại.Độ nhạy (sensitivity) thấp có ảnh hưởng thế nào đến ứng dụng thực tế?
Độ nhạy thấp nghĩa là mô hình có thể bỏ sót các trường hợp bệnh, gây nguy cơ chẩn đoán sai. Do đó, cần cải tiến mô hình để tăng độ nhạy nhằm đảm bảo an toàn và hiệu quả trong y tế.Làm thế nào để mở rộng ứng dụng mô hình này trong thực tế?
Cần thu thập thêm dữ liệu đa dạng, tích hợp mô hình vào hệ thống y tế hiện có, đào tạo nhân viên y tế sử dụng công nghệ và phối hợp với các cơ quan quản lý để đảm bảo tính pháp lý và an toàn thông tin.
Kết luận
- Nghiên cứu đã xây dựng thành công hệ thống hỗ trợ chẩn đoán rối loạn suy giảm thần kinh vận động dựa trên tín hiệu EEG và mô hình CNN, trong đó AlexNet với ảnh Scalogram cho kết quả tốt nhất với độ chính xác 71.65%.
- Phương pháp biến đổi Wavelet (WT) hiệu quả hơn STFT trong việc trích xuất đặc trưng tín hiệu EEG phục vụ phân loại bệnh.
- Mô hình hiện tại có độ nhạy còn thấp, cần cải tiến để tăng khả năng phát hiện bệnh chính xác hơn.
- Kết quả nghiên cứu góp phần giảm chi phí chẩn đoán, hỗ trợ bác sĩ trong việc ra quyết định điều trị, mang lại lợi ích xã hội và nhân văn sâu sắc.
- Các bước tiếp theo bao gồm tối ưu mô hình, mở rộng dữ liệu thực nghiệm và phát triển hệ thống ứng dụng thực tế nhằm nâng cao hiệu quả chẩn đoán và điều trị bệnh.
Hành động khuyến nghị: Các nhà nghiên cứu và chuyên gia y tế nên phối hợp triển khai thử nghiệm mô hình trên quy mô lớn hơn, đồng thời phát triển ứng dụng hỗ trợ chẩn đoán để đưa công nghệ AI vào thực tiễn y học hiện đại.