Tổng quan nghiên cứu
Rối loạn nhịp tim là một trong những bệnh lý tim mạch phổ biến và nguy hiểm, ảnh hưởng đến hàng triệu người trên toàn cầu. Theo ước tính, năm 2010 có khoảng 33,5 triệu người mắc các bệnh liên quan đến rối loạn nhịp tim trên thế giới, trong đó rung tâm nhĩ chiếm khoảng một phần ba các trường hợp. Tại Việt Nam, mỗi năm có khoảng 3.000 bệnh nhân được ghi nhận mắc các bệnh rối loạn nhịp tim. Rối loạn nhịp tim không chỉ làm giảm hiệu quả tuần hoàn máu mà còn là nguyên nhân dẫn đến các biến chứng nghiêm trọng như đột quỵ, suy tim và đột tử. Việc phát hiện sớm và chính xác các rối loạn này là rất cần thiết để nâng cao hiệu quả điều trị và giảm thiểu nguy cơ tử vong.
Trước đây, các thiết bị theo dõi điện tâm đồ (ECG) như Holter được sử dụng phổ biến để phát hiện rối loạn nhịp tim, tuy nhiên chúng có nhược điểm về chi phí cao, cồng kềnh và gây bất tiện cho người dùng. Trong bối cảnh công nghệ y tế phát triển, tín hiệu photoplethysmography (PPG) đã trở thành một giải pháp thay thế tiềm năng nhờ tính tiện lợi, chi phí thấp và khả năng tích hợp trong các thiết bị đeo tay thông minh. Tín hiệu PPG phản ánh sự thay đổi lưu lượng máu qua mao mạch, từ đó có thể gián tiếp phát hiện các bất thường về nhịp tim.
Mục tiêu nghiên cứu là phát triển và đánh giá các thuật toán xử lý tín hiệu PPG nhằm phát hiện rối loạn nhịp tim, đặc biệt là rung tâm nhĩ và ngoại thu tâm thất, với độ chính xác, độ nhạy và độ đặc hiệu đạt trên 95%. Nghiên cứu cũng tập trung vào việc phát triển thuật toán loại bỏ các đoạn tín hiệu PPG bị nhiễu do cử động người dùng, nhằm nâng cao chất lượng dữ liệu đầu vào cho các mô hình phát hiện bệnh. Phạm vi nghiên cứu bao gồm phân tích dữ liệu thu thập từ bộ dữ liệu MIMIC-III và bệnh viện Thống Nhất, trong khoảng thời gian từ năm 2022 đến giữa năm 2023. Kết quả nghiên cứu có ý nghĩa quan trọng trong việc ứng dụng công nghệ PPG vào giám sát sức khỏe tim mạch cá nhân, góp phần giảm tải cho hệ thống y tế và nâng cao chất lượng chăm sóc sức khỏe cộng đồng.
Cơ sở lý thuyết và phương pháp nghiên cứu
Khung lý thuyết áp dụng
Nghiên cứu dựa trên các lý thuyết và mô hình sau:
Định luật Beer–Lambert: Giải thích nguyên lý hấp thụ ánh sáng của các mô dưới da, làm cơ sở cho việc thu nhận tín hiệu PPG. Theo đó, cường độ ánh sáng bị hấp thụ tỷ lệ thuận với mật độ vật chất và chiều dài đường truyền ánh sáng trong môi trường.
Tín hiệu photoplethysmography (PPG): Là tín hiệu điện áp thu được từ sự chuyển hóa quang năng của ánh sáng sau khi bị hấp thụ bởi các mô và máu dưới da. Tín hiệu này bao gồm thành phần DC (phản ánh lượng máu không đổi) và thành phần AC (phản ánh sự thay đổi lưu lượng máu theo chu kỳ tim).
Mạng autoencoder: Mạng nơ-ron học không giám sát được sử dụng để phát hiện bất thường và lọc nhiễu trong tín hiệu PPG. Mạng này gồm bộ mã hóa (encoder) và bộ giải mã (decoder), có khả năng tái tạo tín hiệu đầu vào và phát hiện các đoạn tín hiệu không phù hợp dựa trên sai số tái tạo.
Mạng nơ-ron tích chập (CNN) và mạng kết hợp CNN-LSTM: Các mô hình học sâu được sử dụng để tự động trích xuất đặc trưng và phân loại tín hiệu PPG thành các nhóm có hoặc không có rối loạn nhịp tim. CNN giúp nhận diện các đặc trưng không gian trong phổ thời gian – tần số của tín hiệu, trong khi LSTM hỗ trợ xử lý dữ liệu chuỗi thời gian có tính tuần tự.
Phổ thời gian – tần số (Time-frequency spectrum): Phương pháp biến đổi wavelet và Hilbert được sử dụng để chuyển đổi tín hiệu PPG thô thành dạng phổ thời gian – tần số, giúp giữ lại thông tin về sự thay đổi tần số và biên độ theo thời gian, rất hữu ích trong việc phát hiện các cơn rối loạn nhịp tim đột ngột.
Phương pháp nghiên cứu
Nguồn dữ liệu: Nghiên cứu sử dụng hai bộ dữ liệu chính gồm bộ dữ liệu MIMIC-III (một cơ sở dữ liệu y tế lớn chứa các tín hiệu sinh lý của bệnh nhân) và bộ dữ liệu thu thập từ bệnh viện Thống Nhất. Dữ liệu bao gồm tín hiệu PPG thô và các nhãn bệnh dựa trên điện tâm đồ đồng bộ.
Phương pháp tiền xử lý: Thuật toán tiền xử lý bao gồm lọc nhiễu, phát hiện đỉnh tín hiệu PPG để tạo mẫu nhịp, chuẩn hóa dữ liệu và loại bỏ các đoạn tín hiệu bị ảnh hưởng bởi cử động thông qua mô hình autoencoder.
Phương pháp phân tích và phát hiện rối loạn nhịp tim: Sử dụng mô hình học sâu CNN và CNN-LSTM với đầu vào là phổ thời gian – tần số của tín hiệu PPG. Mô hình được huấn luyện và đánh giá trên các tập dữ liệu đã được dán nhãn, sử dụng các chỉ số đánh giá như độ chính xác, độ nhạy, độ đặc hiệu và diện tích dưới đường cong ROC (AUC).
Timeline nghiên cứu: Nghiên cứu được thực hiện từ tháng 2/2022 đến tháng 6/2023, bao gồm các giai đoạn thu thập dữ liệu, phát triển thuật toán tiền xử lý, xây dựng và huấn luyện mô hình học sâu, đánh giá kết quả và hoàn thiện luận văn.
Cỡ mẫu và chọn mẫu: Dữ liệu được lựa chọn từ các bệnh nhân có và không có rối loạn nhịp tim, đảm bảo tính đại diện và đa dạng về đặc điểm sinh lý. Phương pháp chọn mẫu dựa trên dữ liệu có sẵn trong hai bộ dữ liệu lớn, kết hợp với việc dán nhãn chính xác dựa trên điện tâm đồ.
Kết quả nghiên cứu và thảo luận
Những phát hiện chính
Hiệu quả loại bỏ nhiễu tín hiệu PPG bằng mô hình autoencoder: Thuật toán phát hiện và loại bỏ các đoạn tín hiệu PPG bị ảnh hưởng do cử động đạt độ chính xác trên 90% khi đánh giá trên bộ dữ liệu MIMIC-III và bệnh viện Thống Nhất. Việc này giúp giữ lại các đoạn tín hiệu chất lượng cao, phục vụ cho các bước phân tích tiếp theo.
Độ chính xác phát hiện rối loạn nhịp tim: Mô hình CNN và CNN-LSTM đạt độ chính xác trung bình trên 95% trong việc phân loại các trường hợp có và không có rối loạn nhịp tim, với độ nhạy và độ đặc hiệu tương ứng trên 94%. Kết quả này được đánh giá trên tập kiểm tra từ cả hai bộ dữ liệu.
So sánh mô hình CNN và CNN-LSTM: Mô hình CNN-LSTM có ưu thế hơn về khả năng xử lý dữ liệu chuỗi thời gian dài và tính tuần tự, thể hiện qua độ nhạy cao hơn khoảng 1-2% so với CNN đơn thuần. Tuy nhiên, CNN có ưu điểm về tốc độ xử lý nhanh hơn và số lượng tham số ít hơn, phù hợp với các ứng dụng yêu cầu tính toán nhanh.
Phổ thời gian – tần số giúp phân biệt rõ ràng tín hiệu PPG của người mắc và không mắc rối loạn nhịp tim: Các phân tích phổ cho thấy tín hiệu PPG của người bệnh có nhiều thành phần tần số cao hơn và biến động biên độ rõ rệt hơn so với người bình thường, hỗ trợ hiệu quả cho việc phát hiện bệnh.
Thảo luận kết quả
Nguyên nhân của hiệu quả cao trong phát hiện rối loạn nhịp tim dựa trên tín hiệu PPG là do mô hình học sâu có khả năng tự động trích xuất các đặc trưng phức tạp từ dữ liệu phổ thời gian – tần số, tránh được các sai sót do trích xuất đặc trưng thủ công. Việc sử dụng mô hình autoencoder để loại bỏ nhiễu giúp nâng cao chất lượng dữ liệu đầu vào, giảm thiểu nhầm lẫn giữa tín hiệu nhiễu và tín hiệu bệnh.
So với các nghiên cứu trước đây sử dụng phương pháp thống kê hoặc học máy, mô hình học sâu cho thấy khả năng đáp ứng tốt hơn với lượng dữ liệu lớn và đa dạng, đồng thời phát hiện được nhiều loại rối loạn nhịp tim khác nhau như rung tâm nhĩ và ngoại thu tâm thất. Kết quả này phù hợp với các báo cáo trong ngành cho thấy mô hình CNN và CNN-LSTM là lựa chọn ưu việt trong phân tích tín hiệu sinh lý phức tạp.
Việc sử dụng phổ thời gian – tần số làm đầu vào giúp giữ lại thông tin quan trọng về sự thay đổi tần số và biên độ theo thời gian, điều mà các phương pháp lọc truyền thống có thể làm mất đi. Điều này đặc biệt hữu ích trong phát hiện các cơn rối loạn nhịp tim đột ngột và ngắn hạn.
Dữ liệu có thể được trình bày qua các biểu đồ so sánh độ chính xác, độ nhạy của hai mô hình CNN và CNN-LSTM trên các bộ dữ liệu khác nhau, cũng như bảng phân tích các chỉ số đánh giá chất lượng tín hiệu PPG trước và sau khi xử lý bằng autoencoder.
Đề xuất và khuyến nghị
Triển khai thuật toán lọc nhiễu PPG trên thiết bị đeo tay: Đề xuất tích hợp mô hình autoencoder vào phần mềm thiết bị đeo tay để tự động loại bỏ các đoạn tín hiệu nhiễu do cử động, nâng cao chất lượng dữ liệu thu thập. Thời gian thực hiện trong vòng 12 tháng, chủ thể thực hiện là các nhà phát triển thiết bị y tế.
Phát triển hệ thống giám sát rối loạn nhịp tim dựa trên đám mây: Thuật toán học sâu được triển khai trên nền tảng đám mây để xử lý dữ liệu PPG từ thiết bị đeo tay, giúp giảm tải tính toán trên thiết bị và nâng cao độ chính xác. Thời gian thực hiện dự kiến 18 tháng, do các công ty công nghệ y tế đảm nhiệm.
Nâng cao độ chính xác bằng cá nhân hóa mô hình: Sử dụng dữ liệu thu thập liên tục từ người dùng để huấn luyện lại mô hình theo thời gian thực, giúp mô hình thích nghi với đặc điểm sinh lý riêng biệt của từng cá nhân. Thời gian thực hiện 24 tháng, phối hợp giữa viện nghiên cứu và bệnh viện.
Mở rộng nghiên cứu với đa dạng nhóm dân cư và điều kiện sinh lý: Tiến hành thu thập và phân tích dữ liệu PPG từ các nhóm dân cư khác nhau, đặc biệt là người Việt Nam, để đánh giá và điều chỉnh mô hình phù hợp với đặc điểm sinh học vùng miền. Thời gian thực hiện 36 tháng, do các tổ chức y tế và nghiên cứu đảm nhận.
Đối tượng nên tham khảo luận văn
Các nhà nghiên cứu và sinh viên ngành kỹ thuật y sinh và cơ điện tử: Luận văn cung cấp kiến thức chuyên sâu về xử lý tín hiệu PPG, mô hình học sâu và ứng dụng trong phát hiện rối loạn nhịp tim, hỗ trợ phát triển các đề tài nghiên cứu liên quan.
Các công ty phát triển thiết bị y tế và thiết bị đeo thông minh: Thông tin về thuật toán lọc nhiễu và phát hiện rối loạn nhịp tim giúp cải tiến sản phẩm, nâng cao tính năng giám sát sức khỏe tim mạch cho người dùng.
Bác sĩ và chuyên gia y tế trong lĩnh vực tim mạch: Hiểu rõ hơn về công nghệ mới trong giám sát và chẩn đoán rối loạn nhịp tim, hỗ trợ trong việc tư vấn và theo dõi bệnh nhân từ xa.
Các nhà hoạch định chính sách y tế và quản lý bệnh viện: Cơ sở để xây dựng các chương trình chăm sóc sức khỏe từ xa, giảm tải cho hệ thống y tế và nâng cao hiệu quả quản lý bệnh nhân tim mạch.
Câu hỏi thường gặp
Tín hiệu PPG là gì và tại sao được sử dụng để phát hiện rối loạn nhịp tim?
PPG là tín hiệu điện áp thu được từ sự hấp thụ ánh sáng của mô và máu dưới da, phản ánh sự thay đổi lưu lượng máu theo chu kỳ tim. Do đó, PPG có thể gián tiếp phản ánh các bất thường về nhịp tim như rung tâm nhĩ hay ngoại thu tâm thất.Mô hình autoencoder giúp gì trong xử lý tín hiệu PPG?
Autoencoder được sử dụng để phát hiện và loại bỏ các đoạn tín hiệu PPG bị nhiễu do cử động người dùng, giúp giữ lại các đoạn tín hiệu chất lượng cao phục vụ cho việc phân tích và phát hiện rối loạn nhịp tim.Ưu điểm của mô hình CNN và CNN-LSTM trong phát hiện rối loạn nhịp tim là gì?
CNN tự động trích xuất đặc trưng từ dữ liệu phổ thời gian – tần số, trong khi CNN-LSTM kết hợp khả năng xử lý dữ liệu tuần tự, giúp cải thiện độ nhạy và độ chính xác trong phát hiện các cơn rối loạn nhịp tim.Tại sao phổ thời gian – tần số được sử dụng làm đầu vào cho mô hình học sâu?
Phổ thời gian – tần số giữ lại thông tin về sự thay đổi tần số và biên độ theo thời gian, giúp mô hình nhận diện các đặc trưng quan trọng của tín hiệu PPG mà các bộ lọc truyền thống có thể làm mất đi.Làm thế nào để áp dụng kết quả nghiên cứu vào thực tế?
Thuật toán có thể được tích hợp vào các thiết bị đeo tay thông minh hoặc hệ thống giám sát từ xa trên nền tảng đám mây, giúp người dùng và bác sĩ theo dõi sức khỏe tim mạch liên tục và chính xác hơn.
Kết luận
Luận văn đã phát triển thành công hai thuật toán chính: một thuật toán loại bỏ nhiễu tín hiệu PPG dựa trên mô hình autoencoder và một thuật toán phát hiện rối loạn nhịp tim sử dụng mô hình học sâu CNN và CNN-LSTM với đầu vào là phổ thời gian – tần số của tín hiệu PPG.
Thuật toán loại bỏ nhiễu đạt độ chính xác trên 90%, giúp nâng cao chất lượng dữ liệu đầu vào cho các mô hình phát hiện bệnh.
Mô hình học sâu đạt độ chính xác, độ nhạy và độ đặc hiệu trên 95% trong việc phát hiện rung tâm nhĩ và ngoại thu tâm thất trên hai bộ dữ liệu lớn.
So sánh giữa CNN và CNN-LSTM cho thấy CNN-LSTM có ưu thế về độ nhạy, trong khi CNN có ưu điểm về tốc độ xử lý và số lượng tham số.
Các bước tiếp theo bao gồm triển khai thuật toán trên thiết bị đeo tay, phát triển hệ thống giám sát dựa trên đám mây, cá nhân hóa mô hình và mở rộng nghiên cứu với đa dạng nhóm dân cư.
Để tiếp tục phát triển ứng dụng công nghệ PPG trong chăm sóc sức khỏe tim mạch, các nhà nghiên cứu và doanh nghiệp nên hợp tác để đưa các thuật toán này vào thực tế, góp phần nâng cao chất lượng cuộc sống và giảm thiểu các biến chứng do rối loạn nhịp tim gây ra.