Tổng quan nghiên cứu

Theo báo cáo của Tổ chức Y tế Thế giới (WHO), các bệnh hô hấp mãn tính đang là nguyên nhân chính gây tử vong trên toàn cầu, với hơn 250 triệu ca nhiễm Covid-19 và hơn 5 triệu ca tử vong tính đến năm 2021. Tại Việt Nam, tỷ lệ mắc bệnh hen phế quản ở trẻ em 12-13 tuổi lên tới 29,1%, cao nhất châu Á, trong khi viêm phổi chiếm tới 50% các bệnh ở trẻ em dưới 5 tuổi, gây tử vong khoảng 4.500 trẻ mỗi năm. Việc phát hiện và phân loại nhịp thở đóng vai trò quan trọng trong chẩn đoán và theo dõi các bệnh lý hô hấp, góp phần giảm thiểu tử vong và chi phí điều trị.

Luận văn tập trung nghiên cứu các phương pháp phát hiện và phân loại nhịp thở dựa trên dữ liệu âm thanh thu thập từ thiết bị gắn micro không dây kết nối với hệ thống đám mây. Mục tiêu chính là ứng dụng mô hình học sâu đa nhiệm BiLSTM để vừa phát hiện nhịp thở, vừa phân loại các dạng nhịp thở như thở thường, thở sâu, thở mạnh. Phạm vi nghiên cứu bao gồm thu thập dữ liệu tại Việt Nam trong giai đoạn 2020-2021, với dữ liệu âm thanh nhịp thở được xử lý và phân tích trên nền tảng học sâu.

Nghiên cứu có ý nghĩa lớn trong việc phát triển các hệ thống theo dõi sức khỏe hô hấp thời gian thực, hỗ trợ y tế từ xa, đặc biệt trong bối cảnh dịch bệnh và quá tải bệnh viện. Việc áp dụng học sâu đa nhiệm giúp nâng cao độ chính xác phát hiện và phân loại nhịp thở, đồng thời giảm thiểu chi phí và kích thước thiết bị theo dõi.

Cơ sở lý thuyết và phương pháp nghiên cứu

Khung lý thuyết áp dụng

Luận văn dựa trên hai lý thuyết chính: học sâu (Deep Learning) và học sâu đa nhiệm (Multi-task Deep Learning). Học sâu cho phép mô hình tự động trích xuất đặc trưng từ dữ liệu âm thanh phức tạp, trong khi học sâu đa nhiệm giúp mô hình thực hiện đồng thời nhiều nhiệm vụ như phát hiện và phân loại nhịp thở, tăng hiệu quả và độ chính xác.

Mô hình BiLSTM (Bidirectional Long Short-Term Memory) được sử dụng để xử lý chuỗi dữ liệu âm thanh nhịp thở. BiLSTM có khả năng ghi nhớ thông tin từ cả hai chiều thời gian, giúp nhận dạng chính xác các đặc trưng âm thanh liên tục và phức tạp. Các khái niệm chính bao gồm:

  • MFCC (Mel-frequency Cepstral Coefficients): đặc trưng âm thanh phổ biến trong xử lý giọng nói và âm thanh y tế.
  • RNNoise: bộ lọc học sâu dùng để loại bỏ nhiễu trong tín hiệu âm thanh.
  • Mạng nơ-ron hồi quy (RNN): mạng có khả năng xử lý dữ liệu chuỗi.
  • Mạng BiLSTM: mở rộng RNN với khả năng xử lý thông tin theo cả hai chiều thời gian.

Phương pháp nghiên cứu

Nguồn dữ liệu chính là âm thanh nhịp thở thu thập từ thiết bị Raspberry Pi gắn micro BETA 98H/C, với tổng số khoảng 36.210 tệp âm thanh thu được từ hơn 6.000 người tham gia. Dữ liệu được cắt thành các mẫu 4 giây, chồng lấn 2 giây để tăng số lượng mẫu và giảm mất mát thông tin.

Quá trình xử lý dữ liệu bao gồm lọc nhiễu bằng bộ lọc RNNoise, trích xuất đặc trưng MFCC với 40 hệ số trên mỗi frame 30ms, chồng lấn 10ms, tạo thành ma trận đặc trưng kích thước 40x249 cho mỗi mẫu. Mô hình BiLSTM đa nhiệm được xây dựng trên nền tảng TensorFlow và Keras, với hai đầu ra softmax cho nhiệm vụ phát hiện nhịp thở và phân loại loại nhịp thở.

Phương pháp phân tích sử dụng kỹ thuật huấn luyện mô hình học sâu với cỡ mẫu lớn, đánh giá bằng ma trận nhầm lẫn, độ chính xác, độ nhạy và độ đặc hiệu. Thời gian nghiên cứu kéo dài gần hai năm, từ thu thập dữ liệu đến xây dựng và thử nghiệm mô hình.

Kết quả nghiên cứu và thảo luận

Những phát hiện chính

  1. Hiệu quả lọc nhiễu RNNoise: Bộ lọc RNNoise giúp giảm đáng kể nhiễu nền trong dữ liệu âm thanh nhịp thở, cải thiện chất lượng tín hiệu đầu vào cho mô hình. Kết quả thực nghiệm cho thấy độ chính xác nhận dạng tăng khoảng 10% so với dữ liệu chưa lọc.

  2. Độ chính xác mô hình BiLSTM đa nhiệm: Mô hình đạt độ chính xác phát hiện nhịp thở trên 92%, trong đó độ nhạy đạt 90% và độ đặc hiệu 94%. Phân loại các dạng nhịp thở đạt độ chính xác trung bình 88%, vượt trội so với các mô hình học máy truyền thống như SVM (độ chính xác khoảng 80%).

  3. Tăng cường dữ liệu bằng kỹ thuật chồng lấn: Việc cắt mẫu âm thanh 4 giây với chồng lấn 2 giây giúp tăng số lượng mẫu huấn luyện lên khoảng 1,5 lần, góp phần nâng cao độ ổn định và khả năng tổng quát của mô hình.

  4. Ứng dụng thực tế: Ứng dụng phát hiện và phân loại nhịp thở được triển khai trên thiết bị Raspberry Pi, cho phép theo dõi nhịp thở thời gian thực với độ trễ dưới 1 giây, phù hợp với yêu cầu y tế.

Thảo luận kết quả

Kết quả cho thấy mô hình học sâu đa nhiệm BiLSTM có khả năng xử lý hiệu quả dữ liệu âm thanh nhịp thở phức tạp, đồng thời thực hiện hai nhiệm vụ phát hiện và phân loại cùng lúc, giảm thiểu thời gian xử lý và tăng độ chính xác. So với các nghiên cứu trước đây sử dụng học máy truyền thống như SVM, KNN, mô hình BiLSTM đa nhiệm vượt trội về độ chính xác và khả năng xử lý chuỗi thời gian dài.

Việc áp dụng bộ lọc RNNoise giúp giảm nhiễu hiệu quả, điều này phù hợp với các nghiên cứu về xử lý tín hiệu âm thanh y tế, đồng thời giảm tải cho mô hình học sâu. Kỹ thuật chồng lấn mẫu âm thanh cũng góp phần làm giàu dữ liệu, giúp mô hình học sâu tránh hiện tượng overfitting.

Kết quả thực nghiệm trên thiết bị Raspberry Pi chứng minh tính khả thi của hệ thống trong môi trường thực tế, mở ra hướng phát triển các thiết bị IoT y tế giá rẻ, nhỏ gọn, dễ sử dụng. Tuy nhiên, vẫn còn một số hạn chế như độ chính xác phân loại các dạng nhịp thở phức tạp chưa đạt mức tối ưu tuyệt đối, cần nghiên cứu thêm về mở rộng tập dữ liệu và cải tiến mô hình.

Dữ liệu và kết quả có thể được trình bày qua biểu đồ ROC, ma trận nhầm lẫn và biểu đồ so sánh độ chính xác giữa các mô hình, giúp minh họa rõ ràng hiệu quả của phương pháp đề xuất.

Đề xuất và khuyến nghị

  1. Mở rộng và đa dạng hóa dữ liệu: Thu thập thêm dữ liệu nhịp thở từ nhiều đối tượng khác nhau, bao gồm các bệnh lý hô hấp đa dạng, nhằm nâng cao khả năng tổng quát và độ chính xác của mô hình. Thời gian thực hiện: 12 tháng; chủ thể: nhóm nghiên cứu và các cơ sở y tế.

  2. Tối ưu hóa mô hình học sâu: Nghiên cứu và áp dụng các kiến trúc mạng học sâu mới như Transformer hoặc kết hợp CNN-BiLSTM để cải thiện khả năng nhận dạng các dạng nhịp thở phức tạp. Thời gian: 6-9 tháng; chủ thể: nhóm nghiên cứu.

  3. Phát triển thiết bị IoT theo dõi nhịp thở: Thiết kế và sản xuất thiết bị gắn micro nhỏ gọn, chi phí thấp, tích hợp mô hình học sâu để theo dõi nhịp thở liên tục, hỗ trợ y tế từ xa. Thời gian: 12 tháng; chủ thể: doanh nghiệp công nghệ y tế phối hợp với viện nghiên cứu.

  4. Xây dựng hệ thống cảnh báo sớm: Tích hợp hệ thống phát hiện bất thường nhịp thở tự động gửi cảnh báo đến bác sĩ hoặc người dùng, giúp can thiệp kịp thời. Thời gian: 6 tháng; chủ thể: nhóm phát triển phần mềm và y tế.

  5. Đào tạo và phổ biến ứng dụng: Tổ chức các khóa đào tạo cho nhân viên y tế và người dùng cuối về cách sử dụng thiết bị và ứng dụng, nâng cao nhận thức về theo dõi sức khỏe hô hấp. Thời gian: liên tục; chủ thể: các cơ sở y tế và tổ chức đào tạo.

Đối tượng nên tham khảo luận văn

  1. Nhà nghiên cứu và sinh viên ngành Khoa học máy tính, Trí tuệ nhân tạo: Luận văn cung cấp kiến thức chuyên sâu về ứng dụng học sâu đa nhiệm trong xử lý tín hiệu âm thanh y tế, giúp phát triển các đề tài nghiên cứu liên quan.

  2. Chuyên gia y tế và kỹ thuật y sinh: Tham khảo phương pháp thu thập, xử lý và phân tích dữ liệu nhịp thở, hỗ trợ phát triển các thiết bị theo dõi sức khỏe hô hấp hiện đại.

  3. Doanh nghiệp công nghệ y tế và IoT: Cung cấp cơ sở khoa học và kỹ thuật để phát triển sản phẩm thiết bị theo dõi nhịp thở thông minh, ứng dụng trong chăm sóc sức khỏe từ xa.

  4. Cơ quan quản lý và hoạch định chính sách y tế: Tham khảo các giải pháp công nghệ mới nhằm nâng cao hiệu quả giám sát và phòng chống các bệnh hô hấp, đặc biệt trong bối cảnh dịch bệnh.

Câu hỏi thường gặp

  1. Phương pháp học sâu đa nhiệm là gì và tại sao được chọn?
    Học sâu đa nhiệm là kỹ thuật cho phép mô hình thực hiện nhiều nhiệm vụ cùng lúc, như phát hiện và phân loại nhịp thở. Phương pháp này giúp tiết kiệm thời gian xử lý và tăng độ chính xác nhờ học chung đặc trưng từ dữ liệu. Ví dụ, mô hình BiLSTM đa nhiệm trong nghiên cứu vừa phát hiện nhịp thở vừa phân loại loại nhịp thở hiệu quả.

  2. Dữ liệu âm thanh nhịp thở được thu thập như thế nào?
    Dữ liệu được thu từ thiết bị Raspberry Pi gắn micro BETA 98H/C, thu âm tại vùng ngực người tham gia. Mỗi mẫu âm thanh dài 4 giây, chồng lấn 2 giây để tăng số lượng mẫu. Dữ liệu sau đó được xử lý lọc nhiễu và trích xuất đặc trưng MFCC.

  3. Bộ lọc RNNoise có vai trò gì trong xử lý dữ liệu?
    RNNoise là bộ lọc học sâu giúp loại bỏ nhiễu nền trong tín hiệu âm thanh nhịp thở, cải thiện chất lượng dữ liệu đầu vào cho mô hình học sâu. Thực nghiệm cho thấy RNNoise giúp tăng độ chính xác nhận dạng lên khoảng 10%.

  4. Mô hình BiLSTM khác gì so với mạng nơ-ron truyền thống?
    BiLSTM là mạng nơ-ron hồi quy hai chiều, xử lý dữ liệu chuỗi theo cả hai hướng thời gian, giúp ghi nhớ thông tin trước và sau trong chuỗi dữ liệu. Điều này cải thiện khả năng nhận dạng các đặc trưng âm thanh liên tục so với mạng nơ-ron truyền thống chỉ xử lý theo một chiều.

  5. Ứng dụng thực tế của nghiên cứu này là gì?
    Nghiên cứu đã xây dựng ứng dụng phát hiện và phân loại nhịp thở thời gian thực trên thiết bị Raspberry Pi, có thể sử dụng trong theo dõi sức khỏe hô hấp tại nhà hoặc bệnh viện, hỗ trợ phát hiện sớm các bệnh lý hô hấp và giảm tải cho hệ thống y tế.

Kết luận

  • Luận văn đã nghiên cứu và ứng dụng thành công mô hình học sâu đa nhiệm BiLSTM trong phát hiện và phân loại nhịp thở dựa trên dữ liệu âm thanh thu thập từ thiết bị gắn micro không dây.
  • Bộ lọc RNNoise được áp dụng hiệu quả trong xử lý nhiễu, nâng cao chất lượng dữ liệu đầu vào và độ chính xác mô hình.
  • Kỹ thuật chồng lấn mẫu âm thanh giúp tăng số lượng dữ liệu huấn luyện, cải thiện khả năng tổng quát của mô hình.
  • Ứng dụng thực tế trên thiết bị Raspberry Pi chứng minh tính khả thi của hệ thống trong theo dõi nhịp thở thời gian thực.
  • Đề xuất mở rộng dữ liệu, tối ưu mô hình và phát triển thiết bị IoT theo dõi nhịp thở nhằm nâng cao hiệu quả ứng dụng trong y tế.

Tiếp theo, nghiên cứu sẽ tập trung vào mở rộng tập dữ liệu đa dạng, cải tiến mô hình học sâu và phát triển hệ thống cảnh báo sớm. Độc giả và các nhà nghiên cứu được khuyến khích áp dụng và phát triển thêm các giải pháp dựa trên nền tảng này để nâng cao chất lượng chăm sóc sức khỏe hô hấp.