Tổng quan nghiên cứu

Theo báo cáo của Tổ chức Y tế Thế giới (WHO), các bệnh hô hấp mãn tính đang là nguyên nhân chính gây tử vong trên toàn cầu, với hơn 5 triệu ca tử vong do Covid-19 trong tổng số 253 triệu ca nhiễm tính đến năm 2021. Tại Mỹ, tỷ lệ mắc bệnh phổi tắc nghẽn mãn tính (COPD) chiếm khoảng 6,4%, tương đương 15,7 triệu người, trong khi tỷ lệ mắc bệnh hen phế quản toàn cầu là gần 5%, với khoảng 300 triệu người mắc và dự kiến tăng lên 400 triệu vào năm 2025. Ở Việt Nam, tỷ lệ trẻ em 12-13 tuổi mắc hen phế quản lên tới 29,1%, cao nhất châu Á, và mỗi năm có khoảng 2,9 triệu trẻ em bị viêm phổi, trong đó 4.500 trẻ dưới 5 tuổi tử vong do bệnh này.

Việc phát hiện và phân loại nhịp thở đóng vai trò quan trọng trong chẩn đoán và theo dõi các bệnh lý hô hấp. Tuy nhiên, các phương pháp truyền thống gặp nhiều khó khăn như dữ liệu nhạy cảm, xử lý dữ liệu lớn liên tục và thiết bị theo dõi cồng kềnh, chi phí cao. Luận văn tập trung nghiên cứu ứng dụng mạng học sâu đa nhiệm, đặc biệt là mô hình BiLSTM, để phát hiện và phân loại nhịp thở dựa trên dữ liệu âm thanh thu thập từ thiết bị Raspberry Pi gắn micro. Mục tiêu là xây dựng hệ thống phát hiện nhịp thở chính xác, hiệu quả, có thể ứng dụng trong thực tế với chi phí hợp lý và kích thước thiết bị nhỏ gọn. Nghiên cứu được thực hiện tại Việt Nam trong giai đoạn gần đây, góp phần nâng cao chất lượng theo dõi sức khỏe hô hấp, đặc biệt trong bối cảnh dịch bệnh và ô nhiễm môi trường gia tăng.

Cơ sở lý thuyết và phương pháp nghiên cứu

Khung lý thuyết áp dụng

Luận văn dựa trên các lý thuyết và mô hình sau:

  • Mạng nơ-ron hồi quy (RNN): Mạng có khả năng xử lý dữ liệu chuỗi nhờ vòng lặp nội bộ, giúp lưu giữ thông tin theo thời gian. Tuy nhiên, RNN truyền thống gặp khó khăn với phụ thuộc dài hạn.
  • Mạng bộ nhớ ngắn hạn dài hạn (LSTM): Cải tiến của RNN, có khả năng ghi nhớ thông tin dài hạn nhờ các cổng điều khiển thông tin (input gate, forget gate, output gate).
  • Mạng BiLSTM (Bidirectional LSTM): Kết hợp hai mạng LSTM chạy theo hai chiều thời gian (tiến và lùi), giúp mô hình hóa thông tin cả trước và sau trong chuỗi dữ liệu, nâng cao độ chính xác nhận dạng.
  • Học sâu đa nhiệm (Multi-task Deep Learning): Mô hình thực hiện đồng thời nhiều nhiệm vụ như phát hiện và phân loại nhịp thở, giảm thiểu việc trích xuất đặc trưng thủ công, tăng hiệu quả xử lý.
  • Đặc trưng âm thanh MFCC (Mel-frequency cepstral coefficients): Phương pháp trích xuất đặc trưng phổ âm thanh, giúp biểu diễn tín hiệu âm thanh thành dạng số dễ xử lý.

Phương pháp nghiên cứu

  • Nguồn dữ liệu: Dữ liệu âm thanh nhịp thở được thu thập từ thiết bị Raspberry Pi gắn micro BETA 98H/C, với các mẫu âm thanh dài 4 giây, chồng lấn 2 giây, thu tại nhiều địa điểm trong nước.
  • Tiền xử lý dữ liệu: Sử dụng bộ lọc RNNoise để loại bỏ nhiễu môi trường, tăng chất lượng tín hiệu đầu vào. Dữ liệu được cắt thành các frame nhỏ 25-30ms, chồng lấn 10ms, trích xuất 40 đặc trưng MFCC cho mỗi frame.
  • Phương pháp phân tích: Xây dựng mô hình học sâu BiLSTM đa nhiệm với hai đầu ra softmax, một cho phát hiện nhịp thở (có/không), một cho phân loại loại nhịp thở (bình thường, sâu, mạnh, khác). Mô hình được huấn luyện trên tập dữ liệu đã gán nhãn.
  • Timeline nghiên cứu: Quá trình thu thập và xử lý dữ liệu kéo dài gần 2 năm, từ thu thập, tiền xử lý, xây dựng mô hình đến triển khai ứng dụng phát hiện nhịp thở thời gian thực.
  • Cỡ mẫu và chọn mẫu: Hàng nghìn mẫu âm thanh nhịp thở được thu thập, trong đó dữ liệu được chọn lọc kỹ lưỡng, đảm bảo đa dạng về loại nhịp thở và điều kiện thu thập để tăng tính đại diện.

Kết quả nghiên cứu và thảo luận

Những phát hiện chính

  1. Hiệu quả lọc nhiễu RNNoise: Bộ lọc RNNoise giúp giảm đáng kể nhiễu môi trường, nâng cao chất lượng dữ liệu âm thanh đầu vào, cải thiện độ chính xác mô hình lên khoảng 15% so với dữ liệu chưa lọc.
  2. Độ chính xác mô hình BiLSTM đa nhiệm: Mô hình đạt độ chính xác phát hiện nhịp thở trên 90%, phân loại nhịp thở đạt khoảng 88%, vượt trội so với các mô hình học máy truyền thống như SVM (độ chính xác khoảng 83%).
  3. Tiết kiệm thời gian xử lý: Việc sử dụng học sâu đa nhiệm giúp giảm thời gian xử lý dữ liệu và trích xuất đặc trưng thủ công, rút ngắn thời gian huấn luyện và dự đoán xuống còn khoảng 30% so với phương pháp truyền thống.
  4. Ứng dụng thực tế: Ứng dụng phát hiện và phân loại nhịp thở dựa trên mô hình BiLSTM được triển khai trên thiết bị Raspberry Pi, hoạt động ổn định trong thời gian thực với độ trễ dưới 1 giây.

Thảo luận kết quả

Kết quả cho thấy việc áp dụng mô hình học sâu đa nhiệm BiLSTM là phù hợp và hiệu quả trong bài toán phát hiện và phân loại nhịp thở dựa trên dữ liệu âm thanh. Việc sử dụng bộ lọc RNNoise giúp xử lý nhiễu hiệu quả, điều này phù hợp với các nghiên cứu quốc tế về xử lý tín hiệu âm thanh y tế. So với các nghiên cứu trước đây sử dụng học máy truyền thống như SVM, KNN, mô hình BiLSTM đa nhiệm không chỉ nâng cao độ chính xác mà còn giảm thiểu công đoạn trích xuất đặc trưng thủ công, giúp hệ thống có thể vận hành thời gian thực.

Dữ liệu được trình bày qua các bảng ma trận nhầm lẫn và biểu đồ độ chính xác cho thấy mô hình có khả năng phân biệt tốt các loại nhịp thở khác nhau, đặc biệt là nhịp thở bình thường và nhịp thở sâu. Tuy nhiên, một số loại nhịp thở ít phổ biến hơn vẫn còn tỷ lệ nhầm lẫn nhất định, cần cải tiến thêm trong các nghiên cứu tiếp theo.

Việc triển khai ứng dụng trên thiết bị nhỏ gọn như Raspberry Pi cho thấy tiềm năng ứng dụng trong thực tế, đặc biệt tại các vùng có điều kiện y tế hạn chế. Kết quả này góp phần thúc đẩy phát triển các giải pháp y tế số, hỗ trợ chẩn đoán và theo dõi bệnh hô hấp hiệu quả hơn.

Đề xuất và khuyến nghị

  1. Phát triển hệ thống thu thập dữ liệu đa kênh: Mở rộng thu thập dữ liệu âm thanh nhịp thở từ nhiều vị trí trên cơ thể để tăng độ chính xác phân loại, đồng thời giảm thiểu ảnh hưởng của nhiễu môi trường. Thời gian thực hiện: 6-12 tháng, chủ thể: nhóm nghiên cứu và đối tác y tế.
  2. Tối ưu mô hình BiLSTM đa nhiệm: Nâng cao khả năng phân loại các loại nhịp thở ít phổ biến bằng cách tăng cường dữ liệu huấn luyện và áp dụng kỹ thuật học tăng cường (data augmentation). Mục tiêu tăng độ chính xác phân loại lên trên 92%. Thời gian: 6 tháng, chủ thể: nhóm phát triển AI.
  3. Triển khai ứng dụng trên nền tảng di động và IoT: Phát triển ứng dụng tích hợp trên smartphone và thiết bị IoT để thuận tiện theo dõi nhịp thở cá nhân, hỗ trợ giám sát từ xa. Thời gian: 12 tháng, chủ thể: nhóm phát triển phần mềm và đối tác công nghệ.
  4. Xây dựng quy trình bảo mật và quản lý dữ liệu y tế: Thiết lập hệ thống bảo mật nghiêm ngặt, tuân thủ quy định về bảo vệ thông tin cá nhân và dữ liệu y tế nhằm đảm bảo quyền riêng tư người dùng. Thời gian: 6 tháng, chủ thể: ban quản lý dự án và chuyên gia pháp lý.
  5. Đào tạo và phổ biến công nghệ cho nhân viên y tế: Tổ chức các khóa đào tạo sử dụng hệ thống phát hiện và phân loại nhịp thở cho bác sĩ, kỹ thuật viên nhằm nâng cao hiệu quả ứng dụng trong thực tế. Thời gian: liên tục, chủ thể: cơ sở y tế và nhóm nghiên cứu.

Đối tượng nên tham khảo luận văn

  1. Nhà nghiên cứu và sinh viên ngành Khoa học máy tính, Trí tuệ nhân tạo: Nghiên cứu sâu về ứng dụng học sâu đa nhiệm trong xử lý tín hiệu âm thanh y tế, phát triển mô hình BiLSTM.
  2. Chuyên gia y tế và kỹ thuật viên y sinh: Áp dụng công nghệ phát hiện và phân loại nhịp thở trong chẩn đoán và theo dõi bệnh hô hấp, nâng cao hiệu quả điều trị.
  3. Nhà phát triển phần mềm và IoT: Tham khảo kiến thức về xây dựng hệ thống thu thập và xử lý dữ liệu âm thanh nhịp thở, phát triển ứng dụng y tế số.
  4. Quản lý dự án và nhà hoạch định chính sách y tế: Hiểu rõ tiềm năng và thách thức của công nghệ AI trong y tế, từ đó xây dựng chiến lược phát triển và ứng dụng phù hợp.

Câu hỏi thường gặp

  1. Mô hình BiLSTM đa nhiệm có ưu điểm gì so với các mô hình học máy truyền thống?
    Mô hình BiLSTM đa nhiệm có khả năng xử lý dữ liệu chuỗi thời gian theo cả hai chiều, giúp nắm bắt thông tin ngữ cảnh trước và sau, đồng thời thực hiện đồng thời hai nhiệm vụ phát hiện và phân loại nhịp thở. Điều này giúp tăng độ chính xác và giảm công đoạn trích xuất đặc trưng thủ công so với các mô hình như SVM hay KNN.

  2. Bộ lọc RNNoise hoạt động như thế nào trong xử lý dữ liệu âm thanh nhịp thở?
    RNNoise là bộ lọc dựa trên mạng nơ-ron hồi quy, được huấn luyện để phân biệt và loại bỏ nhiễu trong tín hiệu âm thanh. Trong nghiên cứu, RNNoise giúp giảm nhiễu môi trường hiệu quả, cải thiện chất lượng dữ liệu đầu vào, từ đó nâng cao độ chính xác của mô hình phân loại.

  3. Dữ liệu âm thanh nhịp thở được thu thập như thế nào?
    Dữ liệu được thu thập bằng thiết bị Raspberry Pi gắn micro BETA 98H/C, ghi âm các đoạn âm thanh nhịp thở dài 4 giây, với các mẫu chồng lấn 2 giây để tăng lượng dữ liệu và giảm mất mát thông tin. Dữ liệu được thu tại nhiều địa điểm nhằm đảm bảo tính đa dạng và đại diện.

  4. Ứng dụng phát hiện nhịp thở có thể triển khai trong thực tế ra sao?
    Ứng dụng được triển khai trên thiết bị nhỏ gọn như Raspberry Pi, có thể hoạt động thời gian thực với độ trễ dưới 1 giây. Điều này cho phép theo dõi nhịp thở liên tục, hỗ trợ giám sát sức khỏe từ xa, đặc biệt hữu ích tại các vùng có điều kiện y tế hạn chế.

  5. Những thách thức chính khi áp dụng mô hình học sâu trong phân tích nhịp thở là gì?
    Thách thức bao gồm việc thu thập và quản lý dữ liệu nhạy cảm, xử lý dữ liệu lớn liên tục với nhiều nhiễu, và phát triển thiết bị thu thập dữ liệu có chi phí hợp lý, kích thước nhỏ gọn. Ngoài ra, cần đảm bảo độ chính xác cao để ứng dụng trong y tế, đồng thời tuân thủ các quy định bảo mật thông tin.

Kết luận

  • Luận văn đã nghiên cứu và ứng dụng thành công mô hình học sâu đa nhiệm BiLSTM trong phát hiện và phân loại nhịp thở dựa trên dữ liệu âm thanh, đạt độ chính xác phát hiện trên 90% và phân loại khoảng 88%.
  • Bộ lọc RNNoise được áp dụng hiệu quả trong xử lý nhiễu âm thanh, nâng cao chất lượng dữ liệu đầu vào cho mô hình.
  • Hệ thống được triển khai trên thiết bị Raspberry Pi, hoạt động ổn định trong thời gian thực, có tiềm năng ứng dụng rộng rãi trong y tế số.
  • Nghiên cứu góp phần giải quyết các khó khăn về chi phí, kích thước thiết bị và xử lý dữ liệu lớn trong theo dõi nhịp thở, đồng thời mở hướng phát triển các ứng dụng y tế thông minh.
  • Các bước tiếp theo bao gồm tối ưu mô hình, mở rộng thu thập dữ liệu đa kênh, phát triển ứng dụng trên nền tảng di động và IoT, đồng thời xây dựng quy trình bảo mật dữ liệu y tế.

Để tiếp tục phát triển và ứng dụng công nghệ này, các nhà nghiên cứu và chuyên gia y tế được khuyến khích hợp tác, thử nghiệm và triển khai thực tế nhằm nâng cao chất lượng chăm sóc sức khỏe cộng đồng.