Tổng quan nghiên cứu
COVID-19, do virus SARS-CoV-2 gây ra, đã trở thành đại dịch toàn cầu với hơn 760 triệu ca nhiễm và hơn 6,8 triệu ca tử vong tính đến tháng 9 năm 2023 theo WHO. Triệu chứng phổ biến nhất là tổn thương phổi, gây khó thở và suy hô hấp nghiêm trọng. Việc đánh giá mức độ tổn thương phổi đóng vai trò quan trọng trong việc quyết định phương án điều trị và quản lý bệnh nhân. Tuy nhiên, các phương pháp chẩn đoán truyền thống như RT-PCR và chụp CT thường không phổ biến tại nhiều trung tâm y tế do chi phí và thời gian thực hiện cao. Hình ảnh X-quang ngực (CXR) trở thành công cụ chẩn đoán hiệu quả, dễ tiếp cận và chi phí thấp hơn, hỗ trợ bác sĩ trong việc đánh giá mức độ tổn thương phổi do COVID-19.
Mục tiêu nghiên cứu là phát triển mô hình học máy dựa trên mạng nơ-ron tích chập (CNN) để tự động phân loại mức độ tổn thương phổi thành bốn cấp độ: bình thường, nhẹ, trung bình và nặng, từ hình ảnh CXR. Nghiên cứu sử dụng dữ liệu thu thập từ các bộ dữ liệu công khai Brixia và COVIDGR, kết hợp và tăng cường dữ liệu để tạo ra một tập dữ liệu đa dạng và cân bằng gồm 9.294 hình ảnh. Phạm vi nghiên cứu tập trung vào việc xây dựng và đánh giá hiệu suất của năm kiến trúc CNN hiện đại trên tập dữ liệu này, nhằm hỗ trợ chẩn đoán nhanh và chính xác tại các cơ sở y tế có nguồn lực hạn chế. Kết quả nghiên cứu có ý nghĩa lớn trong việc giảm tải cho hệ thống y tế, tối ưu hóa chi phí và nâng cao hiệu quả điều trị bệnh nhân COVID-19.
Cơ sở lý thuyết và phương pháp nghiên cứu
Khung lý thuyết áp dụng
Nghiên cứu dựa trên hai lý thuyết chính: lý thuyết học sâu (Deep Learning) và bài toán phân loại đa lớp trong học máy. Mạng nơ-ron tích chập (CNN) được chọn làm nền tảng do khả năng tự động trích xuất đặc trưng từ hình ảnh, giảm thiểu sự phụ thuộc vào kiến thức chuyên môn và tăng hiệu quả xử lý dữ liệu hình ảnh phức tạp. Các khái niệm chính bao gồm:
- Phân loại đa lớp (Multi-class Classification): Phân chia dữ liệu thành nhiều lớp khác nhau dựa trên đặc điểm nhận dạng, trong đó bài toán phân loại mức độ tổn thương phổi gồm 4 lớp.
- Trích chọn đặc trưng tự động: CNN tự động học các đặc trưng quan trọng từ hình ảnh CXR như hình dạng, kích thước và cấu trúc tổn thương.
- Hệ thống điểm số Brixia và RALE: Các hệ thống điểm số này được sử dụng để đánh giá mức độ tổn thương phổi dựa trên hình ảnh CXR, làm cơ sở gán nhãn cho dữ liệu.
- Phương pháp tăng cường dữ liệu (Data Augmentation): Bao gồm xoay, lật, phóng to, thu nhỏ hình ảnh nhằm cân bằng số lượng mẫu giữa các lớp và tăng tính đa dạng cho tập dữ liệu.
- Transfer Learning và Fine-tuning: Sử dụng các mô hình CNN đã được huấn luyện trước trên tập dữ liệu lớn để tăng hiệu quả và giảm thời gian đào tạo trên tập dữ liệu COVID-19 cụ thể.
Phương pháp nghiên cứu
Nguồn dữ liệu chính gồm hai bộ dữ liệu công khai: Brixia (4.695 hình ảnh) và COVIDGR (852 hình ảnh), được kết hợp và chuẩn hóa thành tập dữ liệu mới gồm 9.294 hình ảnh CXR, chia đều cho 4 lớp tổn thương phổi. Dữ liệu được xử lý qua các bước tiền xử lý, chuẩn hóa định dạng ảnh, tăng cường dữ liệu và cân bằng nhãn.
Nghiên cứu áp dụng năm kiến trúc CNN hiện đại: VGG16, RegNet0Y40, DenseNet121, MobileNetV3 và EfficientNetB7. Các mô hình được huấn luyện sử dụng kỹ thuật transfer learning với pre-trained weights trên ImageNet, sau đó fine-tuning trên tập dữ liệu COVID-19. Phương pháp Early Stopping được áp dụng với tham số patience=5 để ngăn ngừa overfitting.
Quá trình nghiên cứu được thực hiện theo timeline gồm: thu thập và chuẩn bị dữ liệu, xây dựng và huấn luyện mô hình, đánh giá hiệu suất bằng các chỉ số accuracy, precision, recall, specificity và F1-score, cuối cùng là kiểm định bằng kỹ thuật cross-validation 5-fold và 10-fold để đảm bảo tính ổn định và tổng quát của mô hình.
Kết quả nghiên cứu và thảo luận
Những phát hiện chính
- Hiệu suất mô hình EfficientNetB7 vượt trội: Mô hình đạt độ chính xác trung bình 75,58% và độ đặc hiệu 91,86% trên tập dữ liệu 6.498 hình ảnh huấn luyện, cao hơn so với các mô hình VGG16, RegNet0Y40, DenseNet121 và MobileNetV3.
- Khả năng phân loại tổn thương nhẹ (MILD) tốt nhất: EfficientNetB7 phân loại chính xác tổn thương phổi nhẹ với tỷ lệ cao hơn các mô hình khác, giảm thiểu sai sót phân loại nhầm sang lớp bình thường hoặc nặng.
- Kết quả cross-validation ổn định: Qua 5-fold và 10-fold cross-validation, mô hình EfficientNetB7 duy trì độ đặc hiệu lên đến 92,89% và độ chính xác khoảng 75%, chứng tỏ tính ổn định và khả năng tổng quát hóa tốt trên dữ liệu chưa từng thấy.
- Thời gian huấn luyện và dự đoán hợp lý: Mặc dù EfficientNetB7 có số lượng tham số lớn, thời gian huấn luyện và dự đoán không chênh lệch đáng kể so với các mô hình khác, đảm bảo khả năng ứng dụng thực tế.
Thảo luận kết quả
Hiệu suất vượt trội của EfficientNetB7 có thể giải thích bởi kiến trúc tối ưu, khả năng trích xuất đặc trưng sâu và kỹ thuật fine-tuning hiệu quả trên tập dữ liệu đa dạng và cân bằng. Việc tăng cường dữ liệu và cân bằng nhãn đã giúp mô hình tránh được hiện tượng overfitting và cải thiện khả năng nhận diện các mức độ tổn thương khác nhau.
So với các nghiên cứu trước đây tập trung phân loại nhị phân (nghiêm trọng và không nghiêm trọng), nghiên cứu này mở rộng phân loại thành bốn cấp độ, cung cấp thông tin chi tiết hơn cho bác sĩ trong việc quyết định phương án điều trị. Kết quả cũng phù hợp với các nghiên cứu sử dụng CNN trong phân loại hình ảnh y tế, đồng thời khắc phục hạn chế về dữ liệu nhỏ và mất cân bằng nhãn.
Biểu đồ ma trận nhầm lẫn và biểu đồ so sánh hiệu suất các mô hình minh họa rõ ràng sự ưu việt của EfficientNetB7 trong việc phân loại chính xác các lớp tổn thương, đặc biệt là lớp nhẹ và trung bình, vốn thường bị nhầm lẫn trong các mô hình khác. Điều này có ý nghĩa quan trọng trong thực tế lâm sàng, giúp phát hiện sớm và theo dõi sát sao bệnh nhân.
Đề xuất và khuyến nghị
- Triển khai mô hình EfficientNetB7 tại các cơ sở y tế: Áp dụng mô hình để hỗ trợ bác sĩ trong việc phân loại mức độ tổn thương phổi từ hình ảnh CXR, giúp rút ngắn thời gian chẩn đoán và nâng cao độ chính xác. Thời gian thực hiện: 6-12 tháng; chủ thể: bệnh viện, trung tâm y tế.
- Phát triển hệ thống giám sát sức khỏe phổi tự động: Xây dựng hệ thống theo dõi tình trạng phổi bệnh nhân COVID-19 theo thời gian thực dựa trên mô hình CNN, hỗ trợ quản lý và điều trị cá nhân hóa. Thời gian: 12-18 tháng; chủ thể: các tổ chức nghiên cứu và công ty công nghệ y tế.
- Mở rộng tập dữ liệu và cập nhật mô hình: Thu thập thêm dữ liệu hình ảnh từ nhiều nguồn khác nhau để tăng tính đa dạng và cải thiện độ chính xác mô hình, đồng thời cập nhật mô hình định kỳ. Thời gian: liên tục; chủ thể: cộng đồng nghiên cứu và bệnh viện.
- Đào tạo và nâng cao năng lực cho nhân viên y tế: Tổ chức các khóa đào tạo về ứng dụng AI trong chẩn đoán hình ảnh, giúp nhân viên y tế hiểu và sử dụng hiệu quả công nghệ mới. Thời gian: 6 tháng; chủ thể: các cơ sở y tế và trường đại học.
Đối tượng nên tham khảo luận văn
- Bác sĩ và chuyên gia y tế: Nâng cao khả năng chẩn đoán và phân loại mức độ tổn thương phổi do COVID-19, hỗ trợ quyết định điều trị chính xác và kịp thời.
- Nhà nghiên cứu và phát triển AI trong y tế: Tham khảo phương pháp xây dựng và đánh giá mô hình CNN, kỹ thuật tăng cường dữ liệu và transfer learning trong lĩnh vực y tế.
- Quản lý bệnh viện và trung tâm y tế: Áp dụng mô hình để tối ưu hóa quy trình chẩn đoán, giảm tải cho hệ thống y tế và nâng cao hiệu quả quản lý bệnh nhân.
- Sinh viên và học viên ngành công nghệ thông tin, y sinh: Học tập về ứng dụng học sâu trong phân tích hình ảnh y tế, phát triển kỹ năng nghiên cứu và triển khai mô hình thực tế.
Câu hỏi thường gặp
Mô hình CNN có thể áp dụng cho các bệnh phổi khác không?
Có, kiến trúc CNN và phương pháp huấn luyện có thể được điều chỉnh để phân loại các bệnh phổi khác như viêm phổi, lao phổi, dựa trên dữ liệu hình ảnh phù hợp.Tại sao chọn hình ảnh X-quang thay vì CT?
Hình ảnh X-quang dễ tiếp cận, chi phí thấp và thời gian thực hiện nhanh hơn CT, phù hợp với nhiều cơ sở y tế có nguồn lực hạn chế.Làm thế nào để xử lý sự mất cân bằng dữ liệu trong tập huấn luyện?
Sử dụng kỹ thuật tăng cường dữ liệu như xoay, lật, phóng to, thu nhỏ để cân bằng số lượng mẫu giữa các lớp, giúp mô hình học hiệu quả hơn.Mô hình có thể hoạt động tốt trên dữ liệu thực tế không?
Qua đánh giá cross-validation và thử nghiệm trên tập dữ liệu đa dạng, mô hình cho thấy khả năng tổng quát hóa tốt, phù hợp ứng dụng thực tế.Thời gian huấn luyện và dự đoán của mô hình có phù hợp với môi trường bệnh viện?
Thời gian huấn luyện có thể kéo dài nhưng chỉ thực hiện một lần; thời gian dự đoán nhanh, phù hợp để hỗ trợ chẩn đoán tức thì tại bệnh viện.
Kết luận
- Đã xây dựng thành công tập dữ liệu đa dạng gồm 9.294 hình ảnh CXR phân loại bốn mức độ tổn thương phổi do COVID-19.
- Đánh giá năm mô hình CNN hiện đại, trong đó EfficientNetB7 đạt hiệu suất cao nhất với độ chính xác 75% và độ đặc hiệu 92,89%.
- Áp dụng kỹ thuật tăng cường dữ liệu và transfer learning giúp cải thiện đáng kể hiệu quả phân loại và khả năng tổng quát hóa của mô hình.
- Mô hình có tiềm năng ứng dụng thực tế trong hỗ trợ chẩn đoán và quản lý bệnh nhân COVID-19 tại các cơ sở y tế.
- Hướng phát triển tiếp theo là mở rộng dữ liệu, phát triển hệ thống giám sát sức khỏe phổi tự động và đào tạo nhân lực y tế về ứng dụng AI.
Luận văn khuyến khích các nhà nghiên cứu và chuyên gia y tế tiếp tục phát triển và ứng dụng các mô hình học sâu trong lĩnh vực y tế, góp phần nâng cao chất lượng chăm sóc sức khỏe cộng đồng.