## Tổng quan nghiên cứu
Bệnh lao phổi (Tuberculosis - TB) là một căn bệnh nhiễm trùng mạn tính, có tốc độ tiến triển nhanh và thường có giai đoạn tiềm ẩn sau khi nhiễm bệnh ban đầu. Theo báo cáo của Tổ chức Y tế Thế giới (WHO) năm 2020, số người tử vong do TB là khoảng 1.3 triệu người, gần gấp đôi so với số người chết do HIV/AIDS. Bệnh có khả năng lây lan qua đường hô hấp, gây ra nhiều khó khăn trong việc phát hiện sớm do triệu chứng mơ hồ như ho kéo dài, tức ngực, vã mồ hôi, ho ra máu. Việc phát hiện sớm và chính xác bệnh TB là rất quan trọng nhằm giảm thiểu gánh nặng kinh tế và y tế cho xã hội.
Mục tiêu nghiên cứu là phát triển hệ thống phân loại ảnh X-quang tự động nhằm phát hiện bệnh lao phổi sử dụng các phương pháp học sâu (Deep Neural Networks - DNN). Nghiên cứu tập trung vào việc áp dụng và so sánh hiệu quả của các kiến trúc mạng học sâu hiện đại như VGG16, EfficientNetB7, MobileNetV3, DenseNet121 và RegNet trên 4 bộ dữ liệu X-quang uy tín: Tuberculosis Chest X-ray, Shenzhen Chest X-ray, Montgomery Chest X-ray và India Chest X-ray. Phạm vi nghiên cứu bao gồm dữ liệu thu thập từ nhiều vùng địa lý khác nhau trên thế giới, đảm bảo tính đa dạng và đặc trưng vùng miền, với thời gian thực hiện nghiên cứu đến năm 2022.
Nghiên cứu có ý nghĩa lớn trong việc hỗ trợ y tế chẩn đoán tự động, tăng độ chính xác và giảm thời gian xử lý, đồng thời giảm thiểu chi phí và nhân lực trong phát hiện bệnh lao phổi.
## Cơ sở lý thuyết và phương pháp nghiên cứu
### Khung lý thuyết áp dụng
- **Bệnh lao phổi (Tuberculosis)**: Do vi khuẩn Mycobacterium tuberculosis gây ra, có thể tồn tại ở dạng tiềm ẩn hoặc phát bệnh. Vi khuẩn lây lan qua không khí khi người bệnh ho, khạc nhổ.
- **Bài toán phân lớp nhị phân**: Phân loại ảnh X-quang thành hai lớp: TUBERCULOSIS (bệnh lao) và NORMAL (bình thường). Mô hình học sâu được xây dựng để ánh xạ ảnh đầu vào thành nhãn dự đoán.
- **Trích chọn đặc trưng (Feature Extraction)**: Sử dụng các lớp tích chập (Convolutional layers) trong mạng học sâu để tự động rút trích các đặc trưng quan trọng từ ảnh X-quang, giảm chiều dữ liệu và tăng hiệu quả phân loại.
- **Mạng học sâu (Deep Neural Networks - DNN)**: Áp dụng các kiến trúc CNN tiên tiến như VGG16, EfficientNetB7, MobileNetV3, DenseNet121, RegNet để khai thác đặc trưng ảnh và phân loại chính xác.
- **Đánh giá mô hình**: Sử dụng các chỉ số như Accuracy, Precision, Recall, F1-Score và Confusion Matrix để đánh giá hiệu quả phân loại, đặc biệt chú trọng giảm thiểu False Negative nhằm tránh bỏ sót bệnh nhân.
### Phương pháp nghiên cứu
- **Nguồn dữ liệu**: Sử dụng 4 bộ dữ liệu X-quang phổi đã được gán nhãn gồm Tuberculosis Chest X-ray (7000 ảnh), Shenzhen Chest X-ray (662 ảnh), Montgomery Chest X-ray (138 ảnh), và India Chest X-ray (155 ảnh). Các bộ dữ liệu được chia thành tập huấn luyện, xác thực và kiểm thử theo tỷ lệ phù hợp.
- **Tiền xử lý dữ liệu**: Ảnh được chuẩn hóa kích thước 224x224, sử dụng kênh màu RGB. Áp dụng kỹ thuật tăng cường dữ liệu (data augmentation) như xoay, cắt, dịch chuyển để tăng tính đa dạng và giảm hiện tượng quá khớp, đặc biệt cho bộ dữ liệu nhỏ như Montgomery và India.
- **Phương pháp phân tích**: Huấn luyện các mô hình DNN với kỹ thuật học chuyển tiếp (transfer learning) và tinh chỉnh (fine-tuning). Sử dụng thuật toán tối ưu Gradient Descent, hàm mất mát binary cross-entropy, và kỹ thuật Early Stopping để tránh overfitting.
- **Timeline nghiên cứu**: Quá trình thu thập dữ liệu, tiền xử lý, huấn luyện và đánh giá mô hình được thực hiện trong năm 2021-2022, sử dụng nền tảng Google Colab Pro với GPU Tesla T4 để tăng tốc độ xử lý.
## Kết quả nghiên cứu và thảo luận
### Những phát hiện chính
- **Hiệu quả mô hình MobileNetV3**: Trên bộ dữ liệu Tuberculosis Chest X-ray, MobileNetV3 đạt số lượng True Positive và False Negative lần lượt là 64 và 62, cho thấy khả năng phát hiện bệnh tốt và giảm thiểu bỏ sót bệnh nhân.
- **Kết quả trên bộ dữ liệu Shenzhen**: MobileNetV3 đạt True Positive là 4 và False Negative là 13, đứng thứ hai về hiệu quả so với các mô hình khác.
- **Bộ dữ liệu Montgomery**: MobileNetV3 cho kết quả tốt nhất với True Positive khoảng 7.5 và False Negative là 12, thể hiện sự ổn định trên bộ dữ liệu nhỏ.
- **Bộ dữ liệu India**: MobileNetV3 cũng cho kết quả khả quan với True Positive là 12 và False Negative là 10.
- **Sử dụng tài nguyên**: MobileNetV3 sử dụng ít tham số nhất (khoảng 4.5 triệu tham số tổng cộng), tiết kiệm bộ nhớ và tài nguyên tính toán so với các mô hình như EfficientNetB7 (hơn 80 triệu tham số).
- **Thời gian huấn luyện**: MobileNetV3 có thời gian huấn luyện nhanh nhất trên bộ dữ liệu Shenzhen (khoảng 4.85 phút), tuy nhiên trên các bộ dữ liệu khác thời gian có thể dài hơn nhưng vẫn đảm bảo hiệu suất ổn định.
### Thảo luận kết quả
- Sự vượt trội của MobileNetV3 đến từ kiến trúc Depthwise Separable Convolution giúp giảm số lượng tham số và tăng tốc độ tính toán mà không làm giảm độ chính xác.
- Kết quả cho thấy mô hình học sâu hiện đại có thể áp dụng hiệu quả cho bài toán phân loại ảnh X-quang lao phổi, hỗ trợ chẩn đoán tự động với độ chính xác cao.
- So sánh với các nghiên cứu trước đây, mô hình MobileNetV3 đạt hiệu suất tương đương hoặc vượt trội trong khi sử dụng tài nguyên thấp hơn, phù hợp với ứng dụng trên thiết bị di động hoặc hệ thống có hạn chế về phần cứng.
- Việc giữ nguyên đặc trưng vùng miền trong dữ liệu giúp mô hình có khả năng thích ứng tốt hơn với dữ liệu thực tế của người dân Việt Nam trong tương lai.
- Dữ liệu có thể được trình bày qua biểu đồ Confusion Matrix và bảng so sánh các chỉ số Accuracy, F1-Score để minh họa hiệu quả từng mô hình trên từng bộ dữ liệu.
## Đề xuất và khuyến nghị
- **Triển khai mô hình MobileNetV3 trong hệ thống y tế**: Áp dụng mô hình vào các trung tâm y tế để hỗ trợ chẩn đoán sớm bệnh lao phổi, giảm thiểu sai sót và tăng tốc độ xử lý.
- **Mở rộng thu thập dữ liệu địa phương**: Thu thập và xây dựng bộ dữ liệu X-quang của người dân Việt Nam để huấn luyện và tinh chỉnh mô hình, nâng cao độ chính xác và tính thực tiễn.
- **Phát triển ứng dụng di động và IoT**: Tận dụng ưu điểm của MobileNetV3 để phát triển các ứng dụng trên thiết bị di động, giúp bác sĩ và nhân viên y tế có thể chẩn đoán nhanh tại hiện trường.
- **Đào tạo và nâng cao nhận thức cho nhân viên y tế**: Tổ chức các khóa đào tạo về sử dụng công nghệ AI trong chẩn đoán TB, giúp họ hiểu và tin tưởng vào kết quả mô hình.
- **Theo dõi và cập nhật mô hình liên tục**: Thiết lập quy trình đánh giá và cập nhật mô hình định kỳ dựa trên dữ liệu mới, đảm bảo mô hình luôn phù hợp với thực tế và cải thiện hiệu suất.
## Đối tượng nên tham khảo luận văn
- **Nhà nghiên cứu và sinh viên ngành Khoa học Máy tính, Trí tuệ nhân tạo**: Học hỏi phương pháp áp dụng học sâu trong xử lý ảnh y tế, phát triển mô hình phân loại ảnh.
- **Chuyên gia y tế và bác sĩ chuyên khoa lao phổi**: Hiểu rõ về công nghệ hỗ trợ chẩn đoán tự động, áp dụng vào thực tiễn để nâng cao hiệu quả khám chữa bệnh.
- **Nhà phát triển phần mềm và công ty công nghệ y tế**: Tham khảo kiến trúc mạng và quy trình huấn luyện mô hình để phát triển các sản phẩm AI trong y tế.
- **Cơ quan quản lý y tế và chính sách**: Đánh giá tiềm năng ứng dụng AI trong hệ thống y tế quốc gia, xây dựng chính sách hỗ trợ phát triển công nghệ y tế số.
## Câu hỏi thường gặp
1. **Mô hình học sâu nào phù hợp nhất cho bài toán phát hiện lao phổi?**
MobileNetV3 được đánh giá cao nhờ hiệu suất phân loại tốt, sử dụng ít tài nguyên và thời gian huấn luyện nhanh, phù hợp với nhiều môi trường triển khai.
2. **Tại sao cần tăng cường dữ liệu (data augmentation)?**
Tăng cường dữ liệu giúp mở rộng kích thước và đa dạng bộ dữ liệu, giảm hiện tượng quá khớp, đặc biệt quan trọng với các bộ dữ liệu nhỏ như Montgomery và India.
3. **Các chỉ số đánh giá mô hình nào quan trọng nhất?**
F1-Score là chỉ số tổng hợp giữa Precision và Recall, rất quan trọng trong bài toán phân loại bệnh để cân bằng giữa phát hiện đúng bệnh và giảm bỏ sót.
4. **Mô hình có thể áp dụng trên thiết bị di động không?**
MobileNetV3 được thiết kế tối ưu cho các thiết bị có tài nguyên hạn chế như điện thoại di động và IoT, giúp triển khai dễ dàng trong thực tế.
5. **Làm thế nào để đảm bảo mô hình phù hợp với dữ liệu Việt Nam?**
Cần thu thập và huấn luyện lại mô hình trên bộ dữ liệu X-quang của người dân Việt Nam, giữ nguyên đặc trưng vùng miền để tăng độ chính xác và tính ứng dụng.
## Kết luận
- Luận văn đã phát triển và đánh giá thành công các mô hình học sâu tiên tiến cho bài toán phân loại ảnh X-quang phát hiện bệnh lao phổi.
- MobileNetV3 nổi bật với hiệu suất cao, sử dụng tài nguyên thấp và thời gian huấn luyện hợp lý, phù hợp cho ứng dụng thực tế.
- Nghiên cứu sử dụng 4 bộ dữ liệu đa dạng, đảm bảo tính khách quan và khả năng áp dụng rộng rãi.
- Kết quả nghiên cứu đã được công bố trên tạp chí quốc tế uy tín, góp phần thúc đẩy ứng dụng AI trong y tế.
- Đề xuất các hướng phát triển tiếp theo bao gồm mở rộng dữ liệu địa phương, phát triển ứng dụng di động và đào tạo nhân lực y tế.
**Hành động tiếp theo:** Triển khai thử nghiệm mô hình MobileNetV3 trong các cơ sở y tế, đồng thời thu thập dữ liệu thực tế để tinh chỉnh và nâng cao hiệu quả chẩn đoán tự động bệnh lao phổi.