Khóa luận chẩn đoán bệnh phổi qua X-Quang với Deep Learning - HCMUTE

Khóa luận nghiên cứu ứng dụng xử lý ảnh và học sâu với các mô hình VGG16, MobileNet, DenseNet121 để chẩn đoán bệnh phổi qua ảnh X-Quang chính xác

2016 - 2020

123
0
0

Phí lưu trữ

35 Point

Tóm tắt

I. Cách chẩn đoán bệnh phổi bằng xử lý ảnh và học sâu hiệu quả

Chẩn đoán bệnh phổi bằng xử lý ảnh và học sâu đang trở thành xu hướng nổi bật trong y học hiện đại. Phương pháp này kết hợp xử lý ảnh y tế với mô hình học sâu để phát hiện sớm các bất thường trên phổi từ hình ảnh X-quang hoặc CT. Theo nghiên cứu của Nguyễn Lê Điền và Nguyễn Trường Tráng (2020) tại Trường Đại học Sư phạm Kỹ thuật TP.HCM, việc ứng dụng mạng nơ-ron tích chập (CNN) giúp phân loại chính xác các bệnh như viêm phổi, lao phổi và ung thư phổi với độ tin cậy cao. Học sâu cho phép hệ thống tự động trích xuất đặc trưng hình ảnh mà không cần can thiệp thủ công, từ đó nâng cao hiệu suất chẩn đoán. Việc tích hợp Grad-CAM còn hỗ trợ trực quan hóa vùng ảnh có ảnh hưởng lớn đến quyết định chẩn đoán, tăng tính minh bạch cho mô hình. Với sự phát triển nhanh chóng của trí tuệ nhân tạo trong y tế, phương pháp này hứa hẹn mang lại giải pháp hỗ trợ bác sĩ trong môi trường lâm sàng, đặc biệt tại các cơ sở y tế thiếu chuyên gia chẩn đoán hình ảnh.

1.1. Vai trò của xử lý ảnh trong chẩn đoán bệnh phổi

Xử lý ảnh y tế là bước nền tảng để chuẩn hóa và làm nổi bật vùng phổi trong hình ảnh X-quang. Các kỹ thuật như cắt vùng ROI (Region of Interest), cân bằng histogram và lọc nhiễu giúp cải thiện chất lượng đầu vào cho mô hình học sâu. Việc xác định chính xác vùng phổi giúp loại bỏ nhiễu từ các cơ quan lân cận, từ đó tăng độ chính xác của hệ thống chẩn đoán. Trong nghiên cứu của nhóm sinh viên ĐH Sư phạm Kỹ thuật TP.HCM, bước tiền xử lý này đóng vai trò then chốt trong việc nâng cao hiệu suất mô hình.

1.2. Ứng dụng học sâu trong phân tích hình ảnh phổi

Học sâu, đặc biệt là CNN, cho phép hệ thống tự học các đặc trưng hình ảnh phức tạp từ dữ liệu huấn luyện. Các kiến trúc như VGG16, MobileNetV2DenseNet được thử nghiệm để phân loại bệnh phổi. Mô hình không chỉ phát hiện sự hiện diện của bệnh mà còn có thể phân biệt giữa các loại bệnh khác nhau. Độ chính xác đạt được trong nghiên cứu đạt khoảng 85–90%, tùy thuộc vào chất lượng dữ liệu và kiến trúc mạng. Điều này cho thấy tiềm năng lớn của trí tuệ nhân tạo trong chẩn đoán hình ảnh y tế.

II. Thách thức khi chẩn đoán bệnh phổi bằng học sâu

Mặc dù tiềm năng lớn, chẩn đoán bệnh phổi bằng xử lý ảnh và học sâu vẫn đối mặt với nhiều thách thức. Một trong những rào cản chính là thiếu dữ liệu y tế chất lượng cao và được gán nhãn chính xác. Dữ liệu hình ảnh X-quang thường không đồng nhất về độ phân giải, góc chụp và thiết bị thu nhận. Ngoài ra, thiếu kiến thức y khoa chuyên sâu ở nhóm phát triển mô hình khiến việc giải thích kết quả chẩn đoán trở nên khó khăn. Nghiên cứu của Nguyễn Lê Điền và cộng sự (2020) cũng chỉ ra rằng mô hình hiện tại mới chỉ dừng ở mức thử nghiệm, chưa được triển khai thực tế trong môi trường lâm sàng. Một thách thức khác là tính minh bạch và khả năng giải thích của mô hình học sâu – điều cực kỳ quan trọng trong y học. Bác sĩ cần hiểu rõ lý do vì sao mô hình đưa ra chẩn đoán cụ thể để tin tưởng và áp dụng vào thực tiễn.

2.1. Hạn chế về dữ liệu huấn luyện và gán nhãn

Dữ liệu hình ảnh y tế cho bệnh phổi thường khan hiếm và khó thu thập do yêu cầu bảo mật và đạo đức. Việc gán nhãn chính xác đòi hỏi sự can thiệp của bác sĩ chuyên khoa, tốn kém thời gian và chi phí. Trong nghiên cứu tại ĐH Sư phạm Kỹ thuật TP.HCM, nhóm tác giả chỉ có thể tiếp cận dữ liệu từ các nguồn công cộng như ChestX-ray14, dẫn đến hạn chế về số lượng và độ đa dạng bệnh lý. Điều này ảnh hưởng trực tiếp đến khả năng tổng quát hóa của mô hình.

2.2. Thiếu tích hợp kiến thức y học vào mô hình AI

Các mô hình học sâu hiện tại chủ yếu dựa trên đặc trưng hình ảnh mà không lồng ghép kiến thức y học lâm sàng. Điều này khiến hệ thống khó phân biệt các dấu hiệu tương đồng giữa các bệnh khác nhau, ví dụ như viêm phổiphù phổi. Việc kết hợp hệ chuyên gia y tế với mô hình AI là hướng đi cần thiết để nâng cao độ chính xác và độ tin cậy trong chẩn đoán.

III. Phương pháp chẩn đoán bệnh phổi bằng CNN và Grad CAM

Phương pháp chẩn đoán bệnh phổi bằng xử lý ảnh và học sâu hiệu quả nhất hiện nay dựa trên mạng nơ-ron tích chập (CNN) kết hợp với kỹ thuật Grad-CAM. CNN trích xuất đặc trưng hình ảnh tự động, trong khi Grad-CAM giúp xác định vùng ảnh có ảnh hưởng lớn đến quyết định phân lớp. Trong nghiên cứu của Nguyễn Lê Điền và Nguyễn Trường Tráng (2020), nhóm đã thử nghiệm nhiều kiến trúc CNN như VGG16, MobileNetV2DenseNet trên tập dữ liệu hình ảnh X-quang phổi. Kết quả cho thấy DenseNet đạt độ chính xác cao nhất nhờ khả năng tái sử dụng đặc trưng qua các lớp. Đồng thời, Grad-CAM được sử dụng để trực quan hóa vùng tổn thương, giúp bác sĩ xác minh tính hợp lý của chẩn đoán. Đây là bước tiến quan trọng trong việc xây dựng hệ thống AI hỗ trợ chẩn đoán y tế có thể giải thích được.

3.1. So sánh hiệu suất các kiến trúc CNN trong chẩn đoán

Các kiến trúc CNN như VGG16, MobileNetV2DenseNet được đánh giá dựa trên độ chính xác, tốc độ và khả năng tổng quát. VGG16 cho kết quả ổn định nhưng yêu cầu tài nguyên cao. MobileNetV2 nhẹ và nhanh, phù hợp triển khai trên thiết bị di động. DenseNet vượt trội nhờ kết nối dày đặc giữa các lớp, giúp giảm mất mát thông tin và cải thiện độ chính xác. Trong nghiên cứu, DenseNet đạt độ chính xác khoảng 89% trên tập kiểm thử.

3.2. Trực quan hóa chẩn đoán bằng Grad CAM

Grad-CAM (Gradient-weighted Class Activation Mapping) là kỹ thuật giúp hiểu được mô hình học sâu đang “nhìn” vào đâu khi đưa ra quyết định. Bằng cách tính gradient của lớp phân lớp theo đặc trưng ở lớp cuối cùng, Grad-CAM tạo ra bản đồ nhiệt cho thấy vùng ảnh quan trọng. Trong chẩn đoán bệnh phổi, bản đồ này thường trùng với vùng tổn thương thực tế, giúp bác sĩ tin tưởng hơn vào kết quả AI.

IV. Ứng dụng thực tiễn của AI trong chẩn đoán bệnh phổi

Ứng dụng chẩn đoán bệnh phổi bằng xử lý ảnh và học sâu đang dần được triển khai trong thực tế, đặc biệt tại các quốc gia đang phát triển. Hệ thống AI có thể hỗ trợ bác sĩ chẩn đoán hình ảnh trong việc sàng lọc hàng loạt ca X-quang, giảm tải công việc và phát hiện sớm bệnh. Tại Việt Nam, nghiên cứu của Trường Đại học Sư phạm Kỹ thuật TP.HCM mở ra hướng tiếp cận khả thi cho các giải pháp y tế thông minh. Tuy nhiên, để đưa vào lâm sàng, hệ thống cần vượt qua các rào cản về đạo đức y khoa, quy định pháp lýtích hợp với hệ thống bệnh viện. Một số ứng dụng thương mại như Qure.ai hay Aidoc đã được FDA phê duyệt, cho thấy xu hướng toàn cầu đang chuyển dịch mạnh mẽ sang AI hỗ trợ chẩn đoán y tế.

4.1. Hỗ trợ sàng lọc bệnh phổi tại cơ sở y tế tuyến dưới

Tại các bệnh viện tuyến huyện hoặc vùng sâu vùng xa, thiếu bác sĩ chuyên khoa X-quang, hệ thống AI có thể đóng vai trò sàng lọc ban đầu. Khi phát hiện dấu hiệu bất thường, hệ thống sẽ cảnh báo để chuyển tuyến trên. Điều này giúp tối ưu hóa nguồn lực y tế và phát hiện sớm bệnh phổi, đặc biệt là ung thư phổi – bệnh có tỷ lệ tử vong cao nếu không được điều trị kịp thời.

4.2. Tích hợp AI vào hệ thống PACS và HIS

Để ứng dụng thực tế, mô hình học sâu cần được tích hợp vào hệ thống lưu trữ và truyền hình ảnh y tế (PACS)hệ thống thông tin bệnh viện (HIS). Việc này đòi hỏi chuẩn hóa đầu vào, bảo mật dữ liệu và giao diện thân thiện với bác sĩ. Nghiên cứu của nhóm sinh viên ĐH Sư phạm Kỹ thuật TP.HCM đề xuất hướng phát triển theo mô hình cloud-based AI, cho phép truy cập từ xa và cập nhật mô hình liên tục.

V. Tương lai của chẩn đoán bệnh phổi bằng học sâu

Tương lai của chẩn đoán bệnh phổi bằng xử lý ảnh và học sâu nằm ở sự kết hợp giữa AI, dữ liệu lớnkiến thức y học lâm sàng. Các hướng phát triển bao gồm: thu thập dữ liệu đa trung tâm, áp dụng học liên kết (federated learning) để bảo vệ quyền riêng tư, và tích hợp hệ chuyên gia y tế vào vòng huấn luyện mô hình. Nhóm nghiên cứu tại ĐH Sư phạm Kỹ thuật TP.HCM đề xuất cải thiện độ chính xác bằng cách xác định chính xác vùng phổi và mở rộng tập dữ liệu cho các bệnh như thoát vị hoành, xơ hóa phổi. Ngoài ra, việc ứng dụng mô hình chuyển đổi (transformer) trong xử lý hình ảnh y tế cũng đang được kỳ vọng sẽ vượt trội hơn CNN truyền thống. Mục tiêu cuối cùng là xây dựng hệ thống AI y tế thông minh, đáng tin cậy và có thể triển khai rộng rãi trong hệ thống y tế quốc gia.

5.1. Mở rộng dữ liệu và bệnh lý đa dạng

Để nâng cao độ chính xác, cần thu thập thêm hình ảnh X-quang cho các bệnh phổi ít phổ biến như phù phổi, xơ hóa phổithoát vị hoành. Việc hợp tác với nhiều bệnh viện giúp tạo ra tập dữ liệu đa dạng, phản ánh đúng thực tế lâm sàng. Điều này cũng giúp mô hình tránh thiên lệch (bias) và hoạt động tốt trên nhiều nhóm dân cư khác nhau.

5.2. Nghiên cứu mô hình học sâu thế hệ mới

Các kiến trúc học sâu mới như Vision Transformer (ViT)ConvNeXt đang cho thấy hiệu suất vượt trội trong nhiều tác vụ thị giác máy tính. Việc thử nghiệm những mô hình này trong chẩn đoán bệnh phổi là hướng đi tiềm năng. Đồng thời, học không giám sáthọc bán giám sát có thể tận dụng lượng lớn dữ liệu X-quang chưa gán nhãn, giảm phụ thuộc vào chuyên gia y khoa trong khâu chuẩn bị dữ liệu.

14/03/2026
Chuẩn đoán một số bệnh phổi sử dụng xử lý ảnh và học sâu