ĐẠI HỌC QUỐC GIA TP.HCM TRUONG ĐẠI HỌC CÔNG NGHỆ THONG TIN BÙI THỊ ÁNH HOA __ LUẬN VĂN THẠC SĨ NGÀNH CÔNG NGHỆ THÔNG TIN Mã số: 8. Hồ Chí Minh, 2022 ĐẠI HỌC QUỐC GIA TP.HCM TRƯỜNG ĐẠI HỌC CÔNG NGHỆ THÔNG TIN ⁄Z BÙI THỊ ÁNH HOA HINH ANH VA DU LIEU LAM SANG __ LUẬN VAN THAC SĨ NGÀNH CÔNG NGHỆ THÔNG TIN Mã số: 8.01 NGƯỜI HƯỚNG DẪN KHOA HỌC TS. LÊ MINH HƯNG TP. Hồ Chí Minh, 2022 LỜI CẢM ƠN Lời đầu tiên, em xin gửi lời cảm ơn chân thành đến thầy TS. Lê Minh Hưng đã nhiệt tình hướng dẫn, định hướng và hỗ trợ em trong suốt quá trình tìm hiểu và thực hiện luận văn. Đồng thời em cũng xin chân thành cảm ơn quý thay cô và bạn bè trường Đại Học Công Nghệ Thông Tin thành phố Hồ Chí Minh đã nhiệt tình giảng dạy và chia sẻ những kiến thức và kinh nghiệm quý báu trong suốt quá trình em học tập ở trường. Cuối cùng em cũng xin gửi lời cảm ơn sâu sắc đến bạn bè đồng nghiệp, đặc biệt là gia đình đã luôn luôn ủng hộ, động viên và giúp đỡ em trên chặn đường này. Em xin chân thành cảm ơn. Thanh phố Hồ Chí Minh, ngày 29 tháng 12 năm 2022 Bùi Thị Ánh Hoa LỜI CAM ĐOAN Tôi xin cam đoan đây là công trình nghiên cứu của riêng tôi dưới sự hướng dẫn của tiền sĩ Lê Minh Hưng. Các số liệu và kết quả trong luậi văn là trung thực va các thông tin trong luận văn được trích dẫn rõ ràng và đầy dủ nguồn gốc trong phần tài liệu tham khảo. Tôi xin hoàn toàn chịu trách nhiệm về nội dung luận văn của mình. Thanh phô Hồ Chí Minh, ngày 29 tháng 12 năm 2022 Bùi Thị Ánh Hoa TÓM TẮT NỘI DUNG Xo phổi là bệnh lý về hô hấp và gây phá hủy cấu trúc phổi theo thời gian nhưng không có dấu hiệu rõ ràng và cũng như nguyên nhân gây bệnh như là xơ phổi vô căn. Do đó, các y bác sĩ có rất ít thông tin và thời gian để nghiên cứu và tim ra phương pháp điều trị thích hợp dẫn đến người bệnh có ít khả năng phục hồi và dẫn đến tử vong. Ngày nay, khi mà công nghệ ngày càng phát triển đặc biệt như công nghệ thông tin thì việc ứng dụng hỗ trợ chuẩn đoán bệnh được ra đời giúp hỗ trợ phần nào trong quá trình chuẩn đoán và điều trị. Dung tích sống gắng sức là lượng không khí được thở ra thật mạnh sau khi hít vào thật sâu là một trong những chỉ số quan trọng giúp đánh giá sự tiến triển của chức năng phổi. Vì thế, dự đoán giá trị này có thể giúp hỗ trợ dự đoán và tiên lượng bệnh xơ phổi ở giai đoạn đầu. Bài toán "Ước lượng dung tích sống gắng sức bệnh xơ phổi dựa trên hình ảnh và dữ liệu lâm sàng" là vấn đề mà luận văn sẽ tập trung tìm hiểu và nghiên cứu dựa trên bộ dữ liệu cuộc thi trên Kaggle “OSIC Pulmonary Fibrosis Progression”. Sau khi phân tích và tìm hiểu bài toán luận văn đã đề xuất mô hình dự đoán kết hợp LSTM với mô hình tích chập và hồi quy nhiều phân vị để giải quyết bài toán này. Kết quả mô hình đề xuất đã đạt được kết quả tốt hơn top 1 của cuộc thi trên bộ dữ liệu bảo mật của Kaggle và ứng dụng minh họa cũng được trình bày trong luận văn này. Cuối cùng, công nghệ thông tin đã đóng một vai trò quan trọng trong hỗ trợ y khoa. Tuy nhiên, các ứng dụng công nghệ thông tin vào y khoa phải luôn luôn được cập nhật và cải thiện, do đó học tập và nghiên cứu để nâng cao kiến thức là điều hết sức cần thiết. iii iv [Danh mục các thuật ngữ và từ viết tit] vii viii [Danh sách hình ve] viii 1 1 3 4 4 4 6 6 6 1.2 Giới thiệu bộ dữ liệu|. 7 [L2_ Các hướng nghiên cứu tiếp cận liên quan|.1 Cac hướng tiếp cận xử lý anh CT Scan|.2 _ Các hướng tiếp cận xử lý dữ liệu lâm sàng|.3 Các hướng kết hợp cả ảnh và dữ liệu lâm sàng|. SH ky 13 2_Cơsở lý thuyết 14 .1 Mang thân kinh nhântạo|.ẶẶẶ eee 14 ba | Giới thiệu mạng thần kinh sinhhọc|_. a eee eens 7 ` eet tenet eae 18 20 21 21 22 23 2.7__Hoc chuyển tiếp và tỉnh chinh|.1 Kiến tric mô hình hồi quy|.4 Hồi quy phân vÌ. 31 3 Mô hình đề xuất 32 3.1 Phân tích dữliệu.I Phân tích dữ liệu ảnh|. 32 "an an 33 Môhình|. 39 Lee 42 Lee eee ee eee 46 E Thực nghiệm và ứng dụng minh hoạ| 47 WW-ẽ-.1 Tien xử ly dữ liệu anh #2 Dodobaitoan.1 Kết quả so sánh transfer learning va fine-tuning].2 _ Kết quả zero-center và không có zero-center|.- 433 Kết quả CNN-LSTM, LSTM-QRNN va kết hợp cả hai mô hinh] .4 Kết quả so sánh với các hướng tiếp cận khác|.4 Ứng dụng minh họa|.- 61 61 E:2 Khuyến nghị -- - es ho.1 Thông tin số lượng tuan khám của bệnh nhân|. 34 E2 Dữ liệu khám lâm sàng minh họa giá tri Percent trong OSIC [6Ï ¬ 38 jua thử nghiệm transfer learning và fine-tunin 52 ua thử nghiệm fine-tuning với các mô hình khác nhau| 52 S|fe]fis Kết quả so sánh chuẩn hóa zero-center với không zero-center|. 4 / zZE Eẩ a z eae 88 = E 3© = 5 53 54 viii Danh sách hình vẽ [[ — Hình ảnh minh họa bệnh xơ phổi|.2 _ Hình ảnh minh họa mô hình toán học của nơ-ron (Nguồn hình (5) . 15 3 _ Hình ảnh minh họa kiến trúc của mạng nơ-ron (Nguôn hình [I5)|. 16 4 Hình ảnh minh họa quá trình tim trong số tôi ưu (Nguồn hình (16D).5 Hình ảnh minh họa kiến trúc cơ ban CNN (Nguén hình [I6Ù|. 18 E:6_ Hình ảnh minh họa tang Convolution (Nguôn hình [I7J|.7 Hình ảnh minh họa bước trượt Stride (Nguồn hình ñØJ|. 19 ps Hình ảnh minh họa Padding (Nguồn hình 7| . 19 Es» Hình ảnh minh họa lớp pooling (Nguồn hình [I5Ù|. 10_Hinh ảnh minh họa lớp FC (Nguồn hình [I6Ù|. 21 E 11 Hình ảnh minh họa mô hình VGG16 (Nguồn hình [I8Ù|.13 Hình minh hoa ResNet50 (Nguôn hình [20))}.14 Mô hình thu phóng.- 23 E-15 Mô hình mở rộng với những kịch bản khác nhau (Nguồn hình [21]|.16 Hình minh họa mô hình RNN (Nguôn hình [5| . 19 Hinh minh họa LSTM với trang thái ẩn (Nguồn hình [17] .22_ Hình minh hoa hàm smooth pinball loss (Nguôn hình [22J)|. 31 B-1_ Phân bổ số lượng ảnh Dicom trong tập dữ liệu công bổ|.2 __ Hình anh CT scan cat lớp day đủ của một bệnh nhân từ OSIC [6||.3_ Hình minh họa ma trận tương quan giữa các thuộc tính trong dữ liệu lâm sang] 35 B.4_ Hình minh họa phân bố của thông tin khám lâm sàng theo Weeks}. 35 BS Hình minh họa phân bo của giá trị FVC|.- 35 B:6_ Hình minh họa xu hướng FVC của bệnh nhân|. 36 Bz Hình minh họa phân bố của thuộc tinh Age va Sex|.8 _ Hình minh họa phân bé của thuộc tinh Smoking Status|.9 Hinh minh hoa quan hệ FVC, Sex và SmokingSatu|. 38 k Hình minh họa quan hệ FVC, Age và SmokinsgSatusl.TT Hình ảnh minh họa mô hình top I OSĨC Ï6Ï].12 Hình ảnh minh họa mô hình xử lý anh CT Scan top I OSIC [6Ï]].13 Tĩnh ảnh minh hoa mo hình dy đoán trên dữ liệu lam sàng top | OSIC Io].14 Hình ảnh mô hình đề xuat dự đoán FVC tổng. 15_Hinh ảnh mô hình dé xuất dự đoán FVC dựa trên anh CT Scan]. 16 Hình ảnh mô hình đề xuất dự đoán FVC dựa trên dữ liệu lâm sang]. 17_Hinh ảnh minh họa mô hình kết hợp FVŒI và fVG@|. 45 48 49 [<3 Hình ảnh minh họa kiến trúc trang webl.- 55 <2 Tĩnh ảnh minh họa use case của trang web|.- 56 E-5_ Hình ảnh minh họa đăng nhập hệ thông|.- 5 ¬ 38 7 Hình ảnh minh họa trang thông tin bệnh nhân|. 58 É:§_ Hình ảnh minh họa trang dự đoán EVŒ]|. 59 ks Hình ảnh minh họa kết qua dự đoán FVC theo bảng]. 59 ®» Mở đầu Dẫn nhập Xơ phổi vô căn (Idiopathic Pulmonary Fibrosis - IPF) là bệnh lý nghiêm trọng gây seo ở mô phổi, làm mất đi tính đàn hồi, giảm thể tích khí lưu thông dẫn đến tình trạng suy hô hấp và tử vong. Đặc biệt là khi bệnh lý đã xảy ra thì không thể phục hồi và bệnh lý tiến triển ngày một tệ hơn. Thời gian sống trung bình khi mắc bệnh của bệnh nhân khoảng 2-4 năm [T]. Bệnh thường xảy ra phổ biến với nam hon là nữ, thường ở độ tuổi thường lớn hơn 50 tuổi [Ïl. Triệu chứng bệnh xuắt hiện chậm, đa phan không có triệu chứng nhưng suy thoái nhanh chóng, thường không rõ nguyên nhân và giống các bệnh lý khác ở phổi. Bên cạnh đó, các biện pháp điều trị xơ phổi vô căn cũng còn hạn chế và phải tùy thuộc vào từng bệnh nhân để có phương pháp phù hợp. Chi số ống gắng sức (Forced Vital Capacity FVC) là lượng không khí tối da thé ra sau khi hít vào that sâu của phổi [2]. Chi số này được do bằng phép đo dung phế như hinh 2} "hups:/Awww.com/news/articles-and-information/668-what-is-pulmonary-fibrosis.html, truy cập lần cuối 23/10/2022. người đo sẽ phải kẹp mũi, miệng ngậm ống đo kết nối với máy dung phế và có gắng lấy hơi thật sâu và thở ra thật mạnh trong thời gian từ 6 đến 8 giây. Trong quá trình thực hiện phép đo, nhân viên y tế sẽ giám sát và hỗ trợ bệnh nhân. Bên cạnh đó, để đảm bảo chỉ số đo được chất lượng bệnh nhân khi thực hiện phép đo này nên [2Ì]: * Không nên uống rượu bia, hút thuốc, tập thể dục thể thao quá độ hay ăn quá no trước đó ít nhất 30 phút hoặc vài giờ. + Ngồi thẳng lưng, hai chân chạm đất và không bắt chéo chân. * Nên mặc quan áo thoải mái và tinh thần ở trạng thái tự nhiên thoải mái. Nose clip trained person watches and helps the patient during the test Patient takes a deep breath and blows a hard as possible into the ‘mouthpiece for 6 to 8 seconds nti the lungs are emptied ‘a8 much as possible ‘Spirometer records the results ofthe test Hinh 2: Hinh anh minh hoa phép do phé dung dé do rvd] Chi số FVC là một trong những chỉ số được sử dụng để hỗ trợ chẩn đoán và điều trị các bệnh lý liên quan về phổi đặc biệt là xơ phổi. Điển hình như một số nghiên cứu sử dụng giá trị dung tích sống gắng sức để dự đoán sự sống xót của bệnh nhân đối với các bệnh lý liên quan về phổi như [3] [4] [5]. Trong đó [3] sử dung cả hình ảnh và thông tin khám lâm sang để dự đoán còn [5] dùng hình chụp phổi động (dynamic chest radiography) để dự đoán FVC.
Tổng quan nghiên cứu
Xơ phổi vô căn (Idiopathic Pulmonary Fibrosis - IPF) là bệnh lý nghiêm trọng về hô hấp, gây phá hủy cấu trúc phổi và suy giảm chức năng hô hấp theo thời gian. Thời gian sống trung bình của bệnh nhân mắc IPF chỉ khoảng 2-4 năm, với tỷ lệ nam giới mắc bệnh cao gấp khoảng 3,7 lần nữ giới và chủ yếu xuất hiện ở độ tuổi trên 50. Triệu chứng bệnh thường xuất hiện chậm, không rõ ràng và dễ nhầm lẫn với các bệnh phổi khác, khiến việc chẩn đoán và điều trị gặp nhiều khó khăn. Dung tích sống gắng sức (Forced Vital Capacity - FVC) là chỉ số quan trọng đánh giá chức năng phổi, phản ánh lượng không khí bệnh nhân có thể thở ra mạnh sau khi hít vào sâu. Việc dự đoán chính xác giá trị FVC theo tuần giúp hỗ trợ phát hiện sớm và tiên lượng bệnh xơ phổi, từ đó nâng cao hiệu quả điều trị và tăng khả năng sống sót cho bệnh nhân.
Luận văn tập trung nghiên cứu bài toán dự đoán giá trị FVC dựa trên dữ liệu hình ảnh CT scan phổi và thông tin khám lâm sàng của bệnh nhân, sử dụng bộ dữ liệu OSIC Pulmonary Fibrosis Progression với khoảng 200 bệnh nhân được theo dõi trong 1-2 năm. Mục tiêu chính là xây dựng mô hình học sâu kết hợp mạng nơ-ron tích chập (CNN) và mạng hồi quy dài hạn (LSTM) cùng phương pháp hồi quy phân vị nhằm dự đoán chính xác chỉ số FVC theo tuần, đồng thời phát triển ứng dụng minh họa hỗ trợ y bác sĩ trong chẩn đoán và điều trị. Nghiên cứu có ý nghĩa quan trọng trong việc ứng dụng công nghệ thông tin vào y khoa, góp phần nâng cao chất lượng chăm sóc sức khỏe cho bệnh nhân xơ phổi.
Cơ sở lý thuyết và phương pháp nghiên cứu
Khung lý thuyết áp dụng
Luận văn dựa trên các lý thuyết và mô hình học sâu hiện đại trong lĩnh vực xử lý ảnh y khoa và dự đoán chuỗi thời gian:
-
Mạng nơ-ron tích chập (CNN): Được sử dụng để trích xuất đặc trưng từ ảnh CT scan cắt lớp phổi. Các kiến trúc CNN phổ biến như VGG16, ResNet50 và EfficientNet được nghiên cứu để tối ưu hóa hiệu suất trích xuất đặc trưng. CNN giúp giảm số lượng tham số so với mạng nơ-ron truyền thống nhờ các lớp tích chập, pooling và fully connected.
-
Mạng nơ-ron hồi quy dài hạn (LSTM): Được áp dụng để xử lý dữ liệu chuỗi thời gian từ các chỉ số lâm sàng theo tuần, giúp mô hình ghi nhớ và dự đoán xu hướng thay đổi FVC trong tương lai. LSTM khắc phục hạn chế của RNN truyền thống trong việc lưu giữ thông tin dài hạn.
-
Hồi quy phân vị (Quantile Regression): Phương pháp thống kê giúp dự đoán các phân vị khác nhau của biến phụ thuộc, cung cấp không chỉ giá trị trung bình mà còn khoảng tin cậy cho dự đoán FVC. Hàm mất mát smooth pinball loss được sử dụng để tối ưu hóa mô hình hồi quy phân vị, giúp cải thiện độ chính xác và ổn định.
Ba khái niệm chính trong nghiên cứu gồm: Dung tích sống gắng sức (FVC), mạng nơ-ron tích chập (CNN), và mạng hồi quy dài hạn (LSTM).
Phương pháp nghiên cứu
-
Nguồn dữ liệu: Bộ dữ liệu OSIC Pulmonary Fibrosis Progression từ cuộc thi Kaggle, gồm khoảng 200 bệnh nhân xơ phổi với dữ liệu ảnh CT scan phổi tuần 0 (định dạng DICOM) và dữ liệu khám lâm sàng theo tuần trong vòng 1-2 năm. Tập train gồm 176 bệnh nhân với 1549 dòng dữ liệu, tập test công khai 5 bệnh nhân và tập test bảo mật khoảng 24-28 bệnh nhân.
-
Phân tích và tiền xử lý dữ liệu: Phân tích đặc điểm dữ liệu ảnh và lâm sàng, loại bỏ dữ liệu ngoại lai, chuẩn hóa ảnh CT scan, lựa chọn ảnh cắt lớp chứa thông tin phổi chính. Dữ liệu lâm sàng gồm các thuộc tính: tuần khám (Weeks), FVC, tuổi (Age), giới tính (Sex), tình trạng hút thuốc (Smoking Status).
-
Phương pháp phân tích: Kết hợp mô hình CNN để trích xuất đặc trưng ảnh CT scan, LSTM để xử lý chuỗi thời gian dữ liệu lâm sàng, và hồi quy phân vị để dự đoán giá trị FVC theo từng tuần cùng khoảng tin cậy. Sử dụng kỹ thuật học chuyển tiếp (transfer learning) và tinh chỉnh (fine-tuning) các mô hình CNN đã được huấn luyện trước nhằm tăng hiệu quả và giảm thời gian huấn luyện.
-
Cỡ mẫu và chọn mẫu: Toàn bộ dữ liệu 176 bệnh nhân được sử dụng cho huấn luyện và đánh giá mô hình, với phân chia tập train và test theo bộ dữ liệu Kaggle. Phương pháp chọn mẫu dựa trên dữ liệu thực tế thu thập, đảm bảo tính đại diện cho bệnh nhân xơ phổi.
-
Timeline nghiên cứu: Thu thập và phân tích dữ liệu trong vòng 1-2 năm theo tuần khám của bệnh nhân; huấn luyện và đánh giá mô hình trong quá trình thực hiện luận văn; phát triển ứng dụng minh họa sau khi hoàn thiện mô hình.
Kết quả nghiên cứu và thảo luận
Những phát hiện chính
-
Phân tích dữ liệu ảnh CT scan: Số lượng ảnh cắt lớp CT scan mỗi bệnh nhân dao động lớn, từ 12 đến 1018 ảnh, với trung bình khoảng 188 ảnh. Thông tin phổi tập trung chủ yếu ở các ảnh giữa chuỗi cắt lớp, do đó mô hình tập trung xử lý các ảnh này giúp giảm thời gian huấn luyện mà vẫn giữ được thông tin quan trọng.
-
Đặc điểm dữ liệu lâm sàng: Trong 176 bệnh nhân, đa số (132 bệnh nhân) có 9 tuần thông tin khám lâm sàng, với giá trị FVC dao động từ khoảng 1220 ml đến 4500 ml, tập trung chủ yếu trong khoảng 2000-3300 ml. Khoảng 82% bệnh nhân có xu hướng giảm FVC theo thời gian, phản ánh tiến triển xấu của bệnh. Tỷ lệ nam giới cao gấp 3,7 lần nữ giới, phù hợp với đặc điểm dịch tễ của IPF.
-
Hiệu quả mô hình đề xuất: Mô hình kết hợp CNN-LSTM và hồi quy phân vị đạt kết quả dự đoán FVC chính xác hơn so với các mô hình top 1 trong cuộc thi Kaggle OSIC trên bộ dữ liệu bảo mật. Việc sử dụng kỹ thuật học chuyển tiếp và tinh chỉnh giúp cải thiện độ chính xác và giảm thời gian huấn luyện. Mô hình cũng cung cấp chỉ số Confidence giúp đánh giá độ tin cậy của dự đoán.
-
Ứng dụng minh họa: Ứng dụng web được xây dựng cho phép nhập dữ liệu ảnh CT scan và thông tin lâm sàng, hiển thị kết quả dự đoán FVC theo tuần cùng khoảng tin cậy, hỗ trợ bác sĩ trong việc theo dõi tiến triển bệnh và đưa ra quyết định điều trị kịp thời.
Thảo luận kết quả
Kết quả nghiên cứu cho thấy việc kết hợp dữ liệu hình ảnh và lâm sàng là hướng tiếp cận hiệu quả trong dự đoán chức năng phổi cho bệnh nhân xơ phổi. Mô hình CNN giúp trích xuất đặc trưng sâu sắc từ ảnh CT scan, trong khi LSTM xử lý tốt dữ liệu chuỗi thời gian khám lâm sàng, phản ánh sự thay đổi FVC theo tuần. Hồi quy phân vị cung cấp dự đoán không chỉ giá trị trung bình mà còn khoảng tin cậy, tăng tính ứng dụng thực tế.
So với các nghiên cứu trước đây chỉ sử dụng một loại dữ liệu hoặc mô hình đơn lẻ, mô hình đề xuất đã cải thiện đáng kể độ chính xác dự đoán. Việc phân tích kỹ đặc điểm dữ liệu, loại bỏ dữ liệu ngoại lai và áp dụng kỹ thuật học chuyển tiếp cũng góp phần nâng cao hiệu quả mô hình. Kết quả có thể được trình bày qua biểu đồ so sánh giá trị FVC thực tế và dự đoán theo tuần, bảng thống kê độ chính xác và sai số trung bình của các mô hình.
Tuy nhiên, mô hình vẫn còn hạn chế do dữ liệu ảnh CT scan chỉ được chụp một lần ở tuần 0, chưa phản ánh đầy đủ sự thay đổi cấu trúc phổi theo thời gian. Ngoài ra, số lượng bệnh nhân trong bộ dữ liệu còn hạn chế, ảnh hưởng đến khả năng tổng quát hóa của mô hình. Do đó, nghiên cứu tiếp theo cần mở rộng dữ liệu và cải tiến mô hình để nâng cao độ chính xác và ứng dụng rộng rãi hơn.
Đề xuất và khuyến nghị
-
Tăng cường thu thập dữ liệu đa thời điểm: Khuyến nghị các cơ sở y tế thu thập ảnh CT scan phổi định kỳ theo tuần hoặc tháng để cung cấp dữ liệu phong phú hơn cho mô hình dự đoán, giúp phản ánh chính xác tiến triển bệnh. Thời gian thực hiện: 1-2 năm; Chủ thể: bệnh viện, trung tâm y tế.
-
Phát triển mô hình đa nguồn dữ liệu: Kết hợp thêm các dữ liệu sinh học phân tử, xét nghiệm máu và các chỉ số lâm sàng khác để nâng cao độ chính xác dự đoán FVC và tiên lượng bệnh. Thời gian: 6-12 tháng; Chủ thể: nhóm nghiên cứu công nghệ thông tin và y học.
-
Triển khai ứng dụng hỗ trợ chẩn đoán tại bệnh viện: Ứng dụng minh họa mô hình dự đoán FVC nên được tích hợp vào hệ thống quản lý bệnh viện để hỗ trợ bác sĩ theo dõi và điều trị bệnh nhân xơ phổi kịp thời. Thời gian: 3-6 tháng; Chủ thể: phòng công nghệ thông tin bệnh viện, nhà phát triển phần mềm.
-
Đào tạo và nâng cao năng lực chuyên môn: Tổ chức các khóa đào tạo về ứng dụng công nghệ thông tin trong y khoa cho bác sĩ và nhân viên y tế nhằm nâng cao nhận thức và kỹ năng sử dụng các công cụ hỗ trợ chẩn đoán hiện đại. Thời gian: liên tục; Chủ thể: trường đại học, bệnh viện, cơ quan y tế.
Đối tượng nên tham khảo luận văn
-
Bác sĩ chuyên khoa hô hấp và y học lâm sàng: Nghiên cứu giúp hiểu rõ hơn về ứng dụng công nghệ trong chẩn đoán và theo dõi tiến triển bệnh xơ phổi, hỗ trợ ra quyết định điều trị chính xác hơn.
-
Nhà nghiên cứu và phát triển công nghệ y tế: Cung cấp cơ sở lý thuyết và mô hình học sâu kết hợp dữ liệu hình ảnh và lâm sàng, làm nền tảng phát triển các giải pháp AI trong y khoa.
-
Sinh viên và học viên cao học ngành Công nghệ Thông tin và Y sinh: Tài liệu tham khảo về ứng dụng mạng nơ-ron tích chập, LSTM và hồi quy phân vị trong xử lý dữ liệu y tế thực tế.
-
Quản lý và hoạch định chính sách y tế: Hiểu rõ tiềm năng ứng dụng công nghệ thông tin trong nâng cao chất lượng chăm sóc sức khỏe, từ đó xây dựng các chính sách hỗ trợ phát triển công nghệ y tế.
Câu hỏi thường gặp
-
Tại sao dung tích sống gắng sức (FVC) quan trọng trong chẩn đoán xơ phổi?
FVC phản ánh khả năng phổi thở ra lượng khí tối đa sau khi hít vào sâu, giúp đánh giá chức năng phổi và tiến triển bệnh. Dự đoán FVC giúp phát hiện sớm và theo dõi hiệu quả điều trị. -
Mô hình CNN-LSTM hoạt động như thế nào trong bài toán này?
CNN trích xuất đặc trưng từ ảnh CT scan phổi, LSTM xử lý chuỗi thời gian dữ liệu lâm sàng theo tuần, kết hợp để dự đoán giá trị FVC tương lai chính xác hơn. -
Hồi quy phân vị có ưu điểm gì so với hồi quy truyền thống?
Hồi quy phân vị không chỉ dự đoán giá trị trung bình mà còn cung cấp khoảng tin cậy cho dự đoán, giúp đánh giá độ không chắc chắn và tăng tính ứng dụng thực tế. -
Dữ liệu ảnh CT scan chỉ chụp một lần có ảnh hưởng gì đến mô hình?
Việc chỉ có ảnh CT scan tuần 0 giới hạn khả năng mô hình nắm bắt sự thay đổi cấu trúc phổi theo thời gian, có thể làm giảm độ chính xác dự đoán trong dài hạn. -
Ứng dụng minh họa mô hình có thể hỗ trợ bác sĩ như thế nào?
Ứng dụng cho phép nhập dữ liệu ảnh và lâm sàng, hiển thị dự đoán FVC theo tuần cùng khoảng tin cậy, giúp bác sĩ theo dõi tiến triển bệnh và đưa ra quyết định điều trị kịp thời.
Kết luận
- Luận văn đã xây dựng thành công mô hình dự đoán dung tích sống gắng sức (FVC) cho bệnh nhân xơ phổi dựa trên dữ liệu ảnh CT scan và khám lâm sàng, sử dụng kết hợp CNN, LSTM và hồi quy phân vị.
- Mô hình đạt hiệu quả vượt trội so với các phương pháp hiện có trên bộ dữ liệu OSIC Kaggle, cung cấp dự đoán chính xác và chỉ số tin cậy.
- Ứng dụng minh họa được phát triển giúp hỗ trợ y bác sĩ trong chẩn đoán và theo dõi tiến triển bệnh xơ phổi.
- Nghiên cứu góp phần nâng cao vai trò của công nghệ thông tin trong y khoa, đặc biệt trong lĩnh vực chẩn đoán và điều trị bệnh lý phổi.
- Hướng phát triển tiếp theo là mở rộng dữ liệu đa thời điểm, tích hợp thêm các nguồn dữ liệu y tế khác và triển khai ứng dụng thực tế tại các cơ sở y tế.
Quý độc giả và các nhà nghiên cứu được khuyến khích tiếp tục phát triển và ứng dụng các mô hình học sâu trong y học để nâng cao chất lượng chăm sóc sức khỏe cộng đồng.