Xây Dựng Ứng Dụng Phân Loại Hạch Ung Thư Phổi: Luận Văn Thạc Sĩ

Luận văn thạc sĩ CNTT về xây dựng ứng dụng phân loại hạch ung thư phổi. Nghiên cứu và ứng dụng Deep Learning trong y học, hỗ trợ chẩn đoán bệnh hiệu quả.

Trường đại học

Trường Đại học Công nghệ Thông tin

Chuyên ngành

Công nghệ thông tin

Người đăng

Ẩn danh

Thể loại

Luận văn thạc sĩ

2023

Phí lưu trữ

30 Point

Mục lục chi tiết

LỜI CẢM ƠN

LỜI CAM ĐOAN

1. CHƯƠNG 1: TỔNG QUAN

1.1. MỤC TIÊU ĐỀ TÀI

1.2. PHẠM VI VÀ ĐỐI TƯỢNG NGHIÊN CỨU

1.3. NỘI DUNG NGHIÊN CỨU

1.4. PHƯƠNG PHÁP NGHIÊN CỨU

1.5. KHÓ KHĂN VÀ THÁCH THỨC

1.6. HƯỚNG GIẢI QUYẾT

2. CHƯƠNG 2: CƠ SỞ LÝ THUYẾT

2.1. GIỚI THIỆU VỀ DEEP LEARNING

2.2. LỊCH SỬ HÌNH THÀNH

2.3. MỘT SỐ MÔ HÌNH DEEP LEARNING

2.3.1. Mô hình mạng Neural truyền thắng (Feedforward Neural Network — FNN)

2.3.2. Mô hình mạng Neural hồi quy (Recurrent Neural Network — RNN)

2.3.3. Mô hình Transformer

2.3.4. Mô hình mạng sinh đối nghịch Convolutional Neural Network (CNN)

2.3.5. Giới thiệu 3D — Convolutional Neural Network (3D-CNN)

2.3.6. Lớp chuyển đổi (Convolutional Layer)

2.3.7. Lớp được kết nối dày đủ (Fully-Connected Layer)

2.4. MỘT SỐ THƯ VIỆN VÀ THUẬT TOÁN SỬ DỤNG TRONG MÔ HÌNH

2.4.1. Thư viện Tensorflow

2.4.2. Kiến trúc của Tensorflow

2.4.3. Ưu điểm của Tensorflow

2.4.4. Các Component của Tensorflow

2.4.5. Thư viện Keras

2.4.5.1. Giới thiệu về Keras

2.4.6. Thư viện SimpleITK

2.4.7. Dicom và Pydicom

2.4.8. Thư viện OpenCV (CV2)

2.4.9. Thuật toán Gradient Descent

2.5. TỔNG KẾT CHƯƠNG 2

3. CHƯƠNG 3: HỆ THỐNG ĐỀ XUẤT

3.1. Áp dụng mạng 3D-CNN phân loại hạch ung thư phổi

3.2. Xây dựng sơ đồ tổng quan giải quyết bài toán phân loại hạch ung thư

3.3. Trực quan hóa dữ liệu

4. CHƯƠNG 4: CÀI ĐẶT THỰC NGHIỆM VÀ ĐÁNH GIÁ

4.1. Môi trường cài đặt

4.2. Mô tả tập dữ liệu

4.3. Kết quả thực nghiệm

5. CHƯƠNG 5: KẾT LUẬN VÀ HƯỚNG PHÁT TRIỂN

5.1. Kết luận

5.2. Hướng phát triển

TÀI LIỆU THAM KHẢO

Tóm tắt

I. Tổng Quan Về Phân Loại Hạch Ung Thư Phổi Deep Learning

Ung thư phổi là một trong những bệnh ung thư nguy hiểm nhất, với tỷ lệ tử vong cao. Việc phân loại hạch ung thư phổi đóng vai trò quan trọng trong việc chẩn đoán và điều trị. Các phương pháp chẩn đoán truyền thống thường tốn nhiều thời gian và công sức của bác sĩ. Sự ra đời của deep learning mở ra một hướng đi mới, hứa hẹn cải thiện đáng kể hiệu quả và độ chính xác trong chẩn đoán ung thư phổi. Nghiên cứu này tập trung vào việc phát triển ứng dụng AI để tự động phân loại hạch ung thư phổi từ ảnh chụp CT. Đây là một bước tiến quan trọng trong việc nâng cao chất lượng chẩn đoán hình ảnh ung thư phổi và hỗ trợ bác sĩ đưa ra quyết định điều trị tối ưu. Bài toán này không chỉ mang ý nghĩa khoa học mà còn có giá trị thực tiễn to lớn, góp phần giảm gánh nặng cho bệnh nhân và gia đình.

1.1. Tầm Quan Trọng Của Chẩn Đoán Sớm Ung Thư Phổi

Phát hiện sớm ung thư phổi là yếu tố then chốt để cải thiện cơ hội sống sót của bệnh nhân. Hầu hết bệnh nhân ung thư phổi giai đoạn đầu không có triệu chứng rõ ràng, do đó việc chẩn đoán thường bị trì hoãn. Ứng dụng deep learning có thể giúp sàng lọc nhanh chóng và chính xác hơn, từ đó phát hiện bệnh ở giai đoạn sớm nhất. Theo Tổ chức Ung thư Thế giới, việc phát hiện sớm ung thư phổi bằng chụp cắt lớp (CT) có thể giảm tỷ lệ tử vong.

1.2. Mục Tiêu Của Nghiên Cứu Về Phân Loại Hạch Ung Thư

Nghiên cứu này hướng đến việc xây dựng một ứng dụng deep learning có khả năng phân loại hạch ung thư phổi dựa trên ảnh CT. Mục tiêu là phát triển một hệ thống tự động, chính xác và hiệu quả, hỗ trợ bác sĩ trong quá trình chẩn đoán. Ứng dụng sẽ sử dụng mạng 3D CNN và các thư viện như Keras và TensorFlow.

II. Thách Thức Trong Chẩn Đoán Hạch Ung Thư Phổi Hiện Nay

Việc chẩn đoán hạch ung thư phổi hiện nay đối mặt với nhiều thách thức. Các phương pháp truyền thống dựa vào kinh nghiệm và đánh giá chủ quan của bác sĩ, dễ dẫn đến sai sót. Ngoài ra, việc quan sát các dấu hiệu ung thư trên ảnh chụp cắt lớp vi tính liều thấp (LDCT) đòi hỏi nhiều thời gian và chuyên môn cao. Các bộ dữ liệu y tế thường có số lượng hạn chế, gây khó khăn cho việc huấn luyện các mô hình deep learning phức tạp. Sự đa dạng về hình dạng và kết cấu của tổn thương phổi cũng làm tăng độ khó cho quá trình phân loại. Cần có những giải pháp đột phá để vượt qua những rào cản này và nâng cao hiệu quả chẩn đoán ung thư phổi.

2.1. Sự Phụ Thuộc Vào Kinh Nghiệm Của Bác Sĩ X Quang

Bác sĩ X-quang phải dựa trên các tiêu chuẩn chủ quan như kích thước, tính chất và vị trí của tổn thương để chẩn đoán hạch ung thư phổi. Điều này có thể dẫn đến sự khác biệt trong kết quả chẩn đoán giữa các bác sĩ khác nhau. Việc đánh giá hình ảnh LDCT tốn nhiều thời gian và công sức.

2.2. Khó Khăn Trong Huấn Luyện Mô Hình Deep Learning

Các mô hình deep learning cần lượng dữ liệu lớn để huấn luyện hiệu quả. Tuy nhiên, các bộ dữ liệu y tế thường có số lượng hạn chế, đặc biệt là dữ liệu đã được gán nhãn chính xác. Điều này gây khó khăn cho việc xây dựng các mô hình phân loại ung thư có độ chính xác cao. Cần có giải pháp để tăng cường dữ liệu hoặc sử dụng các kỹ thuật học chuyển giao (transfer learning).

2.3. Hạn Chế Của Dữ Liệu Đầu Vào Ảnh 2D Trong Chẩn Đoán Ung Thư Phổi

Dữ liệu đầu vào thông thường cho các mô hình deep learning thường là ảnh 2D, nên sẽ làm mất mát một số đặc trưng có giá trị của dữ liệu do ảnh chụp cắt lớp có cấu trúc 3D. Chẩn đoán ung thư phổi cần giữ được đặc trưng 3 chiều để có thể đưa ra kết luận chính xác nhất.

III. Cách Ứng Dụng Mạng 3D CNN Phân Loại Hạch Ung Thư Phổi

Nghiên cứu này đề xuất sử dụng mạng 3D-CNN (Convolutional Neural Network) để phân loại hạch ung thư phổi. Mạng 3D-CNN có khả năng xử lý dữ liệu hình ảnh 3 chiều, giữ lại thông tin không gian quan trọng trong việc chẩn đoán ung thư phổi. Mô hình sẽ được huấn luyện trên bộ dữ liệu ảnh CT phổi, sử dụng các thư viện như TensorFlow và Keras. Quá trình huấn luyện bao gồm các bước tiền xử lý dữ liệu, xây dựng kiến trúc mạng, tối ưu hóa tham số và đánh giá hiệu năng. Mục tiêu là xây dựng một mô hình có độ chính xác cao, có khả năng phân biệt chính xác giữa hạch lành tính và ác tính, giúp bác sĩ đưa ra quyết định điều trị phù hợp.

3.1. Ưu Điểm Của Mạng 3D CNN Trong Xử Lý Ảnh CT

Mạng 3D-CNN có khả năng xử lý dữ liệu hình ảnh 3 chiều, giữ lại thông tin không gian quan trọng trong việc chẩn đoán ung thư phổi. So với mạng 2D-CNN, mạng 3D-CNN có thể khai thác được nhiều đặc trưng hơn từ dữ liệu ảnh CT, giúp cải thiện độ chính xác của mô hình. Mạng 3D-CNN phù hợp với việc phát hiện và phân loại ung thư trong không gian 3 chiều.

3.2. Quy Trình Huấn Luyện Mô Hình Deep Learning 3D CNN

Quá trình huấn luyện mô hình deep learning bao gồm các bước tiền xử lý dữ liệu, xây dựng kiến trúc mạng, tối ưu hóa tham số và đánh giá hiệu năng. Dữ liệu ảnh CT sẽ được tiền xử lý để loại bỏ nhiễu và chuẩn hóa kích thước. Kiến trúc mạng sẽ được thiết kế phù hợp với đặc điểm của bài toán phân loại hạch ung thư. Các tham số của mô hình sẽ được tối ưu hóa bằng các thuật toán học máy. Hiệu năng của mô hình sẽ được đánh giá bằng các độ đo như độ chính xác, độ nhạy và độ đặc hiệu.

3.3. Tiền Xử Lý Dữ Liệu Ảnh CT Scan Phổi

Trước khi đưa vào mô hình 3D CNN, dữ liệu ảnh CT Scan cần được tiền xử lý kỹ lưỡng. Các bước tiền xử lý bao gồm: Loại bỏ nhiễu, chuẩn hóa kích thước ảnh, cắt ảnh, thay đổi kích thước ảnh, mô phỏng phục hồi khung xương lồng ngực.

IV. Kết Quả Nghiên Cứu Đánh Giá Độ Chính Xác Phân Loại Hạch

Nghiên cứu đã tiến hành thực nghiệm và đánh giá hiệu năng của mô hình deep learning trên bộ dữ liệu ảnh CT phổi. Kết quả cho thấy mô hình đạt được độ chính xác cao trong việc phân loại hạch ung thư phổi. So với các phương pháp truyền thống, mô hình deep learning có khả năng tự động trích xuất đặc trưng và đạt được hiệu quả chẩn đoán tốt hơn. Kết quả này khẳng định tiềm năng ứng dụng của AI trong y học, đặc biệt là trong lĩnh vực chẩn đoán hình ảnh ung thư.

4.1. Độ Chính Xác Của Mô Hình Phân Loại Hạch Ung Thư

Mô hình deep learning đạt được độ chính xác cao trong việc phân loại hạch ung thư phổi. Kết quả này cho thấy tiềm năng ứng dụng của AI trong y học, đặc biệt là trong lĩnh vực chẩn đoán hình ảnh ung thư. Cần có thêm các nghiên cứu để đánh giá hiệu năng của mô hình trên các bộ dữ liệu lớn hơn và đa dạng hơn.

4.2. So Sánh Với Các Phương Pháp Chẩn Đoán Truyền Thống

So với các phương pháp chẩn đoán truyền thống, mô hình deep learning có khả năng tự động trích xuất đặc trưng và đạt được hiệu quả chẩn đoán tốt hơn. Các phương pháp truyền thống thường tốn nhiều thời gian và công sức của bác sĩ, dễ dẫn đến sai sót. Mô hình deep learning có thể giúp giảm thiểu sai sót và nâng cao hiệu quả chẩn đoán.

V. Ứng Dụng Thực Tiễn Và Hướng Phát Triển Của Nghiên Cứu Này

Kết quả nghiên cứu này có thể được ứng dụng trong thực tế để hỗ trợ bác sĩ chẩn đoán ung thư phổi một cách nhanh chóng và chính xác. Ứng dụng deep learning có thể được tích hợp vào hệ thống hỗ trợ quyết định lâm sàng (CDSS), giúp bác sĩ đưa ra quyết định điều trị tối ưu. Trong tương lai, nghiên cứu có thể được mở rộng để phát triển các mô hình deep learning phức tạp hơn, có khả năng phân loại ung thư theo giai đoạn và tiên lượng bệnh. Nghiên cứu cũng có thể được áp dụng cho các loại ung thư khác, góp phần nâng cao chất lượng chăm sóc sức khỏe.

5.1. Tích Hợp Ứng Dụng Deep Learning Vào CDSS

Ứng dụng deep learning có thể được tích hợp vào hệ thống hỗ trợ quyết định lâm sàng (CDSS), giúp bác sĩ đưa ra quyết định điều trị tối ưu. CDSS có thể cung cấp cho bác sĩ thông tin về độ chính xác của mô hình, các đặc trưng quan trọng trong quá trình phân loại ung thư và các lựa chọn điều trị phù hợp.

5.2. Mở Rộng Nghiên Cứu Cho Các Loại Ung Thư Khác

Nghiên cứu có thể được mở rộng để phát triển các mô hình deep learning phức tạp hơn, có khả năng phân loại ung thư theo giai đoạn và tiên lượng bệnh. Nghiên cứu cũng có thể được áp dụng cho các loại ung thư khác, góp phần nâng cao chất lượng chăm sóc sức khỏe. Việc phát triển các mô hình deep learning cho nhiều loại ung thư khác nhau sẽ mang lại lợi ích to lớn cho bệnh nhân và gia đình.

5.3. Phát Triển Ứng Dụng Chẩn Đoán Từ Xa Dựa Trên AI

Trong tương lai, các ứng dụng Deep Learning có thể được triển khai trên nền tảng di động hoặc web để hỗ trợ chẩn đoán từ xa, đặc biệt ở các vùng sâu vùng xa, nơi thiếu nguồn lực y tế. Việc này giúp bệnh nhân tiếp cận dịch vụ y tế chuyên nghiệp một cách dễ dàng hơn, tiết kiệm thời gian và chi phí.

VI. Kết Luận Deep Learning Tương Lai Của Chẩn Đoán Ung Thư Phổi

Nghiên cứu này đã chứng minh tiềm năng to lớn của deep learning trong việc phân loại hạch ung thư phổi. Các kết quả đạt được khẳng định rằng AI trong y học có thể đóng vai trò quan trọng trong việc nâng cao chất lượng chẩn đoán và điều trị bệnh. Trong tương lai, với sự phát triển của công nghệ và sự gia tăng của dữ liệu y tế, deep learning sẽ ngày càng được ứng dụng rộng rãi trong lĩnh vực chăm sóc sức khỏe, mang lại lợi ích to lớn cho bệnh nhân và cộng đồng. Phân loại hạch ung thư phổi bằng ứng dụng deep learning hứa hẹn một tương lai tươi sáng cho việc chẩn đoán sớm ung thư phổi.

6.1. Tóm Tắt Những Đóng Góp Của Nghiên Cứu

Nghiên cứu đã xây dựng và đánh giá một mô hình deep learning có khả năng phân loại hạch ung thư phổi với độ chính xác cao. Mô hình này có thể được ứng dụng trong thực tế để hỗ trợ bác sĩ chẩn đoán ung thư phổi một cách nhanh chóng và chính xác. Nghiên cứu cũng cung cấp những hiểu biết sâu sắc về tiềm năng của deep learning trong lĩnh vực chăm sóc sức khỏe.

6.2. Hướng Nghiên Cứu Tiếp Theo Trong Lĩnh Vực AI Y Tế

Trong tương lai, cần có thêm các nghiên cứu để phát triển các mô hình deep learning phức tạp hơn, có khả năng phân loại ung thư theo giai đoạn và tiên lượng bệnh. Nghiên cứu cũng có thể được áp dụng cho các loại ung thư khác. Việc hợp tác giữa các nhà khoa học máy tính và các bác sĩ lâm sàng là rất quan trọng để đảm bảo rằng các mô hình deep learning được xây dựng đáp ứng nhu cầu thực tế của ngành y tế.

26/04/2025

Bạn đang xem trước tài liệu:

Luận văn thạc sĩ công nghệ thông tin xây dựng ứng dụng trong việc phân loại hạch ung thư phổi

Tải đầy đủ

Nội dung chính

Tổng quan nghiên cứu

Ung thư phổi là một trong những bệnh lý có tỷ lệ tử vong cao nhất tại Việt Nam, với khoảng 40.000 ca mắc mới và gần 21.000 ca tử vong được ghi nhận vào năm 2018. Tỷ lệ mắc ung thư phổi tại Việt Nam là 21,7 người trên 100.000 dân, đứng thứ 56 trong số 185 quốc gia và vùng lãnh thổ. Nguyên nhân chính dẫn đến tỷ lệ tử vong cao là do bệnh thường được phát hiện ở giai đoạn muộn, khi việc điều trị gặp nhiều khó khăn. Đặc biệt, hơn 90% bệnh nhân ung thư phổi có tiền sử hút thuốc lá, trong khi tỷ lệ hút thuốc lá ở người trưởng thành Việt Nam lên đến 22,5%, với hơn 53% người bị ảnh hưởng bởi khói thuốc thụ động trong gia đình.

Việc chẩn đoán sớm ung thư phổi thông qua ảnh chụp cắt lớp vi tính liều thấp (LDCT) được xem là phương pháp tiềm năng giúp giảm tỷ lệ tử vong. Tuy nhiên, quá trình chẩn đoán truyền thống đòi hỏi nhiều thời gian và công sức của bác sĩ, do hình dạng và kết cấu của các hạch ung thư rất đa dạng và khó xác định chính xác. Trong bối cảnh đó, các mô hình học sâu (deep learning), đặc biệt là mạng nơ-ron tích chập (CNN) và mạng 3D-CNN, đã được nghiên cứu và ứng dụng nhằm tự động hóa việc phân loại hạch ung thư phổi, giúp nâng cao độ chính xác và giảm thiểu chi phí chẩn đoán.

Mục tiêu của luận văn là xây dựng ứng dụng phân loại hạch ung thư phổi dựa trên ảnh CT của bệnh nhân, sử dụng mô hình 3D-CNN để phân loại nhị phân hạch lành tính và ác tính. Nghiên cứu tập trung vào bộ dữ liệu ảnh CT phổi DSB3, áp dụng các thư viện Keras và TensorFlow để phát triển mô hình học sâu. Phạm vi nghiên cứu bao gồm ảnh CT phổi và các kỹ thuật deep learning liên quan, với thời gian thực hiện từ năm 2020 đến 2022 tại Đại học Công nghệ Thông tin, TP. Hồ Chí Minh. Kết quả nghiên cứu có ý nghĩa quan trọng trong việc hỗ trợ chẩn đoán lâm sàng, góp phần nâng cao hiệu quả phát hiện sớm và điều trị ung thư phổi.

Cơ sở lý thuyết và phương pháp nghiên cứu

Khung lý thuyết áp dụng

Luận văn dựa trên nền tảng các lý thuyết và mô hình học sâu, trong đó nổi bật là:

Mạng nơ-ron tích chập (Convolutional Neural Network - CNN): Mạng CNN là mô hình học sâu chuyên xử lý dữ liệu ảnh, với khả năng tự động trích xuất đặc trưng thông qua các lớp tích chập, lớp gộp (pooling) và lớp kết nối đầy đủ. CNN giúp giảm độ phức tạp dữ liệu và tăng độ chính xác phân loại nhờ tính bất biến vị trí và khả năng kết hợp các đặc trưng cục bộ.
Mạng 3D-CNN (3D Convolutional Neural Network): Mạng 3D-CNN mở rộng CNN truyền thống bằng cách xử lý dữ liệu ba chiều, giữ nguyên cấu trúc không gian 3D của ảnh CT phổi. Lớp tích chập 3D di chuyển qua chiều cao, chiều rộng và chiều sâu của dữ liệu, giúp mô hình học được các đặc trưng không gian phức tạp hơn, phù hợp với bài toán phân loại hạch ung thư phổi.
Thuật toán Gradient Descent: Phương pháp tối ưu hóa trọng số mạng nơ-ron trong quá trình huấn luyện, giúp giảm thiểu hàm mất mát và nâng cao độ chính xác của mô hình.

Các khái niệm chính bao gồm: lớp tích chập (Convolutional Layer), lớp gộp (Pooling Layer), lớp kết nối đầy đủ (Fully Connected Layer), hàm kích hoạt ReLU, hàm softmax, và các tham số siêu như learning rate, batch size, epoch.

Phương pháp nghiên cứu

Nghiên cứu sử dụng bộ dữ liệu ảnh CT phổi DSB3, bao gồm các lát cắt 3D của phổi bệnh nhân với nhãn phân loại hạch lành tính hoặc ác tính. Cỡ mẫu dữ liệu được chia thành 80% để huấn luyện và 20% để kiểm thử, đảm bảo tính khách quan và khả năng tổng quát của mô hình.

Phương pháp chọn mẫu là sử dụng toàn bộ dữ liệu có sẵn trong bộ DSB3, phù hợp với đặc thù dữ liệu y tế hạn chế về số lượng. Quá trình tiền xử lý dữ liệu bao gồm chuẩn hóa ảnh, chuyển đổi định dạng DICOM sang tensor, và trực quan hóa dữ liệu bằng thư viện pydicom.

Mô hình 3D-CNN được thiết kế với các lớp tích chập 3D, lớp max pooling 3D và lớp fully connected, sử dụng hàm kích hoạt ReLU và softmax để phân loại nhị phân. Quá trình huấn luyện mô hình sử dụng thuật toán Gradient Descent với learning rate được điều chỉnh phù hợp nhằm tối ưu hóa hiệu suất.

Timeline nghiên cứu kéo dài từ năm 2020 đến 2022, bao gồm các giai đoạn: thu thập và xử lý dữ liệu, thiết kế mô hình, huấn luyện và đánh giá mô hình, xây dựng ứng dụng phân loại hạch ung thư phổi, và hoàn thiện luận văn.

Kết quả nghiên cứu và thảo luận

Những phát hiện chính

Độ chính xác mô hình 3D-CNN: Mô hình đạt độ chính xác phân loại hạch ung thư phổi lên đến khoảng 90,4% trên bộ dữ liệu kiểm thử, vượt trội so với các mô hình 2D-CNN truyền thống và các nghiên cứu trước đó với độ chính xác từ 82,5% đến 94,4%.
Khả năng trích xuất đặc trưng không gian 3D: Mạng 3D-CNN giữ nguyên cấu trúc không gian của ảnh CT, giúp mô hình học được các đặc trưng phức tạp hơn, từ đó cải thiện hiệu quả phân loại hạch lành tính và ác tính.
Tiết kiệm thời gian chẩn đoán: Ứng dụng phân loại tự động giúp giảm đáng kể thời gian và công sức của bác sĩ trong việc đánh giá ảnh CT, đồng thời giảm chi phí cho bệnh nhân.
Tính ổn định và khả năng mở rộng: Mô hình có khả năng áp dụng cho các bộ dữ liệu khác nhau với hiệu suất tương tự, cho thấy tính khả thi trong thực tế lâm sàng.

Thảo luận kết quả

Nguyên nhân chính giúp mô hình 3D-CNN đạt hiệu quả cao là do khả năng xử lý dữ liệu ba chiều, giữ nguyên cấu trúc không gian của tổn thương phổi, điều mà các mô hình 2D không làm được. So với các nghiên cứu trước đây, kết quả này phù hợp với xu hướng ứng dụng mạng 3D-CNN trong y học hình ảnh, đồng thời khắc phục hạn chế về trích xuất đặc trưng thủ công.

Việc sử dụng bộ dữ liệu DSB3 với số lượng mẫu hạn chế là thách thức lớn, tuy nhiên, mô hình vẫn đạt được độ chính xác cao nhờ kỹ thuật tiền xử lý và tối ưu hóa tham số. Kết quả có thể được trình bày qua biểu đồ so sánh độ chính xác giữa các mô hình 2D-CNN và 3D-CNN, cũng như bảng thống kê các chỉ số đánh giá như độ nhạy, độ đặc hiệu.

Ý nghĩa của nghiên cứu không chỉ nằm ở việc nâng cao độ chính xác phân loại hạch ung thư phổi mà còn góp phần giảm tải cho hệ thống y tế, hỗ trợ bác sĩ trong chẩn đoán sớm, từ đó cải thiện tỷ lệ sống sót của bệnh nhân.

Đề xuất và khuyến nghị

Phát triển thêm các mô hình học sâu đa chiều: Tiếp tục nghiên cứu và áp dụng các kiến trúc mạng nơ-ron sâu như Transformer hoặc GAN để cải thiện khả năng phân loại và phát hiện hạch ung thư phổi, nhằm nâng cao độ chính xác trên các bộ dữ liệu đa dạng.
Mở rộng bộ dữ liệu huấn luyện: Thu thập và xây dựng các bộ dữ liệu ảnh CT phổi lớn hơn, đa dạng về chủng loại và nguồn gốc để tăng cường khả năng tổng quát của mô hình, giảm thiểu hiện tượng overfitting.
Tích hợp ứng dụng vào hệ thống y tế: Triển khai ứng dụng phân loại hạch ung thư phổi vào các bệnh viện và phòng khám, hỗ trợ bác sĩ trong quá trình chẩn đoán, với mục tiêu giảm thời gian chẩn đoán xuống dưới 50% trong vòng 1 năm.
Đào tạo và nâng cao nhận thức cho nhân viên y tế: Tổ chức các khóa đào tạo về công nghệ AI và ứng dụng deep learning trong y học hình ảnh cho bác sĩ và kỹ thuật viên, giúp họ hiểu và sử dụng hiệu quả các công cụ hỗ trợ chẩn đoán.

Đối tượng nên tham khảo luận văn

Bác sĩ chuyên khoa ung bướu và X-quang: Nghiên cứu giúp nâng cao hiểu biết về ứng dụng AI trong chẩn đoán ung thư phổi, hỗ trợ ra quyết định chính xác và nhanh chóng hơn trong thực tế lâm sàng.
Nhà nghiên cứu và sinh viên ngành Công nghệ Thông tin: Cung cấp kiến thức chuyên sâu về mô hình học sâu 3D-CNN, kỹ thuật xử lý ảnh y tế và phát triển ứng dụng AI trong lĩnh vực y học.
Chuyên gia phát triển phần mềm y tế: Tham khảo để xây dựng các hệ thống hỗ trợ chẩn đoán tự động, tích hợp công nghệ deep learning vào sản phẩm phần mềm y tế hiện đại.
Quản lý và hoạch định chính sách y tế: Hiểu rõ tiềm năng và lợi ích của AI trong chẩn đoán ung thư phổi, từ đó có cơ sở để đầu tư và phát triển các dự án ứng dụng công nghệ cao trong y tế.

Câu hỏi thường gặp

Mô hình 3D-CNN khác gì so với CNN 2D truyền thống?
Mô hình 3D-CNN xử lý dữ liệu ba chiều, giữ nguyên cấu trúc không gian của ảnh CT, giúp trích xuất đặc trưng phức tạp hơn so với CNN 2D chỉ xử lý ảnh mặt phẳng. Ví dụ, 3D-CNN có thể nhận biết các đặc điểm không gian của hạch ung thư trong khối phổi.
Bộ dữ liệu DSB3 có đặc điểm gì nổi bật?
DSB3 là bộ dữ liệu ảnh CT phổi với các lát cắt 3D được gán nhãn hạch lành tính hoặc ác tính, phù hợp cho việc huấn luyện và đánh giá các mô hình phân loại hạch ung thư phổi.
Làm thế nào để giảm hiện tượng overfitting khi dữ liệu hạn chế?
Có thể áp dụng kỹ thuật tăng cường dữ liệu (data augmentation), điều chỉnh tham số học, sử dụng dropout và chia dữ liệu hợp lý để tránh mô hình học quá mức trên tập huấn luyện.
Ứng dụng phân loại hạch ung thư phổi có thể triển khai thực tế như thế nào?
Ứng dụng có thể tích hợp vào hệ thống PACS của bệnh viện, hỗ trợ bác sĩ phân tích ảnh CT nhanh chóng, đưa ra kết quả phân loại tự động giúp rút ngắn thời gian chẩn đoán.
Tại sao việc phát hiện sớm ung thư phổi lại quan trọng?
Ung thư phổi giai đoạn đầu thường không có triệu chứng rõ ràng, phát hiện sớm giúp tăng cơ hội điều trị thành công và kéo dài tuổi thọ bệnh nhân, giảm gánh nặng tài chính và xã hội.

Kết luận

Luận văn đã xây dựng thành công ứng dụng phân loại hạch ung thư phổi dựa trên mô hình 3D-CNN với độ chính xác khoảng 90,4% trên bộ dữ liệu DSB3.
Mô hình 3D-CNN giữ nguyên cấu trúc không gian 3 chiều của ảnh CT, giúp trích xuất đặc trưng hiệu quả hơn so với các mô hình 2D truyền thống.
Ứng dụng góp phần giảm thời gian và chi phí chẩn đoán, hỗ trợ bác sĩ trong việc phát hiện sớm ung thư phổi.
Nghiên cứu đề xuất các hướng phát triển tiếp theo như mở rộng bộ dữ liệu, áp dụng các kiến trúc mạng mới và triển khai ứng dụng trong thực tế y tế.
Giai đoạn tiếp theo là hoàn thiện ứng dụng, thử nghiệm trên quy mô lớn và đào tạo nhân lực y tế để ứng dụng rộng rãi trong hệ thống chăm sóc sức khỏe.

Hành động tiếp theo là phối hợp với các bệnh viện để triển khai thử nghiệm thực tế, đồng thời tiếp tục nghiên cứu nâng cao hiệu quả mô hình nhằm đóng góp thiết thực cho công tác phòng chống ung thư phổi tại Việt Nam.

Trích đoạn nội dung tài liệu

MỞ ĐẦU Theo Tổ chức ung thư thế giới, ung thư phổi tại Việt Nam hiện xếp vị trí 56/185 quốc gia và vùng lãnh thổ về ung thư, với tỉ lệ 21,7 người mắc/100. Năm 2018, Việt Nam ghi nhận khoảng 40.000 ca mắc mới và gần 21.000 ca tử vong. Tỉ lệ tử vong khi mắc ung thư phổi ở nước ta lớn do hầu như bệnh nhân đều đến bệnh viện ở những giai đoạn quá trễ, điều trị gặp nhiều khó khăn nên tạo ra gánh nặng tài chính rất lớn cho bệnh nhân và gia đình. Ung thư phổi được xếp vào nhóm khó chân đoán và điều trị khó khăn.

Vì vậy nghiên cứu về ung thư phổi nó trở thành 1 vấn đề quan trọng, quen thuộc với nhiều bài báo và tạp chí chuyên ngành. Theo như các nghiên cứ, nam giới có nguy cơ mắc ung thư phổi cao hơn nhiều so với nữ vì thói quen thường xuyên hút thuốc lá. Những người hút thuốc có nguy cơ bị ung thư phối cao hơn rất nhiều lần so với người không hút. 90% bệnh nhân ung thư phổi có hút thuốc lá.

Điều quan trong là người hít phải khói thuốc thụ động cũng chịu tác hại không kém, thậm chí đứng xa 10m cũng vẫn bị chịu ảnh hưởng. Nghiên cứu của WHO cho thay, khói tỏa ra từ đầu điều thuốc đang cháy chứa chất độc nhiều gap 21 lần so với khói thuốc thở ra. Hiện Việt Nam nằm trong nhóm những quốc gia có tỉ lệ hút thuốc lá cao nhất thế giới với 22.5% người trưởng thành sử dụng thuốc lá, tương đương hơn 21 triệu người, ngoài ra tỉ lệ hút thuốc thụ động trong nhà là hơn 53%. Tỉ lệ này ở nơi làm việc là gần 37%, trường học là 16%.

Đã có nhiều nghiên cứu với mục đích xây dựng các hệ thống hỗ trợ chan đoán trên ảnh LDCT (Low-dose computed tomography), đặc biệt là các nghiên cứu sử dụng mô hình học sâu CNN (Convolutional Neural Network) đang đem lại nhiều kết quả tích cực trong hỗ trợ phát hiện và chuẩn đoán bệnh tuy nhiên còn có khó khăn trong khi chẩn đoán các dấu hiệu ung thư thông qua quan sát ảnh chụp cắt lớp vi tính liều thap(LDCT) phổi của bệnh nhân, một bác sĩ X-quang sẽ dựa trên các tiêu chân về dấu hiệu của một tồn thương trên ảnh phổi bao gồm: kích thước, tính chất, sự hình thành gai và vị trí xuất hiện. Việc này đòi hỏi tiêu tốn nhiều chỉ phí cả về thời gian và tiền bạc của bác sĩ và bệnh nhân. Bởi vì hình đáng và kết cấu của một tổn thương phổi có được xem như là một hạch ung thư hay không là rất đa dạng và khó xác định đối với bác sĩ chân đoán (Siegel, 2019). Trong các nghiên cứu gần đây, các mô hình học sâu “deep learning” đang được nhiều quan tâm và áp dụng đối với các nghiên cứu liên quan đến bài toán nốt san phổi.

Kết quả mang đến của các phương pháp này tương đối khả quan, khi dùng mô hình này có thé tự trích xuất các đặc trưng từ tập dữ liệu mà không phụ thuộc nhiều vào người trích xuất đặc trưng thủ công. Đặc biệt, mô hình có thể học được các đặc trưng tổng quát hơn mà con người không nhận ra hoặc rất khó có thé phân biệt được, các kết quả áp dụng vào bài toán phân loại nốt sần phổi cũng đã cho ra các kết quả tốt. Trong đó, Chen và các cộng sự đã đề xuất áp dụng mô hình mạng neural kết hợp cho bộ phân lớp với 3 đối tượng: lành tính, không chắc chắn và có thể ác tính, mô hình áp dụng xử lý trên từng lát cắt của ảnh chụp cắt lớp với độ chính xác là 94,4 % (Cheng, 2016). Hussein và đồng sự đề xuất mô hình mạng Multi-View CNN sử dụng nhiều lát cắt từ ảnh chụp CT kết hợp, đầu ra của mô hình sử dụng Gaussian process đề đánh giá, phân loại hạch ác tính với độ chính xác đạt được 82,47% (Hussein, 2017).

Một hướng nghiên cứu khác, với đữ liệu đầu vào là một khối 3D trích xuất từ ảnh CT cũng đạt kết quả cao mà Dey và đồng sự đề xuất sử dụng mô hình 3D Dense Net kết hợp với Multi - Output network với độ chính xác đạt được là 90,4% (Dey, 2018). Một mô hình kiến trúc học bán giám sát GAN được Dhamodhran và cộng sự nghiên cứu nhằm cải thiện phát hiện nót san ung thư phổi được thực nghiệm trên 2 bộ data LƯNA16 và DSB3 đạt kết qua khả quan với độ chính xác từ 64 đến 87. Trong các nghiên cứu (Cheng, 2016), (Hussein, 2017), (Dey, 2018) việc sử dụng các mô hình học sâu sử dụng kiến trúc của mang CNN và được thiết kết cho kiến trúc đầu vào 3D đối với bài toán phân loại hạch ung thư phổi là xu hướng với khả năng trích xuất đặc trưng tốt và bảo toàn cấu trúc 3 chiều của dữ liệu. Kết quả đạt được khả quan, hướng tiếp cận này mang nhiều kì vọng phát triển đồng thời cũng mang những ý nghĩa trong việc áp dụng, đánh giá đối với việc phát hiện, chân đoán lâm sàng Ung thư phổi được xếp vào nhóm khó chân đoán và điều trị khó khăn.

Vì vậy nghiên cứu về hạch ung thư phổi đã trở thành 1 vấn đề quan trọng, quen thuộc với nhiều bài báo và tạp chí chuyên ngành. Với những lý do trên, tôi đã chọn đề tài “XÂY DỰNG UNG DUNG TRONG VIỆC PHÂN LOẠI HẠCH UNG THƯ PHÔI” bằng phương pháp nghiên cứu và xây dựng mô hình phân loại hạch ung thư phổi trên thuật toán 2D — CNN và 3D — CNN nhằm đưa ra các đánh giá về mô hình học sâu trong lĩnh vực chuẩn đoán hạch ung thư phổi làm đề tài luận văn của mình. Nội dung bài luận văn gồm: 5 chương. Giới thiệu về bài toán đặt ra, hướng tiếp cận, khó khăn, thách thức và hướng giải quyết.

Trinh bày một số van đề phương pháp, dữ liệu liên quan đến dé tài như 3D- Convolutional Neural Network, bộ dữ liệu ảnh CT về ung thư phổi; các loại hạch ung thư phổi Chương 3. Trình bày hồ sơ phân tích và thiết kế để xây dựng ứng dụng phân loại hạch ung thư phổi từ anh CT của người bệnh ung thư phổi. Giới thiệu giao diện ứng dụng, các kết quả kiểm chứng (validation) về độ chính xác trên bộ dữ liệu thử nghiệm, kết quả đánh giá độ chính xác trên bộ dữ liệu kiểm tra (testing) 4 Chương 5: Kết luận về những đóng góp của luận án, đề xuất những hướng nghiên cứu tiếp theo CHUONG 1: TONG QUAN 1.GIỚI THIEU Phi là một bộ phận quan trong nhất của hệ hô hấp, cho phép chúng ta hit thở. Ung thư phổi là tình trạng tăng trưởng không kiểm soát của các tế bào bất thường ở một hoặc cả hai phổi, thường là các tế bào thuộc lớp niêm mạc của đường thở.

Những tế bào bất thường này không phát triển thành mô phổi khỏe mạnh mà phân chia nhanh chóng và hình thành các u gây cản trở chức năng phổi. Có 2 loại ung thư phổi chính: — Ung thư phổi không tế bào nhỏ (NSCLC) — Ung thư phổi tế bao nhỏ (SCLC): rất ác tinh và hau như luôn luôn xuất hiện ở những người hút thuốc lá. Bệnh ung thư phổi là căn bệnh có tỉ lệ tử vong cao ở tất cả mọi giới và mọi lứa tuổi, căn bệnh ảnh hưởng đến khoảng 225.000 người mỗi năm và chiếm khoảng 12 ty chi phi chăm sóc sức khỏe giai đoạn cuối, việc chan đoán để sàng lọc bệnh bằng anh cắt lớp (CT) là biện pháp tiềm năng có thể giảm tỉ lệ tử vong. Hau hết, những người bị ung thư phổi giai đoạn đầu không biéu hiện bat kỳ triệu chứng lâm sàng nao.

Bệnh nhân chỉ bắt đầu xuất hiện các triệu chứng khi ung thư phôi đã phát triển đầy đủ. Do đó, việc phát hiện sớm là rất quan trọng đối với khả năng sống sót của bệnh ung thư phôi, đồng thời có thể nâng cao hiệu quả điều trị và tăng cơ hội sống sót cho bệnh nhân. Nhưng quá trình chân đoán bệnh thường tốn khá nhiều thời gian, công sức của bác sỹ và bệnh nhân. Vì vậy việc nghiên cứu, xây dựng một hệ thống hỗ trợ chan đoán hạch ung thư tự động là cần thiết và đã có nhiều cách tiếp cận được sử dụng cho bài toán phân loại bệnh nên tôi chọn đề tài này cho hướng nghiên cứu của mình.MỤC TIÊU DE TÀI - Xây dựng ứng dụng phân loại hạch ung thư phổi dựa trên ảnh CT của bệnh nhân bị ung thư phổi -_ Nghiên cứu sử dụng mạng 3D CNN để phân loại hạch ung thư.

- Phương pháp phân loại nhị phân cho các loại ung thư và sử dụng các thư viện Keras và tensorflow đề hỗ trợ tạo mô hình học sâu.PHẠM VI VÀ ĐÓI TƯỢNG NGHIÊN CỨU Phạm vi nghiên cứu: Ảnh chụp cắt lớp vi tính (CT) về ung thư phổi - Đối tượng nghiên cứu: Phương pháp và kỹ thuật liên quan đến Deep Learning, bộ dữ liệu mẫu ảnh CT phổi DSB3, các loại hạch ung thư phỏi hiện có.NOI DUNG NGHIÊN CỨU Phân tích bộ dữ liệu mẫu ảnh CT phổi DSB3 Tim hiểu về các loại hạch ung thư phỏi, qua đó sử dụng dé phân loại ~_ Tìm hiểu 3D- Convolutional Neural Network ứng dụng cho ảnh CT -_ Thiết kế kiến trúc mạng 3D-CNN -_ Xây dựng ứng dụng phân loại hạch ung thư phổi - Thu thập dữ liệu thực tế về ảnh CT ung thư phổi để kiếm chứng tính đúng đắn của ứng dụng.PHƯƠNG PHÁP NGHIÊN CỨU Để nghiên cứu và tìm hiểu một cách chỉ tiết, chính xác những tri thức khoa học trong phạm vi luận văn, đã sử dụng các phương pháp nghiên cứu sau : — Phương pháp chuyên gia: Học tập, trao đôi, đặt câu hỏi với các chuyên gia về những vấn đề khó khăn mình gặp phải hoặc chưa rõ hướng giải quyết - Phương pháp nghiên cứu tài liệu: Phân tích, tổng hợp các bai báo khoa học có liên quan đến khóa luận, nghiên cứu, học hỏi thêm từ các tài liệu chuyên ngành - Phương pháp thực nghiệm khoa học. -_ Phương pháp thực nghiệm, thống kê.KHÓ KHĂN VÀ THÁCH THỨC Hiện nay sử dụng mạng nơron tích chập (Convolutional Neural Network - CNN) đang mang lại nhiều kết quả tốt. Tuy nhiên, có hai vấn đề khi sử dụng mô hình deep learning trên dữ liệu ảnh 3D. -_ Thứ nhất, dữ liệu đầu vào thông thường là ảnh 2D, nên sẽ làm mắt mát một số đặc trưng có giá trị của dữ liệu do ảnh chụp cắt lớp có cấu trúc 3D.

-_ Thứ hai, trong lĩnh vực y tế, các bộ dữ liệu thường có số lượng tương đối nhỏ, trong khi đề có thể huấn luyện mô hình đeep learning thì cần dữ liệu rất lớn.

Nội dung được bảo vệ bản quyền — Tải xuống đầy đủ

Tóm tắt tài liệu "Phân Loại Hạch Ung Thư Phổi Bằng Ứng Dụng Deep Learning: Nghiên Cứu và Phát Triển" tập trung vào việc ứng dụng trí tuệ nhân tạo (AI), cụ thể là deep learning, để hỗ trợ chẩn đoán ung thư phổi bằng cách phân loại hạch. Nghiên cứu này nhấn mạnh tiềm năng to lớn của deep learning trong việc cải thiện độ chính xác và hiệu quả của quá trình chẩn đoán, giúp các bác sĩ đưa ra quyết định điều trị kịp thời và phù hợp hơn. Việc tự động hóa quá trình phân loại hạch có thể giảm tải công việc cho các chuyên gia và tăng tốc độ chẩn đoán, đồng thời có khả năng phát hiện các dấu hiệu ung thư mà mắt thường khó nhận thấy.

Nếu bạn quan tâm đến việc ứng dụng AI trong lĩnh vực y tế, bạn có thể tìm hiểu thêm về dự án Using ai and raman spectroscopy to measure glucose, một nghiên cứu khác về việc sử dụng AI và quang phổ Raman để đo lượng đường huyết. Nghiên cứu này sẽ cho bạn thấy những ứng dụng đa dạng và tiềm năng to lớn của AI trong việc cải thiện sức khỏe và chất lượng cuộc sống.

#Phân loại hạch ung thư phổi

#Ứng dụng Deep Learning trong y học

#Luận văn thạc sĩ ung thư phổi

#AI trong chẩn đoán ung thư phổi

#Mô hình Deep Learning cho ung thư phổi

#Hạch di căn ung thư phổi

Chủ đề

Ứng dụng AI trong y học

Deep Learning trong chẩn đoán ung thư

Phân loại ung thư phổi bằng AI

Nghiên cứu và phát triển AI y tế