Tổng quan nghiên cứu

Ung thư phổi là một trong những bệnh lý có tỷ lệ tử vong cao nhất tại Việt Nam, với khoảng 40.000 ca mắc mới và gần 21.000 ca tử vong được ghi nhận vào năm 2018. Tỷ lệ mắc ung thư phổi tại Việt Nam là 21,7 người trên 100.000 dân, đứng thứ 56 trong số 185 quốc gia và vùng lãnh thổ. Nguyên nhân chính dẫn đến tỷ lệ tử vong cao là do bệnh thường được phát hiện ở giai đoạn muộn, khi việc điều trị gặp nhiều khó khăn. Đặc biệt, hơn 90% bệnh nhân ung thư phổi có tiền sử hút thuốc lá, trong khi tỷ lệ hút thuốc lá ở người trưởng thành Việt Nam lên đến 22,5%, với hơn 53% người bị ảnh hưởng bởi khói thuốc thụ động trong gia đình.

Việc chẩn đoán sớm ung thư phổi thông qua ảnh chụp cắt lớp vi tính liều thấp (LDCT) được xem là phương pháp tiềm năng giúp giảm tỷ lệ tử vong. Tuy nhiên, quá trình chẩn đoán truyền thống đòi hỏi nhiều thời gian và công sức của bác sĩ, do hình dạng và kết cấu của các hạch ung thư rất đa dạng và khó xác định chính xác. Trong bối cảnh đó, các mô hình học sâu (deep learning), đặc biệt là mạng nơ-ron tích chập (CNN) và mạng 3D-CNN, đã được nghiên cứu và ứng dụng nhằm tự động hóa việc phân loại hạch ung thư phổi, giúp nâng cao độ chính xác và giảm thiểu chi phí chẩn đoán.

Mục tiêu của luận văn là xây dựng ứng dụng phân loại hạch ung thư phổi dựa trên ảnh CT của bệnh nhân, sử dụng mô hình 3D-CNN để phân loại nhị phân hạch lành tính và ác tính. Nghiên cứu tập trung vào bộ dữ liệu ảnh CT phổi DSB3, áp dụng các thư viện Keras và TensorFlow để phát triển mô hình học sâu. Phạm vi nghiên cứu bao gồm ảnh CT phổi và các kỹ thuật deep learning liên quan, với thời gian thực hiện từ năm 2020 đến 2022 tại Đại học Công nghệ Thông tin, TP. Hồ Chí Minh. Kết quả nghiên cứu có ý nghĩa quan trọng trong việc hỗ trợ chẩn đoán lâm sàng, góp phần nâng cao hiệu quả phát hiện sớm và điều trị ung thư phổi.

Cơ sở lý thuyết và phương pháp nghiên cứu

Khung lý thuyết áp dụng

Luận văn dựa trên nền tảng các lý thuyết và mô hình học sâu, trong đó nổi bật là:

  • Mạng nơ-ron tích chập (Convolutional Neural Network - CNN): Mạng CNN là mô hình học sâu chuyên xử lý dữ liệu ảnh, với khả năng tự động trích xuất đặc trưng thông qua các lớp tích chập, lớp gộp (pooling) và lớp kết nối đầy đủ. CNN giúp giảm độ phức tạp dữ liệu và tăng độ chính xác phân loại nhờ tính bất biến vị trí và khả năng kết hợp các đặc trưng cục bộ.

  • Mạng 3D-CNN (3D Convolutional Neural Network): Mạng 3D-CNN mở rộng CNN truyền thống bằng cách xử lý dữ liệu ba chiều, giữ nguyên cấu trúc không gian 3D của ảnh CT phổi. Lớp tích chập 3D di chuyển qua chiều cao, chiều rộng và chiều sâu của dữ liệu, giúp mô hình học được các đặc trưng không gian phức tạp hơn, phù hợp với bài toán phân loại hạch ung thư phổi.

  • Thuật toán Gradient Descent: Phương pháp tối ưu hóa trọng số mạng nơ-ron trong quá trình huấn luyện, giúp giảm thiểu hàm mất mát và nâng cao độ chính xác của mô hình.

Các khái niệm chính bao gồm: lớp tích chập (Convolutional Layer), lớp gộp (Pooling Layer), lớp kết nối đầy đủ (Fully Connected Layer), hàm kích hoạt ReLU, hàm softmax, và các tham số siêu như learning rate, batch size, epoch.

Phương pháp nghiên cứu

Nghiên cứu sử dụng bộ dữ liệu ảnh CT phổi DSB3, bao gồm các lát cắt 3D của phổi bệnh nhân với nhãn phân loại hạch lành tính hoặc ác tính. Cỡ mẫu dữ liệu được chia thành 80% để huấn luyện và 20% để kiểm thử, đảm bảo tính khách quan và khả năng tổng quát của mô hình.

Phương pháp chọn mẫu là sử dụng toàn bộ dữ liệu có sẵn trong bộ DSB3, phù hợp với đặc thù dữ liệu y tế hạn chế về số lượng. Quá trình tiền xử lý dữ liệu bao gồm chuẩn hóa ảnh, chuyển đổi định dạng DICOM sang tensor, và trực quan hóa dữ liệu bằng thư viện pydicom.

Mô hình 3D-CNN được thiết kế với các lớp tích chập 3D, lớp max pooling 3D và lớp fully connected, sử dụng hàm kích hoạt ReLU và softmax để phân loại nhị phân. Quá trình huấn luyện mô hình sử dụng thuật toán Gradient Descent với learning rate được điều chỉnh phù hợp nhằm tối ưu hóa hiệu suất.

Timeline nghiên cứu kéo dài từ năm 2020 đến 2022, bao gồm các giai đoạn: thu thập và xử lý dữ liệu, thiết kế mô hình, huấn luyện và đánh giá mô hình, xây dựng ứng dụng phân loại hạch ung thư phổi, và hoàn thiện luận văn.

Kết quả nghiên cứu và thảo luận

Những phát hiện chính

  1. Độ chính xác mô hình 3D-CNN: Mô hình đạt độ chính xác phân loại hạch ung thư phổi lên đến khoảng 90,4% trên bộ dữ liệu kiểm thử, vượt trội so với các mô hình 2D-CNN truyền thống và các nghiên cứu trước đó với độ chính xác từ 82,5% đến 94,4%.

  2. Khả năng trích xuất đặc trưng không gian 3D: Mạng 3D-CNN giữ nguyên cấu trúc không gian của ảnh CT, giúp mô hình học được các đặc trưng phức tạp hơn, từ đó cải thiện hiệu quả phân loại hạch lành tính và ác tính.

  3. Tiết kiệm thời gian chẩn đoán: Ứng dụng phân loại tự động giúp giảm đáng kể thời gian và công sức của bác sĩ trong việc đánh giá ảnh CT, đồng thời giảm chi phí cho bệnh nhân.

  4. Tính ổn định và khả năng mở rộng: Mô hình có khả năng áp dụng cho các bộ dữ liệu khác nhau với hiệu suất tương tự, cho thấy tính khả thi trong thực tế lâm sàng.

Thảo luận kết quả

Nguyên nhân chính giúp mô hình 3D-CNN đạt hiệu quả cao là do khả năng xử lý dữ liệu ba chiều, giữ nguyên cấu trúc không gian của tổn thương phổi, điều mà các mô hình 2D không làm được. So với các nghiên cứu trước đây, kết quả này phù hợp với xu hướng ứng dụng mạng 3D-CNN trong y học hình ảnh, đồng thời khắc phục hạn chế về trích xuất đặc trưng thủ công.

Việc sử dụng bộ dữ liệu DSB3 với số lượng mẫu hạn chế là thách thức lớn, tuy nhiên, mô hình vẫn đạt được độ chính xác cao nhờ kỹ thuật tiền xử lý và tối ưu hóa tham số. Kết quả có thể được trình bày qua biểu đồ so sánh độ chính xác giữa các mô hình 2D-CNN và 3D-CNN, cũng như bảng thống kê các chỉ số đánh giá như độ nhạy, độ đặc hiệu.

Ý nghĩa của nghiên cứu không chỉ nằm ở việc nâng cao độ chính xác phân loại hạch ung thư phổi mà còn góp phần giảm tải cho hệ thống y tế, hỗ trợ bác sĩ trong chẩn đoán sớm, từ đó cải thiện tỷ lệ sống sót của bệnh nhân.

Đề xuất và khuyến nghị

  1. Phát triển thêm các mô hình học sâu đa chiều: Tiếp tục nghiên cứu và áp dụng các kiến trúc mạng nơ-ron sâu như Transformer hoặc GAN để cải thiện khả năng phân loại và phát hiện hạch ung thư phổi, nhằm nâng cao độ chính xác trên các bộ dữ liệu đa dạng.

  2. Mở rộng bộ dữ liệu huấn luyện: Thu thập và xây dựng các bộ dữ liệu ảnh CT phổi lớn hơn, đa dạng về chủng loại và nguồn gốc để tăng cường khả năng tổng quát của mô hình, giảm thiểu hiện tượng overfitting.

  3. Tích hợp ứng dụng vào hệ thống y tế: Triển khai ứng dụng phân loại hạch ung thư phổi vào các bệnh viện và phòng khám, hỗ trợ bác sĩ trong quá trình chẩn đoán, với mục tiêu giảm thời gian chẩn đoán xuống dưới 50% trong vòng 1 năm.

  4. Đào tạo và nâng cao nhận thức cho nhân viên y tế: Tổ chức các khóa đào tạo về công nghệ AI và ứng dụng deep learning trong y học hình ảnh cho bác sĩ và kỹ thuật viên, giúp họ hiểu và sử dụng hiệu quả các công cụ hỗ trợ chẩn đoán.

Đối tượng nên tham khảo luận văn

  1. Bác sĩ chuyên khoa ung bướu và X-quang: Nghiên cứu giúp nâng cao hiểu biết về ứng dụng AI trong chẩn đoán ung thư phổi, hỗ trợ ra quyết định chính xác và nhanh chóng hơn trong thực tế lâm sàng.

  2. Nhà nghiên cứu và sinh viên ngành Công nghệ Thông tin: Cung cấp kiến thức chuyên sâu về mô hình học sâu 3D-CNN, kỹ thuật xử lý ảnh y tế và phát triển ứng dụng AI trong lĩnh vực y học.

  3. Chuyên gia phát triển phần mềm y tế: Tham khảo để xây dựng các hệ thống hỗ trợ chẩn đoán tự động, tích hợp công nghệ deep learning vào sản phẩm phần mềm y tế hiện đại.

  4. Quản lý và hoạch định chính sách y tế: Hiểu rõ tiềm năng và lợi ích của AI trong chẩn đoán ung thư phổi, từ đó có cơ sở để đầu tư và phát triển các dự án ứng dụng công nghệ cao trong y tế.

Câu hỏi thường gặp

  1. Mô hình 3D-CNN khác gì so với CNN 2D truyền thống?
    Mô hình 3D-CNN xử lý dữ liệu ba chiều, giữ nguyên cấu trúc không gian của ảnh CT, giúp trích xuất đặc trưng phức tạp hơn so với CNN 2D chỉ xử lý ảnh mặt phẳng. Ví dụ, 3D-CNN có thể nhận biết các đặc điểm không gian của hạch ung thư trong khối phổi.

  2. Bộ dữ liệu DSB3 có đặc điểm gì nổi bật?
    DSB3 là bộ dữ liệu ảnh CT phổi với các lát cắt 3D được gán nhãn hạch lành tính hoặc ác tính, phù hợp cho việc huấn luyện và đánh giá các mô hình phân loại hạch ung thư phổi.

  3. Làm thế nào để giảm hiện tượng overfitting khi dữ liệu hạn chế?
    Có thể áp dụng kỹ thuật tăng cường dữ liệu (data augmentation), điều chỉnh tham số học, sử dụng dropout và chia dữ liệu hợp lý để tránh mô hình học quá mức trên tập huấn luyện.

  4. Ứng dụng phân loại hạch ung thư phổi có thể triển khai thực tế như thế nào?
    Ứng dụng có thể tích hợp vào hệ thống PACS của bệnh viện, hỗ trợ bác sĩ phân tích ảnh CT nhanh chóng, đưa ra kết quả phân loại tự động giúp rút ngắn thời gian chẩn đoán.

  5. Tại sao việc phát hiện sớm ung thư phổi lại quan trọng?
    Ung thư phổi giai đoạn đầu thường không có triệu chứng rõ ràng, phát hiện sớm giúp tăng cơ hội điều trị thành công và kéo dài tuổi thọ bệnh nhân, giảm gánh nặng tài chính và xã hội.

Kết luận

  • Luận văn đã xây dựng thành công ứng dụng phân loại hạch ung thư phổi dựa trên mô hình 3D-CNN với độ chính xác khoảng 90,4% trên bộ dữ liệu DSB3.
  • Mô hình 3D-CNN giữ nguyên cấu trúc không gian 3 chiều của ảnh CT, giúp trích xuất đặc trưng hiệu quả hơn so với các mô hình 2D truyền thống.
  • Ứng dụng góp phần giảm thời gian và chi phí chẩn đoán, hỗ trợ bác sĩ trong việc phát hiện sớm ung thư phổi.
  • Nghiên cứu đề xuất các hướng phát triển tiếp theo như mở rộng bộ dữ liệu, áp dụng các kiến trúc mạng mới và triển khai ứng dụng trong thực tế y tế.
  • Giai đoạn tiếp theo là hoàn thiện ứng dụng, thử nghiệm trên quy mô lớn và đào tạo nhân lực y tế để ứng dụng rộng rãi trong hệ thống chăm sóc sức khỏe.

Hành động tiếp theo là phối hợp với các bệnh viện để triển khai thử nghiệm thực tế, đồng thời tiếp tục nghiên cứu nâng cao hiệu quả mô hình nhằm đóng góp thiết thực cho công tác phòng chống ung thư phổi tại Việt Nam.