Tổng quan nghiên cứu

Ung thư vú là một trong những loại ung thư phổ biến nhất trên thế giới, đặc biệt ở nữ giới. Theo Hiệp hội Ung thư Hoa Kỳ, năm 2019 có khoảng 268,600 ca ung thư vú xâm lấn được chẩn đoán ở nữ và 2,670 ca ở nam giới tại Mỹ, với hơn 41,760 phụ nữ tử vong do căn bệnh này. Tại Việt Nam, năm 2018 ghi nhận khoảng 15,529 ca mắc mới và 6,103 ca tử vong do ung thư vú, chiếm lần lượt 9.2% và 5.3% tổng số ca ung thư và tử vong do ung thư. Tỉ lệ sống sót sau 5 năm có thể lên đến 99% nếu bệnh được phát hiện sớm ở giai đoạn đầu. Do đó, việc phát triển các phương pháp chẩn đoán sớm, chính xác là rất cần thiết.

Luận văn tập trung nghiên cứu ứng dụng học sâu trong việc chẩn đoán ung thư vú qua ảnh nhũ ảnh kỹ thuật số, nhằm hỗ trợ bác sĩ X-quang phát hiện và phân loại khối u lành tính hoặc ác tính. Mục tiêu cụ thể là xây dựng mô hình học sâu dựa trên thuật toán YOLO (You Only Look Once) phiên bản 3 và 4, cải tiến để tăng độ chính xác và tốc độ phát hiện khối u nhỏ trong ảnh. Nghiên cứu sử dụng tập dữ liệu INbreast gồm 410 nhũ ảnh số toàn trường, thu thập từ năm 2008 đến 2010 tại một trung tâm y tế ở Porto, với các vùng tổn thương được ghi chú chi tiết theo tiêu chuẩn BI-RADS.

Ý nghĩa nghiên cứu thể hiện ở việc cung cấp một công cụ hỗ trợ chẩn đoán ung thư vú có độ chính xác trung bình đạt 94.4% (mAP), giúp giảm thiểu sai sót do con người và tăng hiệu quả phát hiện sớm, từ đó góp phần nâng cao chất lượng điều trị và giảm thiểu rủi ro cho bệnh nhân.

Cơ sở lý thuyết và phương pháp nghiên cứu

Khung lý thuyết áp dụng

Luận văn dựa trên nền tảng học sâu (Deep Learning), một nhánh của học máy, với khả năng trích xuất đặc trưng phân cấp từ dữ liệu đầu vào. Mạng nơ-ron tích chập (CNN) được sử dụng làm mô hình chính do hiệu quả vượt trội trong xử lý ảnh y tế. CNN gồm các lớp tích chập, lớp gộp và lớp kết nối đầy đủ, giúp trích xuất và học các đặc trưng quan trọng từ ảnh nhũ ảnh.

Thuật toán YOLO được lựa chọn làm khung phát hiện đối tượng do ưu điểm về tốc độ và khả năng phát hiện nhiều đối tượng trong ảnh. Phiên bản YOLOv3 và YOLOv4 được áp dụng với các cải tiến như kiến trúc mạng sâu hơn (Darknet-53 và CSPDarknet-53), dự đoán trên nhiều tỉ lệ bản đồ đặc trưng, sử dụng các kỹ thuật tăng cường dữ liệu và tinh chỉnh tốc độ học (cosine annealing, warm-up). Các khái niệm chính bao gồm:

  • Học sâu (Deep Learning): Phương pháp học đặc trưng phân cấp từ dữ liệu.
  • Mạng nơ-ron tích chập (CNN): Mô hình học sâu chuyên biệt cho xử lý ảnh.
  • Thuật toán YOLO: Mạng CNN duy nhất thực hiện đồng thời phát hiện và phân loại đối tượng.
  • Non-Maximum Suppression (NMS): Thuật toán loại bỏ các dự đoán trùng lặp.
  • Mean Average Precision (mAP): Chỉ số đánh giá độ chính xác trung bình của mô hình phát hiện đối tượng.

Phương pháp nghiên cứu

Nguồn dữ liệu chính là tập nhũ ảnh INbreast với 410 ảnh số toàn trường, được ghi chú vùng tổn thương theo chuẩn BI-RADS. Dữ liệu được tiền xử lý bằng các kỹ thuật xử lý ảnh như lọc nhiễu, chuẩn hóa, trích xuất vùng ngực, và tăng cường ảnh (phép biến đổi hình học, tăng cường độ tương phản).

Mô hình học sâu được xây dựng dựa trên kiến trúc YOLOv3 và YOLOv4, sử dụng ngôn ngữ Python và thư viện học sâu phổ biến. Quá trình huấn luyện được thực hiện trên nền tảng máy ảo Google Colab với phần cứng GPU, sử dụng kỹ thuật khởi động tốc độ học và suy giảm tốc độ học theo hàm cosine để tối ưu hiệu quả huấn luyện.

Cỡ mẫu huấn luyện được xác định dựa trên toàn bộ tập dữ liệu INbreast, chia thành tập huấn luyện và tập đánh giá theo tỉ lệ phù hợp để đảm bảo tính khách quan. Phương pháp phân tích bao gồm đánh giá độ chính xác phát hiện (mAP), độ nhạy (Recall), và độ đặc hiệu, so sánh kết quả với các nghiên cứu trước đó để đánh giá hiệu quả mô hình.

Timeline nghiên cứu kéo dài từ tháng 8/2021 đến tháng 3/2022, bao gồm các giai đoạn thu thập dữ liệu, tiền xử lý, xây dựng và huấn luyện mô hình, đánh giá và triển khai ứng dụng CAD hỗ trợ chẩn đoán.

Kết quả nghiên cứu và thảo luận

Những phát hiện chính

  1. Độ chính xác phát hiện khối u: Mô hình YOLOv4 đạt độ chính xác trung bình (mAP) 94.4% trong việc phát hiện khối u trên ảnh nhũ ảnh, cao hơn so với YOLOv3 và các mô hình trước đó. Độ chính xác này được đánh giá trên tập dữ liệu INbreast với nhiều kích thước ảnh đầu vào khác nhau.

  2. Khả năng phát hiện khối u nhỏ: Nhờ kiến trúc mạng sâu và dự đoán trên nhiều tỉ lệ bản đồ đặc trưng, mô hình có thể phát hiện hiệu quả các khối u nhỏ chiếm phần khiêm tốn trong ảnh, cải thiện đáng kể so với các phiên bản YOLO đầu tiên.

  3. Tốc độ xử lý: Mô hình đề xuất duy trì tốc độ xử lý nhanh, phù hợp cho ứng dụng thời gian thực trong môi trường lâm sàng, giúp bác sĩ X-quang có thể nhận kết quả chẩn đoán nhanh chóng.

  4. Hiệu quả tăng cường dữ liệu và tinh chỉnh tốc độ học: Việc áp dụng kỹ thuật tăng cường ảnh và điều chỉnh tốc độ học theo hàm cosine giúp mô hình tránh hiện tượng quá khớp, nâng cao độ ổn định và hiệu quả huấn luyện.

Thảo luận kết quả

Nguyên nhân chính giúp mô hình đạt hiệu quả cao là do sự kết hợp của kiến trúc mạng tiên tiến CSPDarknet-53, kỹ thuật tổng hợp đặc trưng đa tỉ lệ (PAN, SPP), và các phương pháp tăng cường dữ liệu phù hợp với đặc thù ảnh y tế. So với các nghiên cứu trước đây sử dụng Faster R-CNN hoặc YOLO phiên bản đầu, mô hình đề xuất không chỉ cải thiện độ chính xác mà còn giảm thiểu độ phức tạp và tăng tốc độ xử lý.

Kết quả có thể được trình bày qua biểu đồ đường cong Precision-Recall (PR curve) cho thấy mô hình YOLOv4 vượt trội hơn YOLOv3 ở các mức độ phân giải ảnh khác nhau. Bảng so sánh hiệu suất với các nghiên cứu gần đây cũng minh chứng cho sự tiến bộ về độ chính xác và tốc độ.

Ý nghĩa của kết quả là mô hình có tiềm năng ứng dụng thực tiễn trong các bệnh viện, giúp giảm thiểu sai sót do con người và nâng cao hiệu quả chẩn đoán sớm ung thư vú, từ đó cải thiện tỷ lệ sống sót của bệnh nhân.

Đề xuất và khuyến nghị

  1. Triển khai rộng rãi phần mềm CAD: Khuyến nghị các cơ sở y tế trang bị phần mềm hỗ trợ chẩn đoán dựa trên mô hình YOLOv4 để tăng cường khả năng phát hiện sớm ung thư vú, giảm thiểu sai sót chẩn đoán. Thời gian thực hiện trong vòng 6-12 tháng, do các bệnh viện có thể tích hợp phần mềm vào quy trình làm việc hiện tại.

  2. Đào tạo và nâng cao nhận thức cho bác sĩ X-quang: Tổ chức các khóa đào tạo về sử dụng công cụ CAD và hiểu biết về học sâu để bác sĩ tận dụng tối đa lợi ích của công nghệ, nâng cao chất lượng chẩn đoán. Thời gian đào tạo đề xuất 3-6 tháng.

  3. Mở rộng nghiên cứu với dữ liệu đa dạng: Thu thập thêm dữ liệu nhũ ảnh từ nhiều nguồn và các nhóm dân cư khác nhau để huấn luyện và đánh giá mô hình, đảm bảo tính tổng quát và khả năng áp dụng rộng rãi. Kế hoạch thực hiện trong 1-2 năm.

  4. Phát triển thêm các tính năng hỗ trợ: Nâng cấp phần mềm CAD với khả năng phân tích các bất thường khác như vôi hóa, cấu trúc mô không đồng đều, kết hợp với các kỹ thuật hình ảnh khác như MRI, siêu âm để tăng cường độ chính xác chẩn đoán. Thời gian phát triển dự kiến 12-18 tháng.

Đối tượng nên tham khảo luận văn

  1. Bác sĩ X-quang và chuyên gia y tế: Nghiên cứu cung cấp công cụ hỗ trợ chẩn đoán ung thư vú chính xác, giúp họ nâng cao hiệu quả công việc và giảm thiểu sai sót trong chẩn đoán hình ảnh.

  2. Nhà nghiên cứu và phát triển AI trong y tế: Luận văn trình bày chi tiết về ứng dụng học sâu và thuật toán YOLO trong phân tích ảnh y tế, là tài liệu tham khảo quý giá cho các dự án phát triển mô hình AI tương tự.

  3. Các cơ sở y tế và bệnh viện: Có thể áp dụng kết quả nghiên cứu để triển khai phần mềm hỗ trợ chẩn đoán, nâng cao chất lượng dịch vụ khám chữa bệnh và tăng cường phát hiện sớm ung thư vú.

  4. Sinh viên và học viên cao học chuyên ngành kỹ thuật điện tử, công nghệ thông tin: Luận văn cung cấp kiến thức chuyên sâu về học sâu, xử lý ảnh y tế và phát triển ứng dụng thực tiễn, hỗ trợ học tập và nghiên cứu chuyên môn.

Câu hỏi thường gặp

  1. Học sâu là gì và tại sao được sử dụng trong chẩn đoán ung thư vú?
    Học sâu là một nhánh của học máy, sử dụng mạng nơ-ron nhiều lớp để tự động trích xuất đặc trưng từ dữ liệu phức tạp như ảnh y tế. Nó giúp phát hiện các dấu hiệu bệnh lý nhỏ và phức tạp mà con người có thể bỏ sót, nâng cao độ chính xác chẩn đoán.

  2. Tại sao chọn thuật toán YOLO thay vì các mô hình khác?
    YOLO có ưu điểm về tốc độ xử lý thời gian thực và khả năng phát hiện nhiều đối tượng trong ảnh cùng lúc. Phiên bản YOLOv3 và YOLOv4 còn cải thiện khả năng phát hiện các vật thể nhỏ, phù hợp với đặc điểm khối u vú nhỏ trong nhũ ảnh.

  3. Tập dữ liệu INbreast có đặc điểm gì nổi bật?
    INbreast là tập dữ liệu nhũ ảnh kỹ thuật số toàn trường, gồm 410 ảnh với các vùng tổn thương được ghi chú chi tiết theo chuẩn BI-RADS, giúp mô hình học sâu huấn luyện và đánh giá chính xác hơn.

  4. Làm thế nào để mô hình xử lý các khối u rất nhỏ?
    Mô hình sử dụng kiến trúc mạng sâu với dự đoán trên nhiều tỉ lệ bản đồ đặc trưng (FPN, PAN), giúp bảo tồn và phát hiện các đặc trưng nhỏ trong ảnh, đồng thời áp dụng kỹ thuật tăng cường dữ liệu để cải thiện khả năng nhận diện.

  5. Phần mềm CAD có thể áp dụng trong thực tế như thế nào?
    Phần mềm CAD tích hợp mô hình học sâu giúp tự động phát hiện và phân loại khối u trên ảnh nhũ ảnh, hỗ trợ bác sĩ đưa ra chẩn đoán nhanh và chính xác, giảm thiểu sai sót và tăng hiệu quả khám chữa bệnh.

Kết luận

  • Luận văn đã xây dựng thành công mô hình học sâu dựa trên thuật toán YOLOv4 với độ chính xác trung bình đạt 94.4% trong phát hiện khối u ung thư vú trên ảnh nhũ ảnh kỹ thuật số.
  • Mô hình cải thiện đáng kể khả năng phát hiện các khối u nhỏ và duy trì tốc độ xử lý nhanh, phù hợp ứng dụng thực tiễn trong y tế.
  • Kỹ thuật tăng cường dữ liệu và tinh chỉnh tốc độ học giúp nâng cao hiệu quả huấn luyện và tránh hiện tượng quá khớp.
  • Phần mềm CAD được triển khai trên nền tảng .NET hỗ trợ bác sĩ X-quang trong chẩn đoán, góp phần giảm thiểu sai sót và tăng hiệu quả phát hiện sớm.
  • Đề xuất các bước tiếp theo bao gồm mở rộng dữ liệu huấn luyện, đào tạo người dùng và phát triển thêm tính năng hỗ trợ chẩn đoán đa dạng hơn.

Hãy áp dụng và phát triển công nghệ học sâu trong chẩn đoán y tế để nâng cao chất lượng chăm sóc sức khỏe cộng đồng.