Tổng quan nghiên cứu

Phát hiện tự động polyp trong ảnh y học, đặc biệt là ảnh nội soi đại tràng, là một vấn đề cấp thiết trong lĩnh vực chẩn đoán hình ảnh y tế. Theo ước tính, polyp đại tràng có tỷ lệ chuyển hóa thành ung thư cao nhất trong các loại polyp, gây nguy hiểm lớn cho sức khỏe cộng đồng. Việc phát hiện chính xác và kịp thời các polyp giúp giảm thiểu nguy cơ bỏ sót, nâng cao hiệu quả điều trị và giảm gánh nặng cho nhân lực y tế. Tuy nhiên, hiện nay việc sàng lọc polyp chủ yếu dựa vào quan sát thủ công của chuyên gia y tế, dễ dẫn đến sai sót do hiện tượng “mù thoáng qua” hoặc “mù không chủ ý”.

Mục tiêu của luận văn là nghiên cứu và phát triển phương pháp phát hiện tự động polyp dựa trên các kỹ thuật xử lý ảnh tiên tiến như lọc Hessian, biến đổi Hough và đặc trưng biên HOG, kết hợp với thuật toán phân loại SVM trong học máy. Phạm vi nghiên cứu tập trung vào ảnh nội soi đại tràng, sử dụng bộ dữ liệu CVC ClinicDB với 612 frame ảnh kích thước 384×288 pixels, có kèm theo mặt nạ ground truth cho vùng polyp. Nghiên cứu nhằm nâng cao độ chính xác phát hiện, giảm thiểu lỗi bỏ sót và hỗ trợ chẩn đoán tự động trong thực tế y tế.

Việc áp dụng các phương pháp này không chỉ giúp cải thiện hiệu quả phát hiện polyp mà còn góp phần thúc đẩy ứng dụng trí tuệ nhân tạo trong y học, nâng cao chất lượng dịch vụ khám chữa bệnh và giảm thiểu chi phí nhân lực. Kết quả nghiên cứu có ý nghĩa thực tiễn lớn trong bối cảnh phát triển công nghệ y tế số và chẩn đoán hình ảnh hiện đại.

Cơ sở lý thuyết và phương pháp nghiên cứu

Khung lý thuyết áp dụng

Luận văn dựa trên ba lý thuyết và mô hình nghiên cứu chính:

  1. Đặc trưng HOG (Histogram of Oriented Gradients): Là phương pháp trích xuất đặc trưng hình dạng và cấu trúc đối tượng trong ảnh dựa trên biểu đồ hướng gradient. HOG mô tả hình dạng vật thể qua ma trận độ lớn và hướng gradient, được chia thành các ô (cells) và khối (blocks) để tính toán histogram. Phép chuẩn hóa vectơ đặc trưng giúp tăng tính bất biến với thay đổi ánh sáng và đổ bóng.

  2. Lọc Hessian: Kỹ thuật xử lý ảnh dùng ma trận Hessian để phát hiện các vùng có cấu trúc lồi lõm đặc trưng như polyp trong ảnh nội soi. Lọc Hessian kết hợp với bộ lọc Gaussian giúp làm mịn ảnh, loại bỏ nhiễu và tăng cường các vùng ứng cử viên polyp dựa trên giá trị riêng của ma trận Hessian.

  3. Biến đổi Hough (Hough Transform): Phương pháp phát hiện hình dạng hình học như đường thẳng, hình tròn, elip trong ảnh. Biến đổi Hough cho hình tròn (CHT) và elip (EHT) được sử dụng để xác định vị trí và kích thước các vùng ứng cử viên polyp trong ảnh nội soi đại tràng.

Ngoài ra, thuật toán SVM (Support Vector Machine) được áp dụng để phân loại các vùng ứng cử viên thành polyp hoặc không polyp dựa trên vectơ đặc trưng HOG. SVM tối ưu siêu phẳng phân tách dữ liệu với lề lớn nhất, giúp mô hình có khả năng tổng quát hóa tốt và chịu nhiễu cao.

Các khái niệm chính bao gồm: điểm ảnh (pixel), mức xám (grayscale), gradient, biên ảnh (edge), histogram, ma trận Hessian, biến đổi Hough, vectơ đặc trưng, siêu phẳng phân loại, overfitting và underfitting.

Phương pháp nghiên cứu

Nguồn dữ liệu chính là bộ ảnh nội soi đại tràng CVC ClinicDB gồm 612 frame ảnh kích thước 384×288 pixels, có kèm mặt nạ ground truth cho vùng polyp. Dữ liệu được chuẩn hóa, tiền xử lý bằng các bộ lọc Gaussian và lọc Hessian để làm mịn và tăng cường vùng biên.

Phương pháp phân tích gồm các bước:

  • Tiền xử lý ảnh: chuẩn hóa kích thước, cân bằng histogram, làm mờ Gaussian để giảm nhiễu.
  • Trích xuất đặc trưng HOG: tính toán độ lớn và hướng gradient, chia ảnh thành các ô 8×8 pixel, xây dựng histogram 9 bin cho mỗi ô, chuẩn hóa vectơ đặc trưng.
  • Phát hiện vùng ứng cử viên polyp bằng lọc Hessian và biến đổi Hough (hình tròn và elip) để xác định các vùng có cấu trúc đặc trưng.
  • Huấn luyện mô hình phân loại SVM tuyến tính với tập dữ liệu huấn luyện, sử dụng kỹ thuật k-fold cross-validation để tránh overfitting.
  • Đánh giá mô hình qua các chỉ số Precision, Recall, F1-score dựa trên confusion matrix.

Quá trình nghiên cứu được thực hiện trong khoảng thời gian từ năm 2019 đến 2021 tại Viện Công nghệ thông tin, Viện Hàn lâm Khoa học và Công nghệ Việt Nam. Các thuật toán được cài đặt trên ngôn ngữ Python, sử dụng thư viện OpenCV hỗ trợ xử lý ảnh và học máy.

Kết quả nghiên cứu và thảo luận

Những phát hiện chính

  1. Hiệu quả trích xuất đặc trưng HOG: Đặc trưng HOG cho phép mô tả chính xác hình dạng polyp trong ảnh nội soi đại tràng. Kích thước vectơ đặc trưng dao động từ 7.056 đến 12.996 chiều tùy theo kích thước ảnh đầu vào và tham số HOG. Việc chuẩn hóa vectơ đặc trưng giúp tăng độ chính xác phân loại lên khoảng 85-90%.

  2. Phát hiện vùng ứng cử viên bằng lọc Hessian và biến đổi Hough: Lọc Hessian giúp xác định các vùng có cấu trúc lồi lõm đặc trưng polyp, giảm nhiễu hiệu quả. Biến đổi Hough cho hình tròn và elip hỗ trợ phát hiện chính xác các vùng ứng cử viên với tỷ lệ phát hiện đúng trên 80%. Việc kết hợp hai phương pháp này giúp giảm số lượng vùng giả, tăng độ tin cậy.

  3. Mô hình phân loại SVM: Sử dụng SVM tuyến tính với tham số điều chỉnh lề mềm (soft margin) và kernel tuyến tính, mô hình đạt độ chính xác phân loại polyp đạt khoảng 88%, Recall đạt 85%, Precision đạt 90%, F1-score đạt 87%. Kỹ thuật k-fold cross-validation (k=5) được áp dụng để đánh giá và tránh hiện tượng overfitting.

  4. So sánh với các phương pháp khác: Kết quả nghiên cứu cho thấy phương pháp kết hợp lọc Hessian, biến đổi Hough và đặc trưng HOG vượt trội hơn so với các phương pháp chỉ dùng HOG hoặc chỉ dùng biến đổi Hough về độ chính xác và khả năng phát hiện polyp trong ảnh nội soi đại tràng.

Thảo luận kết quả

Nguyên nhân thành công của phương pháp là do sự kết hợp hiệu quả giữa các kỹ thuật xử lý ảnh và học máy. Lọc Hessian giúp làm nổi bật các vùng có cấu trúc đặc trưng polyp, giảm nhiễu và tăng độ tương phản. Biến đổi Hough cho phép phát hiện chính xác các hình dạng tròn và elip đặc trưng của polyp, hỗ trợ xác định vùng ứng cử viên hiệu quả. Đặc trưng HOG cung cấp mô tả chi tiết về hình dạng và cấu trúc biên, giúp mô hình phân loại SVM phân biệt chính xác polyp và các vùng không phải polyp.

So với các nghiên cứu trước đây, phương pháp này có ưu điểm là không phụ thuộc quá nhiều vào dữ liệu lớn như các mô hình học sâu (deep learning), đồng thời vẫn đạt hiệu quả cao trong phát hiện polyp. Kết quả có thể được trình bày qua biểu đồ so sánh Precision, Recall và F1-score giữa các phương pháp, cũng như bảng confusion matrix minh họa hiệu quả phân loại.

Ý nghĩa của kết quả là mở ra hướng phát triển các hệ thống hỗ trợ chẩn đoán tự động trong y học, giảm thiểu sai sót do con người và tăng tốc độ xử lý ảnh nội soi đại tràng.

Đề xuất và khuyến nghị

  1. Triển khai hệ thống hỗ trợ chẩn đoán tự động tại bệnh viện: Áp dụng phương pháp phát hiện polyp tự động vào các thiết bị nội soi đại tràng để hỗ trợ bác sĩ trong quá trình chẩn đoán, giảm thiểu bỏ sót polyp. Mục tiêu tăng tỷ lệ phát hiện polyp lên trên 90% trong vòng 12 tháng. Chủ thể thực hiện: phòng công nghệ thông tin và khoa nội soi.

  2. Nâng cao chất lượng dữ liệu huấn luyện: Thu thập thêm dữ liệu ảnh nội soi đa dạng từ nhiều bệnh viện khác nhau để mở rộng tập huấn luyện, giảm hiện tượng overfitting và tăng khả năng tổng quát hóa mô hình. Mục tiêu tăng số lượng ảnh lên ít nhất 2.000 frame trong 18 tháng. Chủ thể thực hiện: nhóm nghiên cứu và các bệnh viện hợp tác.

  3. Tối ưu thuật toán và tăng tốc xử lý: Nghiên cứu áp dụng các kỹ thuật tối ưu hóa thuật toán, sử dụng phần cứng GPU để tăng tốc độ xử lý ảnh, đảm bảo thời gian phát hiện polyp trong mỗi frame dưới 1 giây. Mục tiêu hoàn thành trong 12 tháng. Chủ thể thực hiện: nhóm phát triển phần mềm.

  4. Đào tạo và chuyển giao công nghệ: Tổ chức các khóa đào tạo cho bác sĩ, kỹ thuật viên về sử dụng hệ thống phát hiện polyp tự động, đồng thời chuyển giao công nghệ cho các đơn vị y tế. Mục tiêu đào tạo ít nhất 50 nhân sự trong 6 tháng. Chủ thể thực hiện: Viện Công nghệ thông tin và các bệnh viện đối tác.

Đối tượng nên tham khảo luận văn

  1. Chuyên gia và nhà nghiên cứu trong lĩnh vực thị giác máy tính và xử lý ảnh y học: Luận văn cung cấp cơ sở lý thuyết và phương pháp thực nghiệm chi tiết về phát hiện đối tượng trong ảnh y học, đặc biệt là polyp đại tràng, giúp mở rộng nghiên cứu và ứng dụng.

  2. Bác sĩ và kỹ thuật viên nội soi đại tràng: Hiểu rõ về công nghệ hỗ trợ phát hiện polyp tự động, từ đó nâng cao hiệu quả chẩn đoán và giảm thiểu sai sót trong thực tế lâm sàng.

  3. Nhà phát triển phần mềm và kỹ sư công nghệ y tế: Áp dụng các thuật toán xử lý ảnh và học máy trong phát triển các hệ thống chẩn đoán hình ảnh tự động, cải tiến sản phẩm công nghệ y tế.

  4. Sinh viên và học viên cao học ngành công nghệ thông tin, máy tính: Tham khảo mô hình nghiên cứu thực tiễn, phương pháp xử lý ảnh và học máy ứng dụng trong y học, phục vụ học tập và nghiên cứu khoa học.

Câu hỏi thường gặp

  1. Phương pháp HOG có ưu điểm gì trong phát hiện polyp?
    HOG mô tả hình dạng và cấu trúc biên của polyp thông qua biểu đồ hướng gradient, giúp phân biệt polyp với các vùng nền khác trong ảnh. Ví dụ, HOG chuẩn hóa vectơ đặc trưng giúp giảm ảnh hưởng của ánh sáng và đổ bóng, tăng độ chính xác phân loại.

  2. Lọc Hessian giúp gì trong xử lý ảnh nội soi?
    Lọc Hessian phát hiện các vùng có cấu trúc lồi lõm đặc trưng polyp, làm nổi bật vùng ứng cử viên và giảm nhiễu. Kết hợp với Gaussian giúp làm mịn ảnh, tăng độ tin cậy phát hiện.

  3. Biến đổi Hough được sử dụng như thế nào?
    Biến đổi Hough cho hình tròn và elip giúp xác định vị trí và kích thước các vùng ứng cử viên polyp dựa trên hình dạng đặc trưng. Phương pháp này nhanh và hiệu quả trong việc phát hiện các hình dạng hình học trong ảnh.

  4. Tại sao chọn SVM làm thuật toán phân loại?
    SVM có khả năng phân loại nhị phân hiệu quả, tối ưu siêu phẳng phân tách với lề lớn nhất giúp mô hình tổng quát tốt, chịu nhiễu cao. SVM cũng dễ dàng điều chỉnh tham số để tránh overfitting, phù hợp với dữ liệu ảnh y học.

  5. Làm thế nào để tránh hiện tượng overfitting trong nghiên cứu?
    Sử dụng kỹ thuật k-fold cross-validation để đánh giá mô hình trên nhiều tập con dữ liệu khác nhau, đồng thời mở rộng tập dữ liệu huấn luyện và điều chỉnh tham số SVM (tham số C) giúp cân bằng giữa độ chính xác và khả năng tổng quát.

Kết luận

  • Nghiên cứu đã phát triển thành công phương pháp phát hiện tự động polyp trong ảnh nội soi đại tràng dựa trên lọc Hessian, biến đổi Hough và đặc trưng biên HOG kết hợp với phân loại SVM.
  • Phương pháp đạt độ chính xác phân loại khoảng 88%, Recall 85%, Precision 90%, F1-score 87%, vượt trội so với các phương pháp truyền thống.
  • Kết quả thực nghiệm trên bộ dữ liệu CVC ClinicDB với 612 frame ảnh chứng minh tính khả thi và hiệu quả của phương pháp.
  • Đề xuất triển khai ứng dụng thực tế tại các bệnh viện, đồng thời mở rộng nghiên cứu nâng cao chất lượng dữ liệu và tối ưu thuật toán.
  • Các bước tiếp theo bao gồm phát triển hệ thống phần mềm hoàn chỉnh, đào tạo nhân lực và chuyển giao công nghệ nhằm hỗ trợ chẩn đoán y tế chính xác và nhanh chóng hơn.

Hãy tiếp tục nghiên cứu và ứng dụng các kỹ thuật xử lý ảnh và học máy để nâng cao chất lượng chẩn đoán hình ảnh y học, góp phần cải thiện sức khỏe cộng đồng.