I. Giới thiệu về Phân loại và Phân đoạn Tổn thương Nội soi bằng AI
Phân loại tổn thương nội soi và phân đoạn tổn thương là hai nhiệm vụ quan trọng trong chẩn đoán y tế hiện đại. Với sự phát triển của trí tuệ nhân tạo (AI) và mạng nơ-ron sâu, các công nghệ này đã trở thành công cụ hỗ trợ không thể thiếu cho các bác sĩ. Đặc biệt, trong lĩnh vực nội soi đường tiêu hóa trên, việc sử dụng deep learning giúp phát hiện bệnh lý sớm và chính xác hơn. Luận án thạc sĩ từ Trường Đại học Công nghệ, Đại học Quốc gia Hà Nội đã phát triển các mô hình mạng nơ-ron thống nhất có khả năng xử lý nhiều tác vụ đồng thời trên bộ dữ liệu 11.469 hình ảnh nội soi.
1.1. Ứng dụng AI trong chẩn đoán y tế
AI và machine learning đóng vai trò thiết yếu trong chẩn đoán có hỗ trợ máy tính (CAD). Công nghệ này giúp bác sĩ chẩn đoán bệnh sớm, nhất quán và hiệu quả hơn. Ngoài ra, deep learning còn hỗ trợ cá nhân hóa liệu pháp cho từng bệnh nhân, nâng cao chất lượng chăm sóc sức khỏe toàn diện.
1.2. Tầm quan trọng của nội soi đường tiêu hóa trên
Nội soi đường tiêu hóa trên (Upper GI Endoscopy) là phương pháp kiểm tra không thể thiếu để phát hiện các bệnh lý như ung thư, viêm loét. Sử dụng mạng nơ-ron tích chập (CNN) và các kỹ thuật phân đoạn hình ảnh, các tổn thương có thể được xác định và phân loại một cách chính xác và nhanh chóng.
II. Các Công nghệ Deep Learning cho Phân loại Tổn thương
Để thực hiện phân loại tổn thương nội soi, các nhà nghiên cứu đã sử dụng nhiều kiến trúc mạng nơ-ron sâu khác nhau. Convolutional Neural Networks (CNN) là nền tảng của các mô hình này, với khả năng trích xuất đặc trưng hình ảnh tự động. Các cải tiến như Squeeze-and-Excitation blocks và Feature Pyramid Networks (FPN) giúp tăng cường khả năng học và nhận diện của mô hình. Multi-task learning cho phép mô hình xử lý đồng thời nhiều tác vụ như phân loại vị trí giải phẫu và phân đoạn tổn thương, từ đó nâng cao độ chính xác tổng thể.
2.1. Kiến trúc mạng nơ ron tích chập CNN
CNN là kiến trúc cơ sở cho hầu hết các mô hình phân loại tổn thương. Các lớp convolution và pooling giúp trích xuất các đặc trưng quan trọng từ hình ảnh nội soi. Fully Convolutional Networks (FCN) được sử dụng để phân đoạn tổn thương pixel-level, cho phép xác định chính xác ranh giới của tổn thương.
2.2. Các kỹ thuật nâng cao FPN và Squeeze and Excitation
Feature Pyramid Networks (FPN) cho phép mô hình nhận diện các tổn thương ở nhiều kích thước khác nhau. Squeeze-and-Excitation blocks tăng cường khả năng chọn lọc các đặc trưng quan trọng nhất. Kết hợp với Transfer Learning, các mô hình này đạt độ chính xác cao hơn trong phân loại và phân đoạn tổn thương.
III. Dữ liệu và Phương pháp Huấn luyện Mô hình
Bộ dữ liệu sử dụng trong nghiên cứu bao gồm 11.469 hình ảnh nội soi được phân thành ba tập con: tập dữ liệu vị trí giải phẫu, tập dữ liệu tổn thương, và tập dữ liệu HP. Data preprocessing và data augmentation là những bước quan trọng để cải thiện chất lượng dữ liệu huấn luyện. Các kỹ thuật như normalization, rotation, flip, và zoom được áp dụng để tăng đa dạng dữ liệu. Multi-task learning được sử dụng để mô hình có thể học đồng thời phân loại vị trí giải phẫu và phân đoạn tổn thương, với các loss functions và metrics được tối ưu hóa riêng biệt.
3.1. Xử lý và tăng cường dữ liệu
Data augmentation bao gồm các phép biến đổi hình ảnh như rotation, flip, zoom để tạo ra các biến thể dữ liệu huấn luyện. Normalization giúp chuẩn hóa giá trị pixel để mô hình học tốt hơn. Các kỹ thuật này giúp tránh overfitting và cải thiện khả năng phân loại tổn thương trên dữ liệu mới.
3.2. Huấn luyện và tối ưu hóa mô hình
Multi-task learning cho phép một mô hình duy nhất xử lý phân loại vị trí giải phẫu và phân đoạn tổn thương cùng lúc. Learning rate scheduling và các optimization algorithms được sử dụng để tối ưu hóa quá trình huấn luyện. Evaluation metrics như confusion matrix được sử dụng để đánh giá hiệu suất trên tập fold khác nhau.
IV. Kết quả và Ứng dụng Thực tế
Các mô hình được phát triển, bao gồm EndoUNet và SFMNet, đã cho thấy những kết quả khá tích cực trong cả phân loại tổn thương và phân đoạn tổn thương. Các confusion matrices trên các fold khác nhau cho thấy mô hình có khả năng phân loại vị trí giải phẫu với độ chính xác cao. Lesion segmentation cũng cho thấy các ví dụ phân đoạn chính xác các vùng tổn thương. Những kết quả này chứng tỏ tiềm năng của AI trong hỗ trợ chẩn đoán nội soi, giúp các bác sĩ phát hiện bệnh lý sớm và cải thiện kết quả điều trị cho bệnh nhân.
4.1. Hiệu suất của các mô hình EndoUNet và SFMNet
EndoUNet và SFMNet đạt được độ chính xác cao trong phân loại vị trí giải phẫu. Confusion matrices cho thấy mô hình phân biệt tốt giữa các vị trí khác nhau của đường tiêu hóa trên. Lesion classification task cũng cho kết quả tương tự tốt, với khả năng phân loại tổn thương chính xác trên các fold khác nhau của bộ dữ liệu.
4.2. Tiềm năng ứng dụng trong thực tế lâm sàng
Các mô hình AI này có thể được tích hợp vào hệ thống nội soi thực tế để hỗ trợ bác sĩ theo thời gian thực. Computer-aided diagnosis giúp phát hiện các tổn thương nhỏ dễ bị bỏ sót, cải thiện chất lượng chẩn đoán và tỷ lệ sống sót của bệnh nhân. Tương lai, các mô hình này có thể mở rộng để phân đoạn tổn thương từ các loại nội soi khác và các bệnh lý khác nhau.