Ứng dụng mô hình chuyển đổi thị giác trong phân loại và diễn giải ảnh y tế tại HCMUTE

I. Mô hình Chuyển Đổi Thị Giác Mô hình chuyển đổi thị giác

Phần này tập trung vào mô hình chuyển đổi thị giác, cụ thể là ứng dụng của kỹ thuật chuyển đổi kiến thức trong lĩnh vực phân tích ảnh y tế. Nghiên cứu khảo sát việc sử dụng các mô hình pre-trained, được huấn luyện trên các tập dữ liệu lớn như ImageNet, sau đó được tinh chỉnh (huấn luyện mô hình) trên tập dữ liệu ảnh y tế mục tiêu. Việc này giúp giảm thiểu thời gian huấn luyện và cải thiện hiệu suất, đặc biệt hữu ích khi bộ dữ liệu ảnh y tế thường có kích thước nhỏ hơn so với dữ liệu ảnh thông thường. Mô hình chuyển đổi thị giác tận dụng kiến thức đã học được từ các nhiệm vụ khác để thích nghi nhanh chóng với bài toán phân loại và diễn giải ảnh y tế. Transfer learning in medical image analysis là trọng tâm của phần này. Các mô hình CNN và ViT (Vision Transformer) được so sánh, đánh giá hiệu quả. Một điểm đáng chú ý là việc sử dụng mạng nơ-ron tích chập (mạng nơ-ron tích chập) và mạng nơ-ron tái diễn (mạng nơ-ron tái diễn) trong kiến trúc, lựa chọn phù hợp phụ thuộc vào đặc thù của xử lý ảnh y tế.

1.1. So sánh Mô hình CNN và ViT

Phần này so sánh hiệu quả của hai kiến trúc mạng thần kinh: Convolutional Neural Network (CNN) và Vision Transformer (ViT). CNN, với ưu điểm trong việc trích xuất đặc trưng cục bộ, được xem xét như một backbone truyền thống. Ngược lại, ViT, dựa trên cơ chế attention, có khả năng nắm bắt mối quan hệ toàn cục giữa các vùng ảnh, rất hữu ích trong việc xử lý các trường hợp nhiều bệnh cùng xuất hiện trên một ảnh. Mô hình ResNet, một kiến trúc CNN nổi bật, được sử dụng để so sánh với ViT. Nghiên cứu tập trung vào việc đánh giá hiệu suất của mỗi kiến trúc trên tập dữ liệu VinDr-CXR, xét về độ chính xác phân loại và khả năng phát hiện bệnh tật ảnh y tế. Phân loại ảnh y tế là mục tiêu chính, nhưng diễn giải ảnh y tế cũng được xem xét thông qua việc so sánh Attention map của ViT với Grad-CAM của CNN. Deep learning trong y tế được áp dụng ở đây.

1.2. Ảnh hưởng của Kích thước Dữ liệu và Pre training

Phần này phân tích ảnh hưởng của kích thước tập dữ liệu và kỹ thuật pre-training đến hiệu quả của mô hình chuyển đổi thị giác. Như đã biết, ViT thường đòi hỏi tập dữ liệu huấn luyện rất lớn để đạt hiệu suất tối ưu. Nghiên cứu này khảo sát hiệu quả của việc sử dụng các mô hình pre-trained trên tập dữ liệu lớn (như CheXpert và Chest14) trước khi tinh chỉnh trên tập dữ liệu VinDr-CXR có kích thước nhỏ hơn. Kết quả được phân tích để đánh giá mức độ cải thiện hiệu suất. Bộ dữ liệu ảnh y tế được sử dụng trong phần này đóng vai trò quan trọng. Đánh giá hiệu quả mô hình dựa trên các chỉ số chính xác và độ chính xác của việc phân loại. Việc sử dụng mạng nơ-ron tích chập và mạng nơ-ron tái diễn cần được đánh giá kỹ lưỡng trong bối cảnh này. Deep learning in medical image analysis được ứng dụng để tối ưu hóa quá trình này.

II. Phân Loại và Diễn Giải Ảnh Y tế Phân loại ảnh y tế Diễn giải ảnh y tế

Phần này tập trung vào ứng dụng thực tế của mô hình chuyển đổi thị giác trong phân loại ảnh y tế và diễn giải ảnh y tế. Kết quả phân loại được đánh giá dựa trên các chỉ số như độ chính xác, độ nhạy, độ đặc hiệu. Phân tích ảnh y tế được thực hiện trên tập dữ liệu VinDr-CXR, một tập dữ liệu lớn về ảnh X-quang phổi. Nhận dạng đối tượng trong ảnh y tế được thực hiện thông qua việc sử dụng Grad-CAM và Attention map để trực quan hóa vùng ảnh ảnh hưởng đến quyết định của mô hình. Học máy trong y tế được ứng dụng để nâng cao độ chính xác của việc phát hiện bệnh tật ảnh y tế. Ứng dụng AI trong hình ảnh y tế được đề cập cụ thể ở đây. Khả năng chẩn đoán hỗ trợ bằng AI cũng được xem xét.

2.1. Đánh giá Hiệu suất Phân Loại

Phần này trình bày kết quả phân loại ảnh y tế cụ thể. Độ chính xác của mô hình được đo lường và so sánh giữa các kiến trúc CNN và ViT, với và không có bước pre-training. Các chỉ số đánh giá như độ chính xác, độ nhạy, độ đặc hiệu được sử dụng để đánh giá hiệu quả của mô hình. Dữ liệu ảnh y tế được sử dụng trong quá trình đánh giá. Medical image classification được xem xét kỹ lưỡng. Ứng dụng AI trong chẩn đoán y tế được minh chứng thông qua kết quả phân loại. Nghiên cứu này cũng đề cập tới thách thức và triển vọng trong việc áp dụng các kỹ thuật này.

2.2. Diễn Giải Kết Quả và Trực Quan Hóa

Phần này tập trung vào diễn giải ảnh y tế. Grad-CAM và Attention map được sử dụng để trực quan hóa vùng ảnh đóng góp nhiều nhất vào quyết định phân loại. Việc so sánh kết quả trực quan hóa giữa CNN và ViT giúp hiểu rõ hơn về cơ chế ra quyết định của mỗi kiến trúc. Phân tích ảnh y tế sâu hơn được thực hiện để hiểu rõ hơn về medical image interpretation. Ứng dụng thực tiễn của việc trực quan hóa được nhấn mạnh. Công nghệ hình ảnh y tế đóng vai trò quan trọng trong quá trình này. Học sâu trong phân tích ảnh y tế được ứng dụng hiệu quả trong việc này.

III. Ứng dụng tại HCMUTE HCMUTE Trường Đại học Công nghệ TP

Phần này nhấn mạnh vào đóng góp của nghiên cứu đối với nghiên cứu y tế tại HCMUTE. Nghiên cứu này góp phần thúc đẩy ứng dụng AI trong chẩn đoán hỗ trợ bằng AI tại Trường Đại học Công nghệ TP.HCM. Kết quả nghiên cứu có tiềm năng ứng dụng trong thực tiễn, hỗ trợ bác sĩ trong việc phân loại ảnh y tế và diễn giải ảnh y tế. Ứng dụng thực tiễn của nghiên cứu được đề cập. Công nghệ hình ảnh y tế tại HCMUTE được nâng cao. Nghiên cứu cũng đề xuất các hướng nghiên cứu trong tương lai để tiếp tục phát triển công nghệ này.

3.1. Đóng góp và Ứng dụng Thực Tiễn

Phần này nhấn mạnh vào những đóng góp cụ thể của nghiên cứu. Ứng dụng thực tiễn của nghiên cứu này là hỗ trợ bác sĩ trong việc chẩn đoán bệnh dựa trên ảnh y tế, nâng cao hiệu quả và độ chính xác. Kết quả nghiên cứu có thể được tích hợp vào các hệ thống chẩn đoán hỗ trợ bằng AI. AI in healthcare được thúc đẩy bởi nghiên cứu này. Nghiên cứu này có ý nghĩa quan trọng trong việc ứng dụng học sâu vào lĩnh vực y tế tại HCMUTE. Machine learning in healthcare được ứng dụng hiệu quả. Công nghệ hình ảnh y tế được cải thiện nhờ nghiên cứu này.

3.2. Hướng Nghiên cứu Tương Lai

Phần này đề xuất các hướng nghiên cứu trong tương lai. Việc mở rộng tập dữ liệu, cải tiến mô hình, và tích hợp với các hệ thống y tế hiện có là những hướng nghiên cứu quan trọng. Cải thiện khả năng diễn giải ảnh y tế và giải quyết vấn đề đa bệnh cùng xuất hiện cũng là những thách thức cần nghiên cứu. Nghiên cứu sâu hơn về deep learning in medical image analysis và transfer learning in medical image analysis là cần thiết. Thách thức và triển vọng trong việc phát triển công nghệ này tại HCMUTE được đề cập.

Mô hình chuyển đổi thị giác cho phân loại và diễn giải ảnh y tế tại HCMUTE

I. Mô hình Chuyển Đổi Thị Giác Mô hình chuyển đổi thị giác

1.1. So sánh Mô hình CNN và ViT

1.2. Ảnh hưởng của Kích thước Dữ liệu và Pre training

II. Phân Loại và Diễn Giải Ảnh Y tế Phân loại ảnh y tế Diễn giải ảnh y tế

2.1. Đánh giá Hiệu suất Phân Loại

2.2. Diễn Giải Kết Quả và Trực Quan Hóa

III. Ứng dụng tại HCMUTE HCMUTE Trường Đại học Công nghệ TP

3.1. Đóng góp và Ứng dụng Thực Tiễn

3.2. Hướng Nghiên cứu Tương Lai

TÀI LIỆU LIÊN QUAN

THÔNG TIN CHI TIẾT

Tác giả: Phạm Nguyễn Ngọc Diễm

Người hướng dẫn: T.S Nguyễn Mạnh Hùng

Trường học: Trường Đại Học Sư Phạm Kỹ Thuật Thành Phố Hồ Chí Minh

Chuyên ngành: Kỹ thuật

Đề tài: Ứng Dụng Mô Hình Chuyển Đổi Thị Giác Trong Phân Loại Và Diễn Giải Ảnh Y Tế

Loại tài liệu: luận văn

Năm xuất bản: 2022

Địa điểm: Thành Phố Hồ Chí Minh