Dang Quốc Bao - Phân Loại Ảnh Chụp Đáy Mắt Hỗ Trợ Chẩn Đoán Bệnh Võng Mạc Tiểu Đường

Luận văn về phân loại ảnh đáy mắt bằng công nghệ thông tin, hỗ trợ chẩn đoán bệnh võng mạc tiểu đường. Nghiên cứu chuyên sâu, ứng dụng AI trong y tế.

Trường đại học

Trường Đại học Công Nghệ Thông Tin

Chuyên ngành

Công Nghệ Thông Tin

Người đăng

Ẩn danh

Thể loại

Luận Văn Thạc Sĩ

2022

Phí lưu trữ

30 Point

Mục lục chi tiết

LỜI CAM ĐOAN

LỜI CẢM ƠN

1. CHƯƠNG 1: GIỚI THIỆU CHUNG

1.1. Tình hình nghiên cứu trong và ngoài nước

1.1.1. Tình hình nghiên cứu trong nước

1.1.2. Công trình nghiên cứu ngoài nước

1.2. Lý do thực hiện đề tài

1.3. Mục tiêu đề tài

1.4. Đối tượng nghiên cứu

1.5. Phạm vi nghiên cứu

1.6. Giới hạn, tính mới, tính khoa học của đề tài

1.6.1. Giới hạn của đề tài

1.6.2. Tính mới của đề tài

1.6.3. Tính khoa học của đề tài

2. CHƯƠNG 2: BỆNH VÕNG MẠC TIỂU ĐƯỜNG (ĐÁI THÁO ĐƯỜNG)

2.1. Võng mạc là gì

2.2. Bệnh võng mạc tiểu đường là gì

2.3. Lý thuyết máy học

2.4. Lý thuyết học sâu

2.4.1. Khái niệm Mạng nơ ron tích chập (mạng CNN)

2.4.2. Kiến trúc mạng VGG-16

2.4.3. Kiến trúc mạng InceptionNet-V3 (2015)

2.4.4. Kiến trúc mạng ResNet50 (2015)

2.4.5. Kiến trúc mạng EfficientNet

2.4.6. Kiến trúc mạng Inception-ResNet-V2

3. CHƯƠNG 3: MÔ HÌNH THỰC NGHIỆM VÀ KẾT QUẢ

3.1. Ý tưởng xây dựng hệ thống và hoạt động

3.2. Bộ dữ liệu làm thực nghiệm

3.2.1. Bộ dữ liệu được công bố trên Kaggle

3.2.2. Bộ dữ liệu tại bệnh viện ĐKKV Cai Lậy

3.3. Hoạt động của phần mềm

3.3.1. Huấn luyện mô hình học sâu

3.3.2. Phần mềm ứng dụng desktop

3.3.3. Xây dựng phần mềm

3.3.3.1. Thiết kế cơ sở dữ liệu

3.3.3.2. Giao diện ứng dụng

3.4. Kết quả thực nghiệm

3.4.1. Kết quả thực nghiệm trên bộ APTOS 2019

3.4.2. Kết quả thực nghiệm trên bộ Bệnh viện Cai Lậy

3.4.3. So sánh kết quả với các nghiên cứu khác

4. CHƯƠNG 4: KẾT LUẬN VÀ KHUYẾN NGHỊ

4.1. Luận văn đã giải quyết được

4.2. Những hạn chế của hệ thống và hướng giải quyết

4.3. Kết quả đạt được và ý nghĩa

4.4. Hướng phát triển

TÀI LIỆU THAM KHẢO

DANH MỤC CÁC BẢNG

DANH MỤC HÌNH VẼ, ĐỒ THỊ

DANH MỤC TỪ VIẾT TẮT, KÝ HIỆU

Tóm tắt

I. Tổng Quan Cách AI Phân Loại Ảnh Đáy Mắt Chẩn Đoán Bệnh

Các ứng dụng của máy học và học sâu trong y học đang thu hút sự chú ý lớn, với nhiều thành tựu đáng mong đợi. Phân tích và xử lý ảnh y tế, đặc biệt là chẩn đoán bệnh bằng máy học, ngày càng trở nên nhanh chóng và chính xác hơn. Bệnh võng mạc đái tháo đường (VMĐTĐ) là một biến chứng do tổn thương các mạch máu nhỏ trong võng mạc do bệnh đái tháo đường gây ra. Bệnh có nhiều giai đoạn, từ chưa tăng sinh đến tăng sinh, và có thể dẫn đến giảm hoặc mất thị lực. Các thiết bị hiện đại có thể chụp ảnh đáy mắt với độ phân giải cao, hỗ trợ bác sĩ chẩn đoán bệnh tốt hơn. Tuy nhiên, việc chẩn đoán đòi hỏi kiến thức chuyên môn và kinh nghiệm, do đó sự hỗ trợ của trí tuệ nhân tạo là rất cần thiết để giảm bớt khó khăn và hạn chế sai sót. Theo nghiên cứu của Hoang Nhut Huynh và cộng sự, "Classification of Stages Diabetic Retinopathy Using MobileNetV2 Model" [1], mô hình MobileNetV2 đạt độ chính xác 93% trên bộ dữ liệu APTOS 2019. Bệnh võng mạc đái tháo đường (VMĐTĐ) là kết quả các mạch máu rất nhỏ trong võng mạc bị ton thương do bệnh đái thao đường (DTD) gây ra.

1.1. Tổng quan về bệnh võng mạc tiểu đường và nguy cơ mù lòa

Bệnh võng mạc tiểu đường là một trong những nguyên nhân hàng đầu gây mù lòa trên toàn thế giới. Việc phát hiện sớm và điều trị kịp thời có thể làm chậm hoặc ngăn chặn tiến triển của bệnh. Các dấu hiệu ban đầu của bệnh thường không rõ ràng, vì vậy việc tầm soát bệnh định kỳ là rất quan trọng. Theo thống kê của Tổ chức Y tế Thế giới (WHO), số lượng người mắc bệnh tiểu đường và bệnh võng mạc tiểu đường đang gia tăng nhanh chóng. Việc ứng dụng AI trong chẩn đoán bệnh sẽ giúp tăng cường khả năng tiếp cận dịch vụ y tế và cải thiện hiệu quả điều trị.

1.2. Vai trò của ảnh chụp đáy mắt trong chẩn đoán bệnh võng mạc

Ảnh chụp đáy mắt là một phương pháp quan trọng để đánh giá tình trạng võng mạc và phát hiện các dấu hiệu của bệnh võng mạc tiểu đường. Ảnh chụp đáy mắt cho phép bác sĩ quan sát trực tiếp các mạch máu, thần kinh và các cấu trúc khác của võng mạc. Các dấu hiệu như vi phình mạch, xuất huyết, phù hoàng điểm và tân mạch có thể được phát hiện thông qua phân tích ảnh. Tuy nhiên, việc phân tích ảnh đòi hỏi kinh nghiệm và sự tập trung cao độ, và đôi khi có thể bị bỏ sót các dấu hiệu nhỏ. Chính vì thế, việc ứng dụng phần mềm chẩn đoán có sử dụng AI là một giải pháp tối ưu.

II. Thách Thức Chẩn Đoán Sớm Bệnh Võng Mạc Tiểu Đường Chính Xác

Mặc dù ảnh chụp đáy mắt là một công cụ hữu ích, việc chẩn đoán bệnh võng mạc tiểu đường vẫn đối mặt với nhiều thách thức. Sự khác biệt tinh tế giữa các giai đoạn bệnh có thể gây khó khăn cho bác sĩ nhãn khoa. Sự thiếu hụt bác sĩ chuyên khoa, đặc biệt ở vùng sâu vùng xa, cũng là một vấn đề lớn. Ngoài ra, việc phân tích ảnh thủ công tốn nhiều thời gian và dễ bị sai sót do yếu tố chủ quan. Sự cần thiết của một phương pháp chẩn đoán nhanh chóng, chính xác và khách quan là rất rõ ràng. Theo Vinmec cùng với Bệnh viện Phôi Trung ương và VinBrain đã hợp tác trién khai ứng “DrAid - AI Trợ lý bác sĩ trong chân đoán hình ảnh” [7],. Đây là một trong những phần mềm dau tiên tại Việt Nam ứng dụng trí tuệ nhân tao, kết hợp thị giác máy tính và công nghệ xử lý ngôn ngữ tự nhiên hỗ trợ chân đoán và điều trị bệnh. Giao diện ứng dụng DrAidTM cho Radiology (Nguồn hình [7])

2.1. Khó khăn trong việc đánh giá mức độ nghiêm trọng của bệnh

Bệnh võng mạc tiểu đường có nhiều giai đoạn, từ nhẹ đến nặng, và việc xác định chính xác giai đoạn bệnh là rất quan trọng để đưa ra phương pháp điều trị phù hợp. Các dấu hiệu của bệnh có thể rất nhỏ và khó phát hiện, đặc biệt ở giai đoạn sớm. Sự khác biệt giữa các giai đoạn bệnh có thể rất tinh tế, đòi hỏi bác sĩ phải có kinh nghiệm và sự tập trung cao độ. Việc ứng dụng AI có thể giúp giảm bớt sự phụ thuộc vào kinh nghiệm của bác sĩ và cải thiện độ chính xác của chẩn đoán.

2.2. Sự thiếu hụt nguồn lực y tế và cơ sở vật chất ở vùng sâu vùng xa

Ở các vùng sâu vùng xa, việc tiếp cận dịch vụ khám mắt và chẩn đoán bệnh võng mạc tiểu đường còn gặp nhiều khó khăn do thiếu hụt bác sĩ chuyên khoa và trang thiết bị y tế. Điều này dẫn đến việc bệnh nhân thường phát hiện bệnh ở giai đoạn muộn, khi việc điều trị trở nên khó khăn hơn. Telemedicine và các giải pháp chăm sóc sức khỏe từ xa có thể giúp giải quyết vấn đề này bằng cách cung cấp dịch vụ chẩn đoán và tư vấn từ xa, sử dụng AI để phân loại ảnh đáy mắt và hỗ trợ bác sĩ đưa ra quyết định điều trị.

2.3. Yếu tố chủ quan và sai sót trong phân tích ảnh đáy mắt thủ công

Việc phân tích ảnh đáy mắt thủ công phụ thuộc nhiều vào kinh nghiệm và sự tập trung của bác sĩ, và có thể bị ảnh hưởng bởi các yếu tố chủ quan như mệt mỏi, căng thẳng và định kiến cá nhân. Các sai sót trong phân tích ảnh có thể dẫn đến chẩn đoán sai và ảnh hưởng đến quá trình điều trị của bệnh nhân. AI có thể giúp giảm thiểu các sai sót này bằng cách cung cấp một phương pháp phân tích ảnh khách quan, nhất quán và có thể lặp lại.

III. Giải Pháp Ứng Dụng Deep Learning Phân Loại Ảnh Đáy Mắt DR

Để giải quyết những thách thức trên, việc ứng dụng Deep Learning trong phân loại ảnh đáy mắt để hỗ trợ chẩn đoán bệnh võng mạc tiểu đường là một giải pháp đầy tiềm năng. Các mô hình học máy, đặc biệt là mạng nơ-ron tích chập (CNN), có khả năng học các đặc trưng phức tạp từ ảnh đáy mắt và phân loại ảnh một cách chính xác. Các mô hình như VGG-16, ResNet, Inception và EfficientNet đã được chứng minh là có hiệu quả trong việc phát hiện bệnh và phân loại các giai đoạn bệnh. Các mô hình học sâu gün tích chập (CNN) được đề xuất năm 2014 trong bài báo “Very Deep Convolutional Networks for Large-Scale Image Recognition” [6] VGG-16 có số lượng tham số: 138.000 VGG-16 vẫn dữ các đặc điểm của kiến trúc AlexNet nhưng có những cải tiến hơn: « Kiến trúc VGG-16 sâu hon, bao gồm 13 lớp tích chập 2 chiều (so với AlexNet là 5) và 3 lớp fully connected.

3.1. Sử dụng mạng nơ ron tích chập CNN để trích xuất đặc trưng

Mạng nơ-ron tích chập (CNN) là một loại mô hình học máy đặc biệt phù hợp cho việc xử lý ảnh. Các lớp tích chập trong CNN có khả năng tự động trích xuất các đặc trưng quan trọng từ ảnh, như đường nét, góc cạnh và màu sắc. Các lớp pooling giúp giảm kích thước của ảnh và tăng tính tổng quát của mô hình. Các lớp fully connected kết hợp các đặc trưng đã được trích xuất để đưa ra dự đoán về giai đoạn bệnh.

3.2. Các mô hình Deep Learning phổ biến trong phân loại ảnh đáy mắt

Nhiều mô hình Deep Learning đã được sử dụng thành công trong phân loại ảnh đáy mắt, bao gồm VGG-16, ResNet, Inception, DenseNet và EfficientNet. Mỗi mô hình có kiến trúc và ưu điểm riêng. VGG-16 là một mô hình đơn giản và dễ triển khai. ResNet sử dụng các kết nối residual để giải quyết vấn đề vanishing gradient. Inception sử dụng các module inception để tăng hiệu quả tính toán. EfficientNet sử dụng một phương pháp scaling compound để tối ưu hóa kích thước và hiệu suất của mô hình. Việc lựa chọn mô hình phù hợp phụ thuộc vào đặc điểm của bộ dữ liệu và yêu cầu về độ chính xác và tốc độ chẩn đoán.

3.3. Tiền xử lý và tăng cường dữ liệu để cải thiện độ chính xác

Tiền xử lý dữ liệu và tăng cường dữ liệu là các kỹ thuật quan trọng để cải thiện độ chính xác của các mô hình Deep Learning. Tiền xử lý dữ liệu bao gồm các bước như chuẩn hóa, làm mịn và cắt bỏ các vùng không quan trọng của ảnh. Tăng cường dữ liệu bao gồm việc tạo ra các bản sao mới của ảnh bằng cách áp dụng các phép biến đổi như xoay, lật, co giãn và thay đổi độ sáng. Các kỹ thuật này giúp tăng kích thước của bộ dữ liệu và giảm thiểu overfitting, từ đó cải thiện độ chính xác của mô hình.

IV. Kết Quả Đánh Giá Độ Chính Xác Mô Hình AI Chẩn Đoán DR

Sau khi huấn luyện và kiểm tra, các mô hình AI cho thấy độ chính xác ấn tượng trong chẩn đoán bệnh võng mạc tiểu đường. Các nghiên cứu đã chứng minh rằng AI có thể đạt được độ chính xác tương đương hoặc thậm chí cao hơn so với bác sĩ nhãn khoa trong một số trường hợp. Độ tin cậy của AI trong chẩn đoán bệnh đã mở ra cơ hội mới cho việc tầm soát bệnh và điều trị bệnh hiệu quả hơn. Kết quả độ chính xác của thực nghiệm 5 lớp Bảng 3. Ma trận phân lớp 5 lớp. Kết quả độ chính xác của thực nghiệm 2 lớp Bảng 3. Ma trận phân lớp 2 lớp. So sánh kết quả độ chính xác của thực nghiệm với các tác giả khác .59

4.1. So sánh hiệu suất của các mô hình AI khác nhau

Hiệu suất của các mô hình AI khác nhau có thể được so sánh dựa trên các chỉ số như độ chính xác, độ nhạy và độ đặc hiệu. Độ chính xác là tỷ lệ các ảnh được phân loại đúng. Độ nhạy là tỷ lệ các bệnh nhân mắc bệnh được phát hiện đúng. Độ đặc hiệu là tỷ lệ các bệnh nhân không mắc bệnh được xác định đúng. Các nghiên cứu đã chỉ ra rằng các mô hình tiên tiến như EfficientNet thường có hiệu suất cao hơn so với các mô hình truyền thống như VGG-16.

4.2. Ảnh hưởng của chất lượng ảnh đến độ chính xác chẩn đoán

Chất lượng của ảnh đáy mắt có ảnh hưởng lớn đến độ chính xác của chẩn đoán. Ảnh mờ, thiếu sáng hoặc có nhiễu có thể làm giảm khả năng của AI trong việc phát hiện các dấu hiệu của bệnh. Việc sử dụng các kỹ thuật tiền xử lý ảnh để cải thiện chất lượng ảnh có thể giúp tăng độ chính xác của chẩn đoán. Ngoài ra, việc đào tạo AI trên các bộ dữ liệu đa dạng với các loại ảnh khác nhau cũng có thể giúp tăng tính tổng quát của mô hình.

4.3. Tính ứng dụng thực tế và triển khai hệ thống AI trong bệnh viện

Việc triển khai hệ thống AI trong bệnh viện có thể giúp tăng cường hiệu quả và năng suất của bác sĩ nhãn khoa. Hệ thống AI có thể được sử dụng để phân loại ảnh đáy mắt và đưa ra các gợi ý chẩn đoán, giúp bác sĩ tập trung vào các trường hợp phức tạp hơn. Hệ thống AI cũng có thể được tích hợp với hệ thống thông tin bệnh viện (HIS) để quản lý dữ liệu bệnh nhân và theo dõi tiến trình điều trị.

V. Hướng Phát Triển Tương Lai Của AI Trong Nhãn Khoa DR

Ứng dụng của AI trong nhãn khoa, đặc biệt là trong chẩn đoán bệnh võng mạc tiểu đường, đang phát triển mạnh mẽ. Trong tương lai, chúng ta có thể mong đợi những tiến bộ vượt bậc trong độ chính xác, tốc độ và tính tiện lợi của các hệ thống AI. AI có thể được sử dụng để phát hiện các dấu hiệu sớm của bệnh, dự đoán nguy cơ tiến triển bệnh và cá nhân hóa phương pháp điều trị cho từng bệnh nhân. Theo Luận văn đã giải quyết được 4. Những hạn chế của hệ thống và hướng giải quyết. Kết qua đạt được và ý nghĩa. Hướng phát triễn.-«+cccceetriererrriiiiiriirrriirrirriirrrrrrririisorrreoooooouuĐ2 TAI LIEU THAM KHAO. +63

5.1. Phát triển các mô hình AI tiên tiến hơn và đa năng hơn

Các nhà nghiên cứu đang không ngừng phát triển các mô hình AI tiên tiến hơn với khả năng học sâu hơn, hiểu ảnh tốt hơn và đưa ra các dự đoán chính xác hơn. Các mô hình mới như transformers và graph neural networks có tiềm năng cách mạng hóa lĩnh vực phân loại ảnh y tế. Ngoài ra, các mô hình đa năng có thể được huấn luyện để phát hiện nhiều bệnh về mắt khác nhau từ cùng một ảnh đáy mắt.

5.2. Kết hợp AI với các công nghệ khác như Telemedicine và IoT

AI có thể được kết hợp với các công nghệ khác như Telemedicine và Internet of Things (IoT) để cung cấp dịch vụ chăm sóc sức khỏe toàn diện và dễ dàng tiếp cận hơn. Các thiết bị IoT có thể được sử dụng để thu thập dữ liệu về sức khỏe của bệnh nhân, như đường huyết và huyết áp. Dữ liệu này có thể được sử dụng để AI đưa ra các cảnh báo sớm về nguy cơ mắc bệnh võng mạc tiểu đường và đề xuất các biện pháp phòng ngừa.

5.3. Đảm bảo tính minh bạch công bằng và trách nhiệm giải trình của AI

Để AI được chấp nhận rộng rãi trong nhãn khoa, cần đảm bảo tính minh bạch, công bằng và trách nhiệm giải trình của các hệ thống AI. Các quyết định của AI cần phải được giải thích rõ ràng và dễ hiểu. AI cần được huấn luyện trên các bộ dữ liệu đa dạng và không thiên vị để tránh phân biệt đối xử. Các nhà phát triển và người sử dụng AI cần phải chịu trách nhiệm về các hậu quả có thể xảy ra do việc sử dụng AI.

25/04/2025

Bạn đang xem trước tài liệu:

Luận văn thạc sĩ công nghệ thông tin phân loại ảnh chụp đáy mắt hỗ trợ chẩn đoán bệnh võng mạc tiểu đường

Tải đầy đủ

Nội dung chính

Tổng quan nghiên cứu

Bệnh võng mạc tiểu đường (VMDTD) là một biến chứng nghiêm trọng của bệnh đái tháo đường, ảnh hưởng đến hàng triệu người trên toàn thế giới. Theo ước tính, tỷ lệ mắc VMDTD ở bệnh nhân tiểu đường có thể lên đến 30-40%, với các giai đoạn tiến triển từ nhẹ đến nặng, có thể dẫn đến mù lòa nếu không được phát hiện và điều trị kịp thời. Việc chẩn đoán chính xác và phân loại các giai đoạn bệnh dựa trên ảnh chụp đáy mắt đóng vai trò quan trọng trong việc quản lý và điều trị hiệu quả. Tuy nhiên, việc phân tích ảnh đáy mắt đòi hỏi chuyên môn cao và kinh nghiệm lâu năm của bác sĩ chuyên khoa, đồng thời tốn nhiều thời gian.

Luận văn tập trung vào ứng dụng các mô hình học sâu (Deep Learning) để phân loại ảnh chụp đáy mắt thành 5 lớp bệnh VMDTD: Không bệnh, nhẹ, trung bình, nặng và tăng sinh. Mục tiêu cụ thể là xây dựng hệ thống phân loại tự động với độ chính xác cao, hỗ trợ bác sĩ trong chẩn đoán, giảm thiểu sai sót và nâng cao hiệu quả khám chữa bệnh. Nghiên cứu sử dụng dữ liệu ảnh từ bộ dữ liệu công khai APTOS 2019 gồm 3662 ảnh và bộ dữ liệu thực tế thu thập tại Bệnh viện ĐKKV Cai Lậy với hơn 1400 ảnh, được gán nhãn bởi các chuyên gia y tế.

Phạm vi nghiên cứu tập trung vào việc áp dụng các kiến trúc mạng nơ ron tích chập hiện đại như VGG16, Inception-V3, ResNet50, Inception-ResNet-V2 và EfficientNet B3 để huấn luyện và đánh giá hiệu quả phân loại ảnh đáy mắt. Ý nghĩa của nghiên cứu được thể hiện qua việc cải thiện độ chính xác phân loại, giúp phát hiện sớm các giai đoạn bệnh, từ đó góp phần nâng cao chất lượng chăm sóc sức khỏe mắt cho bệnh nhân tiểu đường.

Cơ sở lý thuyết và phương pháp nghiên cứu

Khung lý thuyết áp dụng

Luận văn dựa trên nền tảng lý thuyết học sâu, đặc biệt là mạng nơ ron tích chập (CNN) – một mô hình mạnh mẽ trong xử lý ảnh y tế. CNN gồm ba thành phần chính: lớp tích chập (Convolution), lớp giảm kích thước (Pooling) và lớp kết nối đầy đủ (Fully Connected). Các kiến trúc CNN được nghiên cứu bao gồm:

VGG16: Mạng sâu gồm 13 lớp tích chập và 3 lớp fully connected, sử dụng bộ lọc 3x3 giúp giảm số lượng tham số, đầu vào ảnh kích thước 224x224 pixel. Ưu điểm là cấu trúc đơn giản, dễ hiểu; nhược điểm là huấn luyện chậm và số lượng tham số lớn.
Inception-V3: Kiến trúc phức tạp với 24 triệu tham số, sử dụng kỹ thuật factorisation để giảm độ phức tạp tính toán, cải thiện hiệu quả huấn luyện và độ chính xác.
ResNet50: Mạng sâu 50 lớp với cơ chế residual giúp giải quyết vấn đề vanishing gradient, có khoảng 26 triệu tham số, được sử dụng phổ biến trong nhiều bài toán phân loại ảnh y tế.
Inception-ResNet-V2: Kết hợp ưu điểm của Inception và ResNet, sâu tới 164 lớp, giúp tăng độ chính xác và giảm thời gian huấn luyện.
EfficientNet B3: Áp dụng phương pháp mở rộng kết hợp (compound scaling) để cân bằng chiều sâu, chiều rộng và độ phân giải ảnh, đạt hiệu quả cao với số lượng tham số hợp lý.

Các khái niệm chính bao gồm: độ chính xác (accuracy), độ nhạy (recall), độ đặc hiệu (specificity), ma trận nhầm lẫn (confusion matrix), và các kỹ thuật tiền xử lý ảnh như cắt viền đen, tăng độ tương phản, tăng cường dữ liệu (data augmentation).

Phương pháp nghiên cứu

Nguồn dữ liệu chính gồm hai bộ: bộ dữ liệu APTOS 2019 với 3662 ảnh đáy mắt phân loại 5 lớp và bộ dữ liệu thực tế tại Bệnh viện ĐKKV Cai Lậy gồm 1457 ảnh phân loại 2 lớp (có bệnh và không bệnh). Dữ liệu được tiền xử lý bằng cách cắt bỏ viền đen, tăng độ tương phản và áp dụng các kỹ thuật tăng cường dữ liệu như xoay, lật, thay đổi độ sáng để tăng tính đa dạng và tránh overfitting.

Phương pháp phân tích sử dụng các mô hình học sâu được huấn luyện trên nền tảng Pytorch với GPU hỗ trợ trên Google Colab Pro. Cỡ mẫu huấn luyện cho bộ APTOS là khoảng 2929 ảnh, kiểm tra 733 ảnh; bộ dữ liệu BVCL huấn luyện 1200 ảnh, kiểm tra 257 ảnh. Các siêu tham số như batch size (16-32), learning rate (0.0001), epoch (150-200) được điều chỉnh phù hợp từng mô hình.

Quá trình huấn luyện gồm các bước: tải dữ liệu, tiền xử lý, huấn luyện mô hình, đánh giá trên tập kiểm tra, lưu mô hình tốt nhất và chuyển đổi sang định dạng ONNX để tích hợp vào phần mềm ứng dụng desktop phát triển trên nền .Net Framework với cơ sở dữ liệu SQL Server 2019.

Kết quả nghiên cứu và thảo luận

Những phát hiện chính

Hiệu suất mô hình EfficientNet B3 vượt trội: Mô hình đạt độ chính xác 5 lớp lên đến khoảng 85%, độ nhạy và độ đặc hiệu lần lượt đạt trên 80%, cao hơn so với các mô hình VGG16 (độ chính xác ~78%) và Inception-V3 (~73%). Trên bộ dữ liệu 2 lớp, EfficientNet B3 đạt độ chính xác trên 90%.
Mô hình ResNet50 và Inception-ResNet-V2 cho kết quả ổn định: ResNet50 đạt độ chính xác khoảng 80%, trong khi Inception-ResNet-V2 đạt gần 83%, thể hiện khả năng phân loại tốt các giai đoạn bệnh trung bình và nặng.
Tăng cường dữ liệu và tiền xử lý ảnh cải thiện đáng kể hiệu quả: Việc cắt bỏ viền đen và tăng độ tương phản giúp làm nổi bật các đặc điểm bệnh lý trên ảnh, tăng độ chính xác phân loại lên khoảng 5-7% so với ảnh gốc.
Phần mềm ứng dụng desktop tích hợp mô hình học sâu hoạt động hiệu quả: Hệ thống cho phép nhập ảnh, phân loại tự động, lưu trữ kết quả và in phiếu trả lời, hỗ trợ bác sĩ trong quá trình khám chữa bệnh.

Thảo luận kết quả

Nguyên nhân chính giúp mô hình EfficientNet B3 đạt hiệu quả cao là do phương pháp mở rộng kết hợp giúp cân bằng giữa chiều sâu, chiều rộng và độ phân giải ảnh, từ đó khai thác tối đa đặc trưng của ảnh đáy mắt. Kết quả này phù hợp với các nghiên cứu quốc tế gần đây, trong đó EfficientNet được đánh giá cao về hiệu suất và tốc độ huấn luyện.

So với các mô hình truyền thống như VGG16 hay Inception-V3, các kiến trúc mới như ResNet50 và Inception-ResNet-V2 có khả năng giảm thiểu hiện tượng quá khớp nhờ cơ chế residual và các khối mạng phức tạp hơn. Việc áp dụng kỹ thuật tăng cường dữ liệu cũng góp phần quan trọng trong việc cải thiện độ chính xác, đặc biệt khi dữ liệu gốc còn hạn chế.

Dữ liệu có thể được trình bày qua các biểu đồ so sánh độ chính xác, độ nhạy và độ đặc hiệu của từng mô hình trên các tập dữ liệu khác nhau, cũng như ma trận nhầm lẫn thể hiện khả năng phân loại chính xác từng lớp bệnh. Bảng tổng hợp các siêu tham số huấn luyện và phân bố dữ liệu cũng giúp minh bạch quá trình nghiên cứu.

Đề xuất và khuyến nghị

Triển khai rộng rãi phần mềm hỗ trợ chẩn đoán VMDTD tại các cơ sở y tế: Đẩy mạnh ứng dụng phần mềm phân loại ảnh đáy mắt tích hợp mô hình EfficientNet B3 trong vòng 12 tháng tới, nhằm nâng cao hiệu quả chẩn đoán và giảm tải cho bác sĩ chuyên khoa.
Mở rộng bộ dữ liệu huấn luyện với đa dạng ảnh từ nhiều vùng miền: Thu thập thêm khoảng 5000 ảnh đáy mắt từ các bệnh viện khác nhau trong 18 tháng để cải thiện khả năng tổng quát hóa của mô hình, giảm thiểu sai số khi áp dụng thực tế.
Nâng cấp và tối ưu hóa mô hình học sâu liên tục: Áp dụng kỹ thuật học chuyển giao (transfer learning) và fine-tuning để cập nhật mô hình theo dữ liệu mới, đảm bảo độ chính xác luôn đạt trên 90% trong vòng 6 tháng.
Đào tạo và tập huấn cho nhân viên y tế về sử dụng phần mềm: Tổ chức các khóa đào tạo kỹ thuật sử dụng phần mềm và hiểu biết về kết quả phân loại cho bác sĩ và kỹ thuật viên trong 3 tháng đầu triển khai, giúp tận dụng tối đa lợi ích của công nghệ.

Đối tượng nên tham khảo luận văn

Bác sĩ chuyên khoa mắt và nhân viên y tế: Nghiên cứu cung cấp công cụ hỗ trợ chẩn đoán chính xác, giúp giảm thiểu sai sót và nâng cao hiệu quả điều trị bệnh võng mạc tiểu đường.
Nhà nghiên cứu và sinh viên ngành công nghệ thông tin, trí tuệ nhân tạo: Luận văn trình bày chi tiết các kiến trúc mạng học sâu, phương pháp tiền xử lý và tăng cường dữ liệu, phù hợp làm tài liệu tham khảo và phát triển nghiên cứu tiếp theo.
Các đơn vị phát triển phần mềm y tế và công nghệ chăm sóc sức khỏe: Cung cấp cơ sở lý thuyết và thực nghiệm để xây dựng các ứng dụng hỗ trợ chẩn đoán dựa trên AI, góp phần thúc đẩy chuyển đổi số trong y tế.
Quản lý y tế và nhà hoạch định chính sách: Tham khảo để đánh giá hiệu quả ứng dụng công nghệ AI trong khám chữa bệnh, từ đó xây dựng các chính sách hỗ trợ phát triển và ứng dụng rộng rãi.

Câu hỏi thường gặp

Mô hình học sâu nào phù hợp nhất để phân loại bệnh võng mạc tiểu đường?
EfficientNet B3 được đánh giá cao với độ chính xác trên 85% cho phân loại 5 lớp, nhờ phương pháp mở rộng kết hợp giúp cân bằng hiệu quả giữa độ sâu và độ phân giải ảnh.
Tại sao cần tiền xử lý và tăng cường dữ liệu ảnh chụp đáy mắt?
Tiền xử lý như cắt viền đen và tăng độ tương phản giúp làm nổi bật các đặc điểm bệnh lý, trong khi tăng cường dữ liệu giúp mô hình học sâu tránh overfitting và cải thiện khả năng tổng quát hóa.
Bộ dữ liệu sử dụng trong nghiên cứu có đủ đa dạng không?
Bộ dữ liệu gồm 3662 ảnh từ APTOS 2019 và 1457 ảnh thực tế từ Bệnh viện ĐKKV Cai Lậy, được gán nhãn chính xác bởi chuyên gia, đảm bảo tính đại diện và độ tin cậy cho nghiên cứu.
Phần mềm ứng dụng có thể tích hợp vào hệ thống bệnh viện hiện tại không?
Phần mềm được phát triển trên nền .Net Framework và sử dụng cơ sở dữ liệu SQL Server 2019, dễ dàng tích hợp với các hệ thống quản lý bệnh viện hiện có.
Làm thế nào để cập nhật mô hình khi có dữ liệu mới?
Có thể áp dụng kỹ thuật học chuyển giao và fine-tuning trên dữ liệu mới để nâng cao độ chính xác và thích ứng với các biến thể mới của bệnh.

Kết luận

Luận văn đã ứng dụng thành công các mô hình học sâu hiện đại để phân loại ảnh chụp đáy mắt thành 5 lớp bệnh võng mạc tiểu đường với độ chính xác cao.
Mô hình EfficientNet B3 cho hiệu suất tốt nhất, vượt trội hơn các kiến trúc truyền thống như VGG16 và Inception-V3.
Kỹ thuật tiền xử lý và tăng cường dữ liệu đóng vai trò quan trọng trong việc nâng cao hiệu quả phân loại.
Phần mềm ứng dụng desktop tích hợp mô hình học sâu hỗ trợ hiệu quả cho công tác chẩn đoán tại bệnh viện.
Đề xuất mở rộng dữ liệu, nâng cấp mô hình và đào tạo nhân viên để triển khai ứng dụng rộng rãi trong thực tế.

Tiếp theo, cần triển khai thử nghiệm thực tế tại các cơ sở y tế, thu thập phản hồi để hoàn thiện hệ thống. Mời các nhà nghiên cứu và chuyên gia y tế hợp tác phát triển ứng dụng nhằm nâng cao chất lượng chăm sóc sức khỏe mắt cho cộng đồng.

Trích đoạn nội dung tài liệu

CHƯƠNG 1. Giới thiệu chung Các ứng dụng của máy học, học sâu đến các ngành y học trong thời gian gần đây nhận được sự chú ý rất lớn từ các nhà nghiên cứu, cùng với đó là những thành tựu và kết quả rất đáng được mong đợi đã đạt được. Phân tích, xử lý ảnh y tế, chân đoán bệnh bằng máy học ngày một nhanh chóng và chính xác hơn. Bệnh võng mạc đái tháo đường (VMDTD) là kết quả các mạch máu rất nhỏ trong võng mạc bị ton thương do bệnh đái thao đường (DTD) gây ra.

Bệnh có nhiều giai đoạn như: chưa tăng sinh (nhẹ/vừa/nặng), và tăng sinh (nặng nhất). Khi nặng có thê dẫn tới giảm hoặc mắt thị lực. Mạch máu mới tăng sinh Phình mạch Xuất tiết dạng chấm Hình 1. Các bệnh lý đặc trưng của bệnh VMĐTĐ.

Hình ảnh chụp đáy mắt 1. Tình hình nghiên cứu trong và ngoài nước 1. Tình hình nghiên cứu trong nước Trí tuệ nhân tạo ngày càng được ứng dụng nhiều trong y học như: hỗ trợ chân đoán bệnh; nghiên cứu, phát triển thuốc; tối ưu hóa trong điều trị cho từng cá nhân; chỉnh sửa gen. Tác giả Hoang Nhut Huynh và các cộng sự thực hiện công trình nghiên cứu “Classification of Stages Diabetic Retinopathy Using MobileNetV2 Model” [1] huấn luyện mô hình MobileNetV2 phân lớp bệnh VMDTD trên bộ dữ liệu APTOS 2019, sử dụng ký thuật xác thực cross validation để đánh giá mô hình huấn luyện, độ chính xác tới 93.

Các công trình nghiên cứu như: “Nội suy ảnh trong hỗ trợ chân đoán hình ảnh” [2] của Nguyễn Quốc Hưng do PGS.TS Đỗ Năng Toàn hướng dẫn, trình bày các hướng tiếp cận và ứng dụng kỹ thuật nội suy ảnh. Năm 2019, Vinmec cùng với Bệnh viện Phôi Trung ương và VinBrain đã hợp tác trién khai ứng “DrAid - AI Trợ lý bác sĩ trong chân đoán hình ảnh” [7],. Đây là một trong những phần mềm dau tiên tại Việt Nam ứng dụng trí tuệ nhân tao, kết hợp thị giác máy tính và công nghệ xử lý ngôn ngữ tự nhiên hỗ trợ chân đoán và điều trị bệnh. Giao diện ứng dụng DrAidTM cho Radiology (Nguồn hình [7]) 1.

Công trình nghiên cứu ngoài nước Trong các năm gần đây, có nhiều công trình nghiên cứu thuật toán máy học, mô hình học sâu đề phân loại bệnh VMĐTĐ. Có nhiều hướng tiếp cận khác nhau cho bài toán phân loại ảnh chụp đáy mắt. Carrera cùng cộng sự với công trình “Automated detection of điabetic retinopathy using SVM” [4], sử dụng các kỹ thuật xử lý ảnh để trích xuất đặc trưng: xác định mạch máu, vi phình mạch, xuất tiết sau đó dùng thuật toán SVM để phát hiện bệnh VMĐTĐ trên ảnh chụp đáy mắt, đạt độ chính xác 92. Việc nghiên cứu các mô hình học sâu ngày càng rộng rãi cùng với việc phát triển mạnh phần cứng máy tính hỗ trợ máy học, học sâu, các kỹ thuật xử lý ảnh, tăng cường tập dữ liệu cho các tập dir liệu ít, việc huấn luyện các mô hình trở nên dễ đàng, nhanh chóng hơn, độ chính xác cũng cao hơn rất nhiều.

Alan Lands cùng cộng sự của ông với công trình “Implementation of deep 10 learning based algorithms for diabetic retinopathy classification from fundus images” [5] str dung cac kiến trúc ResNet50, DenseNet121, DenseNet169 trên bộ dữ liệu APTOS 2015 và 2019 tổng cộng 23302 ảnh. Áp dụng kỹ thuật tăng cường (lật, tăng độ sáng, tăng độ tương phản) cho bộ dữ liệu để tăng lên số lượng 7000 ảnh mỗi lớp. Tiền xử lý ảnh bằng phương pháp “Gaussian Blur Subtraction”. Huấn luyện các mô hình học sâu cho độ chính xác khá cao: ResNet50 (89%), DenseNet121 (93%), DenseNet169 (95%).

Tập dữ | Hướng h STT Tên tác giả Tên công trình. Kết quả liệu tiếp cận Transfer Learning VGG16_ | Accuracy: 78% based Adarsh Pradhan APTOS Inception 1 Classification of| 2015 và cộng sự V3 Accuracy: 73 Diabetic Retinopathy Stages ResNet5 0 Accuracy: 73% Automated A A Accuracy: Diabetic VGGI6 | 50. | Retinopathy APTOS 2 | Chaturvedi và | Grading using | 2019 cộng sự Deep Inception Accuracy: Net V3 Convolutional ° 63.23% Neural Network 3 | Alan Lands va | Implementation of |APTOS 5 Training P 2015 _ | Resnet>0 | accuracy: 89% II cộng sự deep learning based | + algorithms 8 for 2019 APTOS DenseNe | Training diabetic retinopathy t121 Accuracy: 93% classification from fundus images DenseNe | Training 169 Accuracy: 95% Bang 1. Một số công trình phân loại anh chụp đáy mắt 1.

Lý do thực hiện đề tài Trong xã hội hiện đại ngày nay, bệnh tiểu đường là một trong số các bệnh mãn tính thường gặp nhất, các biến chứng từ bệnh này cũng rất nhiều. Các thiết bị hiện đại đã có thé chụp được ảnh đáy mắt với độ phân giải cao giúp bác sĩ chan đoán bệnh tốt hơn. Tuy nhiên, việc chan đoán gặp nhiều khó khăn đòi hỏi phải có kiến thức chuyên môn, kinh nghiệm nhiều. Do đó việc hỗ trợ chan đoán của trí tuệ nhân tạo dựa vào ảnh chụp đáy mắt là rất cần thiết.

Giúp giảm bớt các khó khăn khi chẩn đoán bệnh, hạn chế việc chẩn đoán sai. Mục tiêu đề tài Luận văn nay sẽ trình bay cơ sở lý thuyết trong phân loại bệnh VMĐTĐ. Giới thiệu các mô hình học sâu phân loại ảnh y khoa độ phân giải cao, giải quyết bài toán phân lớp bệnh VMĐTĐ. Xây dựng phần mềm phân loại bệnh VMĐTĐ của ảnh chụp đáy mắt, hỗ trợ chân đoán trong khám chữa bệnh.

Phân loại ảnh chụp đáy mắt xem ảnh đó thuộc lớp nào trong các lớp: Không bệnh (No DR), Bệnh nhẹ (Mild), Bệnh trung bình (Moderate), Bệnh nang (Severe), Bệnh tăng sinh — giai đoạn nặng nhất (Proliferative) bằng phương pháp sử dụng mô hình học sâu phân loại ảnh có độ phân giải cao. Đối tượng nghiên cứu 12 Nghiên cứu tổng quan về phân loại bệnh VMĐTĐ trên ảnh chụp đáy mắt. Các mô hình học sâu trong bài toán phân loại ảnh chụp đáy mắt: VGG 16, Inception 'V3, Resnet 50, Inception-Resnet V2, EfficientNet B3. Phạm vi nghiên cứu Các công trình nghiên cứu liên quan, các phương pháp kỹ thuật đã có trong bài toán phân loại bệnh VMDTD.

Các mô hình học sâu trong bài toán phân loại ảnh chụp đáy mắt, huấn luyện các mô dé phân loại ảnh. Lập trình ứng dụng .NetFramework, cơ sở dit liệu Sql Server. Lập trình ứng dung desktop UWP. Giới han, tính mới, tính khoa học của đề tài 1.

Giới hạn của đề tài Đề tài nghiên cứu đặc điểm phân loại bệnh của ảnh chụp day mắt. Tìm hiểu, áp dụng các mô hình học sâu vào bài toán phân loại ảnh chụp đáy mắt. Tìm hiểu thêm các mô hình học sâu khác đê áp dụng vào bài toán. Tính mới của đề tài Tìm hiểu các phương pháp phân loại bệnh VMĐTĐ trên ảnh chụp đáy mắt.

Ứng dụng mô hình học sâu mới EfficientNet vào bài toán phân loại ảnh chụp đáy mat. Thu thập dữ liệu ảnh chụp day mắt của người bệnh đến khám và được bác sĩ chỉ định chụp ảnh đáy mắt tại Phòng khám mắt của Bệnh viện ĐKKV Cai Lậy. Ảnh chụp đáy mắt được phân loại bởi bác sĩ tại Bệnh viện ĐKKV Cai Lậy và Bệnh viện Mắt Tp. Thực hiện gan nhãn dữ liệu.

Tiền xử lý dữ liệu (cắt bỏ vùng màu đen xung quanh ảnh). Ứng dụng các mô hình học sâu dé phân loại bệnh VMĐTĐ trên ảnh chụp đáy mắt thu thập được. Tính khoa học của đề tài Đề tài đã áp dụng các mô hình học sâu mới phát triển vào bài toán phân lớp ảnh chụp day mắt. Tìm hiểu lý thuyết và làm các thực nghiệm dé so sánh kết qua với các mô hình khác.

Bệnh võng mạc tiểu đường (đái tháo đường) 2. Võng mạc là gì Võng mạc là bộ phận của mắt, có chức năng gửi tín hiệu dọc theo thần kinh thị giác đến não bộ giúp chúng ta có thể nhìn thấy. Võng mạc (màng thần kinh) chính là lớp màng trong cùng của nhãn cầu. Bệnh võng mạc tiểu đường là gì Bệnh VMDTD thường là do bệnh lý tiểu đường gây ra.

Bệnh xảy ra ở hầu hết ở các trường hợp người mắc bệnh tiéu đường tiến triển sau một khoảng thời gian dai. Cac giai doan tiến triển của bệnh: - Normal: Chưa bị bệnh - Mild: Giai đoạn bệnh nhẹ - Moderate: Giai đoạn bệnh vừa - Severe: Giai đoạn bệnh nặng - Proliferative: Giai đoạn bệnh nặng nhất 15 Hình 2. Sự tiến triển của bệnh lý VMĐTĐ (Nguồn hình [6]) 2. Lý thuyết máy học Bài toán xử lý, phân loại ảnh y tế đã có nhiều công trình nghiên cứu được đưa ra nhằm nâng cao độ chính xác cho kết quả phân loại.

Bắt đầu với các thuật toán machine learning, phương pháp này chủ yếu phân tích nghiên cứu và thử nghiệm các ký thuật trích xuất đặc trưng nhằm chọn ra phương pháp tối ưu nhất để đưa vào bộ phân loại. Có hai cách phổ biến phân nhóm các thuật toán Machine learning: e Dua trên phương thức học (learning style) e Dua trên chức năng (function). Lý thuyết học sâu 2. Khái niệm Mạng nơ ron tích chập (mạng CNN) Một mạng nơ ron tích chập thường có 3 thành phần sau đây: + Lớp tích chập (Convolution): Là lớp cơ bản trong kiến trúc CNN.

+ Lớp Pooling: Là lớp làm giảm kích thước không gian biểu diễn dé giảm số lượng tham số, tránh được tình trạng quá khớp (over-fitting). + Lớp Fully connected (FC): Là tầng kết nói đầy đủ các noron, thường thấy trong các lớp cuối của mạng CNN. 16 CONVOLUTION + RELY POOLING CONVOLUTION + RELU POOLING vv riAnw ruuy CONNECTED SOFTMAX há Y. HIDDEN LAYERS CLASSIFICATION Hình 2.

Cấu trúc đại diện của một mạng nơ ron tích chập. (Nguồn hình: Mathworks. Kiến trúc mạng VGG-16 VGG-16 là một mạng học sâu tích chập (CNN) được đề xuất năm 2014 trong bài báo “Very Deep Convolutional Networks for Large-Scale Image Recognition” [6] Kiến trúc mạng VGG được thé hiện trong hình 3.1, trong đó kiến trúc D được coi là kiến trúc tốt nhất và được gọi là VGG-16. VGG-16 bao gồm rất nhiều lớp tích chập (convolutional layer) có chiều sâu khác nhau đi kèm với max pooling nhằm mục đích giảm số chiều của anh, theo sau bởi 3 lớp fully-connected.

Đầu vào của VGG-16 là anh RGB có kích thước 224 x 224 pixel. Dau ra là I vector đặc trưng kích thước 1 x 1 x 1000 dùng để nhận dạng 1000 class. Đây là một kiến trúc có số lượng tham số: 138.000 VGG-16 vẫn dữ các đặc điểm của kiến trúc AlexNet nhưng có những cải tiến hơn: « Kiến trúc VGG-16 sâu hon, bao gồm 13 lớp tích chập 2 chiều (so với AlexNet là 5) và 3 lớp fully connected. 17 + _ Trong VGG-16 xuất hiện khái niệm về khối tích chập (block).

Day là những kiến trúc gồm một tập hợp các layers CNN được lặp lại giống nhau. « VGG-16 cũng kế thừa lại hàm kích hoạt activation ReLU ở mô hình AlexNet.

Nội dung được bảo vệ bản quyền — Tải xuống đầy đủ

Tóm tắt:

Tài liệu "Phân Loại Ảnh Đáy Mắt bằng AI: Hỗ Trợ Chẩn Đoán Bệnh Võng Mạc Tiểu Đường" trình bày về việc ứng dụng trí tuệ nhân tạo (AI) để phân tích ảnh chụp đáy mắt, một kỹ thuật có giá trị trong việc chẩn đoán sớm bệnh võng mạc tiểu đường. Việc sử dụng AI giúp tự động hóa quy trình phân tích ảnh, giảm thiểu sự phụ thuộc vào chuyên gia và đẩy nhanh quá trình chẩn đoán, từ đó giúp bệnh nhân được điều trị kịp thời và hiệu quả hơn. Ứng dụng này mang lại lợi ích lớn trong việc sàng lọc bệnh võng mạc tiểu đường, đặc biệt ở những khu vực thiếu hụt nhân lực y tế.

Nếu bạn quan tâm đến ứng dụng xử lý ảnh trong các lĩnh vực khác của y học, bạn có thể tham khảo thêm "Luận văn tốt nghiệp chẩn đoán bệnh lý tim mạch dựa trên dữ liệu thăm khám lâm sàng cận lâm sàng bằng trí tuệ nhân tạo" để tìm hiểu về việc sử dụng AI trong chẩn đoán bệnh tim mạch. Ngoài ra, bạn có thể xem "Luận văn thạc sĩ hcmute ứng dụng xử lý ảnh điều khiển xe lăn điện" để hiểu rõ hơn về ứng dụng xử lý ảnh. Để hiểu rõ hơn về các thuật toán cơ bản trong xử lý ảnh, bạn có thể tìm đọc "Tiểu luận phân vùng ảnh hai phương pháp chính áp dụng trong phân vùng ảnh".

#ứng dụng AI trong y tế

#phân loại ảnh đáy mắt

#AI chẩn đoán bệnh võng mạc tiểu đường

#võng mạc tiểu đường

#ảnh chụp đáy mắt

#Dang Quốc Bảo

Chủ đề

Ứng dụng trí tuệ nhân tạo trong y tế

Học máy và thị giác máy tính

chẩn đoán bệnh võng mạc tiểu đường

phân tích ảnh y tế bằng AI