Ứng Dụng Kỹ Thuật Học Sâu Để Phát Hiện, Phân Loại Tế Bào Máu Trên Ảnh Hiển Vi

Tài liệu nghiên cứu Ứng dụng kỹ thuật học sâu để phát hiện phân loại tế bào máu trên ảnh hiển vi chụp tiêu bản máu, tổng hợp lý thuyết và thực hành, cung cấp kiến thức chuyên sâu

Trường đại học

Trường Đại Học Bách Khoa Hà Nội

Chuyên ngành

Kỹ thuật Y sinh

Người đăng

Ẩn danh

Thể loại

luận văn thạc sĩ

2022

153

Phí lưu trữ

45 Point

Mục lục chi tiết

LỜI CẢM ƠN

TÓM TẮT LUẬN VĂN

MỞ ĐẦU

1. CHƯƠNG 1: TỔNG QUAN VỀ MÁU VÀ CÁC PHƯƠNG PHÁP CHẨN ĐOÁN BỆNH LÝ MÁU

1.1. Máu và các thành phần trong máu

1.2. Các phương pháp hỗ trợ chẩn đoán bệnh lý máu

1.3. Tầm quan trọng và ý nghĩa của phương pháp phết máu ngoại vi

1.4. Các hướng nghiên cứu hiện nay

1.5. Hướng tiếp cận và mục đích phạm vi nghiên cứu

1.6. Tổng kết chương

2. CHƯƠNG 2: PHÂN TÍCH BÀI TOÁN ỨNG DỤNG KỸ THUẬT HỌC SÂU ĐỂ PHÁT HIỆN, PHÂN LOẠI

2.1. Tổng quan về kỹ thuật học sâu

2.2. Cấu trúc mô hình phát hiện, phân loại tế bào

2.3. Phân tích các nghiên cứu phát hiện, phân loại tế bào máu

2.4. Tổng kết chương 2

3. CHƯƠNG 3: XÂY DỰNG MÔ HÌNH HUẤN LUYỆN PHÁT HIỆN, PHÂN LOẠI TẾ BÀO MÁU

3.1. Phân loại tế bào bạch cầu sử dụng mô hình mạng Faster R-CNN

3.2. Phân loại tế bào bạch cầu sử dụng mô hình mạng YOLOv5

3.3. Tổng kết chương 3

4. CHƯƠNG 4: KẾT QUẢ VÀ BÀN LUẬN

4.1. Cơ sở dữ liệu huấn luyện

4.2. Công cụ lập trình

4.3. Chỉ số đánh giá mô hình

4.4. Quá trình huấn luyện các mô hình

4.5. Đánh giá hiệu quả của từng mô hình

4.6. Kết quả mô phỏng

TÀI LIỆU THAM KHẢO

Tóm tắt

I. Tổng Quan Về Ứng Dụng Kỹ Thuật Học Sâu Trong Phát Hiện Tế Bào Máu

Kỹ thuật học sâu đã trở thành một công cụ quan trọng trong lĩnh vực y tế, đặc biệt là trong việc phát hiện và phân loại tế bào máu. Việc áp dụng các mô hình học sâu như Faster R-CNN và YOLOv5 đã giúp cải thiện độ chính xác và tốc độ phát hiện tế bào máu. Những tiến bộ này không chỉ giúp giảm thiểu sai sót trong quá trình phân loại mà còn hỗ trợ bác sĩ trong việc chẩn đoán bệnh lý một cách hiệu quả hơn.

1.1. Khái Niệm Về Kỹ Thuật Học Sâu Trong Y Tế

Kỹ thuật học sâu là một nhánh của trí tuệ nhân tạo, sử dụng các mạng nơ-ron để phân tích và xử lý dữ liệu. Trong y tế, nó được áp dụng để phát hiện và phân loại tế bào máu, giúp nâng cao độ chính xác trong chẩn đoán.

1.2. Lợi Ích Của Việc Ứng Dụng Học Sâu Trong Phân Loại Tế Bào

Việc sử dụng kỹ thuật học sâu giúp tăng cường độ chính xác trong phân loại tế bào máu, giảm thiểu thời gian và công sức của kỹ thuật viên. Điều này đặc biệt quan trọng trong việc xử lý lượng mẫu lớn trong các cơ sở y tế.

II. Thách Thức Trong Phát Hiện Và Phân Loại Tế Bào Máu

Mặc dù có nhiều lợi ích, việc phát hiện và phân loại tế bào máu vẫn gặp phải nhiều thách thức. Các vấn đề như độ chính xác của mô hình, chất lượng dữ liệu và sự đa dạng của các loại tế bào là những yếu tố cần được xem xét kỹ lưỡng.

2.1. Độ Chính Xác Của Các Mô Hình Học Sâu

Độ chính xác của các mô hình học sâu phụ thuộc vào chất lượng dữ liệu đầu vào. Việc thu thập và xử lý dữ liệu không đồng nhất có thể dẫn đến sai sót trong phân loại tế bào máu.

2.2. Sự Đa Dạng Của Các Loại Tế Bào

Tế bào máu có nhiều loại với hình dạng và kích thước khác nhau. Sự đa dạng này tạo ra khó khăn trong việc phát hiện và phân loại chính xác, đòi hỏi các mô hình học sâu phải được huấn luyện trên một tập dữ liệu phong phú.

III. Phương Pháp Phát Hiện Tế Bào Máu Bằng Kỹ Thuật Học Sâu

Để phát hiện và phân loại tế bào máu, các phương pháp học sâu như Faster R-CNN và YOLOv5 đã được áp dụng. Những mô hình này cho phép phát hiện nhanh chóng và chính xác các loại tế bào khác nhau trong mẫu máu.

3.1. Mô Hình Faster R CNN Trong Phát Hiện Tế Bào

Faster R-CNN là một trong những mô hình học sâu hiệu quả nhất trong việc phát hiện đối tượng. Mô hình này sử dụng mạng nơ-ron để tạo ra các đề xuất vùng và phân loại tế bào máu với độ chính xác cao.

3.2. Mô Hình YOLOv5 Và Tốc Độ Phát Hiện

YOLOv5 nổi bật với khả năng phát hiện nhanh chóng, cho phép xử lý hàng trăm khung hình mỗi giây. Mô hình này rất hữu ích trong các ứng dụng cần tốc độ cao mà vẫn đảm bảo độ chính xác.

IV. Ứng Dụng Thực Tiễn Của Kỹ Thuật Học Sâu Trong Y Tế

Kỹ thuật học sâu không chỉ dừng lại ở việc phát hiện tế bào máu mà còn có nhiều ứng dụng khác trong y tế. Các nghiên cứu đã chỉ ra rằng việc áp dụng học sâu có thể cải thiện đáng kể quy trình chẩn đoán và điều trị bệnh.

4.1. Cải Thiện Quy Trình Chẩn Đoán

Việc áp dụng học sâu trong phân loại tế bào máu giúp bác sĩ có thể đưa ra chẩn đoán nhanh chóng và chính xác hơn, từ đó nâng cao chất lượng điều trị cho bệnh nhân.

4.2. Nghiên Cứu Và Phát Triển Các Ứng Dụng Mới

Nghiên cứu hiện tại đang tập trung vào việc phát triển các ứng dụng mới sử dụng học sâu để phân tích dữ liệu y tế, từ đó mở ra nhiều cơ hội mới trong lĩnh vực y học.

V. Kết Luận Về Tương Lai Của Kỹ Thuật Học Sâu Trong Phát Hiện Tế Bào Máu

Kỹ thuật học sâu đang mở ra nhiều triển vọng trong việc phát hiện và phân loại tế bào máu. Tương lai của công nghệ này hứa hẹn sẽ mang lại nhiều cải tiến trong chẩn đoán và điều trị bệnh lý liên quan đến máu.

5.1. Xu Hướng Phát Triển Công Nghệ

Công nghệ học sâu sẽ tiếp tục phát triển, với nhiều mô hình mới được nghiên cứu và cải tiến để nâng cao độ chính xác và tốc độ phát hiện tế bào máu.

5.2. Tác Động Đến Ngành Y Tế

Việc áp dụng học sâu trong y tế không chỉ giúp cải thiện quy trình chẩn đoán mà còn có thể giảm thiểu chi phí và thời gian điều trị cho bệnh nhân.

02/07/2025

Bạn đang xem trước tài liệu:

Ứng dụng kỹ thuật học sâu để phát hiện phân loại tế bào máu trên ảnh hiển vi chụp tiêu bản máu ngoại vi

Tải đầy đủ

Nội dung chính

Tổng quan nghiên cứu

Việc phát hiện và phân loại tế bào máu trên ảnh hiển vi chụp tiêu bản máu ngoại vi đóng vai trò quan trọng trong chẩn đoán các bệnh lý huyết học. Ước tính, mỗi người trưởng thành có khoảng 5 lít máu với các thành phần tế bào đa dạng như hồng cầu, bạch cầu và tiểu cầu, mỗi loại có chức năng và đặc điểm riêng biệt. Phương pháp phân loại tế bào máu thủ công hiện nay dựa trên quan sát trực tiếp dưới kính hiển vi, tuy nhiên gặp nhiều hạn chế như nhức mỏi mắt cho kỹ thuật viên, sai sót do sự đa dạng về hình dạng và kích thước tế bào, cũng như phạm vi quan sát hạn chế.

Mục tiêu nghiên cứu là ứng dụng kỹ thuật học sâu để tự động phát hiện và phân loại tế bào bạch cầu trên ảnh hiển vi tiêu bản máu ngoại vi, nhằm nâng cao độ chính xác và tốc độ xử lý, hỗ trợ bác sĩ trong chẩn đoán bệnh. Nghiên cứu tập trung vào việc xây dựng và đánh giá các mô hình mạng nơ-ron tích chập (CNN) như Faster R-CNN và YOLOv5 trên bộ dữ liệu ảnh tế bào bạch cầu thu thập trực tiếp tại cơ sở y tế và các nguồn dữ liệu công khai. Phạm vi nghiên cứu bao gồm ảnh hiển vi phết máu ngoại vi với độ phóng đại 50-100 lần, tập trung vào phân loại bạch cầu trong khoảng thời gian nghiên cứu năm 2022 tại Hà Nội.

Ý nghĩa của nghiên cứu được thể hiện qua việc cải thiện độ chính xác phân loại tế bào bạch cầu lên trên 95%, đặc biệt mô hình Faster R-CNN với backbone ResNet101 đạt độ chính xác 97,27%, đồng thời tăng tốc độ phát hiện tế bào lên gấp 4 lần so với phương pháp truyền thống. Kết quả này góp phần giảm thiểu sai sót trong chẩn đoán, tiết kiệm thời gian và nâng cao hiệu quả điều trị bệnh lý máu.

Cơ sở lý thuyết và phương pháp nghiên cứu

Khung lý thuyết áp dụng

Nghiên cứu dựa trên nền tảng kỹ thuật học sâu (deep learning), một lĩnh vực con của học máy (machine learning) trong trí tuệ nhân tạo, sử dụng mạng nơ-ron nhân tạo để tự động trích xuất đặc trưng và phân loại dữ liệu ảnh. Hai mô hình chính được áp dụng là Faster R-CNN và YOLOv5:

Faster R-CNN: Mô hình phát hiện vật thể hai giai đoạn, sử dụng Region Proposal Network (RPN) để đề xuất vùng quan tâm, kết hợp với mạng backbone như ResNet101 để trích xuất đặc trưng sâu. Ưu điểm là độ chính xác cao, phù hợp với các bài toán phân loại tế bào phức tạp.
YOLOv5: Mô hình phát hiện vật thể một giai đoạn, nổi bật với tốc độ xử lý nhanh nhờ kiến trúc mạng nhẹ và tối ưu, sử dụng backbone MobileNetv3. Mô hình này phù hợp với ứng dụng yêu cầu thời gian thực.

Các khái niệm chính bao gồm:

Intersection over Union (IoU): Đo lường mức độ chồng lắp giữa vùng dự đoán và vùng thực tế, dùng để đánh giá hiệu quả phát hiện.
Mean Average Precision (mAP): Chỉ số đánh giá tổng quát độ chính xác của mô hình phát hiện và phân loại.
Non-Maximum Suppression (NMS): Thuật toán loại bỏ các dự đoán trùng lặp không cần thiết.
Backbone: Mạng trích xuất đặc trưng chính trong mô hình học sâu.

Phương pháp nghiên cứu

Nguồn dữ liệu gồm ảnh tế bào bạch cầu được thu thập trực tiếp tại Bệnh viện Sản nhi Phú Thọ và các bộ dữ liệu công khai như BCCD, Cellavision. Bộ dữ liệu được xử lý tăng cường bằng các kỹ thuật như cắt ngẫu nhiên, xoay, điều chỉnh độ bão hòa nhằm tăng tính đa dạng và tránh hiện tượng quá khớp.

Cỡ mẫu ảnh sử dụng trong huấn luyện khoảng vài nghìn ảnh cho mỗi loại tế bào bạch cầu, đảm bảo đủ dữ liệu cho việc học sâu. Dữ liệu được chia thành ba tập: huấn luyện (70%), xác thực (15%) và kiểm thử (15%).

Phương pháp phân tích sử dụng các chỉ số đánh giá như độ chính xác (accuracy), mAP, thời gian phát hiện (ms/frame). Quá trình huấn luyện được thực hiện trên môi trường lập trình Python với thư viện PyTorch, sử dụng GPU để tăng tốc độ xử lý. Mô hình Faster R-CNN được huấn luyện với các backbone VGG16, AlexNet và ResNet101 để so sánh hiệu quả. Mô hình YOLOv5 sử dụng backbone MobileNetv3 nhằm tối ưu tốc độ.

Timeline nghiên cứu kéo dài trong năm 2022, bao gồm các giai đoạn thu thập dữ liệu, tiền xử lý, xây dựng mô hình, huấn luyện và đánh giá kết quả.

Kết quả nghiên cứu và thảo luận

Những phát hiện chính

Độ chính xác phân loại tế bào bạch cầu: Mô hình Faster R-CNN với backbone ResNet101 đạt độ chính xác cao nhất là 97,27%, vượt trội so với các backbone khác như VGG16 và AlexNet (đạt khoảng 95-96%). Mô hình YOLOv5 với backbone MobileNetv3 đạt độ chính xác 93,59%, thấp hơn nhưng vẫn ở mức chấp nhận được.
Tốc độ phát hiện: YOLOv5 cho tốc độ phát hiện trung bình 16ms/frame, nhanh hơn gấp khoảng 4 lần so với Faster R-CNN (khoảng 64ms/frame), phù hợp với ứng dụng yêu cầu xử lý thời gian thực.
Hiệu quả tổng quát: So sánh các mô hình cho thấy Faster R-CNN ưu thế về độ chính xác, trong khi YOLOv5 nổi bật về tốc độ. Việc lựa chọn mô hình phụ thuộc vào yêu cầu cụ thể của ứng dụng.
Độ tin cậy của mô hình: Các biểu đồ ROC và đường cong loss cho thấy mô hình không bị hiện tượng quá khớp, đảm bảo khả năng tổng quát hóa tốt trên dữ liệu kiểm thử.

Thảo luận kết quả

Nguyên nhân chính giúp Faster R-CNN đạt độ chính xác cao là do kiến trúc hai giai đoạn cho phép mô hình tập trung vào các vùng đề xuất chính xác hơn, kết hợp với backbone ResNet101 có khả năng trích xuất đặc trưng sâu và phong phú. Tuy nhiên, nhược điểm là tốc độ xử lý chậm hơn do tính toán phức tạp.

Ngược lại, YOLOv5 với kiến trúc một giai đoạn và backbone nhẹ MobileNetv3 giảm thiểu thời gian xử lý, phù hợp với các hệ thống cần phản hồi nhanh nhưng độ chính xác giảm nhẹ do khả năng trích xuất đặc trưng hạn chế hơn.

So sánh với các nghiên cứu khác trong ngành, kết quả của luận văn cho thấy sự cải thiện rõ rệt về độ chính xác và tốc độ, đồng thời áp dụng thành công trên dữ liệu thực tế thu thập tại cơ sở y tế Việt Nam, tăng tính ứng dụng thực tiễn.

Dữ liệu có thể được trình bày qua biểu đồ so sánh độ chính xác và tốc độ của các mô hình, bảng tổng hợp các chỉ số mAP, IoU, và biểu đồ đường cong ROC minh họa hiệu quả phân loại.

Đề xuất và khuyến nghị

Triển khai mô hình Faster R-CNN backbone ResNet101 trong các phòng xét nghiệm lớn nhằm nâng cao độ chính xác chẩn đoán, với mục tiêu đạt độ chính xác trên 97% trong vòng 6 tháng, do các trung tâm y tế thực hiện.
Ứng dụng mô hình YOLOv5 backbone MobileNetv3 cho các hệ thống chẩn đoán di động hoặc tại điểm chăm sóc (point-of-care), nhằm tăng tốc độ xử lý, giảm thời gian chờ kết quả xuống dưới 20ms/frame, trong vòng 3 tháng, do các nhà phát triển phần mềm y sinh thực hiện.
Mở rộng bộ dữ liệu huấn luyện bằng cách thu thập thêm ảnh tế bào từ nhiều cơ sở y tế khác nhau để tăng tính đa dạng và khả năng tổng quát hóa của mô hình, với kế hoạch thu thập trong 12 tháng, do các nhóm nghiên cứu phối hợp thực hiện.
Phát triển giao diện người dùng thân thiện tích hợp mô hình học sâu để hỗ trợ bác sĩ trong việc phân loại tế bào máu, giảm thiểu sai sót do yếu tố con người, dự kiến hoàn thành trong 6 tháng, do các chuyên gia công nghệ thông tin và y sinh phối hợp.

Đối tượng nên tham khảo luận văn

Các nhà nghiên cứu và sinh viên ngành Kỹ thuật Y sinh: Nghiên cứu cung cấp kiến thức sâu về ứng dụng học sâu trong y học, đặc biệt về phát hiện và phân loại tế bào máu, hỗ trợ phát triển các đề tài liên quan.
Bác sĩ và kỹ thuật viên phòng xét nghiệm huyết học: Tài liệu giúp hiểu rõ về các phương pháp tự động hóa trong chẩn đoán tế bào máu, nâng cao hiệu quả và độ chính xác trong công việc hàng ngày.
Các nhà phát triển phần mềm y tế và công nghệ AI: Cung cấp cơ sở lý thuyết và thực tiễn để phát triển các ứng dụng chẩn đoán hình ảnh y sinh dựa trên học sâu, đặc biệt trong lĩnh vực huyết học.
Quản lý và hoạch định chính sách y tế: Tham khảo để đánh giá tiềm năng ứng dụng công nghệ AI trong nâng cao chất lượng dịch vụ y tế, từ đó xây dựng các kế hoạch đầu tư và phát triển phù hợp.

Câu hỏi thường gặp

Tại sao cần ứng dụng học sâu trong phân loại tế bào máu?
Học sâu giúp tự động trích xuất đặc trưng phức tạp từ ảnh tế bào, giảm sai sót do quan sát thủ công, tăng độ chính xác và tốc độ xử lý, hỗ trợ chẩn đoán nhanh và chính xác hơn.
Mô hình Faster R-CNN và YOLOv5 khác nhau như thế nào?
Faster R-CNN là mô hình hai giai đoạn với độ chính xác cao nhưng tốc độ chậm, trong khi YOLOv5 là mô hình một giai đoạn, ưu tiên tốc độ xử lý nhanh hơn nhưng độ chính xác thấp hơn một chút.
Bộ dữ liệu huấn luyện có ảnh hưởng thế nào đến kết quả?
Bộ dữ liệu đa dạng và đủ lớn giúp mô hình học sâu tránh hiện tượng quá khớp, tăng khả năng tổng quát hóa và độ chính xác khi áp dụng trên dữ liệu thực tế.
Có thể áp dụng mô hình này cho các loại tế bào khác ngoài bạch cầu không?
Có thể, tuy nhiên cần thu thập dữ liệu và huấn luyện lại mô hình với các loại tế bào cụ thể để đảm bảo độ chính xác và hiệu quả phát hiện.
Thời gian huấn luyện mô hình mất bao lâu?
Tùy thuộc vào kích thước bộ dữ liệu và cấu hình phần cứng, quá trình huấn luyện có thể kéo dài từ vài giờ đến vài ngày. Ví dụ, mô hình Faster R-CNN có thể mất vài ngày trên GPU hiện đại.

Kết luận

Nghiên cứu đã thành công trong việc xây dựng mô hình học sâu phát hiện và phân loại tế bào bạch cầu trên ảnh hiển vi tiêu bản máu ngoại vi với độ chính xác trên 95%.
Mô hình Faster R-CNN backbone ResNet101 đạt độ chính xác cao nhất 97,27%, trong khi YOLOv5 backbone MobileNetv3 cung cấp tốc độ phát hiện nhanh gấp 4 lần.
Kết quả thực nghiệm trên dữ liệu thu thập tại cơ sở y tế và dữ liệu công khai chứng minh tính khả thi và hiệu quả của phương pháp.
Đề xuất triển khai ứng dụng mô hình trong các phòng xét nghiệm và phát triển phần mềm hỗ trợ chẩn đoán nhằm nâng cao chất lượng dịch vụ y tế.
Các bước tiếp theo bao gồm mở rộng bộ dữ liệu, tối ưu mô hình và phát triển giao diện người dùng thân thiện để ứng dụng rộng rãi trong thực tế.

Hãy tiếp tục nghiên cứu và ứng dụng các kỹ thuật học sâu để nâng cao hiệu quả chẩn đoán và điều trị bệnh lý máu, góp phần cải thiện sức khỏe cộng đồng.

Tài liệu có tiêu đề "Ứng Dụng Kỹ Thuật Học Sâu Trong Phát Hiện Và Phân Loại Tế Bào Máu" khám phá cách mà các kỹ thuật học sâu có thể được áp dụng để phát hiện và phân loại tế bào máu một cách hiệu quả. Tài liệu này không chỉ cung cấp cái nhìn sâu sắc về các phương pháp hiện đại trong lĩnh vực y tế mà còn nhấn mạnh lợi ích của việc sử dụng công nghệ tiên tiến để cải thiện độ chính xác trong chẩn đoán. Độc giả sẽ tìm thấy thông tin hữu ích về cách mà học sâu có thể tối ưu hóa quy trình phân tích tế bào, từ đó nâng cao chất lượng chăm sóc sức khỏe.

Nếu bạn muốn mở rộng kiến thức của mình về các ứng dụng khác của học sâu trong y tế, hãy tham khảo tài liệu "Phát hiện dấu hiệu trầm cảm sử dụng mô hình học sâu", nơi bạn sẽ tìm thấy cách mà học sâu có thể hỗ trợ trong việc phát hiện các vấn đề tâm lý. Ngoài ra, tài liệu "Phân loại ảnh x-quang tự động nhằm phát hiện bệnh lao phổi sử dụng các phương pháp học sâu" cũng cung cấp cái nhìn về ứng dụng của học sâu trong chẩn đoán hình ảnh. Cuối cùng, tài liệu "Nghiên cứu ứng dụng kỹ thuật học sâu phân tích tổn thương da hướng tới chuẩn đoán phân loại bệnh" sẽ giúp bạn hiểu rõ hơn về cách mà công nghệ này có thể được áp dụng trong phân tích tổn thương da. Những tài liệu này sẽ mở ra nhiều cơ hội để bạn khám phá sâu hơn về các ứng dụng của học sâu trong lĩnh vực y tế.

#kỹ thuật y sinh

#kỹ thuật học sâu

#chẩn đoán bệnh lý máu

#Phát hiện tế bào máu

#Phân loại tế bào máu

#Mạng Faster R-CNN

Trích đoạn nội dung tài liệu

TRƯỜNG ĐẠI HỌC BÁCH KHOA HÀ NỘI LUẬN VĂN THẠC SĨ Ứng dụng kỹ thuật học sâu để phát hiện, phân loại tế bào máu trên ảnh hiển vi chụp tiêu bản máu ngoại vi ĐẶNG XUÂN HỢP Ngành: Kỹ thuật Y sinh Giảng viên hướng dẫn: TS. Nguyễn Việt Dũng Trường: Điện – Điện tử HÀ NỘI, 2022 TRƯỜNG ĐẠI HỌC BÁCH KHOA HÀ NỘI LUẬN VĂN THẠC SĨ Ứng dụng kỹ thuật học sâu để phát hiện, phân loại tế bào máu trên ảnh hiển vi chụp tiêu bản máu ngoại vi ĐẶNG XUÂN HỢP Ngành: Kỹ thuật Y sinh Giảng viên hướng dẫn: TS. Nguyễn Việt Dũng Chữ ký của GVHD Trường: Điện – Điện tử HÀ NỘI, 2022 CỘNG HÒA XÃ HỘI CHỦ NGHĨA VIỆT NAM Độc lập – Tự do – Hạnh phúc BẢN XÁC NHẬN CHỈNH SỬA LUẬN VĂN THẠC SĨ Họ và tên tác giả luận văn: Đặng Xuân Hợp Đề tài luận văn: Ứng dụng kỹ thuật học sâu để phát hiện, phân loại tế bào máu trên ảnh hiển vi chụp tiêu bản máu ngoại vi. Chuyên ngành: Kỹ thuật Y sinh Mã số SV: 20202693M Tác giả, Người hướng dẫn khoa học và Hội đồng chấm luận văn xác nhận tác giả đã sửa chữa, bổ sung luận văn theo biên bản họp Hội đồng ngày …/…/2022 với các nội dung sau: - Đã chỉnh sửa một số lỗi hành văn trong bài luận văn - Đã chỉnh sửa và việt hóa một số hình ảnh nhỏ còn mờ - Đã bổ sung đánh giá chi tiết cho bảng 4-11 Ngày tháng năm 2022 Giáo viên hướng dẫn Tác giả luận văn TS. Nguyễn Việt Dũng Đặng Xuân Hợp CHỦ TỊCH HỘI ĐỒNG TS. Trần Anh Vũ LỜI CẢM ƠN Trong quá trình thực hiện luận văn, em đã nhận được sự định hướng, chỉ bảo tận tình, những chỉnh sửa, góp ý từ Giảng viên hướng dẫn – TS. Nguyễn Việt Dũng. Em xin gửi lời cảm ơn chân thành đến thầy. Đồng thời, em cũng xin gửi lời cảm ơn đến các thầy cô là giảng viên tại Bộ môn Kỹ thuật Y sinh – Viện Điện tử Viễn thông đã giúp đỡ em trong suốt quá trình học tập và nghiên cứu tại trường. Hà Nội, ngày tháng năm 2022 Tác giả Đặng Xuân Hợp TÓM TẮT LUẬN VĂN Sử dụng kính hiển vi để quan sát tiêu bản phết máu ngoại vi được coi là tiêu chuẩn vàng để phát hiện một số rối loạn huyết học. Tuy nhiên kỹ thuật phân loại thủ công này gặp phải các vấn đề: Kỹ thuật viên phải đặt mắt vào kính hiển vi và quan sát hình ảnh tiêu bản phết máu ngoại vi, do đó sẽ gây nhức mỏi mắt nếu quan sát trong thời gian dài; Tế bào máu có nhiều loại, với nhiều hình dạng kích thước khác nhau; Trường quan sát chỉ là một phần nhỏ của cả phết máu…Tổng hòa các yếu tố trên làm cho việc quan sát thủ công có thể có nhiều sai sót. Từ thực tế này, nghiên cứu đề xuất xây dựng phương pháp phát hiện, phân loại tế bào máu sử dụng kỹ thuật học sâu cụ thể là mô hình mạng Faster R-CNN và YOLOv5. Qua quá trình thực nghiệm trên cùng một cơ sở dữ liệu ảnh tế bào bạch cầu được tạo từ nguồn thu thập dữ liệu trực tiếp tại cơ sở y tế và nguồn dữ liệu được công bố công khai trên mạng, có thể thấy việc áp dụng mô hình mạng Faster R-CNN và YOLOv5 là hoàn toàn hiệu quả. Độ chính xác phân loại tế bào bạch cầu sử dụng mô hình Faster R-CNN cao trên 95%, đặc biệt với backbone ResNet101 độ chính xác đạt tới 97,27%. Độ chính xác của mô hình YOLOv5 backbone MobileNetv3 thấp hơn đạt 93,59%. Tuy nhiên mô hình YOLO lại cho tốc độ phát hiện 16ms nhanh hơn gấp khoảng 4 lần độ phát hiện của mô hình Faster R-CNN. MỤC LỤC DANH MỤC HÌNH VẼ . i DANH MỤC BẢNG BIỂU . v DANH MỤC TỪ VIẾT TẮT . vi MỞ ĐẦU. vii CHƯƠNG 1. TỔNG QUAN VỀ MÁU VÀ CÁC PHƯƠNG PHÁP CHẨN ĐOÁN BỆNH LÝ MÁU . 1 Máu và các thành phần trong máu. 6 Các phương pháp hỗ trợ chẩn đoán bệnh lý máu . 11 Tầm quan trọng và ý nghĩa của phương pháp phết máu ngoại vi . 23 Các hướng nghiên cứu hiện nay . 24 Hướng tiếp cận và mục đích phạm vi nghiên cứu . 25 Tổng kết chương . PHÂN TÍCH BÀI TOÁN ỨNG DỤNG KỸ THUẬT HỌC SÂU ĐỂ PHÁT HIỆN, PHÂN LOẠI . 27 Tổng quan về kỹ thuật học sâu . 27 Cấu trúc mô hình phát hiện, phân loại tế bào . 55 Phân tích các nghiên cứu phát hiện, phân loại tế bào máu. 62 Tổng kết chương 2 . XÂY DỰNG MÔ HÌNH HUẤN LUYỆN PHÁT HIỆN, PHÂN LOẠI TẾ BÀO MÁU .67 Phân loại tế bào bạch cầu sử dụng mô hình mạng Faster R-CNN . 67 Phân loại tế bào bạch cầu sử dụng mô hình mạng YOLOv5 . 84 Tổng kết chương 3 . KẾT QUẢ VÀ BÀN LUẬN .106 Cơ sở dữ liệu huấn luyện . 106 Công cụ lập trình. 112 Chỉ số đánh giá mô hình . 113 Quá trình huấn luyện các mô hình . 117 Đánh giá hiệu quả của từng mô hình . 119 Kết quả mô phỏng .131 TÀI LIỆU THAM KHẢO .133 DANH MỤC HÌNH VẼ Hình 1.1 Các thành phần của tế bào máu [2] .2 Ống máu sau khi được ly tâm chứa Huyết tương, bạch cầu và tiểu cầu, hồng cầu .3 Nguyên tắc phương pháp đếm tế bào dòng chảy [4] .4 Ánh sáng tán xạ (light scattering). FSC tỉ lệ với kích thước, trong khi đó SSC tỉ lệ với các thành phần và độ phức tạp bên trong tế bào [4] .5 Cơ chế tạo huỳnh quang [4] .6 Xử lý và phát hiện tín hiệu máy đếm tế bào dòng chảy [4] .7 Quy trình thực hiện phết máu ngoại vi .8 Máy tính kêt nối với kính hiển vi qua camera để thu nhận ảnh (a). Hình ảnh tiêu bản máu ngoại vi thu nhận được (b) .1 Học máy là tập con của trí tuệ nhân tạo [5] .2 Mô hình dự báo thời tiết bằng học máy .3 Phân loại các thuật toán học máy [6] .4 Quá trình thực hiện của thuật toán học không giám sát [7] .5 Minh họa thuật toán học bán giám sát [8] .6 Ván cờ đấu của AlphaGo và Lee Sedol.7 Vai trò của các tập dữ liệu với việc huấn luyện mô hình học máy .8 Mối quan hệ giữa độ chính xác và tốc độ thực thi [9] .9 Biểu đồ giá trị hàm mất mát theo độ phức tạp của mô hình [10].10 Các trạng thái của mô hình trong trạng thái huấn luyện [11] .11 Quá trình phát triển của mạng nơ-ron nhân tạo [12] .12 Biểu diễn của PLA dưới dạng mạng nơ-ron [13] .13 Mô hình đầu vào – đầu ra mạng nơ-ron rút gọn [14] .14 Biểu diễn thuật toán hồi quy tuyến tính dưới dạng mạng nơ-ron [14] 42 Hình 2.15 Vấn đề với hàm XOR của thuật toán PLA [14] .16 Cách giải quyết vấn đề của hàm XOR [15] .17 Mô hình một mạng nơ-ron với 2 lớp ẩn [15] .18 Hàm kích hoạt sigmoid và ReLU .19 Quá trình tính toán lan truyền ngược [16] .20 Mạng LeNet do LeCun phát minh [17] .21 Sự phát triển của mạng CNN qua từng năm [18] .22 Điển hình của một mạng nơ-ron tích chập [19] .23 Cách tính tích chập .24 Max pooling với hệ số trượt là 2.25 Kiến trúc mạng nơ-ron tích chập cho bài toán phân loại ảnh .26 Upsample sử dụng nearest neighbors .27 Kiến trúc mạng AlexNet với 2 pipeline song song .28 Inception module gốc (trái) và dạng giảm chiều (phải) .29 Cấu trúc VGG-16 [20] .30 Cấu trúc của Residual Block .31 Sơ đồ khối hệ thống phát hiện, phân loại tế bào .32 Đạo hàm và hướng của đạo hàm của các phần tử được xét trong ảnh của HOG [21] .33 Biểu đồ Histogram của đạo hàm [21] .34 Các cấu trúc convolution layers của các mạng CNN khác nhau .35 Các thuộc tính được trích xuất từ mạng VGG16 [22] .36 Kiến trúc mạng R-CNN .37 Kiến trúc Faster RCNN.38 Kiến trúc Single Shot Detector .39 Kiến trúc YOLO.1 Kiến trúc mô hình mạng Faster R-CNN [59] .2 Kiến trúc Region Proposal Network – RPN [59] .3 Mô tả 9 anchor trên mỗi điểm pixel Conv feature map .4 NMS cho trên Faster RCNN .5 Xử lý đặc trưng thông qua Region of Interest (RoI).6 Trích xuất dữ liệu sử dụng VGG16.7 Cấu trúc Faster R-CNN với backbone VGG16 [60] .8 Luồng dữ liệu trong RPN [60] .9 Lớp ROI Pooling [60] .11 Kiến trúc mạng AlexNet .12 Kiến trúc Faster R-CNN với backbone AlexNet [61] .13 Một khối Residual của ResNet.14 Kiến trúc mạng ResNet101 .15 Kiến trúc Faster R-CNN với backbone ResNet101 [62] .16 Kiến trúc mô hình YOLOv5 [63] .17 Cấu tạo Conv module [64] .18 Cấu tạo C3 module [64] .19 Cấu trúc Residual Block [64] .20 Kiến trúc mạng DenseNet với 3 Dense Block. Các layers ở giữa 2 block là các transition layers .21 Quá trình xử lý đầu vào của Dense Block [65] .22 Quá trình xử lý đầu vào của Partial Dense Block [65] .23 Block SPP ban đầu [66] .24 Khối SPP sửa đổi trong YOLOv5 [66] .25 Cấu tạo khối SPPF .26 (a) Kiến trúc FPN ban đầu.27 Mô hình mạng PAN.28 Kiến trúc PAN được điều chỉnh .29 Ứng dụng ROIAlign trong PAN .30 Bộ phát hiện đa kích cỡ ở 3 layer khác nhau [67].31 Kiến trúc Head trong YOLOv5 [68] .32 Mô tả hoạt động depthwise separable convolutions [69].33 Squeeze and Excite blocks [70] .34 Khối Inverted Residual của MobileNetv3 [71] .35 Mô tả hoạt động H-swish và Swish .36 Module Inverted Residual của MobileNetv3 .37 Kiến trúc mô hình mạng YOLOv5 với backbone MobileNetv3.1 Ảnh dữ liệu (phía trên) và nhãn tương ứng (phía dưới) của bốn loại bạch cầu.2 Dữ liệu ảnh được tăng cường bằng random crop .3 Mô tả shearing theo trục hoành.4 Mô tả shearing theo trục tung .5 Dữ liệu ảnh tăng cường sau shearing .6 Dữ liệu ảnh tăng cường sau khi điều chỉnh độ bão hoà .7 Dữ liệu ảnh tăng cường sau Rotation .8 Phân bổ dữ liệu gán nhãn trong bộ dữ liệu tăng cường .10 Cách tính Intersection Over Union .11 Đường con ROC biểu thị sự phụ thuộc precion va recall .12 Biểu đồ train-valid loss với các mô hình mạng Faster R-CNN .13 Biểu đồ train-valid loss với các mô hình mạng YOLO .14 Ảnh tế bào bạch cầu từ bộ dữ liệu huấn luyện.15 Các ảnh kiểm tra được vẽ bounding box với tế bào có grouth-truth 128 Hình 4.16 Bounding box màu cam dự đoán lớp bạch cầu Eosinophil .17 Bounding box màu cam dự đoán lớp bạch cầu Eosinophil .18 Bounding box màu vàng dự đoán lớp bạch cầu Lymphocyte.19 Bounding box màu nâu dự đoán lớp bạch cầu Monocyte . 129 iv DANH MỤC BẢNG BIỂU Bảng 2-1 Phương pháp giải quyết các trạng thái bất lợi trong huấn luyện mô hình39 Bảng 2-2 Nghiên cứu phân loại tế bào bạch cầu theo mô hình two-stage detector63 Bảng 2-3 Các nghiên cứu phân loại tế bào bạch cầu theo mô hình one-stage detector .

Nội dung được bảo vệ bản quyền — Tải xuống đầy đủ

Chủ đề

Công nghệ hình ảnh trong y học

Ứng dụng học sâu trong y tế

Nghiên cứu về tế bào máu

Phương pháp phân loại tế bào máu