TRƯỜNG ĐẠI HỌC BÁCH KHOA HÀ NỘI LUẬN VĂN THẠC SĨ Ứng dụng kỹ thuật học sâu để phát hiện, phân loại tế bào máu trên ảnh hiển vi chụp tiêu bản máu ngoại vi ĐẶNG XUÂN HỢP Ngành: Kỹ thuật Y sinh Giảng viên hướng dẫn: TS. Nguyễn Việt Dũng Trường: Điện – Điện tử HÀ NỘI, 2022 TRƯỜNG ĐẠI HỌC BÁCH KHOA HÀ NỘI LUẬN VĂN THẠC SĨ Ứng dụng kỹ thuật học sâu để phát hiện, phân loại tế bào máu trên ảnh hiển vi chụp tiêu bản máu ngoại vi ĐẶNG XUÂN HỢP Ngành: Kỹ thuật Y sinh Giảng viên hướng dẫn: TS. Nguyễn Việt Dũng Chữ ký của GVHD Trường: Điện – Điện tử HÀ NỘI, 2022 CỘNG HÒA XÃ HỘI CHỦ NGHĨA VIỆT NAM Độc lập – Tự do – Hạnh phúc BẢN XÁC NHẬN CHỈNH SỬA LUẬN VĂN THẠC SĨ Họ và tên tác giả luận văn: Đặng Xuân Hợp Đề tài luận văn: Ứng dụng kỹ thuật học sâu để phát hiện, phân loại tế bào máu trên ảnh hiển vi chụp tiêu bản máu ngoại vi. Chuyên ngành: Kỹ thuật Y sinh Mã số SV: 20202693M Tác giả, Người hướng dẫn khoa học và Hội đồng chấm luận văn xác nhận tác giả đã sửa chữa, bổ sung luận văn theo biên bản họp Hội đồng ngày …/…/2022 với các nội dung sau: - Đã chỉnh sửa một số lỗi hành văn trong bài luận văn - Đã chỉnh sửa và việt hóa một số hình ảnh nhỏ còn mờ - Đã bổ sung đánh giá chi tiết cho bảng 4-11 Ngày tháng năm 2022 Giáo viên hướng dẫn Tác giả luận văn TS. Nguyễn Việt Dũng Đặng Xuân Hợp CHỦ TỊCH HỘI ĐỒNG TS. Trần Anh Vũ LỜI CẢM ƠN Trong quá trình thực hiện luận văn, em đã nhận được sự định hướng, chỉ bảo tận tình, những chỉnh sửa, góp ý từ Giảng viên hướng dẫn – TS. Nguyễn Việt Dũng. Em xin gửi lời cảm ơn chân thành đến thầy. Đồng thời, em cũng xin gửi lời cảm ơn đến các thầy cô là giảng viên tại Bộ môn Kỹ thuật Y sinh – Viện Điện tử Viễn thông đã giúp đỡ em trong suốt quá trình học tập và nghiên cứu tại trường. Hà Nội, ngày tháng năm 2022 Tác giả Đặng Xuân Hợp TÓM TẮT LUẬN VĂN Sử dụng kính hiển vi để quan sát tiêu bản phết máu ngoại vi được coi là tiêu chuẩn vàng để phát hiện một số rối loạn huyết học. Tuy nhiên kỹ thuật phân loại thủ công này gặp phải các vấn đề: Kỹ thuật viên phải đặt mắt vào kính hiển vi và quan sát hình ảnh tiêu bản phết máu ngoại vi, do đó sẽ gây nhức mỏi mắt nếu quan sát trong thời gian dài; Tế bào máu có nhiều loại, với nhiều hình dạng kích thước khác nhau; Trường quan sát chỉ là một phần nhỏ của cả phết máu…Tổng hòa các yếu tố trên làm cho việc quan sát thủ công có thể có nhiều sai sót. Từ thực tế này, nghiên cứu đề xuất xây dựng phương pháp phát hiện, phân loại tế bào máu sử dụng kỹ thuật học sâu cụ thể là mô hình mạng Faster R-CNN và YOLOv5. Qua quá trình thực nghiệm trên cùng một cơ sở dữ liệu ảnh tế bào bạch cầu được tạo từ nguồn thu thập dữ liệu trực tiếp tại cơ sở y tế và nguồn dữ liệu được công bố công khai trên mạng, có thể thấy việc áp dụng mô hình mạng Faster R-CNN và YOLOv5 là hoàn toàn hiệu quả. Độ chính xác phân loại tế bào bạch cầu sử dụng mô hình Faster R-CNN cao trên 95%, đặc biệt với backbone ResNet101 độ chính xác đạt tới 97,27%. Độ chính xác của mô hình YOLOv5 backbone MobileNetv3 thấp hơn đạt 93,59%. Tuy nhiên mô hình YOLO lại cho tốc độ phát hiện 16ms nhanh hơn gấp khoảng 4 lần độ phát hiện của mô hình Faster R-CNN. MỤC LỤC DANH MỤC HÌNH VẼ . i DANH MỤC BẢNG BIỂU . v DANH MỤC TỪ VIẾT TẮT . vi MỞ ĐẦU. vii CHƯƠNG 1. TỔNG QUAN VỀ MÁU VÀ CÁC PHƯƠNG PHÁP CHẨN ĐOÁN BỆNH LÝ MÁU . 1 Máu và các thành phần trong máu. 6 Các phương pháp hỗ trợ chẩn đoán bệnh lý máu . 11 Tầm quan trọng và ý nghĩa của phương pháp phết máu ngoại vi . 23 Các hướng nghiên cứu hiện nay . 24 Hướng tiếp cận và mục đích phạm vi nghiên cứu . 25 Tổng kết chương . PHÂN TÍCH BÀI TOÁN ỨNG DỤNG KỸ THUẬT HỌC SÂU ĐỂ PHÁT HIỆN, PHÂN LOẠI . 27 Tổng quan về kỹ thuật học sâu . 27 Cấu trúc mô hình phát hiện, phân loại tế bào . 55 Phân tích các nghiên cứu phát hiện, phân loại tế bào máu. 62 Tổng kết chương 2 . XÂY DỰNG MÔ HÌNH HUẤN LUYỆN PHÁT HIỆN, PHÂN LOẠI TẾ BÀO MÁU .67 Phân loại tế bào bạch cầu sử dụng mô hình mạng Faster R-CNN . 67 Phân loại tế bào bạch cầu sử dụng mô hình mạng YOLOv5 . 84 Tổng kết chương 3 . KẾT QUẢ VÀ BÀN LUẬN .106 Cơ sở dữ liệu huấn luyện . 106 Công cụ lập trình. 112 Chỉ số đánh giá mô hình . 113 Quá trình huấn luyện các mô hình . 117 Đánh giá hiệu quả của từng mô hình . 119 Kết quả mô phỏng .131 TÀI LIỆU THAM KHẢO .133 DANH MỤC HÌNH VẼ Hình 1.1 Các thành phần của tế bào máu [2] .2 Ống máu sau khi được ly tâm chứa Huyết tương, bạch cầu và tiểu cầu, hồng cầu .3 Nguyên tắc phương pháp đếm tế bào dòng chảy [4] .4 Ánh sáng tán xạ (light scattering). FSC tỉ lệ với kích thước, trong khi đó SSC tỉ lệ với các thành phần và độ phức tạp bên trong tế bào [4] .5 Cơ chế tạo huỳnh quang [4] .6 Xử lý và phát hiện tín hiệu máy đếm tế bào dòng chảy [4] .7 Quy trình thực hiện phết máu ngoại vi .8 Máy tính kêt nối với kính hiển vi qua camera để thu nhận ảnh (a). Hình ảnh tiêu bản máu ngoại vi thu nhận được (b) .1 Học máy là tập con của trí tuệ nhân tạo [5] .2 Mô hình dự báo thời tiết bằng học máy .3 Phân loại các thuật toán học máy [6] .4 Quá trình thực hiện của thuật toán học không giám sát [7] .5 Minh họa thuật toán học bán giám sát [8] .6 Ván cờ đấu của AlphaGo và Lee Sedol.7 Vai trò của các tập dữ liệu với việc huấn luyện mô hình học máy .8 Mối quan hệ giữa độ chính xác và tốc độ thực thi [9] .9 Biểu đồ giá trị hàm mất mát theo độ phức tạp của mô hình [10].10 Các trạng thái của mô hình trong trạng thái huấn luyện [11] .11 Quá trình phát triển của mạng nơ-ron nhân tạo [12] .12 Biểu diễn của PLA dưới dạng mạng nơ-ron [13] .13 Mô hình đầu vào – đầu ra mạng nơ-ron rút gọn [14] .14 Biểu diễn thuật toán hồi quy tuyến tính dưới dạng mạng nơ-ron [14] 42 Hình 2.15 Vấn đề với hàm XOR của thuật toán PLA [14] .16 Cách giải quyết vấn đề của hàm XOR [15] .17 Mô hình một mạng nơ-ron với 2 lớp ẩn [15] .18 Hàm kích hoạt sigmoid và ReLU .19 Quá trình tính toán lan truyền ngược [16] .20 Mạng LeNet do LeCun phát minh [17] .21 Sự phát triển của mạng CNN qua từng năm [18] .22 Điển hình của một mạng nơ-ron tích chập [19] .23 Cách tính tích chập .24 Max pooling với hệ số trượt là 2.25 Kiến trúc mạng nơ-ron tích chập cho bài toán phân loại ảnh .26 Upsample sử dụng nearest neighbors .27 Kiến trúc mạng AlexNet với 2 pipeline song song .28 Inception module gốc (trái) và dạng giảm chiều (phải) .29 Cấu trúc VGG-16 [20] .30 Cấu trúc của Residual Block .31 Sơ đồ khối hệ thống phát hiện, phân loại tế bào .32 Đạo hàm và hướng của đạo hàm của các phần tử được xét trong ảnh của HOG [21] .33 Biểu đồ Histogram của đạo hàm [21] .34 Các cấu trúc convolution layers của các mạng CNN khác nhau .35 Các thuộc tính được trích xuất từ mạng VGG16 [22] .36 Kiến trúc mạng R-CNN .37 Kiến trúc Faster RCNN.38 Kiến trúc Single Shot Detector .39 Kiến trúc YOLO.1 Kiến trúc mô hình mạng Faster R-CNN [59] .2 Kiến trúc Region Proposal Network – RPN [59] .3 Mô tả 9 anchor trên mỗi điểm pixel Conv feature map .4 NMS cho trên Faster RCNN .5 Xử lý đặc trưng thông qua Region of Interest (RoI).6 Trích xuất dữ liệu sử dụng VGG16.7 Cấu trúc Faster R-CNN với backbone VGG16 [60] .8 Luồng dữ liệu trong RPN [60] .9 Lớp ROI Pooling [60] .11 Kiến trúc mạng AlexNet .12 Kiến trúc Faster R-CNN với backbone AlexNet [61] .13 Một khối Residual của ResNet.14 Kiến trúc mạng ResNet101 .15 Kiến trúc Faster R-CNN với backbone ResNet101 [62] .16 Kiến trúc mô hình YOLOv5 [63] .17 Cấu tạo Conv module [64] .18 Cấu tạo C3 module [64] .19 Cấu trúc Residual Block [64] .20 Kiến trúc mạng DenseNet với 3 Dense Block. Các layers ở giữa 2 block là các transition layers .21 Quá trình xử lý đầu vào của Dense Block [65] .22 Quá trình xử lý đầu vào của Partial Dense Block [65] .23 Block SPP ban đầu [66] .24 Khối SPP sửa đổi trong YOLOv5 [66] .25 Cấu tạo khối SPPF .26 (a) Kiến trúc FPN ban đầu.27 Mô hình mạng PAN.28 Kiến trúc PAN được điều chỉnh .29 Ứng dụng ROIAlign trong PAN .30 Bộ phát hiện đa kích cỡ ở 3 layer khác nhau [67].31 Kiến trúc Head trong YOLOv5 [68] .32 Mô tả hoạt động depthwise separable convolutions [69].33 Squeeze and Excite blocks [70] .34 Khối Inverted Residual của MobileNetv3 [71] .35 Mô tả hoạt động H-swish và Swish .36 Module Inverted Residual của MobileNetv3 .37 Kiến trúc mô hình mạng YOLOv5 với backbone MobileNetv3.1 Ảnh dữ liệu (phía trên) và nhãn tương ứng (phía dưới) của bốn loại bạch cầu.2 Dữ liệu ảnh được tăng cường bằng random crop .3 Mô tả shearing theo trục hoành.4 Mô tả shearing theo trục tung .5 Dữ liệu ảnh tăng cường sau shearing .6 Dữ liệu ảnh tăng cường sau khi điều chỉnh độ bão hoà .7 Dữ liệu ảnh tăng cường sau Rotation .8 Phân bổ dữ liệu gán nhãn trong bộ dữ liệu tăng cường .10 Cách tính Intersection Over Union .11 Đường con ROC biểu thị sự phụ thuộc precion va recall .12 Biểu đồ train-valid loss với các mô hình mạng Faster R-CNN .13 Biểu đồ train-valid loss với các mô hình mạng YOLO .14 Ảnh tế bào bạch cầu từ bộ dữ liệu huấn luyện.15 Các ảnh kiểm tra được vẽ bounding box với tế bào có grouth-truth 128 Hình 4.16 Bounding box màu cam dự đoán lớp bạch cầu Eosinophil .17 Bounding box màu cam dự đoán lớp bạch cầu Eosinophil .18 Bounding box màu vàng dự đoán lớp bạch cầu Lymphocyte.19 Bounding box màu nâu dự đoán lớp bạch cầu Monocyte . 129 iv DANH MỤC BẢNG BIỂU Bảng 2-1 Phương pháp giải quyết các trạng thái bất lợi trong huấn luyện mô hình39 Bảng 2-2 Nghiên cứu phân loại tế bào bạch cầu theo mô hình two-stage detector63 Bảng 2-3 Các nghiên cứu phân loại tế bào bạch cầu theo mô hình one-stage detector .
Tổng quan nghiên cứu
Việc phát hiện và phân loại tế bào máu trên ảnh hiển vi chụp tiêu bản máu ngoại vi đóng vai trò quan trọng trong chẩn đoán các bệnh lý huyết học. Ước tính, mỗi người trưởng thành có khoảng 5 lít máu với các thành phần tế bào đa dạng như hồng cầu, bạch cầu và tiểu cầu, mỗi loại có chức năng và đặc điểm riêng biệt. Phương pháp phân loại tế bào máu thủ công hiện nay dựa trên quan sát trực tiếp dưới kính hiển vi, tuy nhiên gặp nhiều hạn chế như nhức mỏi mắt cho kỹ thuật viên, sai sót do sự đa dạng về hình dạng và kích thước tế bào, cũng như phạm vi quan sát hạn chế.
Mục tiêu nghiên cứu là ứng dụng kỹ thuật học sâu để tự động phát hiện và phân loại tế bào bạch cầu trên ảnh hiển vi tiêu bản máu ngoại vi, nhằm nâng cao độ chính xác và tốc độ xử lý, hỗ trợ bác sĩ trong chẩn đoán bệnh. Nghiên cứu tập trung vào việc xây dựng và đánh giá các mô hình mạng nơ-ron tích chập (CNN) như Faster R-CNN và YOLOv5 trên bộ dữ liệu ảnh tế bào bạch cầu thu thập trực tiếp tại cơ sở y tế và các nguồn dữ liệu công khai. Phạm vi nghiên cứu bao gồm ảnh hiển vi phết máu ngoại vi với độ phóng đại 50-100 lần, tập trung vào phân loại bạch cầu trong khoảng thời gian nghiên cứu năm 2022 tại Hà Nội.
Ý nghĩa của nghiên cứu được thể hiện qua việc cải thiện độ chính xác phân loại tế bào bạch cầu lên trên 95%, đặc biệt mô hình Faster R-CNN với backbone ResNet101 đạt độ chính xác 97,27%, đồng thời tăng tốc độ phát hiện tế bào lên gấp 4 lần so với phương pháp truyền thống. Kết quả này góp phần giảm thiểu sai sót trong chẩn đoán, tiết kiệm thời gian và nâng cao hiệu quả điều trị bệnh lý máu.
Cơ sở lý thuyết và phương pháp nghiên cứu
Khung lý thuyết áp dụng
Nghiên cứu dựa trên nền tảng kỹ thuật học sâu (deep learning), một lĩnh vực con của học máy (machine learning) trong trí tuệ nhân tạo, sử dụng mạng nơ-ron nhân tạo để tự động trích xuất đặc trưng và phân loại dữ liệu ảnh. Hai mô hình chính được áp dụng là Faster R-CNN và YOLOv5:
-
Faster R-CNN: Mô hình phát hiện vật thể hai giai đoạn, sử dụng Region Proposal Network (RPN) để đề xuất vùng quan tâm, kết hợp với mạng backbone như ResNet101 để trích xuất đặc trưng sâu. Ưu điểm là độ chính xác cao, phù hợp với các bài toán phân loại tế bào phức tạp.
-
YOLOv5: Mô hình phát hiện vật thể một giai đoạn, nổi bật với tốc độ xử lý nhanh nhờ kiến trúc mạng nhẹ và tối ưu, sử dụng backbone MobileNetv3. Mô hình này phù hợp với ứng dụng yêu cầu thời gian thực.
Các khái niệm chính bao gồm:
-
Intersection over Union (IoU): Đo lường mức độ chồng lắp giữa vùng dự đoán và vùng thực tế, dùng để đánh giá hiệu quả phát hiện.
-
Mean Average Precision (mAP): Chỉ số đánh giá tổng quát độ chính xác của mô hình phát hiện và phân loại.
-
Non-Maximum Suppression (NMS): Thuật toán loại bỏ các dự đoán trùng lặp không cần thiết.
-
Backbone: Mạng trích xuất đặc trưng chính trong mô hình học sâu.
Phương pháp nghiên cứu
Nguồn dữ liệu gồm ảnh tế bào bạch cầu được thu thập trực tiếp tại Bệnh viện Sản nhi Phú Thọ và các bộ dữ liệu công khai như BCCD, Cellavision. Bộ dữ liệu được xử lý tăng cường bằng các kỹ thuật như cắt ngẫu nhiên, xoay, điều chỉnh độ bão hòa nhằm tăng tính đa dạng và tránh hiện tượng quá khớp.
Cỡ mẫu ảnh sử dụng trong huấn luyện khoảng vài nghìn ảnh cho mỗi loại tế bào bạch cầu, đảm bảo đủ dữ liệu cho việc học sâu. Dữ liệu được chia thành ba tập: huấn luyện (70%), xác thực (15%) và kiểm thử (15%).
Phương pháp phân tích sử dụng các chỉ số đánh giá như độ chính xác (accuracy), mAP, thời gian phát hiện (ms/frame). Quá trình huấn luyện được thực hiện trên môi trường lập trình Python với thư viện PyTorch, sử dụng GPU để tăng tốc độ xử lý. Mô hình Faster R-CNN được huấn luyện với các backbone VGG16, AlexNet và ResNet101 để so sánh hiệu quả. Mô hình YOLOv5 sử dụng backbone MobileNetv3 nhằm tối ưu tốc độ.
Timeline nghiên cứu kéo dài trong năm 2022, bao gồm các giai đoạn thu thập dữ liệu, tiền xử lý, xây dựng mô hình, huấn luyện và đánh giá kết quả.
Kết quả nghiên cứu và thảo luận
Những phát hiện chính
-
Độ chính xác phân loại tế bào bạch cầu: Mô hình Faster R-CNN với backbone ResNet101 đạt độ chính xác cao nhất là 97,27%, vượt trội so với các backbone khác như VGG16 và AlexNet (đạt khoảng 95-96%). Mô hình YOLOv5 với backbone MobileNetv3 đạt độ chính xác 93,59%, thấp hơn nhưng vẫn ở mức chấp nhận được.
-
Tốc độ phát hiện: YOLOv5 cho tốc độ phát hiện trung bình 16ms/frame, nhanh hơn gấp khoảng 4 lần so với Faster R-CNN (khoảng 64ms/frame), phù hợp với ứng dụng yêu cầu xử lý thời gian thực.
-
Hiệu quả tổng quát: So sánh các mô hình cho thấy Faster R-CNN ưu thế về độ chính xác, trong khi YOLOv5 nổi bật về tốc độ. Việc lựa chọn mô hình phụ thuộc vào yêu cầu cụ thể của ứng dụng.
-
Độ tin cậy của mô hình: Các biểu đồ ROC và đường cong loss cho thấy mô hình không bị hiện tượng quá khớp, đảm bảo khả năng tổng quát hóa tốt trên dữ liệu kiểm thử.
Thảo luận kết quả
Nguyên nhân chính giúp Faster R-CNN đạt độ chính xác cao là do kiến trúc hai giai đoạn cho phép mô hình tập trung vào các vùng đề xuất chính xác hơn, kết hợp với backbone ResNet101 có khả năng trích xuất đặc trưng sâu và phong phú. Tuy nhiên, nhược điểm là tốc độ xử lý chậm hơn do tính toán phức tạp.
Ngược lại, YOLOv5 với kiến trúc một giai đoạn và backbone nhẹ MobileNetv3 giảm thiểu thời gian xử lý, phù hợp với các hệ thống cần phản hồi nhanh nhưng độ chính xác giảm nhẹ do khả năng trích xuất đặc trưng hạn chế hơn.
So sánh với các nghiên cứu khác trong ngành, kết quả của luận văn cho thấy sự cải thiện rõ rệt về độ chính xác và tốc độ, đồng thời áp dụng thành công trên dữ liệu thực tế thu thập tại cơ sở y tế Việt Nam, tăng tính ứng dụng thực tiễn.
Dữ liệu có thể được trình bày qua biểu đồ so sánh độ chính xác và tốc độ của các mô hình, bảng tổng hợp các chỉ số mAP, IoU, và biểu đồ đường cong ROC minh họa hiệu quả phân loại.
Đề xuất và khuyến nghị
-
Triển khai mô hình Faster R-CNN backbone ResNet101 trong các phòng xét nghiệm lớn nhằm nâng cao độ chính xác chẩn đoán, với mục tiêu đạt độ chính xác trên 97% trong vòng 6 tháng, do các trung tâm y tế thực hiện.
-
Ứng dụng mô hình YOLOv5 backbone MobileNetv3 cho các hệ thống chẩn đoán di động hoặc tại điểm chăm sóc (point-of-care), nhằm tăng tốc độ xử lý, giảm thời gian chờ kết quả xuống dưới 20ms/frame, trong vòng 3 tháng, do các nhà phát triển phần mềm y sinh thực hiện.
-
Mở rộng bộ dữ liệu huấn luyện bằng cách thu thập thêm ảnh tế bào từ nhiều cơ sở y tế khác nhau để tăng tính đa dạng và khả năng tổng quát hóa của mô hình, với kế hoạch thu thập trong 12 tháng, do các nhóm nghiên cứu phối hợp thực hiện.
-
Phát triển giao diện người dùng thân thiện tích hợp mô hình học sâu để hỗ trợ bác sĩ trong việc phân loại tế bào máu, giảm thiểu sai sót do yếu tố con người, dự kiến hoàn thành trong 6 tháng, do các chuyên gia công nghệ thông tin và y sinh phối hợp.
Đối tượng nên tham khảo luận văn
-
Các nhà nghiên cứu và sinh viên ngành Kỹ thuật Y sinh: Nghiên cứu cung cấp kiến thức sâu về ứng dụng học sâu trong y học, đặc biệt về phát hiện và phân loại tế bào máu, hỗ trợ phát triển các đề tài liên quan.
-
Bác sĩ và kỹ thuật viên phòng xét nghiệm huyết học: Tài liệu giúp hiểu rõ về các phương pháp tự động hóa trong chẩn đoán tế bào máu, nâng cao hiệu quả và độ chính xác trong công việc hàng ngày.
-
Các nhà phát triển phần mềm y tế và công nghệ AI: Cung cấp cơ sở lý thuyết và thực tiễn để phát triển các ứng dụng chẩn đoán hình ảnh y sinh dựa trên học sâu, đặc biệt trong lĩnh vực huyết học.
-
Quản lý và hoạch định chính sách y tế: Tham khảo để đánh giá tiềm năng ứng dụng công nghệ AI trong nâng cao chất lượng dịch vụ y tế, từ đó xây dựng các kế hoạch đầu tư và phát triển phù hợp.
Câu hỏi thường gặp
-
Tại sao cần ứng dụng học sâu trong phân loại tế bào máu?
Học sâu giúp tự động trích xuất đặc trưng phức tạp từ ảnh tế bào, giảm sai sót do quan sát thủ công, tăng độ chính xác và tốc độ xử lý, hỗ trợ chẩn đoán nhanh và chính xác hơn. -
Mô hình Faster R-CNN và YOLOv5 khác nhau như thế nào?
Faster R-CNN là mô hình hai giai đoạn với độ chính xác cao nhưng tốc độ chậm, trong khi YOLOv5 là mô hình một giai đoạn, ưu tiên tốc độ xử lý nhanh hơn nhưng độ chính xác thấp hơn một chút. -
Bộ dữ liệu huấn luyện có ảnh hưởng thế nào đến kết quả?
Bộ dữ liệu đa dạng và đủ lớn giúp mô hình học sâu tránh hiện tượng quá khớp, tăng khả năng tổng quát hóa và độ chính xác khi áp dụng trên dữ liệu thực tế. -
Có thể áp dụng mô hình này cho các loại tế bào khác ngoài bạch cầu không?
Có thể, tuy nhiên cần thu thập dữ liệu và huấn luyện lại mô hình với các loại tế bào cụ thể để đảm bảo độ chính xác và hiệu quả phát hiện. -
Thời gian huấn luyện mô hình mất bao lâu?
Tùy thuộc vào kích thước bộ dữ liệu và cấu hình phần cứng, quá trình huấn luyện có thể kéo dài từ vài giờ đến vài ngày. Ví dụ, mô hình Faster R-CNN có thể mất vài ngày trên GPU hiện đại.
Kết luận
- Nghiên cứu đã thành công trong việc xây dựng mô hình học sâu phát hiện và phân loại tế bào bạch cầu trên ảnh hiển vi tiêu bản máu ngoại vi với độ chính xác trên 95%.
- Mô hình Faster R-CNN backbone ResNet101 đạt độ chính xác cao nhất 97,27%, trong khi YOLOv5 backbone MobileNetv3 cung cấp tốc độ phát hiện nhanh gấp 4 lần.
- Kết quả thực nghiệm trên dữ liệu thu thập tại cơ sở y tế và dữ liệu công khai chứng minh tính khả thi và hiệu quả của phương pháp.
- Đề xuất triển khai ứng dụng mô hình trong các phòng xét nghiệm và phát triển phần mềm hỗ trợ chẩn đoán nhằm nâng cao chất lượng dịch vụ y tế.
- Các bước tiếp theo bao gồm mở rộng bộ dữ liệu, tối ưu mô hình và phát triển giao diện người dùng thân thiện để ứng dụng rộng rãi trong thực tế.
Hãy tiếp tục nghiên cứu và ứng dụng các kỹ thuật học sâu để nâng cao hiệu quả chẩn đoán và điều trị bệnh lý máu, góp phần cải thiện sức khỏe cộng đồng.