Tổng quan nghiên cứu

Bệnh ngoài da là một trong những bệnh phổ biến ảnh hưởng đến mọi lứa tuổi và giới tính, chiếm khoảng 1,79% trong tổng số các bệnh trên toàn cầu theo thống kê năm 2017. Các bệnh ngoài da bao gồm viêm da, mụn trứng cá, mày đay, vẩy nến, bệnh do virus, nấm, ghẻ, ung thư da và nhiều loại khác. Việc chẩn đoán sớm và chính xác các bệnh này đóng vai trò quan trọng trong việc điều trị hiệu quả, giảm thiểu tổn thương và cải thiện chất lượng cuộc sống người bệnh.

Nghiên cứu này tập trung vào thiết kế hệ thống phân loại bệnh da người dựa trên phân tích cấu trúc ảnh và thuật toán mạng nơ ron nhiều lớp (MLNNs). Dữ liệu nghiên cứu sử dụng 500 ảnh bệnh da thuộc 5 loại bệnh phổ biến, được lấy từ cơ sở dữ liệu ISIC 2018, với mỗi loại bệnh có 100 ảnh để đảm bảo cân bằng dữ liệu. Mục tiêu chính là trích xuất các đặc trưng tối ưu từ ảnh bệnh da sau khi tiền xử lý và phân đoạn vùng quan tâm (ROI), từ đó nâng cao độ chính xác phân loại bệnh da, hỗ trợ bác sĩ trong chẩn đoán và điều trị sớm.

Phạm vi nghiên cứu bao gồm xử lý ảnh y tế, trích xuất đặc trưng bằng ma trận đồng xuất hiện mức xám (GLCM), và phân loại sử dụng mạng nơ ron nhiều lớp. Nghiên cứu có ý nghĩa lớn trong việc phát triển các công cụ hỗ trợ chẩn đoán tự động, giảm tải cho bác sĩ và nâng cao hiệu quả điều trị bệnh ngoài da.

Cơ sở lý thuyết và phương pháp nghiên cứu

Khung lý thuyết áp dụng

Nghiên cứu dựa trên hai lý thuyết chính: phân tích cấu trúc ảnh bằng ma trận đồng xuất hiện mức xám (GLCM) và mô hình mạng nơ ron nhiều lớp (MLNNs) trong học máy.

  • Ma trận đồng xuất hiện mức xám (GLCM): Là phương pháp trích xuất đặc trưng kết cấu ảnh, GLCM tính toán xác suất xuất hiện cặp pixel với các giá trị cường độ khác nhau trong một khoảng cách và góc định hướng nhất định. Từ GLCM, 11 đặc trưng được trích xuất, trong đó 6 đặc trưng tối ưu gồm Contrast, Energy, Homogeneity, Mean, Standard Deviation và Entropy được chọn để phân biệt các loại bệnh da.

  • Mạng nơ ron nhiều lớp (MLNNs): Là mô hình học sâu gồm nhiều lớp ẩn, có khả năng học các mối quan hệ phức tạp giữa các đặc trưng đầu vào để phân loại chính xác. Mạng MLNNs trong nghiên cứu có cấu trúc gồm 6 nút đầu vào (tương ứng 6 đặc trưng GLCM), 3 lớp ẩn với 100 nút mỗi lớp và 5 nút đầu ra tương ứng 5 loại bệnh da.

Các khái niệm chuyên ngành quan trọng bao gồm: ROI (Region of Interest - vùng quan tâm), bộ lọc Butterworth (lọc thông cao để làm sắc nét ảnh), phương pháp phân đoạn Otsu (phân đoạn ảnh nhị phân), và các phép toán hình thái học (giãn nở, xói mòn) để xử lý ảnh.

Phương pháp nghiên cứu

  • Nguồn dữ liệu: Sử dụng tập dữ liệu ISIC 2018 với 5 loại bệnh da gồm ung thư biểu mô tế bào đáy, dày sừng tiết bã lành tính, u da lành tính, nốt ruồi hắc tố và ung thư tế bào hắc tố. Mỗi loại có 100 ảnh huấn luyện và 20 ảnh kiểm tra, tổng cộng 600 ảnh.

  • Tiền xử lý ảnh: Ảnh gốc được chuẩn hóa kích thước 512x512, tăng cường độ sáng, chuyển sang ảnh xám, lọc nhiễu bằng bộ lọc thông cao Butterworth, bộ lọc trung vị và bộ lọc Bottom-Hat để loại bỏ nhiễu muối tiêu và lông trên da.

  • Phân đoạn ảnh: Áp dụng phương pháp Otsu để phân đoạn ảnh nhị phân, tiếp theo dùng phép toán hình thái học (xói mòn, giãn nở) và bộ dò cạnh Canny để tách vùng ROI chứa tổn thương da.

  • Trích đặc trưng: Từ vùng ROI, sử dụng GLCM tính toán 11 đặc trưng kết cấu ảnh, chọn ra 6 đặc trưng tối ưu để làm đầu vào cho mạng MLNNs.

  • Phân loại: Mạng MLNNs được huấn luyện với hàm mất mát MSE và hàm kích hoạt log-sigmoid, tốc độ học 10^-4, cấu trúc 6-100-100-100-5. Quá trình huấn luyện và kiểm tra được thực hiện trên tập dữ liệu đã chuẩn bị.

  • Timeline nghiên cứu: Thực hiện trong 12 tháng, bao gồm thu thập dữ liệu, tiền xử lý, trích đặc trưng, huấn luyện mô hình, đánh giá kết quả và hoàn thiện báo cáo.

Kết quả nghiên cứu và thảo luận

Những phát hiện chính

  1. Hiệu quả tiền xử lý và phân đoạn ROI: Ảnh bệnh da sau khi xử lý bằng bộ lọc Butterworth, bộ lọc trung vị và Bottom-Hat cùng với phân đoạn Otsu và dò cạnh Canny đã tách chính xác vùng tổn thương, giúp trích đặc trưng hiệu quả. Việc tách ROI giúp giảm thời gian huấn luyện mạng MLNNs.

  2. Đặc trưng GLCM tối ưu: Trong 11 đặc trưng trích xuất, 6 đặc trưng gồm Contrast, Energy, Homogeneity, Mean, Standard Deviation và Entropy có sự khác biệt rõ rệt giữa các loại bệnh, phù hợp làm đầu vào cho phân loại. Ví dụ, bệnh Dermatofibroma có giá trị Contrast và Entropy thấp nhất, trong khi Homogeneity và Energy cao nhất.

  3. Độ chính xác phân loại: Mô hình MLNNs đạt độ chính xác trung bình 92% trên 5 loại bệnh da, trong đó Dermatofibroma đạt 100%, Benign keratosis và Melanoma đạt 95%, Basal cell carcinoma và Melanocytic nevus đạt 85%. So với các mô hình khác như CNN, FRCNN, SVM, mô hình đề xuất có độ chính xác cao hơn từ 2-6%.

  4. Ảnh hưởng số lượng loại bệnh: Khi giảm số loại bệnh phân loại xuống còn 3 hoặc 4, độ chính xác huấn luyện và kiểm tra tăng lên đến gần 99% và 98%, cho thấy sự khác biệt đặc trưng giữa các bệnh giúp mô hình học tốt hơn.

Thảo luận kết quả

Kết quả cho thấy việc tập trung xử lý ảnh để trích xuất các đặc trưng tối ưu giúp giảm thời gian huấn luyện và nâng cao độ chính xác phân loại. Việc sử dụng MLNNs với cấu trúc phù hợp cho phép mô hình học được các mối quan hệ phức tạp giữa các đặc trưng GLCM, từ đó phân biệt chính xác các loại bệnh da.

So sánh với các nghiên cứu trước, mô hình đề xuất vượt trội hơn về độ chính xác và thời gian huấn luyện, nhờ vào việc chọn lọc đặc trưng hiệu quả và cấu trúc mạng đơn giản hơn. Kết quả có thể được trình bày qua biểu đồ cột thể hiện giá trị trung bình các đặc trưng GLCM của từng loại bệnh và ma trận nhầm lẫn minh họa tỷ lệ phân loại chính xác từng bệnh.

Nghiên cứu cũng chỉ ra một số hạn chế như nhầm lẫn giữa các bệnh có đặc trưng tương tự (ví dụ Basal cell carcinoma và Benign keratosis), điều này có thể được cải thiện bằng cách mở rộng tập dữ liệu và bổ sung các đặc trưng mới.

Đề xuất và khuyến nghị

  1. Mở rộng và đa dạng hóa dữ liệu: Thu thập thêm ảnh bệnh da từ nhiều nguồn khác nhau, đặc biệt là ảnh thực tế từ bệnh viện, nhằm tăng tính đại diện và giảm sai số phân loại. Thời gian thực hiện: 12-18 tháng, chủ thể: nhóm nghiên cứu và bệnh viện hợp tác.

  2. Phát triển mô hình học sâu nâng cao: Kết hợp mạng CNN hoặc các mô hình học sâu hiện đại để trích xuất đặc trưng tự động, nâng cao độ chính xác phân loại, đặc biệt với các bệnh có đặc trưng tương tự. Thời gian: 6-12 tháng, chủ thể: nhóm nghiên cứu AI.

  3. Ứng dụng phần mềm hỗ trợ chẩn đoán: Phát triển phần mềm tích hợp mô hình phân loại để hỗ trợ bác sĩ trong chẩn đoán bệnh ngoài da nhanh chóng và chính xác tại các phòng khám, bệnh viện. Thời gian: 6 tháng, chủ thể: nhóm phát triển phần mềm.

  4. Đào tạo và chuyển giao công nghệ: Tổ chức các khóa đào tạo, hội thảo cho sinh viên, học viên và cán bộ y tế về phương pháp xử lý ảnh và phân loại bệnh da sử dụng AI, đồng thời chuyển giao kết quả nghiên cứu cho các phòng thí nghiệm và cơ sở đào tạo. Thời gian: liên tục, chủ thể: trường đại học và các đơn vị y tế.

Đối tượng nên tham khảo luận văn

  1. Bác sĩ da liễu và nhân viên y tế: Nghiên cứu cung cấp công cụ hỗ trợ chẩn đoán bệnh ngoài da chính xác, giúp cải thiện hiệu quả điều trị và giảm thiểu sai sót trong chẩn đoán.

  2. Nhà nghiên cứu và sinh viên ngành công nghệ thông tin, y sinh: Luận văn trình bày chi tiết phương pháp xử lý ảnh y tế, trích xuất đặc trưng và ứng dụng mạng nơ ron trong phân loại, là tài liệu tham khảo quý giá cho các đề tài nghiên cứu liên quan.

  3. Phát triển phần mềm y tế: Các công ty và nhóm phát triển phần mềm có thể ứng dụng mô hình và thuật toán trong nghiên cứu để xây dựng các sản phẩm hỗ trợ chẩn đoán tự động.

  4. Giảng viên và cơ sở đào tạo: Luận văn cung cấp kiến thức cập nhật về ứng dụng AI trong y tế, hỗ trợ giảng dạy và đào tạo sinh viên, học viên cao học trong lĩnh vực xử lý ảnh và học máy.

Câu hỏi thường gặp

  1. Tại sao chọn GLCM để trích xuất đặc trưng ảnh bệnh da?
    GLCM là phương pháp hiệu quả để phân tích kết cấu ảnh, giúp mô tả các đặc điểm không gian của vùng tổn thương da. Nó cung cấp các đặc trưng như Contrast, Energy, Entropy có khả năng phân biệt các loại bệnh da khác nhau rõ ràng.

  2. Mạng nơ ron nhiều lớp (MLNNs) có ưu điểm gì trong phân loại bệnh da?
    MLNNs có khả năng học các mối quan hệ phi tuyến phức tạp giữa các đặc trưng đầu vào, giúp phân loại chính xác hơn so với các phương pháp truyền thống. Cấu trúc mạng đơn giản cũng giúp giảm thời gian huấn luyện.

  3. Làm thế nào để xử lý ảnh nhiễu và tách vùng tổn thương chính xác?
    Nghiên cứu sử dụng bộ lọc Butterworth để làm sắc nét ảnh, bộ lọc trung vị và Bottom-Hat để loại bỏ nhiễu muối tiêu và lông trên da. Phương pháp phân đoạn Otsu và dò cạnh Canny giúp tách chính xác vùng ROI chứa tổn thương.

  4. Độ chính xác phân loại có thể cải thiện như thế nào?
    Có thể cải thiện bằng cách mở rộng tập dữ liệu đa dạng hơn, áp dụng các mô hình học sâu phức tạp hơn như CNN, và kết hợp thêm các đặc trưng mới từ ảnh để tăng khả năng phân biệt các bệnh có đặc trưng tương tự.

  5. Nghiên cứu này có thể ứng dụng thực tế ra sao?
    Mô hình và phần mềm phân loại bệnh da có thể được tích hợp vào hệ thống hỗ trợ chẩn đoán tại các phòng khám, bệnh viện, giúp bác sĩ chẩn đoán nhanh và chính xác hơn, đồng thời hỗ trợ đào tạo sinh viên và cán bộ y tế.

Kết luận

  • Đề tài đã phát triển thành công hệ thống phân loại 5 loại bệnh ngoài da với độ chính xác trung bình đạt 92% nhờ trích xuất 6 đặc trưng GLCM tối ưu và sử dụng mạng nơ ron nhiều lớp.
  • Phương pháp tiền xử lý ảnh và phân đoạn ROI hiệu quả giúp giảm thời gian huấn luyện và nâng cao chất lượng dữ liệu đầu vào.
  • Mô hình đề xuất vượt trội hơn các phương pháp hiện có về độ chính xác và thời gian huấn luyện, phù hợp ứng dụng trong thực tế.
  • Kết quả nghiên cứu có thể mở rộng cho các bộ dữ liệu y tế khác và hỗ trợ đào tạo trong lĩnh vực xử lý ảnh và trí tuệ nhân tạo.
  • Các bước tiếp theo bao gồm mở rộng dữ liệu, phát triển mô hình học sâu nâng cao và ứng dụng phần mềm hỗ trợ chẩn đoán tại các cơ sở y tế.

Hành động tiếp theo: Khuyến khích các nhà nghiên cứu và đơn vị y tế áp dụng, phát triển và chuyển giao công nghệ để nâng cao hiệu quả chẩn đoán và điều trị bệnh ngoài da.