Tổng quan nghiên cứu

Bệnh ngoài da là một trong những vấn đề sức khỏe phổ biến, đặc biệt tại các quốc gia có khí hậu nóng ẩm như Việt Nam. Theo ước tính, các bệnh ngoài da như ung thư tế bào, viêm màng sừng, u da lành tính, nốt ruồi hắc tố và ung thư tế bào hắc tố chiếm tỷ lệ cao trong số các bệnh lý da liễu, ảnh hưởng trực tiếp đến chất lượng cuộc sống và thẩm mỹ của người bệnh. Việc phát hiện và phân loại chính xác các bệnh này ở giai đoạn sớm là rất cần thiết để kiểm soát và điều trị hiệu quả, đồng thời giảm tải cho các cơ sở y tế hiện đang quá tải do phương pháp xét nghiệm truyền thống tốn nhiều thời gian.

Luận văn tập trung xây dựng hệ thống phân loại bệnh da người sử dụng mạng nơ-ron tích chập (CNN) dựa trên bộ dữ liệu ảnh bệnh da ISIC 2018 với khoảng 1000 ảnh thuộc 5 loại bệnh phổ biến. Mục tiêu chính là phát triển một mô hình học sâu có khả năng nhận dạng và phân loại bệnh da với độ chính xác cao, thời gian xử lý nhanh hơn so với các phương pháp truyền thống. Nghiên cứu được thực hiện trong phạm vi ảnh bệnh da thu thập từ nguồn dữ liệu trực tuyến, với ảnh đầu vào được tiền xử lý để chuẩn hóa kích thước và giá trị pixel, nhằm tối ưu hiệu suất mạng CNN.

Việc ứng dụng mạng CNN trong phân loại bệnh da không chỉ hỗ trợ bác sĩ trong chuẩn đoán lâm sàng mà còn góp phần nâng cao hiệu quả chăm sóc sức khỏe cộng đồng. Các chỉ số đánh giá hiệu suất như độ chính xác phân loại và ma trận nhầm lẫn được sử dụng để đo lường kết quả, giúp minh chứng tính khả thi và hiệu quả của phương pháp đề xuất.

Cơ sở lý thuyết và phương pháp nghiên cứu

Khung lý thuyết áp dụng

Luận văn dựa trên các lý thuyết và mô hình sau:

  • Mạng nơ-ron tích chập (CNN): Là mô hình học sâu phổ biến trong nhận dạng và phân loại hình ảnh, CNN sử dụng các lớp tích chập để trích xuất đặc trưng cục bộ từ ảnh đầu vào, kết hợp với các lớp kích hoạt phi tuyến ReLU, lớp lấy mẫu (Pooling) và lớp kết nối đầy đủ (Fully Connected) để xây dựng mô hình phân loại hiệu quả.

  • Tích chập tách rời theo chiều sâu (Depthwise Separable Convolution): Kỹ thuật này giúp giảm đáng kể số lượng tham số và phép tính trong mạng CNN bằng cách tách phép tích chập truyền thống thành hai bước: tích chập theo chiều sâu và tích chập hướng, từ đó tăng tốc độ xử lý mà vẫn giữ được độ chính xác.

  • Phân tích thành phần chính (PCA)Ma trận đồng mức xám (GLCM): Các phương pháp trích đặc trưng ảnh được sử dụng trong các nghiên cứu liên quan để phân tích kết cấu và màu sắc của ảnh bệnh da, hỗ trợ cho việc phân loại.

  • Thuật toán ma trận nhầm lẫn (Confusion Matrix): Dùng để đánh giá hiệu suất phân loại của mô hình, cho phép xác định tỷ lệ chính xác, sai lệch giữa các lớp bệnh.

Các khái niệm chính bao gồm: lớp tích chập, lớp kích hoạt phi tuyến ReLU, lớp lấy mẫu lớn nhất (Max Pooling), lớp kết nối đầy đủ, hàm Softmax, và các tham số kernel trong mạng CNN.

Phương pháp nghiên cứu

  • Nguồn dữ liệu: Sử dụng bộ dữ liệu ảnh bệnh da ISIC 2018, gồm khoảng 10.000 ảnh với 7 loại bệnh, trong đó luận văn chọn 5 loại bệnh phổ biến với tổng số khoảng 1000 ảnh để huấn luyện và kiểm thử.

  • Tiền xử lý dữ liệu: Ảnh gốc có kích thước 600x450 pixels được giảm xuống còn 150x100 pixels để tiết kiệm thời gian xử lý, đồng thời chuẩn hóa giá trị pixel về khoảng từ 0 đến 1 nhằm tăng hiệu quả huấn luyện mạng CNN.

  • Phương pháp phân tích: Xây dựng và huấn luyện mạng CNN với các cấu trúc khác nhau gồm 3 lớp tích chập và 4 lớp tích chập, sử dụng hai loại kernel kích thước (3x3) và (5x5). Áp dụng kỹ thuật tích chập tách rời theo chiều sâu để giảm số lượng tham số và tăng tốc độ xử lý.

  • Cỡ mẫu và chọn mẫu: Tập dữ liệu gồm khoảng 1000 ảnh được chia thành tập huấn luyện và tập kiểm thử, đảm bảo cân bằng giữa các loại bệnh để tránh lệch dữ liệu.

  • Phần mềm và công cụ: Lập trình bằng ngôn ngữ Python trên môi trường Visual Studio Code, sử dụng các thư viện học sâu để xây dựng và huấn luyện mô hình.

  • Timeline nghiên cứu: Quá trình thu thập dữ liệu, tiền xử lý, xây dựng mô hình, huấn luyện và đánh giá được thực hiện trong khoảng thời gian từ đầu năm đến tháng 5 năm 2020.

Kết quả nghiên cứu và thảo luận

Những phát hiện chính

  1. Hiệu suất phân loại với 3 lớp tích chập: Mạng CNN với 3 lớp tích chập và kernel (3x3) đạt độ chính xác khoảng 85%, trong khi kernel (5x5) cho kết quả tương tự nhưng thời gian huấn luyện lâu hơn do kích thước kernel lớn hơn.

  2. Hiệu suất phân loại với 4 lớp tích chập: Mạng CNN 4 lớp tích chập cải thiện độ chính xác lên khoảng 88%, đặc biệt khi sử dụng kernel (3x3), cho thấy việc tăng số lớp tích chập giúp trích xuất đặc trưng sâu hơn, nâng cao khả năng phân biệt các loại bệnh da.

  3. Ứng dụng tích chập tách rời theo chiều sâu: Kỹ thuật này giảm số phép nhân từ hơn 1 triệu xuống khoảng 54 nghìn, giúp mô hình nhẹ hơn và tăng tốc độ xử lý mà vẫn duy trì độ chính xác phân loại tương đương với CNN truyền thống.

  4. Đánh giá bằng ma trận nhầm lẫn: Các phần tử trên đường chéo của ma trận nhầm lẫn chiếm trên 85% tổng số mẫu kiểm thử, chứng tỏ mô hình phân loại chính xác đa số các trường hợp, trong khi các sai lệch chủ yếu xảy ra giữa các bệnh có đặc điểm hình ảnh tương tự.

Thảo luận kết quả

Nguyên nhân chính giúp mô hình CNN đạt hiệu quả cao là do việc tiền xử lý ảnh kỹ lưỡng, bao gồm chuẩn hóa và giảm kích thước ảnh, giúp mạng học sâu tập trung vào các đặc trưng quan trọng. Việc sử dụng kernel nhỏ (3x3) trong các lớp tích chập giúp mạng học được các đặc trưng cục bộ chi tiết hơn, đồng thời giảm thiểu số lượng tham số so với kernel lớn (5x5).

So với các nghiên cứu trước đây sử dụng SVM hoặc MLP, mô hình CNN trong luận văn cho kết quả vượt trội về độ chính xác và khả năng xử lý ảnh phức tạp. Kỹ thuật tích chập tách rời theo chiều sâu là một bước tiến quan trọng, giúp giảm tải tính toán, phù hợp với các ứng dụng thời gian thực hoặc thiết bị có cấu hình hạn chế.

Kết quả có thể được trình bày qua biểu đồ so sánh độ chính xác giữa các cấu trúc mạng và bảng ma trận nhầm lẫn minh họa tỷ lệ phân loại đúng/sai của từng loại bệnh, giúp trực quan hóa hiệu quả mô hình.

Đề xuất và khuyến nghị

  1. Mở rộng bộ dữ liệu ảnh thực tế: Thu thập thêm ảnh bệnh da từ các bệnh viện và cơ sở y tế để tăng tính đa dạng và thực tiễn cho mô hình, giúp cải thiện độ chính xác và khả năng tổng quát hóa. Thời gian thực hiện dự kiến 6-12 tháng, do các cơ sở y tế phối hợp.

  2. Tối ưu hóa mô hình CNN cho thiết bị di động: Áp dụng kỹ thuật tích chập tách rời theo chiều sâu và các phương pháp nén mô hình để triển khai trên các thiết bị di động hoặc hệ thống nhúng, phục vụ chẩn đoán tại chỗ. Chủ thể thực hiện là nhóm nghiên cứu kỹ thuật điện tử trong 3-6 tháng.

  3. Phát triển giao diện ứng dụng thân thiện: Xây dựng phần mềm hoặc ứng dụng di động tích hợp mô hình CNN để người dùng cuối, đặc biệt là bác sĩ và nhân viên y tế, dễ dàng sử dụng trong quá trình khám bệnh. Thời gian phát triển khoảng 4-6 tháng.

  4. Nâng cao độ chính xác bằng học tăng cường và dữ liệu tổng hợp: Áp dụng các kỹ thuật học sâu nâng cao như học tăng cường, tăng cường dữ liệu (data augmentation) để cải thiện khả năng nhận dạng các trường hợp bệnh da hiếm hoặc khó phân biệt. Chủ thể thực hiện là nhóm nghiên cứu AI trong 6 tháng.

Đối tượng nên tham khảo luận văn

  1. Bác sĩ da liễu và nhân viên y tế: Có thể ứng dụng mô hình để hỗ trợ chẩn đoán nhanh, giảm thiểu sai sót và tăng hiệu quả điều trị bệnh ngoài da.

  2. Nhà nghiên cứu và sinh viên ngành kỹ thuật điện tử, công nghệ thông tin: Tham khảo phương pháp xây dựng và huấn luyện mạng CNN, kỹ thuật tích chập tách rời theo chiều sâu trong xử lý ảnh y tế.

  3. Các công ty phát triển phần mềm y tế và thiết bị chẩn đoán hình ảnh: Áp dụng mô hình và thuật toán để phát triển sản phẩm hỗ trợ chẩn đoán bệnh da tự động, nâng cao giá trị sản phẩm.

  4. Cơ quan quản lý y tế và giáo dục: Sử dụng kết quả nghiên cứu để định hướng phát triển công nghệ y tế số, đào tạo nhân lực chuyên môn về AI trong y học.

Câu hỏi thường gặp

  1. Mạng nơ-ron tích chập (CNN) là gì và tại sao được chọn cho phân loại bệnh da?
    CNN là mô hình học sâu chuyên xử lý dữ liệu hình ảnh, có khả năng tự động trích xuất đặc trưng từ ảnh. CNN được chọn vì độ chính xác cao và khả năng học các đặc điểm phức tạp của bệnh da mà các phương pháp truyền thống khó đạt được.

  2. Tại sao cần tiền xử lý ảnh trước khi đưa vào mạng CNN?
    Tiền xử lý như giảm kích thước và chuẩn hóa giúp giảm tải tính toán, tăng tốc độ huấn luyện và đảm bảo dữ liệu đầu vào đồng nhất, từ đó nâng cao hiệu quả và độ chính xác của mô hình.

  3. Phương pháp tích chập tách rời theo chiều sâu có ưu điểm gì so với tích chập truyền thống?
    Phương pháp này giảm đáng kể số lượng tham số và phép tính, giúp mô hình nhẹ hơn, xử lý nhanh hơn mà vẫn giữ được độ chính xác tương đương, rất phù hợp cho các ứng dụng thời gian thực hoặc thiết bị có cấu hình hạn chế.

  4. Làm thế nào để đánh giá hiệu quả của mô hình phân loại bệnh da?
    Hiệu quả được đánh giá qua các chỉ số như độ chính xác (accuracy), ma trận nhầm lẫn (confusion matrix) để xác định tỷ lệ phân loại đúng và sai giữa các lớp bệnh, giúp đánh giá toàn diện khả năng phân loại của mô hình.

  5. Mô hình này có thể áp dụng cho các loại bệnh da khác ngoài 5 loại đã nghiên cứu không?
    Có thể mở rộng mô hình cho các loại bệnh khác bằng cách thu thập thêm dữ liệu và huấn luyện lại mạng CNN, tuy nhiên cần đảm bảo dữ liệu đủ lớn và đa dạng để mô hình học được đặc trưng của các bệnh mới.

Kết luận

  • Mạng nơ-ron tích chập (CNN) được chứng minh là công cụ hiệu quả trong phân loại 5 loại bệnh da phổ biến với độ chính xác trên 85%.
  • Kỹ thuật tích chập tách rời theo chiều sâu giúp giảm đáng kể số lượng phép tính, tăng tốc độ xử lý mà không làm giảm hiệu suất phân loại.
  • Việc tiền xử lý ảnh đóng vai trò quan trọng trong việc nâng cao hiệu quả huấn luyện và phân loại của mạng CNN.
  • Luận văn đề xuất các hướng phát triển tiếp theo như mở rộng dữ liệu thực tế, tối ưu mô hình cho thiết bị di động và phát triển ứng dụng hỗ trợ chẩn đoán.
  • Các kết quả nghiên cứu có thể ứng dụng rộng rãi trong y tế, công nghệ thông tin và phát triển sản phẩm y tế số, góp phần nâng cao chất lượng chăm sóc sức khỏe cộng đồng.

Để tiếp tục phát triển, cần triển khai thu thập dữ liệu thực tế, thử nghiệm mô hình trên các nền tảng khác nhau và xây dựng giao diện ứng dụng thân thiện. Mời các nhà nghiên cứu và chuyên gia trong lĩnh vực cùng hợp tác để hoàn thiện và ứng dụng rộng rãi công nghệ này.