Phân loại ảnh X-quang phổi hỗ trợ chẩn đoán bệnh sử dụng học máy

Tài liệu nghiên cứu Phân loại ảnh chụp xquang phổi trong hỗ trợ chẩn đoán bệnh sử dụng học máy, tổng hợp lý thuyết và thực hành, cung cấp kiến thức chuyên sâu về .

Trường đại học

Học viện Công nghệ Bưu chính Viễn thông

Chuyên ngành

Công nghệ thông tin

Người đăng

Ẩn danh

Thể loại

đồ án tốt nghiệp

2021

Phí lưu trữ

30 Point

Mục lục chi tiết

LỜI CẢM ƠN

1. CHƯƠNG 1: BÀI TOÁN PHÂN LOẠI HÌNH ẢNH X-QUANG PHỔI

1.1. Bài toán phân loại hình ảnh x-quang phổi trong hỗ trợ chẩn đoán bệnh

1.2. Các hướng tiếp cận giải quyết bài toán

1.2.1. K láng giềng gần nhất — K Nearest Neighbor

1.2.2. Cây quyết định - Decision Tree

1.2.3. Mạng nơ ron tích chập - Convolutional neural network

1.2.4. Đề xuất hướng tiếp cận đồ án

1.3. Kết luận chương

2. CHƯƠNG 2: PHÂN LOẠI ẢNH X-QUANG BẰNG MẠNG NƠ RON TÍCH CHẬP CNNS

2.1. Giới thiệu về CNNs

2.2. Mạng nơ-ron tích chập - CNNs

2.3. Kiến trúc của mạng CNNs

2.3.1. Lớp tính chập - Convolutional layer

2.3.2. Lớp gộp - Pooling layer

2.3.3. Lớp ReLU - ReLU layer

2.3.4. Lớp kết nối đầy đủ - Fully connected layer

2.4. Quá trình huấn luyện mạng CNNs

2.4.1. Tiền xử lý và tăng cường dữ liệu

2.4.2. Khởi tạo tham số

2.4.3. Chính quy hóa cho CNNs

2.4.4. Lựa chọn trình tối ưu hóa

2.5. Mạng nơ ron VGG

2.5.1. Giới thiệu về mạng VGG

2.5.2. Kiến trúc mạng VGG

2.6. Kết luận chương

3. CHƯƠNG 3: THỬ NGHIỆM VÀ ĐÁNH GIÁ

3.1. Công cụ và môi trường

3.1.1. Môi trường

3.2. Các bước xử lý bài toán

3.2.1. Thu thập dữ liệu

3.2.2. Tiền xử lý và tăng cường dữ liệu

3.2.3. Xây dựng model huấn luyện

3.2.4. Phương pháp đánh giá model

3.2.4.1. Phương pháp k-fold cross validation (đánh giá chéo)

3.2.4.2. Phương pháp phân tích kết quả model

3.2.5. Kết quả tính toán

3.2.6. Chương trình ứng dụng mô hình thu được

3.2.6.1. Mô tả ứng dụng

3.2.6.2. Kịch bản chuẩn của ứng dụng

3.2.6.3. Trình bày ứng dụng

3.3. Kết luận chương

KẾT LUẬN

TÀI LIỆU THAM KHẢO

Tóm tắt

I. Tổng Quan Về Phân Loại Ảnh X Quang Phổi Bằng Học Máy

Bài toán phân loại ảnh X-quang phổi đang ngày càng trở nên quan trọng trong bối cảnh y tế hiện đại. Nó giúp hỗ trợ chẩn đoán các bệnh phổi một cách nhanh chóng và chính xác. Việc ứng dụng học máy vào phân tích ảnh X-quang không chỉ giúp giảm tải công việc cho các bác sĩ mà còn có thể phát hiện các dấu hiệu bệnh lý tinh vi mà mắt thường khó nhận ra. Đồ án này tập trung vào việc xây dựng và đánh giá các mô hình học máy để phân loại ảnh X-quang thành các nhóm bệnh khác nhau, bao gồm phổi bình thường, viêm phổi và COVID-19. Mục tiêu cuối cùng là tạo ra một công cụ hỗ trợ đắc lực cho các bác sĩ trong quá trình chẩn đoán và điều trị bệnh nhân, góp phần nâng cao hiệu quả chăm sóc sức khỏe cộng đồng. Việc cải thiện độ chính xác chẩn đoán là yếu tố then chốt.

1.1. Ứng Dụng Trí Tuệ Nhân Tạo AI Trong Chẩn Đoán Hình Ảnh

Trí tuệ nhân tạo (AI) trong y tế, đặc biệt trong chẩn đoán hình ảnh, đang chứng kiến sự phát triển vượt bậc. Các thuật toán học máy, đặc biệt là Deep Learning, đã chứng minh khả năng vượt trội trong việc phân tích và diễn giải các hình ảnh y tế, bao gồm cả ảnh X-quang phổi. AI không chỉ giúp tự động hóa quy trình chẩn đoán mà còn có thể cung cấp thông tin chi tiết và khách quan hơn so với phương pháp truyền thống. Sự kết hợp giữa AI và kinh nghiệm của bác sĩ hứa hẹn mang lại những bước tiến lớn trong việc phát hiện và điều trị các bệnh lý phức tạp.

1.2. Tầm Quan Trọng Của Bộ Dữ Liệu X Quang Phổi Lớn

Để xây dựng các mô hình học máy hiệu quả, việc có một bộ dữ liệu X-quang phổi đủ lớn và chất lượng là vô cùng quan trọng. Dữ liệu cần phải đa dạng, bao gồm nhiều trường hợp bệnh khác nhau, cũng như ảnh của người khỏe mạnh để đảm bảo tính tổng quát của mô hình. Bộ dữ liệu X-quang phổi chất lượng cao giúp mô hình học máy học được các đặc trưng quan trọng, từ đó cải thiện độ chính xác và độ tin cậy của quá trình phân loại. Việc thu thập và xử lý dữ liệu y tế đòi hỏi tuân thủ nghiêm ngặt các quy định về bảo mật thông tin cá nhân.

II. Thách Thức Trong Phân Loại Ảnh X Quang Phổi Chính Xác

Mặc dù có nhiều tiềm năng, việc phân loại ảnh X-quang bằng học máy vẫn đối mặt với nhiều thách thức. Sự biến đổi lớn về hình ảnh, do sự khác biệt về thiết bị chụp, tư thế bệnh nhân và giai đoạn bệnh, gây khó khăn cho việc xây dựng các mô hình có khả năng khái quát hóa tốt. Ngoài ra, sự thiếu hụt dữ liệu có nhãn, đặc biệt là với các bệnh hiếm gặp, cũng là một trở ngại lớn. Một thách thức khác là đảm bảo tính minh bạch và giải thích được của các mô hình học máy, giúp bác sĩ hiểu rõ cơ sở của các quyết định chẩn đoán và tin tưởng vào hệ thống. Việc giải thích mô hình học máy là rất quan trọng.

2.1. Vấn Đề Về Chất Lượng Và Sự Đa Dạng Dữ Liệu

Chất lượng và sự đa dạng của dữ liệu là yếu tố then chốt ảnh hưởng đến hiệu suất của các mô hình học máy. Ảnh X-quang có thể bị nhiễu, độ phân giải thấp, hoặc có các artifact do quá trình chụp. Sự khác biệt về chủng tộc, tuổi tác, giới tính và tiền sử bệnh lý của bệnh nhân cũng tạo ra sự đa dạng trong hình ảnh. Việc xử lý trước ảnh, bao gồm loại bỏ nhiễu, chuẩn hóa độ tương phản và tăng cường độ phân giải, là cần thiết để cải thiện chất lượng dữ liệu. Các kỹ thuật xử lý ảnh y tế đóng vai trò quan trọng.

2.2. Khó Khăn Trong Việc Thu Thập Dữ Liệu Có Nhãn Đầy Đủ

Việc gán nhãn cho ảnh X-quang đòi hỏi chuyên môn cao và tốn nhiều thời gian. Các bác sĩ X-quang cần phải xem xét kỹ lưỡng từng ảnh và đưa ra kết luận chẩn đoán. Sự thiếu hụt bác sĩ có kinh nghiệm và thời gian hạn chế khiến việc thu thập dữ liệu có nhãn trở nên khó khăn. Các kỹ thuật học bán giám sát và học không giám sát có thể được sử dụng để tận dụng dữ liệu không nhãn, nhưng vẫn cần phải đảm bảo tính chính xác của nhãn được gán.

III. Ứng Dụng Mạng Nơ Ron Tích Chập CNNs Để Phân Loại Ảnh

Mạng nơ-ron tích chập (CNN) đã chứng minh là một công cụ mạnh mẽ trong việc phân tích ảnh, bao gồm cả ảnh X-quang. CNN có khả năng tự động học các đặc trưng quan trọng từ dữ liệu, giúp giảm bớt công đoạn trích xuất đặc trưng thủ công. Kiến trúc của CNN được thiết kế đặc biệt để xử lý dữ liệu hình ảnh, với các lớp tích chập, lớp gộp và lớp kết nối đầy đủ. Việc huấn luyện CNN đòi hỏi một lượng lớn dữ liệu và tài nguyên tính toán, nhưng kết quả đạt được thường rất ấn tượng. Transfer Learning giúp giảm thiểu nhu cầu dữ liệu.

3.1. Kiến Trúc CNNs Phù Hợp Với Phân Loại Ảnh X Quang

Kiến trúc của CNN bao gồm các lớp tích chập (Convolutional layers), lớp gộp (Pooling layers), và lớp kết nối đầy đủ (Fully connected layers). Lớp tích chập sử dụng các bộ lọc để trích xuất các đặc trưng từ ảnh. Lớp gộp giảm kích thước của ảnh và làm cho mô hình ít nhạy cảm hơn với sự thay đổi vị trí của các đặc trưng. Lớp kết nối đầy đủ sử dụng các đặc trưng đã trích xuất để phân loại ảnh. Mạng nơ-ron tích chập (CNN) là lựa chọn tối ưu.

3.2. Kỹ Thuật Tăng Cường Dữ Liệu Để Cải Thiện Hiệu Suất CNNs

Để cải thiện hiệu suất của CNNs, đặc biệt khi dữ liệu huấn luyện hạn chế, các kỹ thuật tăng cường dữ liệu (Data Augmentation) có thể được sử dụng. Các kỹ thuật này bao gồm xoay ảnh, lật ảnh, thay đổi độ sáng, và thêm nhiễu. Việc tăng cường dữ liệu giúp mô hình học được các đặc trưng tổng quát hơn và giảm thiểu tình trạng overfitting. Các kỹ thuật tăng cường dữ liệu là rất quan trọng.

3.3. Sử Dụng Transfer Learning Với Các Mô Hình CNNs Tiền Huấn Luyện

Transfer Learning là một kỹ thuật mạnh mẽ cho phép tận dụng kiến thức đã học được từ các mô hình CNNs được huấn luyện trên các bộ dữ liệu lớn (ví dụ: ImageNet) để áp dụng vào các bài toán mới với dữ liệu hạn chế. Việc sử dụng các mô hình tiền huấn luyện giúp giảm đáng kể thời gian huấn luyện và cải thiện hiệu suất của mô hình trên dữ liệu X-quang. Transfer Learning là một giải pháp hiệu quả.

IV. Đánh Giá Độ Chính Xác Của Mô Hình Phân Loại Ảnh X Quang

Việc đánh giá mô hình học máy là bước quan trọng để đảm bảo tính tin cậy và hiệu quả của hệ thống. Các chỉ số đánh giá phổ biến bao gồm độ chính xác (accuracy), độ nhạy (sensitivity), độ đặc hiệu (specificity) và diện tích dưới đường cong ROC (AUC). Phương pháp đánh giá chéo (cross-validation) giúp đảm bảo tính tổng quát của kết quả. Việc so sánh hiệu suất của các mô hình khác nhau giúp lựa chọn mô hình tốt nhất cho bài toán phân loại ảnh X-quang phổi. Cần cải thiện độ chính xác chẩn đoán.

4.1. Các Chỉ Số Đánh Giá Quan Trọng Accuracy Sensitivity Specificity

Accuracy (độ chính xác) cho biết tỷ lệ ảnh được phân loại đúng trên tổng số ảnh. Sensitivity (độ nhạy) cho biết tỷ lệ ảnh của bệnh nhân mắc bệnh được phân loại đúng. Specificity (độ đặc hiệu) cho biết tỷ lệ ảnh của người khỏe mạnh được phân loại đúng. Các chỉ số này cung cấp cái nhìn toàn diện về hiệu suất của mô hình. Cần phân tích các chỉ số TP, TN, FP, FN để hiểu rõ hiệu quả của mô hình.

4.2. Phương Pháp K Fold Cross Validation Đánh Giá Chéo

K-Fold Cross-Validation là một phương pháp đánh giá mô hình học máy bằng cách chia dữ liệu thành k phần (folds). Mô hình được huấn luyện trên k-1 phần và đánh giá trên phần còn lại. Quá trình này được lặp lại k lần, mỗi lần một phần khác nhau được sử dụng để đánh giá. Kết quả cuối cùng là trung bình của các kết quả đánh giá trên từng phần. Phương pháp này giúp đánh giá tính tổng quát của mô hình và giảm thiểu tình trạng overfitting. Phương pháp k-fold cross validation (đánh giá chéo) rất hữu ích.

V. Ứng Dụng Thực Tế Và Triển Vọng Của Hệ Thống Chẩn Đoán

Hệ thống phân loại ảnh X-quang phổi có thể được tích hợp vào các hệ thống hỗ trợ quyết định lâm sàng, giúp bác sĩ đưa ra chẩn đoán nhanh chóng và chính xác hơn. Ứng dụng có thể được triển khai trên web, trên điện thoại di động, hoặc tích hợp vào các hệ thống PACS (Picture Archiving and Communication System). Trong tương lai, hệ thống có thể được mở rộng để phát hiện nhiều bệnh lý phổi khác nhau, cũng như tích hợp các thông tin lâm sàng khác để đưa ra chẩn đoán toàn diện hơn. Việc phát triển ứng dụng học máy trong y học là xu hướng tất yếu.

5.1. Tích Hợp Vào Hệ Thống Hỗ Trợ Quyết Định Lâm Sàng

Hệ thống phân loại ảnh X-quang có thể cung cấp thông tin bổ sung cho bác sĩ trong quá trình chẩn đoán. Thông tin này có thể bao gồm xác suất mắc bệnh, các vùng nghi ngờ trên ảnh, và các đặc trưng quan trọng đã được mô hình học được. Sự kết hợp giữa thông tin từ hệ thống và kinh nghiệm của bác sĩ giúp đưa ra quyết định chẩn đoán chính xác và nhanh chóng hơn. Các hệ thống hỗ trợ quyết định lâm sàng rất quan trọng.

5.2. Triển Khai Ứng Dụng Trên Web Và Thiết Bị Di Động

Việc triển khai ứng dụng trên web và thiết bị di động giúp hệ thống dễ dàng tiếp cận với người dùng, đặc biệt là ở các vùng sâu vùng xa. Bác sĩ có thể tải ảnh X-quang lên ứng dụng và nhận kết quả phân loại trong thời gian ngắn. Ứng dụng cũng có thể cung cấp các thông tin hữu ích khác, như hướng dẫn chẩn đoán và điều trị. Ứng dụng trên web và thiết bị di động mang lại sự tiện lợi.

VI. Kết Luận Và Hướng Phát Triển Cho Nghiên Cứu Tương Lai

Bài toán phân loại ảnh X-quang phổi bằng học máy có tiềm năng to lớn trong việc cải thiện chất lượng chẩn đoán và điều trị bệnh lý hô hấp. Nghiên cứu đã trình bày một số phương pháp tiếp cận hiệu quả, đặc biệt là sử dụng mạng nơ-ron tích chập (CNN). Trong tương lai, nghiên cứu có thể tập trung vào việc cải thiện độ chính xác của mô hình, mở rộng phạm vi ứng dụng và tăng cường tính giải thích được của kết quả. Cần tiếp tục nghiên cứu và phát triển trí tuệ nhân tạo (AI) trong y tế.

6.1. Cải Thiện Độ Chính Xác Và Tính Tổng Quát Của Mô Hình

Việc cải thiện độ chính xác và tính tổng quát của mô hình là mục tiêu quan trọng trong nghiên cứu tương lai. Điều này có thể đạt được bằng cách sử dụng các kiến trúc CNNs tiên tiến hơn, tăng cường dữ liệu huấn luyện, và áp dụng các kỹ thuật regularization để tránh overfitting. Cần cải thiện độ chính xác chẩn đoán.

6.2. Khám Phá Các Phương Pháp Học Máy Mới Ví Dụ Graph Neural Networks

Ngoài CNNs, có nhiều phương pháp học máy khác có thể được áp dụng cho bài toán phân loại ảnh X-quang, chẳng hạn như Graph Neural Networks (GNNs). GNNs có khả năng biểu diễn các mối quan hệ giữa các vùng khác nhau trên ảnh, giúp trích xuất các đặc trưng phức tạp hơn. Việc khám phá các phương pháp học máy mới có thể mang lại những đột phá trong lĩnh vực này.

23/05/2025

Bạn đang xem trước tài liệu:

Phân loại ảnh chụp xquang phổi trong hỗ trợ chẩn đoán bệnh sử dụng học máy

Tải đầy đủ

Trích đoạn nội dung tài liệu

chương 1. Giới thiệu về CNNs 2.Mạng nơ ron Mạng nơ-ron nhân tạo - Artificial Neural Network [8] (ANN) được lấy cảm hứng từ quá trình xử lý thông tin và các nút giao tiếp phân tán trong các hệ thống sinh học. ANN có nhiều điểm khác biệt so với não sinh hoc. Cu thé, mạng lưới thần kinh có xu hướng tinh và tượng trưng, trong khi bộ não sinh học của hầu hết các sinh vật sống là động.

Mạng nơ-ron là các thuật toán, tính toán từ đầu vào x (ví dụ: hình ảnh), đầu ra y. Như thể hiện trong hình 2.1, đầu ra này thường là một tập hợp các xác suất: ví dụ đầu ra đầu tiên là xác suât mà hình ảnh có chứa một con mèo (con sô nay cảng gân 100%, điêu đó Lê Trường Long - B17DCAT115 13 Chương 2: Phân loại ảnh x-quang bằng mạng nơ ron tích chập CNNs có nghĩa là thuật toán chắc chắn chính nó), thứ hai là xác suất mà hình ảnh có chứa một con chó, v. Dé đơn giản hóa, xét trong vi dụ cụ thê hai lớp: mèo và chó. Về mặt toán học [12], một thuật toán như vậy xác định một hàm f.

Chương trình máy tính tính toán chức năng này rất đơn giản: nó được tạo thành từ một chuỗi gồm nhiều giai đoạn và mỗi giai đoạn thực hiện các phép tính cơ bản (cộng, nhân và tối đa). Trong khi đó, các chương trình máy tính được tìm thấy trong hệ điều hành của máy tính phức tạp hơn nhiều. Nhưng điều tạo ra sự khác biệt lớn giữa thuật toán “cổ điển” va mạng nơ-ron là thuật toán nơ-ron phụ thuộc vào các tham số, là trọng số của các nơ-ron. Trước khi sử dụng mạng nơron, các trọng số này phải được sửa đổi dé thuật toán có thê giải quyết tốt nhất tác vụ được yêu cầu.

Điều này được thực hiện băng cách sử dụng các phương pháp toán học và thuật toán sẽ được giải thích trong các phần sau. Quá trình này được gọi là “đào tạo” một mạng nơ-ron, và quá trình này đòi hỏi nhiều thời gian, máy móc tính toán và năng lượng. Các nơ-ron tính tông trọng sô của các tín hiệu đâu vào và so sánh kêt quả với giá trị ngưỡng,Ø. Nêu dau vào mạng nhỏ hơn ngưỡng, dau ra nơ-ron là -1.

Nhưng nêu đâu vào lớn hơn hoặc bằng ngưỡng, nơ-ron sẽ được kích hoạt va đầu ra của nó đạt giá trị +1. Nói cách khác, noron sử dụng chức năng truyền hoặc hàm kích hoạt [9]: Y= tự X<0 (2.1) X = 3ï-iXiW 1,X20 Trong đó X là dau vào có trọng sô cua noron, x; là gia tri cua dau vao 1, wi là trọng sô của đâu vao i, n là sô đâu vào của noron và Y là đâu ra của nơron. Loại hàm kích hoạt này được gọi là hàm ký hiệu (sign function). Do đó, đầu ra thực tế của nơ-ron có chức năng kích hoạt dấu hiệu có thê được biểu diễn dưới dạng [9]: Y = sign[3?—oX¡W;¡ — 9] (2.2) Các hàm kích hoạt bước và dấu hiệu, còn được gọi là hàm giới hạn cứng, thường được sử dụng trong các nơ-ron ra quyét định cho các nhiệm vụ phân loại và nhận dạng mâu.

Lê Trường Long - B17DCAT115 14 Chương 2: Phân loại ảnh x-quang bằng mạng nơ ron tích chập CNNs 2.Mạng nơ-ron tích chập - CNNs Nền tảng của mạng nơ-ron tích hợp bắt đầu từ phát hiện của Hubel và Wiesel vào năm 1959. Năm 1980, Kunihiko Fukushima đề xuất Neocognitron, là một Mạng thần kinh tự tổ chức, chứa nhiều lớp, có khả năng nhận dang các mẫu hình ảnh phân cấp thông qua học tập và kiến trúc này đã trở thành mô hình lý thuyết đầu tiên của CNN. Năm 1989, LeCun đã thực hiện một cải tiến lớn đối với kiến trúc của Neocognitron bang cach phat triển một khuôn khô hiện đại của CNNs, được gọi là LeNet-5. LeNet-5 đã được đào tạo băng cách sử dụng thuật toán lan truyền ngược lỗi và nó có thể nhận ra các mẫu trực quan trực tiếp từ các hình ảnh đầu vào thô mà không cần sử dụng bất kỳ cơ chế kỹ thuật tính năng riêng biệt nào [4].

Sau khi phát hiện ra LeNet-5, vì một số hạn chế như thiếu dữ liệu đào tạo lớn, thiếu đổi mới trong thuật toán và khả năng tính toán không đầy đủ, CNNs đã không thực hiện tốt các bài toán phức tạp khác nhau. Nhưng ngày nay, trong kỷ nguyên Dữ liệu lớn, chúng ta có các bộ dt liệu được gắn nhãn lớn, các thuật toán sáng tạo hơn và đặc biệt là các máy GPU mạnh mẽ. CNNs có một lớp đầu vào, lớp đầu ra và các lớp ân. Các lớp an thường bao gồm các convolutional layer (lớp tích chập), ReLU layer (lớp ReLU), pooling layer (lớp gộp) và Fully connected layer (lớp kết nối đầy đủ).

CLonvalyutier Trong lớp tích chập, các tế bào thần kinh chỉ nhận đầu vào từ một vùng con của lớp trước đó. Trong lớp được kết nối đầy đủ, mỗi nơron nhận đầu vào từ mọi phần tử của lớp trước đó. CNNs hoạt động bằng cách trích xuất các tính năng, đặc trưng từ hình ảnh. Điều này giúp loại bỏ nhu cầu khai thác tính năng thủ công.

Các tính năng không được huấn luyện. Lê Trường Long - B17DCAT115 15 Chương 2: Phân loại ảnh x-quang bằng mạng nơ ron tích chập CNNs Chúng được học trong khi mạng huấn luyện về một tập hợp các hình ảnh. Điều này làm cho các mô hình học sâu cực kỳ chính xác cho các tác vụ thị giác máy tính. CNNs học cách phát hiện đặc tính thông qua hàng chục hoặc hàng trăm lớp ẩn.

Mỗi lớp làm tăng độ phức tạp của các đặc tính đã học. Kiến trúc của mạng CNNs 2. Lớp tính chập - Convolutional layer Convolutional layer [18] (lớp tích chập) là thành phần cốt lõi của bất kỳ cấu trúc CNNs nào. Mục đích chính của lớp tích chập là trích xuất các đặc trưng từ hình anh đầu vào.

Do đó lớp tích chập luôn là lớp dau tiên trong CNNs. Nó chứa một tập hợp các hạt nhân tích chập(convolution kernel) (còn được gọi là bộ lọc), được đối chiếu với hình ảnh đầu vào (số liệu N chiều) dé tạo ra một bản đồ đặc trưng (feature map) đầu ra. Hình 2-3 biểu diễn ba bước đầu của cách hoạt động lớp tích chập, trong đó hạt nhân 2 x 2 (được hiển thị bang màu xanh lam nhạt) được nhân với cùng một vung có kích thước (hiển thị bang màu vàng) trong hình anh đầu vào 4 x 4 và các giá trị kết quả được tong hợp dé có được mục nhập tương ứng (được hién thị bằng màu xanh lam đậm) trong bản đô tính năng đâu ra ở mỗi bước tích chập. : nh TE fea 0 & -1 2 mil 1 : 2 [ofa] Zs mm o| © aya} ~ +444 — Hình 2-3 Ba bước dau cách hoạt động của lớp tích chập [4] Sau khi thực hiện phép tính tích chập hoàn chỉnh, bản đồ đặc trưng đầu ra cuối cùng được hiền thị trong hình 2-4: Lê Trường Long - B17DCAT115 16 Chương 2: Phân loại ảnh x-quang bằng mạng nơ ron tích chập CNNs Hình 2-4 Bản đồ đặc trưng sau thực hiện phép tính tích chập hoàn chỉnh [4] Quá trình trượt các bộ lọc thường có các giá trị được quy định bao gồm: - Padding: quy định bộ đệm của bộ lọc hay chính là phần mau xám được thêm vào ảnh nói cách khác là các giá trị 0 được thêm vảo lớp input - Stride: kích thước bước đã thực hiện trượt theo vi trí ngang hoặc dọc.

Ví dụ: stride of one có nghĩa là bạn đang di chuyền bộ lọc của mình qua một pixel tại một thời điểm. Quy ước là stride of two. Công thức dé tìm kích thước bản đồ đặc trưng đầu ra như sau [4]: h’ = => + 1Ì s w' = => + 1| s (2.3) Trong đó h’ biểu thị chiều cao của bản đồ đạc trưng, w’ biểu thị chiều rộng của bản đồ, h biểu thị chiều cao của hình ảnh đầu vào, w biểu thị chiều rộng của hình ảnh đầu vào, f là kích thước bộ lọc, p biểu thị phần đệm của phép toán tích chập và s biểu thị bước nhảy của phép toán tích chập. Lớp gộp - Pooling layer Pooling layer [18] - lớp tong hợp/gộp được sử dung dé lay mẫu con ban đồ đặc trưng, tức là nó lấy bản đồ đặc trưng có kích thước lớn và thu nhỏ chúng thành bản đồ đối tượng có kích thước thấp hơn.

Trong khi thu nhỏ các bản đồ đặc trưng, nó luôn bảo toàn các đối tượng đặc tính (hoặc thông tin) nồi trội nhất trong mỗi bước gộp. Hoạt động gộp được thực hiện băng cách chỉ định kích thước vùng được gộp và bước của hoạt động, tương tự như hoạt động lớp tích chập. Có nhiều loại kỹ thuật gộp khác nhau được sử dụng trong các lớp gộp khác nhau như max pooling, min pooling, average pooling, gated pooling, tree pooling,. Max Pooling là kỹ thuật phổ biến nhất.

Max pooling là việc lay giá trị lớn nhất tại mỗi điểm trong hình ảnh. Điều này giúp loại bỏ 75% thông tin không phải là tính năng. Bằng cách lẫy giá tri tối da của pixel, bạn Lê Trường Long - B17DCAT115 17 Chương 2: Phân loại ảnh x-quang bằng mạng nơ ron tích chập CNNs đang tính đến sự biến dạng. Nếu tính năng xoay một chút sang trái hoặc phải hoặc bất cứ điều gi, thì tính năng gdp sẽ giống nhau.

Ta đang giảm kích thước và thông số. Điều đó có nghĩa là mô hình sẽ không phải xử lý quá nhiều thông tin đó. Công thức đề tìm kích thước bản đồ đặc trưng đầu ra sau khi gộp như sau [4]: wef] welts an Trong đó h’ biêu thi chiêu cao của ban đô đạc trưng, w’ biêu thị chiêu rộng của ban đồ, h biêu thị chiêu cao của hình ảnh đâu vào, w biêu thị chiêu rộng của hình ảnh đâu vảo, f là kích thước bộ lọc và s biểu thị bước nhảy của phép toán tích chập. Lớp ReLU - ReLU layer Trong CNNs, Rectified Linear Units [13] - các đơn vi tuyén tính được chỉnh lưu (viết tắt là ReLU) là một lớp áp dụng hàm kích được sử dụng phổ biến nhất trong CNNs.

Nó được sử dụng để chuyên đổi tất cả các giá trị đầu vào thành số đương. Ưu điểm của ReLU là nó yêu cầu tải tính toán rất nhỏ so với các loại khác. Công thức toán học của ReLU là [13]: f(u) = max (0, u) (2.5) Hình 2-5 Biểu đô biểu diễn hàm f(u) = max (0, u) [13] Ta áp dụng một hàm kích hoạt trên bản đồ đặc trưng đề tăng tính phi tuyến tính trong mạng. Điều này là do bản thân hình ảnh có độ phi tuyến tính cao.

Nó loại bỏ các giá trị âm khỏi bản đồ đặc trưng băng cách đặt chúng thành 0.

Nội dung được bảo vệ bản quyền — Tải xuống đầy đủ

Tài liệu "Phân loại ảnh X-quang phổi hỗ trợ chẩn đoán bệnh bằng học máy" trình bày một phương pháp tiên tiến trong việc sử dụng học máy để phân loại ảnh X-quang phổi, từ đó hỗ trợ các bác sĩ trong việc chẩn đoán bệnh. Bài viết nhấn mạnh tầm quan trọng của công nghệ này trong việc cải thiện độ chính xác và tốc độ chẩn đoán, giúp phát hiện sớm các bệnh lý phổi như viêm phổi, ung thư phổi và các bệnh lý khác.

Độc giả sẽ tìm thấy nhiều lợi ích từ tài liệu này, bao gồm việc hiểu rõ hơn về cách mà học máy có thể được áp dụng trong y tế, cũng như những thách thức và cơ hội trong lĩnh vực này. Để mở rộng kiến thức, bạn có thể tham khảo thêm tài liệu Luận án tiến sĩ giá trị của crp interleukin 6 và bảng câu hỏi cat trong chẩn đoán đợt cấp bệnh phổi tắc nghẽn mạn tính, nơi cung cấp cái nhìn sâu sắc về các chỉ số sinh học trong chẩn đoán bệnh phổi. Ngoài ra, tài liệu Hcmute phân tích cấu trúc ảnh cho phân loại bệnh da người cũng có thể giúp bạn hiểu thêm về ứng dụng của phân tích hình ảnh trong y học. Cuối cùng, tài liệu Luận văn thạc sĩ nghiên cứu một số phương pháp phát hiện và phân loại nhịp thở sử dụng mạng học sâu đa nhiệm sẽ cung cấp thêm thông tin về các phương pháp học sâu trong việc phân tích và chẩn đoán các vấn đề liên quan đến hô hấp. Những tài liệu này sẽ giúp bạn mở rộng hiểu biết và khám phá sâu hơn về các ứng dụng của công nghệ trong y tế.

#công nghệ học sâu

#học máy trong y tế

#chẩn đoán bệnh phổi

#phân tích hình ảnh y tế

#phân loại ảnh X-quang phổi

#trí tuệ nhân tạo trong chẩn đoán

Chủ đề

Ứng dụng trí tuệ nhân tạo

Chẩn đoán bệnh phổi

Công nghệ học máy trong y tế

Phân tích hình ảnh y tế