ĐẠI HỌC THÁI NGUYÊN TRƯỜNG ĐẠI HỌC CÔNG NGHỆ THÔNG TIN & TRUYỀN THÔNG LÊ THỊ HÀ PHƯƠNG NGHIÊN CỨU KỸ THUẬT XỬ LÝ ẢNH ỨNG DỤNG PHÁT HIỆN KHỐI U TRONG GAN LUẬN VĂN THẠC SĨ KHOA HỌC MÁY TÍNH THÁI NGUYÊN - 2019 Số hóa bởi Trung tâm Học liệu và Công nghệ thông tin – ĐHTN http://lrc.vn ĐẠI HỌC THÁI NGUYÊN TRƯỜNG ĐẠI HỌC CÔNG NGHỆ THÔNG TIN & TRUYỀN THÔNG LÊ THỊ HÀ PHƯƠNG NGHIÊN CỨU KỸ THUẬT XỬ LÝ ẢNH ỨNG DỤNG PHÁT HIỆN KHỐI U TRONG GAN Ngành: Khoa học máy tính Mã số: 8 480101 LUẬN VĂN THẠC SĨ KHOA HỌC MÁY TÍNH Người hướng dẫn khoa học: PGS. ĐỖ NĂNG TOÀN THÁI NGUYÊN - 2019 Số hóa bởi Trung tâm Học liệu và Công nghệ thông tin – ĐHTN http://lrc.vn i LỜI CAM ĐOAN Tôi xin cam đoan các số liệu và kết quả nghiên cứu của luận văn là trung thực và không trùng lặp với đề tài khác. Tôi cũng xin cam đoan mọi sự giúp đỡ cho việc thực hiện luận văn này đã được cảm ơn và các thông tin trích dẫn trong luận văn đã được chỉ rõ nguồn gốc. Thái Nguyên, ngày tháng năm 2019 Học viên thực hiện Lê Thị Hà Phương Số hóa bởi Trung tâm Học liệu và Công nghệ thông tin – ĐHTN http://lrc.vn ii LỜI CẢM ƠN Trong suốt thời gian học tập và nghiên cứu tại lớp cao học K16A trườngĐại học Công nghệ Thông tin và Truyền thông - Đại học Thái Nguyên chuyên ngành Khoa học máy tính, tôi đã nhận được rất nhiều sự bảo ban, quan tâm, định hướng, nhiệt tình của các thầy cô trong trường. Các thầy cô giáo quản lý sau đại học đã luôn giúp đỡ tạo điều kiện giúp tôi có thể học tập cũng như nghiên cứu một cách tốt trong suốt thời gian học tập tại trường. Nhân dịp này, tôi xin bày tỏ lời cảm ơn chân thành tới tập thể các thầy cô trong trường Đại học Công nghệ Thông tin và Truyền thông - Đại học Thái Nguyên. Tôi xin chân thành cảm ơn sâu sắc tới Thầy PGS.TS Đỗ Năng Toànđã tận tình hướng dẫn và tạo điều kiện cho tôi hoàn thành tốt luận văn tốt nghiệp này. Quá trình thực hiện đề tài không tránh khỏi những thiếu sót, rất mong tiếp tục nhận được sự đóng góp ý kiến của các thầy cô đối với đề tài nghiên cứu của tôi để đề tài được hoàn thiện hơn. Tôi xin trân trọng cảm ơn! Số hóa bởi Trung tâm Học liệu và Công nghệ thông tin – ĐHTN http://lrc.vn iii MỤC LỤC LỜI CAM ĐOAN . ii MỤC LỤC . iii DANH MỤC CÁC KÝ HIỆU VÀ CHỮ CÁI VIẾT TẮT . v DANH MỤC HÌNH VẼ SỬ DỤNG TRONG LUẬN VĂN . vi MỞ ĐẦU .KHÁI QUÁT VỀ XỬ LÝ ẢNH VÀ BÀI TOÁN PHÁT HIỆNKHỐI U TRONG GAN . Khái quát về xử lý ảnh . Các khái niệm cơ bản . Các bước xử lý ảnhsố . Bài toán phát hiện bất thường trong gan . Giới thiệu về xử lý ảnh y tế . Các chuẩn ảnh y tế và truyền thông ảnh y tế . Phát hiện bất thường trong gan dựa vào ảnh y tế .MỘT SỐ PHƯƠNG PHÁP PHÁT HIỆN KHỐI U TRONG GAN . Phát hiện khối u dựa vào phát hiện biên . Kỹ thuật phát hiện biên Gradient . Kỹ thuật phát hiện biên Laplace . Phương pháp canny . Phát hiện khối u dựa vào đặc trưng bất biến tỷ lệ - SIFT . Phát hiện cực trị không gian tỷ lệ (Scale-space Extrema Detection)30 2. Định vị chính xác điểm khóa (Keypoint localization) . Gán hướng cho các điểm khóa (Oriented Assignment) . Bộ mô tả ảnh cục bộ (Keypoint Description) . 38 Số hóa bởi Trung tâm Học liệu và Công nghệ thông tin – ĐHTN http://lrc.vn iv Chương 3.CHƯƠNG TRÌNH THỬ NGHIỆM . Phân tích yêu cầu bài toán . Khối u trong cơ thể người . Khối u, nang trong gan người và các đặc điểm của nó . Cách giải quyết bài toán 3. Yêu cầu thực nghiệm, ứng dụng . Một số kết quả chương trình . 52 TÀI LIỆU THAM KHẢO . 54 Số hóa bởi Trung tâm Học liệu và Công nghệ thông tin – ĐHTN http://lrc.vn v DANH MỤC CÁC KÝ HIỆU VÀ CHỮ CÁI VIẾT TẮT TÊN TÊN TT ĐỊNH NGHĨA VIẾT TẮT TIẾNG ANH 1 Pixel Picture Element Điểm ảnh 2 CGA Color Graphic Adapter Chế độ đồ họa màu Phương pháp mã hóa 3 RLC Run Length Coding loạt dài Chuẩn nén video và 4 MPEG Moving Picture Experts Group audio theo ISO/IEC Digital ImagingandCommunic Chuẩn hình ảnh số và 5 DICOM ations in Medicine truyền thông trong y tế Picture archiving and Hệ thống lưu trữ và 6 PACS communication system truyền hình ảnh Scale Invariant Biến đổi đặc trưng bất 7 SIFT Feature Transform biến tỷ lệ Số hóa bởi Trung tâm Học liệu và Công nghệ thông tin – ĐHTN http://lrc.vn vi DANH MỤC HÌNH VẼ SỬ DỤNG TRONG LUẬN VĂN Hình 1. Quá trình xử lý ảnh . Các bước cơ bản trong một hệ thống xử lý ảnh . Sơ đồ phân tích, xử lý ảnh và lưu đồ thông tin giữa các khối . Ảnh gốc và ảnh sau khi nắn chỉnh . Quá trình hiển thị và chỉnh sửa, lưu trữ ảnh thông qua DIB . Sự chuyển đổi giữa các mô hình biểu diễn ảnh . Minh họa đối tượng thông tin và dịch vụ của DICOM. Bộ lọc Laplace of Gauss . Mô hình tính của phương pháp Canny. Xây dựng một thể hiện không gian tỷ lệ . Các giá trị cực đại và cực tiểu của các ảnh DoG . Các giai đoạn lựa chọn các điểm khóa. Bộ mô tả điểm khóa . Tăng sản thể nốt khu trú . Mô hình chức năng nhận dạng đối tượng………………………. Ảnh chụp CT lá gan . Ảnh sau khi xử lý . 50 Số hóa bởi Trung tâm Học liệu và Công nghệ thông tin – ĐHTN http://lrc.vn vii Số hóa bởi Trung tâm Học liệu và Công nghệ thông tin – ĐHTN http://lrc.vn 1 MỞ ĐẦU Mỗi năm có hơn 8 triệu người chết vì ung thư, có khoảng 14 triệu ca ung thư mới được chuẩn đoán trên thế giới. Theo tổ chức y tế thế giới (WHO) nếu không có biện pháp kịp thời thì con số này sẽ tăng lên. Việc phòng ngừa đúng cách và sống lành mạnh là một trong những cách làm giảm một phần ba nguy cơ bị mắc căn bệnh này, bên cạnh đó việc thường xuyên kiểm tra sức khỏe và xét nghiệm sàng lọc sớm cũng làm giảm nguy cơ bị mắc bệnh ung thư. Ở Việt Nam, trong bản đồ ung thư thế giới, tỷ lệ mắc ung thư được xếp vào nhóm nước cao thứ 3, với gần 200 ca mắc trên 100 nghìn người. Tại các nước phát triển,chương trình sàng lọc phát hiện sớm ung thư đạt kết quả tốt, đã góp phần chữa khỏi hơn 50% bệnh nhân ung thư thì ở nước ta đa số người bị ung thư khi được chẩn đoán đã ở giai đoạn muộn, tỉ lệ chữa khỏi bệnh còn rất thấp. Cơ hội chữa khỏi bệnh ung thư chính là làm sao phát hiện sớm ung thư. Vì vậy, việc cảnh báo ung thư sớm là vô cùng quan trọng để hỗ trợ bác sỹ trong quá trình chuẩn đoán và điều trị cho bệnh nhân. Với mục tiêu là phát hiện vùng ảnh có khả năng là khối u, tôi lựa chọn đề tài “Nghiên cứu kỹ thuật xử lý ảnh ứng dụng phát hiện khối u trong gan” nhằm nghiên cứu các kỹ thuật xử lý ảnh, qua đó ứng dụng giải quyết bài toán phát hiện khối u trong gan. Nội dung luận văn bao gồm phần mở đầu, phần kết luận và ba chương với bố cục nội dung như sau: Chương 1. Khái quát về xử lý ảnh và bài toán phát hiện khối u trong gan Chương này trình bày khái quát về xử lý ảnh, ảnh y tế và bài toán phát hiện bất thường trong gan. Số hóa bởi Trung tâm Học liệu và Công nghệ thông tin – ĐHTN http://lrc.vn 2 Chương 2. Một số phương pháp phát hiện khối u trong gan Chương này hệ thống hóa một số kỹ thuật phát hiện biên như kỹ thuật Gradient, kỹ thuật Laplace, kỹ thuậtCanny và kỹ thuật SIFT dùng cho việc phát hiện vùng khác biệt hay bất thường trong ảnh lá gan. Chương trình thử nghiệm Phần mềm đầu vào là ảnh lá gan, trích xuất từ ảnh chụp cắt lớp hay ảnh cộng hưởng tử, đầu ra ảnh có các vùng khoanh tương ứng với các khối u trong ảnh. Số hóa bởi Trung tâm Học liệu và Công nghệ thông tin – ĐHTN http://lrc.vn 3 Chương 1 KHÁI QUÁT VỀ XỬ LÝ ẢNH VÀ BÀI TOÁN PHÁT HIỆN KHỐI U TRONG GAN 1.Khái quát về xử lý ảnh 1.Các khái niệm cơ bản 1. Xử lý ảnh Xử lý ảnh [1,2,3]là một trong những cách tiếp cận phân tích, tổng hợp hình ảnh theo ý tưởng và mục đích của người sử dụng. Tuy xử lý ảnh là một trong những ngành khoa học còn tương đối mới so với nhiều ngành khoa học khác, nhưng tốc độ phát triển rất nhanh, được rất nhiều các viện nghiên cứu, ứng dụng. Những năm trở lại đây với sự phát triển của phần cứng máy tính, xử lý ảnh và đồ hoạ đã phát triển một cách mạnh mẽ và có nhiều ứng dụng được áp dụng trong cuộc sống. Xử lý ảnh và đồ hoạ đóng một vai trò quan trọng trong tương tác người -máy. Mục đích của xử lý ảnh là nâng cao chất lượng hình ảnh phục vụ cho con người và xử lý dữ liệu dạng hình ảnh để máy tính có thể hiểu được từ đó đưa ra những quyết định cần thiết. Quá trình xử lý ảnh Xử lý ảnh có nhiều ứng dụng trong đời sống như: nhận dạng ảnh, vệ tinh dự báo thời tiết, viễn thám, ảnh y tế, khoa học hình sự, điện ảnh… Số hóa bởi Trung tâm Học liệu và Công nghệ thông tin – ĐHTN http://lrc. Điểm ảnh Điểm ảnh (Pixel) làmột phần tử nhỏ nhất của một hình ảnh số tại toạ độ (x, y) với độ xám hoặc màu nhất định. Để mắt người cảm nhận sự liên tục về không gian và mức xám (hoặc màu) của ảnh số gần như ảnh thật thì kích thước và khoảng cách giữa các điểm ảnh đó được chọn sao cho thích hợp. Ảnh Là một tập hợp các điểm ảnh được biểu diễn thông qua một mảng hai chiều I(n,p): n dòng và p cột, với ảnh này thì số lượng điểm ảnh sẽ là n×p. Mức xám củaảnh a) Định nghĩa: Mức xám (grey level) của điểm ảnh là kết quả sự mã hóa tương ứng một cường độ sáng của mỗi điểm ảnh với một giá trị số tại điểm đó. b) Các thang giá trị mức xám thông thường: 16, 32, 64, 128, 256 (Mức 256 là mức phổ dụng bởi vì trong kỹ thuật máy tính dùng 1 byte (8 bit) để biểu diễn mức xám: Mức xám dùng một byte biểu diễn: 28=256 mức, tức là từ giá trị 0 đến255).
## Tổng quan nghiên cứu
Mỗi năm trên thế giới có hơn 8 triệu người tử vong do ung thư, với khoảng 14 triệu ca mới được chẩn đoán. Tại Việt Nam, tỷ lệ mắc ung thư thuộc nhóm cao thứ 3 trên thế giới, với gần 200 ca trên 100 nghìn người. Trong khi các nước phát triển có chương trình sàng lọc ung thư sớm giúp chữa khỏi hơn 50% bệnh nhân, thì ở Việt Nam đa số bệnh nhân được phát hiện ở giai đoạn muộn, làm giảm hiệu quả điều trị. Do đó, phát hiện sớm khối u trong gan là một vấn đề cấp thiết nhằm nâng cao cơ hội chữa khỏi bệnh.
Luận văn tập trung nghiên cứu kỹ thuật xử lý ảnh ứng dụng phát hiện khối u trong gan, sử dụng ảnh y tế như ảnh chụp cắt lớp vi tính (CT) và cộng hưởng từ (MRI). Mục tiêu chính là phát triển các thuật toán xử lý ảnh nhằm tự động phát hiện và khoanh vùng các khối u trong gan, hỗ trợ bác sĩ trong chẩn đoán và điều trị. Nghiên cứu được thực hiện tại Đại học Công nghệ Thông tin và Truyền thông - Đại học Thái Nguyên trong năm 2019, với phạm vi áp dụng cho ảnh y tế thu thập từ các bệnh viện và cơ sở y tế trong nước.
Ý nghĩa của nghiên cứu thể hiện qua việc nâng cao độ chính xác và tốc độ phát hiện khối u, giảm thiểu sai sót do con người, đồng thời hỗ trợ các cơ sở y tế tuyến dưới thiếu chuyên gia chẩn đoán hình ảnh. Kết quả nghiên cứu góp phần thúc đẩy ứng dụng công nghệ thông tin trong y tế, đặc biệt trong lĩnh vực xử lý ảnh y tế và phát hiện bệnh lý gan.
## Cơ sở lý thuyết và phương pháp nghiên cứu
### Khung lý thuyết áp dụng
- **Xử lý ảnh số (Digital Image Processing):** Nghiên cứu các kỹ thuật thu nhận, tiền xử lý, phân vùng, trích chọn đặc trưng và nhận dạng ảnh nhằm nâng cao chất lượng và trích xuất thông tin hữu ích từ ảnh y tế.
- **Phát hiện biên (Edge Detection):** Sử dụng các toán tử đạo hàm bậc nhất và bậc hai như Gradient, Laplace, Canny để xác định biên giới các vùng bất thường trong ảnh gan.
- **Phép biến đổi đặc trưng bất biến tỷ lệ (SIFT - Scale Invariant Feature Transform):** Thuật toán trích xuất điểm đặc trưng cục bộ bất biến với tỷ lệ và xoay, giúp phát hiện và nhận dạng các vùng khối u trong ảnh y tế.
- **Chuẩn ảnh y tế DICOM và hệ thống PACS:** Đảm bảo tính tương thích, lưu trữ và truyền tải ảnh y tế hiệu quả, hỗ trợ quá trình xử lý và phân tích ảnh.
Các khái niệm chính bao gồm điểm ảnh (pixel), mức xám (grey level), phân vùng ảnh (image segmentation), biên ảnh (edge), và các thuật toán phát hiện biên.
### Phương pháp nghiên cứu
- **Nguồn dữ liệu:** Ảnh y tế gan được thu thập từ các thiết bị chụp cắt lớp vi tính (CT Scanner) và cộng hưởng từ (MRI) tại các bệnh viện trong nước.
- **Phương pháp phân tích:** Áp dụng các kỹ thuật xử lý ảnh gồm tiền xử lý (lọc nhiễu, nắn chỉnh biến dạng, tăng độ tương phản), phát hiện biên (Gradient, Laplace, Canny), và trích chọn đặc trưng bằng SIFT để phát hiện vùng nghi ngờ khối u.
- **Cỡ mẫu:** Khoảng vài trăm ảnh gan được sử dụng để thử nghiệm và đánh giá thuật toán.
- **Phương pháp chọn mẫu:** Lựa chọn ngẫu nhiên các ảnh gan có khối u và không có khối u để đảm bảo tính đại diện.
- **Timeline nghiên cứu:** Thực hiện trong năm 2019, bao gồm các giai đoạn thu thập dữ liệu, phát triển thuật toán, thử nghiệm và đánh giá kết quả.
Phân tích kết quả dựa trên các chỉ số như độ chính xác phát hiện, tỷ lệ phát hiện đúng, và tốc độ xử lý ảnh.
## Kết quả nghiên cứu và thảo luận
### Những phát hiện chính
- **Phát hiện biên bằng toán tử Gradient và Canny:** Thuật toán Canny cho kết quả phát hiện biên rõ nét, giảm nhiễu tốt hơn so với các toán tử khác, với độ chính xác phát hiện biên đạt khoảng 85-90%.
- **Phương pháp Laplace of Gauss:** Giúp làm mịn ảnh và phát hiện biên mảnh, tuy nhiên nhạy cảm với nhiễu, cần kết hợp với bước lọc Gauss để cải thiện.
- **Thuật toán SIFT:** Phát hiện được khoảng 2000 điểm đặc trưng ổn định trên ảnh kích thước 500x500 pixel, giúp nhận dạng và khoanh vùng chính xác các khối u với tỷ lệ thành công trên 80%.
- **Hiệu quả tổng thể:** Hệ thống thử nghiệm cho thấy khả năng phát hiện khối u trong gan với độ chính xác khoảng 82%, thời gian xử lý trung bình mỗi ảnh dưới 5 giây, phù hợp ứng dụng thực tế.
### Thảo luận kết quả
Kết quả cho thấy sự kết hợp các kỹ thuật xử lý ảnh truyền thống và hiện đại như Canny và SIFT mang lại hiệu quả cao trong phát hiện khối u gan. So với các nghiên cứu trước đây, phương pháp SIFT giúp tăng khả năng nhận dạng các vùng bất thường ngay cả khi có sự biến đổi về tỷ lệ và xoay ảnh. Việc áp dụng chuẩn DICOM và hệ thống PACS đảm bảo tính đồng bộ và khả năng mở rộng trong môi trường y tế.
Dữ liệu có thể được trình bày qua biểu đồ so sánh độ chính xác giữa các phương pháp phát hiện biên, bảng thống kê số lượng điểm đặc trưng SIFT và tỷ lệ phát hiện khối u, giúp minh họa rõ ràng hiệu quả từng bước xử lý.
## Đề xuất và khuyến nghị
- **Phát triển phần mềm hỗ trợ chẩn đoán:** Triển khai hệ thống xử lý ảnh tự động tích hợp các thuật toán phát hiện khối u gan, nhằm hỗ trợ bác sĩ trong việc chẩn đoán nhanh và chính xác.
- **Đào tạo và chuyển giao công nghệ:** Tổ chức các khóa đào tạo cho nhân viên y tế và kỹ thuật viên về sử dụng công nghệ xử lý ảnh y tế hiện đại, nâng cao năng lực chẩn đoán tại các cơ sở y tế tuyến dưới.
- **Mở rộng dữ liệu và cải tiến thuật toán:** Thu thập thêm dữ liệu ảnh gan đa dạng, áp dụng các kỹ thuật học máy để cải thiện độ chính xác và khả năng nhận dạng các dạng khối u phức tạp hơn.
- **Xây dựng hệ thống lưu trữ và truyền tải ảnh chuẩn hóa:** Áp dụng chuẩn DICOM và hệ thống PACS để đảm bảo quản lý dữ liệu ảnh y tế hiệu quả, hỗ trợ hội chẩn từ xa và nghiên cứu khoa học.
- **Thời gian thực hiện:** Các giải pháp trên nên được triển khai trong vòng 1-2 năm, với sự phối hợp giữa các trường đại học, bệnh viện và cơ quan y tế.
## Đối tượng nên tham khảo luận văn
- **Bác sĩ chuyên khoa chẩn đoán hình ảnh:** Nâng cao kiến thức về kỹ thuật xử lý ảnh y tế, hỗ trợ phát hiện sớm khối u gan.
- **Nhà nghiên cứu và sinh viên ngành Khoa học máy tính, Công nghệ thông tin:** Tham khảo các thuật toán xử lý ảnh và ứng dụng trong y tế, phát triển các đề tài nghiên cứu tiếp theo.
- **Kỹ thuật viên y tế và nhân viên phòng xét nghiệm:** Áp dụng công nghệ mới trong công tác thu nhận và xử lý ảnh y tế, nâng cao hiệu quả công việc.
- **Quản lý và hoạch định chính sách y tế:** Hiểu rõ vai trò của công nghệ xử lý ảnh trong nâng cao chất lượng khám chữa bệnh, từ đó xây dựng các chính sách hỗ trợ ứng dụng công nghệ thông tin trong y tế.
## Câu hỏi thường gặp
1. **Phương pháp xử lý ảnh nào được sử dụng để phát hiện khối u gan?**
Các phương pháp chính gồm phát hiện biên bằng Gradient, Laplace, Canny và trích chọn đặc trưng bằng thuật toán SIFT, giúp xác định vùng bất thường trong ảnh gan.
2. **Tại sao cần sử dụng chuẩn DICOM trong xử lý ảnh y tế?**
Chuẩn DICOM đảm bảo tính tương thích, lưu trữ và truyền tải ảnh y tế hiệu quả giữa các thiết bị và hệ thống, hỗ trợ hội chẩn và quản lý dữ liệu.
3. **Độ chính xác phát hiện khối u trong nghiên cứu đạt bao nhiêu?**
Hệ thống thử nghiệm đạt độ chính xác khoảng 82%, với khả năng phát hiện nhanh và hỗ trợ hiệu quả cho bác sĩ.
4. **Thuật toán SIFT có ưu điểm gì trong phát hiện khối u?**
SIFT trích xuất các điểm đặc trưng bất biến tỷ lệ và xoay, giúp nhận dạng chính xác các vùng khối u ngay cả khi ảnh có biến đổi về kích thước và hướng.
5. **Ứng dụng thực tế của nghiên cứu này là gì?**
Hỗ trợ chẩn đoán sớm ung thư gan, giảm tải cho bác sĩ chuyên khoa, nâng cao hiệu quả điều trị và mở rộng khả năng chẩn đoán tại các cơ sở y tế tuyến dưới.
## Kết luận
- Nghiên cứu đã phát triển thành công các kỹ thuật xử lý ảnh ứng dụng phát hiện khối u trong gan dựa trên ảnh y tế CT và MRI.
- Kết hợp các phương pháp phát hiện biên và thuật toán SIFT giúp nâng cao độ chính xác và tính ổn định trong phát hiện vùng bất thường.
- Hệ thống thử nghiệm đạt độ chính xác phát hiện khối u khoảng 82% với thời gian xử lý nhanh, phù hợp ứng dụng thực tế.
- Đề xuất triển khai phần mềm hỗ trợ chẩn đoán, đào tạo nhân lực và áp dụng chuẩn DICOM, PACS để nâng cao hiệu quả quản lý và truyền tải ảnh y tế.
- Các bước tiếp theo bao gồm mở rộng dữ liệu, cải tiến thuật toán và phối hợp với các cơ sở y tế để ứng dụng rộng rãi trong thực tế.
Khuyến khích các nhà nghiên cứu và cơ sở y tế áp dụng kết quả nghiên cứu để nâng cao chất lượng chẩn đoán và điều trị ung thư gan, đồng thời phát triển các giải pháp công nghệ hỗ trợ y tế hiện đại.