Cấu Trúc Cây R-Tree Phân Cụm Không Gian: Giải Pháp Hiệu Quả Cho Bài Toán Tìm Kiếm Ảnh

Luận văn thạc sĩ nghiên cứu cấu trúc cây R-tree phân cụm không gian, ứng dụng hiệu quả trong bài toán tìm kiếm ảnh, nâng cao hiệu suất xử lý dữ liệu.

Trường đại học

Đại học Bà Rịa – Vũng Tàu

Chuyên ngành

Công nghệ thông tin

Người đăng

Ẩn danh

Thể loại

luận văn thạc sĩ

2023

Phí lưu trữ

30 Point

Mục lục chi tiết

LỜI CAM ĐOAN

LỜI CÁM ƠN

1. CHƯƠNG 1: TỔNG QUAN VỀ BÀI TOÁN TÌM KIẾM ẢNH

1.1. Vai trò và ứng dụng của bài toán tìm kiếm ảnh

1.2. Đối tượng và phương pháp nghiên cứu

1.2.1. Đối tượng nghiên cứu

1.2.2. Phương pháp nghiên cứu

1.3. Tổng quan về bài toán tìm kiếm ảnh

1.4. Các công trình liên quan cho bài toán tìm kiếm ảnh

1.5. Nội dung tiếp cận cho bài toán tìm kiếm ảnh

1.6. Tổng kết chương

2. CHƯƠNG 2: CÁC KỸ THUẬT KHAI PHÁ DỮ LIỆU CHO BÀI TOÁN TÌM KIẾM ẢNH TƯƠNG TỰ

2.1. Một số kỹ thuật khai phá dữ liệu cho bài toán tìm kiếm ảnh

2.2. Phân cụm phân hoạch K-Means

2.3. Phương pháp láng giềng gần nhất

2.4. Gom cụm phân cấp

2.5. Tổng kết chương

3. CHƯƠNG 3: CẤU TRÚC CÂY R-TREE CHO BÀI TOÁN TÌM KIẾM ẢNH

3.1. Cây R-Tree nguyên thủy

3.2. Đề xuất cấu trúc HM-RST dựa trên sự kết hợp RS-Tree và bảng băm

3.3. Mô tả cấu trúc cây RS-Tree

3.4. Một cấu trúc gom cụm kết hợp cây RS-Tree và bảng băm

3.5. Các thuật toán trên cấu trúc cây HM-RST

3.5.1. Thuật toán xoá phần tử trên cấu trúc HM-RST

3.5.2. Thuật toán tìm kiếm ảnh tương tự

3.6. Tổng kết chương

4. CHƯƠNG 4: THỰC NGHIỆM TÌM KIẾM ẢNH

4.1. Giới thiệu mô hình tìm kiếm ảnh dựa trên cấu trúc HM-RST

4.2. Cấu trúc mô hình

4.3. Quá trình thực hiện mô hình CBIR_HMRST

4.4. Phân tích mô hình

4.5. Bộ dữ liệu ảnh thực nghiệm

4.6. Môi trường thực nghiệm

4.7. Ứng dụng thực nghiệm

4.8. Thực nghiệm trích xuất đặc trưng ảnh

4.9. Thực nghiệm tìm kiếm ảnh dựa trên cấu trúc HM-RST

4.10. Kết quả thực nghiệm tìm kiếm ảnh trên cấu trúc HM-RST

4.11. So sánh kết quả với các công trình liên quan

TÀI LIỆU THAM KHẢO

Tóm tắt

I. Giới thiệu về cấu trúc cây R Tree và ứng dụng trong tìm kiếm ảnh

Cấu trúc cây R-Tree là một cấu trúc dữ liệu không gian hiệu quả, được sử dụng rộng rãi trong các bài toán tìm kiếm và phân cụm dữ liệu. Trong luận văn này, cấu trúc cây R-Tree được áp dụng để giải quyết bài toán tìm kiếm ảnh dựa trên đặc trưng cấp thấp như màu sắc, hình dạng và kết cấu. Phân cụm không gian là một kỹ thuật quan trọng giúp nhóm các ảnh có đặc trưng tương tự vào cùng một cụm, từ đó tăng hiệu suất tìm kiếm. Luận văn thạc sĩ này đề xuất một cải tiến trong cấu trúc cây R-Tree để tối ưu hóa quá trình tìm kiếm ảnh, đặc biệt là trong các hệ thống cơ sở dữ liệu lớn.

1.1. Cấu trúc cây R Tree nguyên thủy

Cấu trúc cây R-Tree nguyên thủy là một cấu trúc dữ liệu đa chiều, được thiết kế để lưu trữ và truy vấn các đối tượng không gian. Mỗi nút trong cây đại diện cho một hình chữ nhật bao phủ tối thiểu (MBR), giúp giảm thiểu thời gian tìm kiếm. Tuy nhiên, cấu trúc này có một số hạn chế khi áp dụng cho bài toán tìm kiếm ảnh, đặc biệt là khi dữ liệu tăng trưởng nhanh. Thuật toán R-Tree cần được cải tiến để tăng hiệu suất và độ chính xác trong các hệ thống tìm kiếm ảnh hiện đại.

1.2. Ứng dụng R Tree trong tìm kiếm ảnh

Ứng dụng R-Tree trong tìm kiếm ảnh đã được nghiên cứu rộng rãi. Cấu trúc này giúp tăng tốc độ truy vấn bằng cách nhóm các ảnh có đặc trưng tương tự vào cùng một nút. Phân tích dữ liệu không gian cho thấy rằng cấu trúc cây R-Tree có thể giảm đáng kể thời gian tìm kiếm trong các hệ thống cơ sở dữ liệu lớn. Tuy nhiên, việc tách nút trong cây có thể gây ra sự thay đổi lớn trong cấu trúc, làm giảm hiệu suất. Do đó, luận văn đề xuất một cải tiến để hạn chế việc tách nút và tăng hiệu quả tìm kiếm.

II. Phân cụm không gian và tối ưu hóa tìm kiếm ảnh

Phân cụm không gian là một kỹ thuật quan trọng trong tìm kiếm ảnh, giúp nhóm các ảnh có đặc trưng tương tự vào cùng một cụm. Công nghệ tìm kiếm hiện đại đòi hỏi các phương pháp phân cụm hiệu quả để tăng tốc độ và độ chính xác của quá trình tìm kiếm. Luận văn này đề xuất một phương pháp phân cụm dựa trên cấu trúc cây R-Tree, kết hợp với bảng băm để tối ưu hóa quá trình tìm kiếm. Tối ưu hóa tìm kiếm là một yếu tố quan trọng trong các hệ thống cơ sở dữ liệu lớn, đặc biệt là khi xử lý dữ liệu ảnh.

2.1. Kỹ thuật phân cụm K Means và K NN

Phân cụm K-Means và phương pháp láng giềng gần nhất (K-NN) là hai kỹ thuật phổ biến trong phân cụm không gian. Tuy nhiên, các phương pháp này có một số hạn chế khi áp dụng cho bài toán tìm kiếm ảnh, đặc biệt là khi dữ liệu tăng trưởng nhanh. Cấu trúc cây R-Tree được đề xuất để vượt qua các hạn chế này, giúp tăng hiệu suất và độ chính xác của quá trình tìm kiếm.

2.2. Tối ưu hóa tìm kiếm bằng cấu trúc HM RST

Luận văn đề xuất một cấu trúc mới, gọi là HM-RST, kết hợp cấu trúc cây R-Tree với bảng băm để tối ưu hóa quá trình tìm kiếm. Cấu trúc này giúp giảm chi phí tách nút và tăng hiệu suất tìm kiếm. Thuật toán tìm kiếm ảnh tương tự được cải tiến để hoạt động hiệu quả hơn trên cấu trúc HM-RST, đặc biệt là trong các hệ thống cơ sở dữ liệu lớn.

III. Thực nghiệm và đánh giá hiệu quả của cấu trúc HM RST

Luận văn tiến hành thực nghiệm trên các bộ dữ liệu ảnh phổ biến như COREL, OxfordFlowers-17 và MS-COCO để đánh giá hiệu quả của cấu trúc HM-RST. Kết quả thực nghiệm cho thấy rằng cấu trúc này giúp tăng đáng kể độ chính xác và giảm thời gian tìm kiếm so với các phương pháp truyền thống. Hệ thống cơ sở dữ liệu sử dụng cấu trúc HM-RST đạt hiệu suất cao hơn trong việc truy vấn và tìm kiếm ảnh tương tự.

3.1. Thực nghiệm trích xuất đặc trưng ảnh

Quá trình trích xuất đặc trưng ảnh được thực hiện để tạo ra các véc-tơ đặc trưng làm cơ sở cho việc tìm kiếm. Cấu trúc HM-RST được sử dụng để lưu trữ và truy vấn các véc-tơ này, giúp tăng tốc độ tìm kiếm. Kết quả thực nghiệm cho thấy rằng phương pháp này đạt độ chính xác cao hơn so với các phương pháp truyền thống.

3.2. So sánh hiệu suất với các phương pháp khác

Luận văn so sánh hiệu suất của cấu trúc HM-RST với các phương pháp khác như K-Means và K-NN. Kết quả cho thấy rằng cấu trúc HM-RST đạt hiệu suất cao hơn trong việc tìm kiếm ảnh tương tự, đặc biệt là trong các hệ thống cơ sở dữ liệu lớn. Tối ưu hóa tìm kiếm là một yếu tố quan trọng giúp cải thiện hiệu suất của hệ thống.

23/02/2025

Bạn đang xem trước tài liệu:

Luận văn thạc sĩ một cấu trúc cây phân cụm không gian r tree áp dụng cho bài toán tìm kiếm ảnh

Tải đầy đủ

Nội dung chính

Tổng quan nghiên cứu

Bài toán tìm kiếm ảnh tương tự là một lĩnh vực nghiên cứu có tính thời sự và ứng dụng rộng rãi trong nhiều ngành như y tế, an ninh, viễn thám, và hệ thống thư viện số. Theo ước tính, dữ liệu số toàn cầu sẽ đạt khoảng 175ZB vào năm 2025, trong đó ảnh số chiếm tỷ trọng lớn và tăng trưởng nhanh chóng. Ví dụ, tại Bệnh viện Đại học Geneva, hơn 12.000 hình ảnh y tế được tạo ra mỗi ngày vào năm 2002, với tổng dung lượng dữ liệu lên đến 1TB. Trên Internet, Google xử lý 3.9 tỷ lượt tìm kiếm mỗi ngày, trong đó một phần ba là tìm kiếm hình ảnh, và hơn 70% lượt truy cập trên Instagram là xem ảnh. Điều này đặt ra yêu cầu cấp thiết về các hệ thống tìm kiếm ảnh hiệu quả, chính xác và nhanh chóng.

Mục tiêu nghiên cứu của luận văn là xây dựng một cấu trúc cây phân cụm không gian R-Tree cải tiến, gọi là HM-RST, nhằm nâng cao hiệu suất tìm kiếm ảnh tương tự dựa trên đặc trưng cấp thấp như màu sắc, hình dạng, kết cấu và vị trí. Phạm vi nghiên cứu tập trung trên các bộ dữ liệu ảnh thực nghiệm phổ biến như COREL, OxfordFlowers-17 và MS-COCO, với thời gian thực hiện nghiên cứu trong năm 2023 tại Trường Đại học Bà Rịa – Vũng Tàu.

Ý nghĩa nghiên cứu được thể hiện qua việc cải tiến cấu trúc cây R-Tree truyền thống để giảm chi phí tách nút, tăng độ chính xác và giảm thời gian tìm kiếm, từ đó hỗ trợ hiệu quả cho các hệ thống truy xuất hình ảnh theo nội dung (CBIR) trong bối cảnh dữ liệu ảnh ngày càng lớn và đa dạng.

Cơ sở lý thuyết và phương pháp nghiên cứu

Khung lý thuyết áp dụng

Luận văn dựa trên hai lý thuyết chính: (1) Lý thuyết về cấu trúc cây R-Tree và các biến thể như RS-Tree, SR-Tree nhằm lập chỉ mục và gom cụm dữ liệu đa chiều; (2) Lý thuyết về kỹ thuật khai phá dữ liệu, bao gồm các thuật toán phân cụm K-Means, phân cụm phân cấp và thuật toán phân lớp K-Nearest Neighbors (KNN) để xử lý và tìm kiếm ảnh tương tự.

Các khái niệm chính bao gồm:

Cây R-Tree: Cấu trúc cây đa nhánh cân bằng dùng để lưu trữ các vùng không gian đa chiều dưới dạng hình chữ nhật bao phủ tối thiểu (MBR).
Khối cầu bao phủ (MBS): Biểu diễn dữ liệu bằng khối cầu thay vì hình chữ nhật nhằm giảm chi phí tính toán và tăng hiệu quả tìm kiếm.
Bảng băm nút tràn (Hash Table for Overflow Nodes): Cơ chế lưu trữ tạm thời các phần tử vượt quá ngưỡng trong nút lá để hạn chế tách nút thường xuyên.
Độ đo tương tự (Similarity Measure): Khoảng cách Euclid được sử dụng để đánh giá mức độ tương đồng giữa các véc-tơ đặc trưng ảnh.

Phương pháp nghiên cứu

Nguồn dữ liệu chính là các bộ ảnh thực nghiệm COREL, OxfordFlowers-17 và MS-COCO, được trích xuất đặc trưng cấp thấp gồm màu sắc, hình dạng, kết cấu và vị trí. Cỡ mẫu ảnh trong các bộ dữ liệu này dao động từ vài nghìn đến hàng chục nghìn ảnh.

Phương pháp nghiên cứu gồm hai nhóm chính:

Phương pháp lý thuyết: Khảo sát, phân tích các công trình nghiên cứu liên quan về cấu trúc cây R-Tree và các thuật toán phân cụm, phân lớp ảnh. Từ đó đề xuất cấu trúc cây HM-RST kết hợp RS-Tree và bảng băm nhằm cải tiến hiệu suất.
Phương pháp thực nghiệm: Xây dựng mô hình tìm kiếm ảnh CBIR_HMRST dựa trên cấu trúc HM-RST và mạng học sâu Faster R-CNN để trích xuất đối tượng và đặc trưng ảnh. Thực nghiệm được tiến hành trên các bộ dữ liệu thực tế, đánh giá hiệu suất tìm kiếm qua các chỉ số độ chính xác, thời gian truy vấn và độ phủ.

Timeline nghiên cứu bao gồm giai đoạn khảo sát và phát triển lý thuyết, xây dựng mô hình và thuật toán, thực nghiệm trên bộ dữ liệu trong năm 2023.

Kết quả nghiên cứu và thảo luận

Những phát hiện chính

Hiệu quả của cấu trúc HM-RST: Cấu trúc HM-RST giảm đáng kể số lần tách nút so với cây R-Tree nguyên thủy nhờ cơ chế bảng băm lưu trữ nút tràn. Thời gian tìm kiếm trung bình trên bộ dữ liệu COREL giảm khoảng 20% so với R-Tree truyền thống.
Độ chính xác tìm kiếm: Trên bộ dữ liệu COREL, mô hình CBIR_HMRST đạt độ chính xác 76.75%, trên OxfordFlowers-17 đạt 73.36%, và trên MS-COCO đạt khoảng 68%. So sánh với các phương pháp K-Means, KNN và cây phân cụm phân cấp, HM-RST cho kết quả chính xác hơn từ 5-10%.
Thời gian truy vấn: Thời gian tìm kiếm trung bình trên bộ COREL là khoảng 0.15 giây, trên OxfordFlowers-17 là 0.12 giây và trên MS-COCO là 0.18 giây, nhanh hơn đáng kể so với các phương pháp phân cụm truyền thống.
Độ phủ và đường cong ROC: Độ phủ và đường cong ROC của HM-RST trên các bộ dữ liệu đều cho thấy khả năng phân biệt tốt giữa các ảnh tương tự và không tương tự, với giá trị AUC trên 0.8.

Thảo luận kết quả

Nguyên nhân chính của sự cải thiện hiệu suất là do cấu trúc HM-RST sử dụng khối cầu bao phủ thay vì hình chữ nhật, giúp giảm chi phí tính toán khoảng cách và hạn chế vùng chồng lấn không gian. Việc bổ sung bảng băm nút tràn làm giảm tần suất tách nút, giữ cho cây cân bằng và ổn định hơn khi dữ liệu tăng trưởng.

So với các nghiên cứu trước đây sử dụng K-Means hoặc KNN, HM-RST không yêu cầu xác định số cụm trước và có khả năng xử lý dữ liệu tăng trưởng hiệu quả hơn. Kết quả thực nghiệm trên các bộ dữ liệu thực tế minh chứng tính khả thi và ưu việt của phương pháp.

Dữ liệu có thể được trình bày qua biểu đồ so sánh độ chính xác và thời gian truy vấn giữa các phương pháp, cũng như bảng thống kê chi tiết kết quả trên từng bộ dữ liệu để minh họa rõ ràng hiệu quả của HM-RST.

Đề xuất và khuyến nghị

Triển khai cấu trúc HM-RST trong hệ thống CBIR: Đề nghị các tổ chức phát triển hệ thống tìm kiếm ảnh tích hợp cấu trúc HM-RST để nâng cao hiệu suất truy vấn, đặc biệt với các kho dữ liệu lớn và đa dạng. Thời gian thực hiện dự kiến 6-12 tháng.
Phát triển thêm các thuật toán tách nút tối ưu: Nghiên cứu và áp dụng các thuật toán tách nút dựa trên góc và vùng nhớ tạm thời để giảm thiểu tối đa chi phí tách nút, nâng cao độ chính xác tìm kiếm. Chủ thể thực hiện là các nhóm nghiên cứu công nghệ thông tin.
Kết hợp mạng học sâu để trích xuất đặc trưng nâng cao: Mở rộng mô hình bằng cách tích hợp các mạng học sâu tiên tiến hơn để trích xuất đặc trưng ngữ nghĩa cấp cao, từ đó cải thiện độ chính xác tìm kiếm ảnh tương tự. Thời gian nghiên cứu 12-18 tháng.
Xây dựng hệ thống đánh giá và giám sát hiệu suất: Thiết lập hệ thống đánh giá liên tục hiệu suất tìm kiếm dựa trên các chỉ số như độ chính xác, thời gian truy vấn và độ phủ để điều chỉnh và tối ưu mô hình theo thời gian. Chủ thể thực hiện là các đơn vị phát triển phần mềm và quản lý dữ liệu.

Đối tượng nên tham khảo luận văn

Nhà nghiên cứu và sinh viên ngành Công nghệ Thông tin: Có thể áp dụng các kiến thức về cấu trúc dữ liệu không gian, thuật toán phân cụm và học máy để phát triển các hệ thống tìm kiếm ảnh và dữ liệu đa phương tiện.
Chuyên gia phát triển hệ thống quản lý dữ liệu y tế: Sử dụng mô hình HM-RST để xây dựng hệ thống truy xuất hình ảnh y tế nhanh chóng, hỗ trợ chẩn đoán và phân tích hình ảnh y tế số lượng lớn.
Doanh nghiệp phát triển ứng dụng tìm kiếm ảnh và thương mại điện tử: Áp dụng cấu trúc cây phân cụm để nâng cao trải nghiệm người dùng trong việc tìm kiếm sản phẩm dựa trên hình ảnh.
Các tổ chức nghiên cứu về trí tuệ nhân tạo và thị giác máy tính: Tham khảo mô hình kết hợp mạng học sâu Faster R-CNN và cấu trúc HM-RST để phát triển các giải pháp truy vấn hình ảnh thông minh.

Câu hỏi thường gặp

Cấu trúc HM-RST khác gì so với R-Tree truyền thống?
HM-RST sử dụng khối cầu bao phủ thay vì hình chữ nhật, kết hợp bảng băm để lưu trữ nút tràn, giúp giảm chi phí tách nút và tăng hiệu quả tìm kiếm.
Phương pháp trích xuất đặc trưng ảnh được sử dụng như thế nào?
Luận văn sử dụng mạng học sâu Faster R-CNN để phân lớp và trích xuất đối tượng, kết hợp các đặc trưng cấp thấp như màu sắc, hình dạng, kết cấu và vị trí để tạo véc-tơ đặc trưng.
HM-RST có phù hợp với dữ liệu tăng trưởng không?
Có, HM-RST được thiết kế để xử lý dữ liệu tăng trưởng hiệu quả nhờ cơ chế bảng băm nút tràn và cây cân bằng, không cần phân cụm lại toàn bộ dữ liệu.
Độ chính xác tìm kiếm của HM-RST so với các phương pháp khác ra sao?
Thực nghiệm cho thấy HM-RST đạt độ chính xác cao hơn từ 5-10% so với các phương pháp K-Means, KNN và cây phân cụm phân cấp trên các bộ dữ liệu thực tế.
Thời gian tìm kiếm trung bình trên HM-RST là bao lâu?
Trung bình khoảng 0.12 đến 0.18 giây trên các bộ dữ liệu COREL, OxfordFlowers-17 và MS-COCO, nhanh hơn đáng kể so với các phương pháp truyền thống.

Kết luận

Đã xây dựng thành công cấu trúc cây phân cụm không gian HM-RST cải tiến dựa trên RS-Tree và bảng băm, nâng cao hiệu quả tìm kiếm ảnh tương tự.
Mô hình CBIR_HMRST kết hợp mạng học sâu Faster R-CNN cho kết quả thực nghiệm với độ chính xác trên 70% và thời gian truy vấn nhanh.
Cấu trúc HM-RST xử lý tốt dữ liệu tăng trưởng, giảm chi phí tách nút và giữ cân bằng cây hiệu quả.
Kết quả so sánh với các phương pháp K-Means, KNN và phân cụm phân cấp cho thấy ưu thế vượt trội về độ chính xác và tốc độ.
Đề xuất các hướng phát triển tiếp theo bao gồm tối ưu thuật toán tách nút, tích hợp đặc trưng ngữ nghĩa cấp cao và xây dựng hệ thống giám sát hiệu suất.

Để tiếp tục phát triển, các nhà nghiên cứu và doanh nghiệp nên áp dụng và mở rộng mô hình HM-RST trong các hệ thống tìm kiếm ảnh thực tế, đồng thời nghiên cứu thêm các kỹ thuật học sâu để nâng cao khả năng nhận dạng và phân loại hình ảnh. Hãy bắt đầu triển khai ngay hôm nay để tận dụng hiệu quả của công nghệ tìm kiếm ảnh tiên tiến này!

Trích đoạn nội dung tài liệu

MỞ ĐẦU Bài toán tìm kiếm ảnh tương tự là một trong những bài toán có tính thời sự và được ứng dụng rộng rãi trong nhiều lĩnh vực khác nhau. Nhiều công bố về bài toán này đã được xuất bản trong những năm gần đây. Trong luận văn này, một mô hình tìm kiếm ảnh dựa trên cấu trúc cây R-Tree được thực hiện nhằm nâng cao hiệu suất về độ chính xác cũng như thời gian tìm kiếm. Để tiếp cận được mô hình tìm kiếm ảnh này, nội dung luận văn lần lượt khảo sát các đối tượng nghiên cứu liên quan cũng như các phương pháp nghiên cứu nhằm làm cơ sở cho quá trình thực hiện luận văn.

Đối với phương pháp nghiên cứu, luận văn dựa trên hai nhóm phương pháp chính đó là khảo sát lý thuyết để đưa ra đề xuất và phương pháp thực nghiệm nhằm minh chứng cho cơ sở lý thuyết. Trên cơ sở việc phân tích và đánh giá các phương pháp khai phá dữ liệu, đại diện là kỹ thuật gom cụm và kỹ thuật phân lớp, nội dung luận văn lần lượt phân tích ưu và nhược điểm của các kỹ thuật liên quan, cụ thể là thuật toán K-Means, phân cụm phân cấp và thuật toán KNN. Các kỹ thuật này đều có thể áp dụng được cho bài toán tìm kiếm ảnh, nhưng có một số hạn chế nhất định khi áp dụng cho bộ dữ liệu tăng trưởng cũng như cân bằng thời gian tìm kiếm. Sau quá trình phân tích này, cây R- Tree được sử dụng nhằm vượt qua các hạn chế của các phương pháp phân cụm phân hoạch và phân cụm phân cấp.

Vì vậy, nội dung luận văn lần lượt thực hiện áp dụng cấu trúc cây R-Tree cho bài toán phân cụm dữ liệu hình ảnh, đồng thời đưa ra các cải tiến cho cây R-Tree nhằm nâng cao độ chính xác cũng như giảm chi phí khi thực hiện các thao tác trên cây. Quá trình cải tiến cây R-Tree mà mỗi điểm dữ liệu trên cây là một khối cầu để từ đó hình thành các khối cầu trung gian nhằm thực hiện các phép toán trên các khối cầu này. Việc tách nút trên cây có thể gây ra sự thay đổi lớn cho cấu trúc cây R-Tree, nên nội dung luận văn đã đề xuất cải tiến vùng không gian tại nút lá dựa trên một bộ nhớ đệm kết hợp với ngưỡng tương tự nhằm hạn chế việc tách nút cũng như đưa các phần tử gần nhau về cùng một nút lá. Dựa trên cơ sở đề xuất này, luận văn tiến hành thực nghiệm tìm kiếm ảnh tương tự trên các bộ ảnh thông dụng khác nhau để từ đó làm cơ sở đánh giá và so sánh với các phương pháp khác nhằm minh chứng tính hiệu quả của phương pháp đã đề xuất.

TỔNG QUAN VỀ BÀI TOÁN TÌM KIẾM ẢNH 1. Giới thiệu Bài toán tìm kiếm ảnh tương tự là một bài toán quan trọng và được ứng dụng trong nhiều lĩnh vực khác nhau, đặc biệt là trong các hệ thống xử lý dữ liệu đa phương tiện nhằm áp dụng giải quyết việc tìm kiếm các đối tượng ảnh tương tự nhau về mặt nội dung dựa trên đặc trưng cấp thấp hoặc đặc trưng ngữ nghĩa cấp cao. Trong chương này, các nội dung cơ sở cho bài toán tìm kiếm ảnh tương tự lần lượt được tiếp cận, bao gồm: (1) các đối tượng cần được nghiên cứu tập trung vào đặc trưng hình ảnh, phương pháp phân cụm nhằm tạo thành các nhóm ảnh tương tự cho bài toán tìm kiếm, các cấu trúc phân cụm phân hoạch, phân cụm phân cấp… để từ đó nội dung luận văn tiếp cận cấu trúc R-Tree và đề xuất cải tiến nhằm giảm chi phí tách nút, tăng hiệu suất của quá trình tìm kiếm ảnh, (2) các phương pháp nghiên cứu lần lượt được tiếp cận theo cơ sở lý thuyết từ các công trình đã công bố, để từ đó đưa ra cấu trúc tiếp cận mới cho cây R-Tree. Trên cơ sở lý thuyết này, phương pháp thực nghiệm được xây dựng nhằm minh chứng tính khả thi của cấu trúc đề xuất.

Thực nghiệm của luận văn dựa trên các bộ ảnh phổ dụng nhằm đánh giá và so sánh kết quả với một số công trình đã công bố gần đây để minh chứng tính hiệu quả của cơ sở lý thuyết đề xuất, (3) việc khảo sát tính ứng dụng và tính thời sự của bài toán tìm kiếm ảnh cũng được thực hiện trong nội dung chương này nhằm minh chứng sự cần thiết cũng như ý nghĩa về mặt khoa học, tính ứng dụng. Trên cơ sở các nội dung tổng quát được tiếp cận, nội dung của chương lần lượt đi vào các phần như sau: (1) vai trò và ứng dụng của bài toán tìm kiếm ảnh nhằm minh chứng tính thời sự và tính ứng dụng của bài toán, (2) đối tượng nghiên cứu nhằm định hướng quá trình tìm hiểu, nghiên cứu cũng như đề xuất cải tiến cho một cấu trúc mới dựa trên cấu trúc R-Tree đã có, (3) phương pháp nghiên cứu để mô tả các bước thực hiện cũng như quá trình đánh giá cho các đề xuất, (4) các công trình liên quan được khảo sát và phân tích nhằm minh chứng tính khả thi và sự kế thừa kết quả cơ sở, (5) nội dung tổng quát của các chương cũng lần lượt được tiếp cận và định hướng phát triển các nội dung này trong các chương tiếp theo. Vai trò và ứng dụng của bài toán tìm kiếm ảnh Nhiều ứng dụng của bài toán tìm kiếm ảnh tương tự đã được công bố rộng rãi dựa trên các hệ thống như: hệ thống thông tin địa lý GIS (Geographic Information System), hệ thống thông tin bệnh viện HIS (Hospital Information System), hệ thống thư viện số DLS (Digital Library System)… Dữ liệu ảnh có vai trò quan trọng trong nhiều lĩnh vực khác nhau, liên quan đến lĩnh vực tìm kiếm ảnh tương tự theo nội dung, làm cơ sở cho bài toán phân tích hình ảnh theo nội dung, kết xuất đối tượng gần nhất theo đặc trưng hình ảnh, phân nhóm các hình ảnh theo chủ đề… [29]. Dữ liệu ảnh được ứng dụng trong các lĩnh vực khác nhau như thiết kế kiến trúc (Yue và cộng sự, 2011) [46], phòng chống tội phạm (Kekre và cộng sự, 2011) [23], kiểm tra an ninh (Iqbal và cộng sự, 2012) [22], viễn thám (Kekre và cộng sự, 2010) [24], chẩn đoán bệnh trong y tế (Muller và cộng sự, 2004) [30], v.

Trong lĩnh vực y tế, ảnh số được sử dụng với số lượng ngày càng tăng, tại Khoa X-quang của Bệnh viện Đại học Geneva có hơn 12.000 hình ảnh mỗi ngày vào năm 2002; Tổng lượng dữ liệu hình ảnh tim mạch được tạo ra tại Bệnh viện Đại học Geneva khoảng 1 TB vào năm 2002 [30]. Các loại hình ảnh khác nhau cũng đang được tạo ra bởi các thiết bị hình ảnh y tế như chụp cắt lớp vi tính (CT), chụp cộng hưởng từ (MRI), hình ảnh hạt nhân,. ngày càng được gia tăng và trở thành các kho dữ liệu lớn và được coi là nguồn dữ liệu hỗ trợ chẩn đoán [35]. Tuy nhiên, do sự gia tăng nhanh chóng của số lượng hình ảnh y tế từng ngày, nên việc khai phá dữ liệu giúp chẩn đoán bệnh nhân tại các cơ sở y tế và bệnh viện ngày càng trở nên khó khăn hơn và đòi hỏi các phương pháp tìm kiếm, lập chỉ mục và truy xuất hình ảnh chính xác và hiệu quả hơn vì vậy việc truy xuất và lập chỉ mục hình ảnh dựa trên nội dung cần được thực hiện.

Các hệ thống truy xuất hình ảnh y tế áp dụng bài toán tìm kiếm ảnh tương tự để truy xuất các hình ảnh giống nhất từ một tập ảnh tương tự nhằm hỗ trợ quá trình chẩn đoán bệnh nhân từ các nội dung tham chiếu đối với hình ảnh đã có. Để có thể thực hiện được việc tìm kiếm hình ảnh một cách nhanh chóng, các đặc trưng cấp thấp được sử dụng làm cơ sở đối sánh độ tương tự như: màu sắc, kết cấu, hình dạng, cấu trúc, v. 4 Dữ liệu số trên toàn cầu được gia tăng không ngừng, theo tổ chức IDC (International Data Corporation) dự đoán dữ liệu toàn cầu có kích thước 175ZB vào năm 2025 (1ZB ⁓ 1 nghìn tỷ GB) [48]. Theo thống kê năm 2020, Google xử lý 3.9 tỷ lượt tìm kiếm mỗi ngày.

Một phần ba tổng số tìm kiếm được thực hiện trên Google dành cho hình ảnh và 12.5% hiển thị kết quả hình ảnh [52]. Hơn 70% lượt truy cập trên Instagram để xem ảnh vào năm 2023 [50]. Người dùng chia sẻ 6.9 tỷ hình ảnh trên WhatsApp mỗi ngày, 3.8 tỷ trên Snapchat, 2.1 tỷ trên Facebook và 1.3 tỷ trên Instagram [51]. Cùng với sự phát triển của Internet, ảnh số đã được sử dụng trên nhiều thiết bị khác nhau như: camera, mobile, smartphone, tablet,… Số liệu thống kê về tăng trưởng Internet từ Statista cho thấy tính đến tháng 4 năm 2022, có năm tỷ người dùng Internet trên toàn thế giới, chiếm 63% dân số toàn cầu.

Trong tổng số này, 4.65 tỷ là người dùng mạng xã hội và thiết bị mobile có đến 4.28 tỷ người dùng [49]. Kích thước và số lượng ảnh ngày càng được gia tăng nên cần phải có nhiều hệ thống xử lý đáp ứng yêu cầu của người dùng. Do đó, hệ thống tìm kiếm ảnh phải được xây dựng với mục đích nâng cao hiệu quả và độ chính xác của quá trình tìm kiếm ảnh. Bài toán khai phá dữ liệu ảnh để tìm ra tập ảnh tương tự là một bài toán quan trọng có tính thời sự và phù hợp với các hệ thống tìm kiếm ảnh hiện nay [15].

Đối tượng và phương pháp nghiên cứu 1. Đối tượng nghiên cứu Nội dung luận văn tiếp cận xây dựng một mô hình tìm kiếm ảnh tương tự dựa trên đặc trưng cấp thấp như: màu sắc, hình dạng, kích thước, cấu trúc bề mặt… Các đặc trưng này được trích xuất trực tiếp từ một hình ảnh truy vấn đầu vào để từ đó tạo thành một véc-tơ đặc trưng làm cơ sở cho việc đối sánh, tra cứu và tìm kiếm hình ảnh tương tự. Các véc-tơ đặc trưng của bộ dữ liệu ảnh được trích xuất và lưu trữ trên một cấu trúc R-Tree nhằm tăng hiệu suất của quá trình tìm kiếm ảnh. Để tiếp cận được đối tượng nghiên cứu như trên, đề tài luận văn lần lượt nghiên cứu các đối tượng gồm: - Ảnh số và phương pháp trích xuất đặc trưng hình ảnh số để làm cơ sở phân cụm cũng như tổ chức dữ liệu trên cấu trúc cây R-Tree.

5 - Cấu trúc dữ liệu về cây R-Tree, một cấu trúc tìm kiếm hiệu quả cho bài toán tìm kiếm ảnh theo nội dung. Từ đó, một cấu trúc cải tiến được tiếp cận nhằm tăng hiệu suất cho bài toán tìm kiếm.

Nội dung được bảo vệ bản quyền — Tải xuống đầy đủ

Cấu Trúc Cây R-Tree Phân Cụm Không Gian Ứng Dụng Tìm Kiếm Ảnh Trong Luận Văn Thạc Sĩ là một tài liệu chuyên sâu tập trung vào việc ứng dụng cấu trúc cây R-Tree trong phân cụm không gian, đặc biệt là trong lĩnh vực tìm kiếm ảnh. Tài liệu này cung cấp cái nhìn chi tiết về cách cây R-Tree hoạt động, cách nó được sử dụng để tối ưu hóa quá trình tìm kiếm ảnh dựa trên các đặc điểm không gian, và lợi ích của nó trong việc cải thiện hiệu suất và độ chính xác của các hệ thống tìm kiếm. Đây là nguồn tài liệu hữu ích cho những ai đang nghiên cứu về cấu trúc dữ liệu không gian và ứng dụng của chúng trong các bài toán thực tế.

Nếu bạn quan tâm đến các chủ đề liên quan, bạn có thể khám phá thêm về Cài đặt và thực nghiệm sqlcipher trên hệ điều hành android luận văn thạc sĩ, một tài liệu tập trung vào việc bảo mật dữ liệu trên nền tảng di động, hoặc Luận văn thạc sĩ các tiêu chuẩn lựa chọn mô hình chuỗi thời gian, nơi bạn có thể tìm hiểu sâu hơn về các phương pháp phân tích dữ liệu chuỗi thời gian. Cả hai tài liệu này đều mang lại những góc nhìn mới mẻ và bổ ích cho các nhà nghiên cứu và học viên.

#Luận văn Thạc sĩ

#công nghệ thông tin

#thuật toán tìm kiếm

#xử lý ảnh

#cơ sở dữ liệu không gian

#Cấu trúc cây R-Tree

Chủ đề

Nghiên cứu và ứng dụng trong luận văn

Công nghệ cây R-Tree trong tìm kiếm

Phân cụm không gian và ứng dụng

Tìm kiếm ảnh trong cơ sở dữ liệu