I. Giới thiệu về tra cứu ảnh dựa trên nội dung
Tra cứu ảnh dựa trên nội dung (CBIR) là một phương pháp tìm kiếm hình ảnh dựa trên các đặc trưng trực quan như màu sắc, kết cấu, hình dạng và vị trí không gian. Khác với phương pháp truyền thống dựa trên chú thích văn bản, CBIR tự động trích xuất các đặc trưng từ hình ảnh, giúp tăng tính chính xác và nhất quán trong kết quả tìm kiếm. Hệ thống CBIR bao gồm các thành phần chính như trích xuất đặc trưng, đo độ tương tự, đánh chỉ số và giao diện truy vấn. Phương pháp này đặc biệt hữu ích trong các ứng dụng như y tế, thương mại điện tử và quản lý dữ liệu hình ảnh.
1.1. Các thành phần của hệ thống CBIR
Hệ thống CBIR gồm bốn thành phần chính: trích xuất đặc trưng, đo độ tương tự, đánh chỉ số và giao diện truy vấn. Trích xuất đặc trưng là quá trình chuyển đổi hình ảnh thành các vector đặc trưng biểu diễn nội dung. Đo độ tương tự sử dụng các thuật toán để so sánh sự giống nhau giữa ảnh truy vấn và ảnh trong cơ sở dữ liệu. Đánh chỉ số giúp tối ưu hóa quá trình tìm kiếm bằng cách giảm số chiều của vector đặc trưng. Giao diện truy vấn cho phép người dùng tương tác với hệ thống thông qua các phương pháp như truy vấn bằng ví dụ hoặc phác thảo.
II. Phương pháp trích xuất đặc trưng
Trích xuất đặc trưng là bước quan trọng trong CBIR, giúp biểu diễn nội dung hình ảnh dưới dạng các vector số. Các đặc trưng chính bao gồm màu sắc, kết cấu, hình dạng và vị trí không gian. Màu sắc được biểu diễn thông qua lược đồ màu (histogram) hoặc vector liên kết màu (CCV). Kết cấu được trích xuất bằng các phương pháp như ma trận đồng hiện mức xám (Co-occurrence Matrix) hoặc biến đổi Wavelet. Hình dạng được mô tả thông qua lược đồ hệ số góc (Edge Direction Histogram) hoặc vector liên kết hệ số góc. Các đặc trưng này giúp hệ thống phân biệt và so sánh hình ảnh một cách hiệu quả.
2.1. Trích xuất đặc trưng màu sắc
Màu sắc là một trong những đặc trưng quan trọng nhất trong CBIR. Lược đồ màu (histogram) là phương pháp phổ biến để biểu diễn phân bố màu trong ảnh. Tuy nhiên, lược đồ màu không xét đến vị trí không gian của các pixel, dẫn đến hạn chế trong việc phân biệt các ảnh có cùng phân bố màu nhưng khác nhau về ngữ nghĩa. Để khắc phục, vector liên kết màu (CCV) được sử dụng, chia các pixel thành hai nhóm: liên kết màu và không liên kết màu. Phương pháp này giúp cải thiện độ chính xác trong tìm kiếm hình ảnh.
III. Kết hợp đa đặc trưng và phản hồi liên quan
Kết hợp đa đặc trưng là phương pháp sử dụng nhiều loại đặc trưng (màu sắc, kết cấu, hình dạng) để nâng cao hiệu quả tìm kiếm. Phản hồi liên quan (Relevance Feedback) là kỹ thuật cho phép người dùng đánh giá kết quả tìm kiếm, giúp hệ thống điều chỉnh truy vấn để cải thiện độ chính xác. Các phương pháp như SVM (Support Vector Machine) được sử dụng để kết hợp các đặc trưng và tối ưu hóa quá trình tìm kiếm. Kết hợp đa đặc trưng và phản hồi liên quan giúp thu hẹp khoảng cách ngữ nghĩa, mang lại kết quả tìm kiếm chính xác hơn.
3.1. Phản hồi liên quan trong CBIR
Phản hồi liên quan (Relevance Feedback) là một kỹ thuật quan trọng trong CBIR, cho phép người dùng tương tác với hệ thống bằng cách đánh giá kết quả tìm kiếm. Dựa trên phản hồi, hệ thống điều chỉnh truy vấn và trọng số của các đặc trưng để cải thiện độ chính xác. Các phương pháp như cập nhật truy vấn, học thống kê và học ngắn hạn được sử dụng để tối ưu hóa quá trình này. Phản hồi liên quan giúp hệ thống hiểu rõ hơn nhu cầu của người dùng, từ đó mang lại kết quả tìm kiếm phù hợp hơn.
IV. Ứng dụng và đánh giá hệ thống CBIR
Hệ thống CBIR được ứng dụng rộng rãi trong nhiều lĩnh vực như y tế, thương mại điện tử, quản lý dữ liệu hình ảnh và an ninh. Trong y tế, CBIR giúp chẩn đoán bệnh thông qua phân tích hình ảnh y khoa. Trong thương mại điện tử, hệ thống hỗ trợ tìm kiếm sản phẩm dựa trên hình ảnh. Đánh giá hiệu năng của hệ thống CBIR thường dựa trên các chỉ số như độ chính xác, thời gian truy vấn và khả năng xử lý dữ liệu lớn. Các thử nghiệm trên cơ sở dữ liệu Wang và Oliva cho thấy hiệu quả vượt trội của phương pháp kết hợp đa đặc trưng và phản hồi liên quan.
4.1. Đánh giá hiệu năng hệ thống
Đánh giá hiệu năng của hệ thống CBIR được thực hiện thông qua các thử nghiệm trên cơ sở dữ liệu Wang và Oliva. Các chỉ số đánh giá bao gồm độ chính xác trung bình, thời gian truy vấn và khả năng xử lý dữ liệu lớn. Kết quả cho thấy phương pháp kết hợp đa đặc trưng và phản hồi liên quan mang lại hiệu quả cao hơn so với các phương pháp truyền thống. Đặc biệt, việc sử dụng SVM và cập nhật trọng số đặc trưng dựa trên phản hồi liên quan giúp cải thiện đáng kể độ chính xác và tốc độ tìm kiếm.