I. Giới thiệu đề tài
Chương này trình bày các khái niệm cơ bản về chuỗi thời gian, đặc biệt là việc chuyển đổi hình ảnh hai chiều thành dữ liệu chuỗi thời gian. Dữ liệu chuỗi thời gian là một tập hợp có thứ tự các quan sát đơn biến hoặc đa biến được đo theo thời gian. Việc chuyển đổi này cho phép áp dụng các kỹ thuật tìm kiếm hình ảnh hiện đại, mở rộng khả năng tìm kiếm và phân tích. Kỹ thuật tìm kiếm hình ảnh dựa trên dữ liệu chuỗi thời gian cung cấp một phương pháp mới để xử lý và truy vấn hình ảnh, đồng thời giải quyết các vấn đề như độ nhiễu và tính bất biến trong phép quay. Mục tiêu của đề tài là phát triển một khung tổng quát cho kỹ thuật này, giúp nâng cao hiệu quả và độ chính xác trong việc tìm kiếm.
1.1 Dữ liệu chuỗi thời gian
Dữ liệu chuỗi thời gian được định nghĩa là tập hợp các quan sát theo thời gian, có thể là đơn biến hoặc đa biến. Trong nghiên cứu này, chuỗi thời gian được xem xét như một tập hợp dữ liệu hai chiều với các giá trị tương ứng. Các ứng dụng của chuỗi thời gian rất đa dạng, từ phân tích tài chính đến y tế, và đều yêu cầu các phương pháp tìm kiếm tương tự. Các thách thức trong việc xử lý dữ liệu này bao gồm độ nhiễu và sự không đồng nhất về số chiều của dữ liệu, điều này đòi hỏi các phương pháp lập chỉ mục hiệu quả để nâng cao tốc độ tìm kiếm.
1.2 Biểu diễn ảnh dạng chuỗi thời gian
Chuyển đổi hình ảnh hai chiều sang chuỗi thời gian giúp khai thác các đặc điểm của ảnh trong một không gian mới. Phương pháp được sử dụng trong luận văn này dựa trên đường biên hình dạng của ảnh, từ đó tạo ra dữ liệu chuỗi thời gian. Các đặc điểm như nhiễu, phép tỉ lệ và phép quay được xử lý để đảm bảo tính chính xác trong tìm kiếm. Việc biểu diễn ảnh dưới dạng chuỗi thời gian cho phép áp dụng các kỹ thuật machine learning và các phương pháp lập chỉ mục để cải thiện hiệu quả tìm kiếm.
1.3 Kỹ thuật tìm kiếm ảnh 2 chiều dựa trên dữ liệu chuỗi thời gian
Kỹ thuật tìm kiếm ảnh 2 chiều dựa trên chuỗi thời gian là một trong những ứng dụng quan trọng trong lĩnh vực tìm kiếm hình ảnh. Hàm khoảng cách được sử dụng để đo lường độ tương tự giữa các ảnh trong cơ sở dữ liệu, yêu cầu tính bất biến đối với nhiễu và phép quay. Các thách thức chính bao gồm việc xử lý ảnh truy vấn bị nhiễu và lƣu trữ tập dữ liệu lớn. Mục tiêu của nghiên cứu là phát triển một khung tổng quát cho kỹ thuật này, giúp cải thiện tốc độ và độ chính xác trong tìm kiếm.
II. Tổng thuật các công trình liên quan
Chương này tổng hợp các công trình nghiên cứu trước đây liên quan đến tìm kiếm hình ảnh và chuỗi thời gian. Các nghiên cứu đã chỉ ra rằng việc áp dụng các phương pháp như Dynamic Time Warping (DTW) và Longest Common Subsequence (LCS) có thể cải thiện đáng kể độ chính xác trong việc tìm kiếm hình ảnh. Những công trình này đã phát triển các độ đo tương tự, từ đó cung cấp nền tảng cho việc xây dựng các cấu trúc chỉ mục hiệu quả. Việc sử dụng các phương pháp nén dữ liệu cũng đã được nghiên cứu để giảm thiểu kích thước dữ liệu trong quá trình tìm kiếm. Những nghiên cứu này đã khẳng định tầm quan trọng của việc phát triển các phương pháp mới nhằm nâng cao hiệu quả tìm kiếm hình ảnh trong các ứng dụng thực tế.
2.1 Công trình về độ đo tương tự
Các công trình nghiên cứu về độ đo tương tự đã chỉ ra rằng độ đo Minkowski và độ đo khoảng cách Euclid là những phương pháp phổ biến trong việc đánh giá độ tương tự giữa các chuỗi thời gian. Đặc biệt, Dynamic Time Warping (DTW) được sử dụng để xử lý các chuỗi có độ dài khác nhau, cho phép tìm kiếm chính xác hơn trong các tập dữ liệu lớn. Những nghiên cứu này đã tạo điều kiện cho việc phát triển các kỹ thuật tìm kiếm hình ảnh hiệu quả hơn.
2.2 Các công trình về biểu diễn chuỗi thời gian
Việc biểu diễn chuỗi thời gian là một yếu tố quan trọng trong việc tìm kiếm hình ảnh. Nhiều phương pháp thu giảm số chiều đã được đề xuất, bao gồm Piecewise Aggregate Approximation (PAA) và Symbolic Aggregate approXimation (SAX). Những phương pháp này giúp giảm kích thước dữ liệu mà không làm mất đi các đặc trưng chính của dữ liệu, từ đó cải thiện tốc độ tìm kiếm và độ chính xác.
2.3 Kỹ thuật xử lý phép quay trên chuỗi thời gian của ảnh
Nghiên cứu về việc xử lý phép quay trên chuỗi thời gian của ảnh đã chỉ ra rằng việc áp dụng các phương pháp như Fourier Transform có thể giúp đạt được tính bất biến trong phép quay. Các công trình trước đã phát triển nhiều phương pháp để xử lý độ nhiễu và cải thiện độ chính xác trong tìm kiếm. Việc áp dụng các kỹ thuật này trong nghiên cứu hiện tại sẽ góp phần nâng cao hiệu quả của hệ thống tìm kiếm hình ảnh.
III. Cơ sở lý thuyết
Chương này trình bày các lý thuyết cơ bản liên quan đến chuỗi thời gian và các phương pháp xử lý dữ liệu. Biến đổi Fourier được sử dụng để trích xuất đặc trưng từ dữ liệu chuỗi thời gian, giúp đạt được tính bất biến trong phép quay. Cấu trúc dữ liệu VP-Tree được giới thiệu như một giải pháp lập chỉ mục hiệu quả, giúp tăng tốc độ tìm kiếm. Chương này cũng đề cập đến các khái niệm về nén dữ liệu và các thuật toán tìm kiếm lân cận, cung cấp cơ sở lý thuyết cho việc phát triển các phương pháp tìm kiếm hình ảnh trong các chương tiếp theo.
3.1 Phép biến đổi Fourier rời rạc DFT trên chuỗi thời gian của ảnh
Phép biến đổi Fourier rời rạc (DFT) là một công cụ mạnh mẽ trong việc phân tích chuỗi thời gian. DFT giúp trích xuất các đặc trưng quan trọng từ dữ liệu, cho phép nhận diện các mẫu và xu hướng trong ảnh. Việc áp dụng DFT trong nghiên cứu này nhằm đạt được tính bất biến đối với các phép quay, từ đó cải thiện độ chính xác trong tìm kiếm. Nghiên cứu cho thấy rằng việc sử dụng DFT có thể giảm thiểu độ nhiễu và tăng cường khả năng nhận diện các đặc điểm chính của ảnh.
3.2 Cấu trúc dữ liệu VP Tree
Cấu trúc dữ liệu VP-Tree được thiết kế để tối ưu hóa quá trình tìm kiếm trong các tập dữ liệu lớn. Cấu trúc này cho phép thực hiện tìm kiếm lân cận gần nhất một cách hiệu quả, nhờ vào khả năng tổ chức dữ liệu theo cách giảm thiểu số lượng so sánh cần thiết. Việc xây dựng VP-Tree cho phép cải thiện đáng kể tốc độ tìm kiếm so với các cấu trúc dữ liệu truyền thống. Các nghiên cứu trước đây đã chứng minh rằng VP-Tree có thể cải thiện hiệu suất tìm kiếm trong các ứng dụng thực tế.
3.3 Cấu trúc dữ liệu VPC Tree
Cấu trúc dữ liệu VPC-Tree được phát triển nhằm mở rộng khả năng của VP-Tree. Cấu trúc này không chỉ hỗ trợ tìm kiếm lân cận mà còn cho phép nén dữ liệu tại các nút lá, giúp giảm kích thước bộ nhớ lưu trữ. Việc áp dụng VPC-Tree trong nghiên cứu này sẽ giúp cải thiện hiệu quả tìm kiếm, đồng thời giảm thiểu thời gian truy xuất dữ liệu. Các nghiên cứu trước đã chỉ ra rằng VPC-Tree có thể mang lại lợi ích lớn trong việc xử lý các tập dữ liệu lớn.