Nghiên Cứu Ứng Dụng Wavelets Trong Hệ Thống Truy Vấn Ảnh

Luận án tiến sĩ trình bày phương pháp truy vấn ảnh theo nội dung sử dụng trích đặc trưng trên nền wavelets trong kỹ thuật điện tử.

Trường đại học

Đại học Quốc gia TP. Hồ Chí Minh

Chuyên ngành

Kỹ thuật điện tử

Người đăng

Ẩn danh

Thể loại

luận án tiến sĩ

2013

233

Phí lưu trữ

55 Point

Mục lục chi tiết

LỜI CAM ĐOAN

1. CHƯƠNG 1: GIỚI THIỆU

1.1. Phương pháp xử lý truy vấn

1.2. Sự cần thiết của nghiên cứu

1.3. Hướng nghiên cứu

1.4. Mục tiêu và nội dung nghiên cứu

1.5. Những đóng góp của Luận án

1.5.1. Nghiên cứu phối hợp các đặc trưng toàn cục để truy vấn ảnh

1.5.2. Nghiên cứu kết hợp biến đổi contourlets và ma trận GLCM để đề xuất một bộ mô tả đặc trưng ảnh mới contourlet cooccurrence

1.5.3. Nghiên cứu kết hợp biến đổi wavelets phức và toán tử LBP để truy vấn ảnh

1.5.4. Nghiên cứu kết hợp biến đổi Nonsubsampled Contourlet (NSCT) và bộ dò góc Harris để hình thành bộ trích đặc trưng contourlet Harris và thiết kế giải thuật truy vấn

1.5.5. Thực nghiệm khảo sát đánh giá mở rộng các giải thuật đề xuất và so sánh hiệu quả truy vấn với một số giải thuật đã công bố khác

1.5.6. Ứng dụng mở rộng của các đặc trưng đề xuất

1.6. Cấu trúc Luận án

2. CHƯƠNG 2: CÁC KỸ THUẬT THIẾT KẾ, ĐÁNH GIÁ HỆ THỐNG TRUY VẤN ẢNH VÀ CÁC MÔ HÌNH NGHIÊN CỨU

2.1. Các kỹ thuật trích đặc trưng ảnh

2.1.1. Biểu diễn và mô tả ảnh

2.1.2. Các đặc trưng cơ bản

2.1.3. Các đặc trưng dựa trên wavelets

2.2. Kỹ thuật đo đạc sự tương tự giữa các đặc trưng

2.3. Đánh giá hiệu quả giải thuật truy vấn

2.4. Xây dựng mô hình nghiên cứu

2.4.1. Các mô hình nghiên cứu trích đặc trưng ảnh

2.5. Nhận xét

2.6. Kết chương

3. CHƯƠNG 3: ĐỀ XUẤT CÁC PHƯƠNG PHÁP TRÍCH ĐẶC TRƯNG ẢNH VÀ GIẢI THUẬT TRUY VẤN

3.1. Phối hợp các đặc trưng để truy vấn ảnh

3.1.1. Chọn các đặc trưng ảnh

3.2. Thiết kế giải thuật truy vấn

3.3. Độ phức tạp giải thuật

3.4. Thực nghiệm đánh giá

3.5. Đánh giá MAP của các đề xuất với các kết quả trong [8]

3.6. Kết chương

3.2. Truy vấn ảnh dùng đặc trưng ảnh contourlet cooccurrence

3.2.1. Phương pháp đề xuất

3.2.2. Đặc trưng ảnh contourlet cooccurrence

3.2.3. Lựa chọn phép đo sự tương tự mặc định

3.2.4. Kết quả thực nghiệm

3.3. Truy vấn ảnh dùng đặc trưng ảnh phase-based LBP

3.3.1. Đặc trưng ảnh phase-based LBP

3.3.2. Kết quả thực nghiệm

3.4. Truy vấn ảnh dùng đặc trưng ảnh contourlet Harris

3.4.1. Phương pháp đề xuất

3.4.2. Bộ dò contourlet Harris

3.4.3. Đề xuất giải thuật truy vấn

3.4.4. Kết quả thực nghiệm

4. CHƯƠNG 4: THỰC NGHIỆM KHAO SÁT MỨC ĐỘ HIỆU QUẢ CỦA CÁC GIẢI THUẬT TRUY VẤN ĐỀ XUẤT

4.1. Các hướng khảo sát thực nghiệm

4.2. Khảo sát hiệu quả của 4 giải thuật đề xuất so với các giải thuật truy vấn ảnh khác

4.2.1. Khảo sát với cơ sở dữ liệu ảnh: UIUC

4.2.2. Khảo sát với cơ sở dữ liệu ảnh: Brodatz

4.3. Kết chương

5. CHƯƠNG 5: ỨNG DỤNG MỞ RỘNG

5.1. Phân loại ảnh

5.1.1. Các bước xử lý của mô hình BoW

5.1.2. Mô hình Bags of Multi-Features

5.1.3. Dùng nhiều bộ phân loại SVM cho multi-kernels và phương pháp chọn độ chính xác trung bình đạt hiệu quả cao cho các class

5.2. Kết quả thực nghiệm

5.2.1. Thực nghiệm 1: đánh giá hiệu quả phân loại của đặc trưng denseSBP

5.2.2. Thực nghiệm 2: so sánh phương pháp MKL và integrated method với các phương pháp khác

5.3. Kết chương

6. CHƯƠNG 6: TỔNG KẾT

6.1. Tóm tắt các kết quả đạt được

6.2. Hướng phát triển

7. CÁC TÀI LIỆU CÔNG BỐ CỦA TÁC GIẢ

7.1. Các công trình chính của Luận án

7.2. Các công trình công bố trên tạp chí tại Việt Nam

7.3. Các công trình công bố tại các hội nghị quốc tế

7.4. Một số công trình có liên quan đến lĩnh vực xử lý ảnh, video

7.5. Các đề tài cấp ngành

TÀI LIỆU THAM KHẢO

Tóm tắt

I. Tổng Quan Nghiên Cứu Ứng Dụng Wavelets trong CBIR 55 ký tự

Hệ thống truy vấn ảnh dựa trên nội dung (CBIR) đang ngày càng trở nên quan trọng trong việc quản lý và khai thác kho dữ liệu ảnh khổng lồ hiện nay. Tuy nhiên, việc mô tả chính xác các đặc điểm nhìn của con người vẫn là một thách thức lớn. Các nghiên cứu gần đây tập trung vào việc cải tiến các đặc trưng ảnh cơ bản như histogram màu, texture, shape, và phát triển các đặc trưng mới dựa trên các phép biến đổi như wavelets và contourlets. Luận án này tập trung vào nghiên cứu ứng dụng biến đổi wavelets vào thiết kế hệ thống CBIR, cụ thể là xây dựng các thuật toán trích đặc trưng ảnh dùng biến đổi wavelets và giải thuật truy vấn phù hợp. Việc chọn lựa hướng nghiên cứu lấy biến đổi wavelets làm cơ sở nghiên cứu sâu về thiết kế đặc trưng ảnh và ứng dụng vào truy vấn ảnh đã đạt được kết quả nhất định.

Trích dẫn: 'Luận án tập trung nghiên cứu ứng dụng biến đổi wavelets vào thiết kế hệ thong CBIR mà cụ thé là xây dựng các thuật toán trích đặc trưng anh đùng biến doi wavelets và giải thuật truy vấn phù hợp, cùng khả năng ứng dụng mở rộng của các đặc trưng dé xudt.'

1.1. Giới thiệu về Biến đổi Wavelet và ứng dụng trong ảnh

Biến đổi Wavelet (Wavelet transform) là một công cụ mạnh mẽ trong xử lý ảnh và phân tích tín hiệu. Nó cho phép phân tích tín hiệu ở nhiều độ phân giải khác nhau (Multiresolution Analysis), giúp trích xuất thông tin quan trọng từ ảnh. Ứng dụng wavelet trong ảnh bao gồm nén ảnh, lọc ảnh và trích xuất đặc trưng. Các loại wavelet phổ biến bao gồm Daubechies, Haar, và Symlet. Việc lựa chọn wavelet phù hợp phụ thuộc vào đặc tính của ảnh và yêu cầu của ứng dụng.

1.2. CBIR Hệ thống truy vấn ảnh dựa trên nội dung

Hệ thống truy vấn ảnh dựa trên nội dung (CBIR) là một kỹ thuật tìm kiếm ảnh dựa trên các đặc trưng hình ảnh như màu sắc, texture, hình dạng. CBIR giúp người dùng tìm kiếm ảnh một cách hiệu quả hơn so với các phương pháp truyền thống dựa trên từ khóa. Quy trình CBIR bao gồm trích xuất đặc trưng ảnh, xây dựng cơ sở dữ liệu đặc trưng, và so sánh độ tương đồng ảnh giữa ảnh truy vấn và ảnh trong cơ sở dữ liệu. Hiệu suất của CBIR phụ thuộc vào chất lượng của các đặc trưng ảnh và thuật toán truy vấn ảnh.

II. Thách Thức CBIR Biểu Diễn Đặc Trưng Ảnh Hiệu Quả 59 ký tự

Một trong những thách thức lớn nhất trong hệ thống CBIR là làm thế nào để biểu diễn đặc trưng ảnh một cách hiệu quả, sao cho có thể nắm bắt được các đặc điểm quan trọng của ảnh và phân biệt được giữa các ảnh khác nhau. Các phương pháp truyền thống thường gặp khó khăn trong việc xử lý các biến thể về ánh sáng, góc nhìn, và kích thước. Do đó, cần có các phương pháp trích đặc trưng ảnh mạnh mẽ hơn, có khả năng chịu được các biến thể này và vẫn đảm bảo tính chính xác cao. Việc lựa chọn và kết hợp các mô hình hóa ảnh cũng đóng vai trò quan trọng trong việc cải thiện hiệu suất của hệ thống CBIR. Luận án này tập trung vào việc giải quyết thách thức này bằng cách đề xuất các phương pháp trích đặc trưng ảnh dựa trên wavelets, có khả năng biểu diễn ảnh một cách hiệu quả và linh hoạt. Trích dẫn: 'Mặc dù, các nhà nghiên cứu đã có nhiều nỗ lực trong những năm gan đây trong việc nghiên cứu hệ thống truy van ảnh, nhưng vẫn chưa có giải thuật thuyết phục được chấp nhận pho biến có thé biểu diễn được các đặc điểm nhìn của con người (human vision), đặc biệt là có thé mô tả ảnh đạt độ chính xác cao theo nội dung cần quan tâm, và điều này luôn là thách thức lớn với tất cả các nhà nghiên cứu.'

2.1. Các Yếu Tố Ảnh Hưởng Đến Hiệu Suất CBIR

Hiệu suất của hệ thống CBIR chịu ảnh hưởng bởi nhiều yếu tố, bao gồm chất lượng của dữ liệu ảnh, phương pháp trích xuất đặc trưng ảnh, thuật toán so sánh độ tương đồng ảnh, và phương pháp indexing ảnh. Độ chính xác truy vấn cũng phụ thuộc vào lựa chọn các tham số trong thuật toán trích xuất đặc trưng và so sánh. Việc đánh giá hiệu suất của hệ thống CBIR thường được thực hiện bằng các độ đo như độ chính xác (precision), độ phủ (recall), và MAP (Mean Average Precision). Cần có các phương pháp đánh giá khách quan và đáng tin cậy để so sánh hiệu suất của các hệ thống CBIR khác nhau.

2.2. Giới Hạn của Phương Pháp Trích Xuất Đặc Trưng Ảnh Truyền Thống

Các phương pháp trích xuất đặc trưng ảnh truyền thống như histogram màu và texture thường gặp khó khăn trong việc biểu diễn các đặc điểm phức tạp của ảnh. Chúng có thể nhạy cảm với các biến đổi về ánh sáng, góc nhìn, và kích thước. Ngoài ra, chúng thường bỏ qua thông tin về cấu trúc không gian của ảnh. Do đó, cần có các phương pháp trích xuất đặc trưng ảnh tiên tiến hơn, có khả năng khắc phục các hạn chế này và biểu diễn ảnh một cách đầy đủ và chính xác hơn. Kỹ thuật wavelet có tiềm năng giải quyết các hạn chế của phương pháp truyền thống.

III. Phương Pháp Wavelet Giải Pháp Trích Xuất Đặc Trưng CBIR 60 ký tự

Luận án này đề xuất các phương pháp trích đặc trưng ảnh mới dựa trên biến đổi wavelets, kết hợp với các kỹ thuật khác như contourlets và LBP (Local Binary Pattern). Cụ thể, luận án đề xuất ba đặc trưng ảnh mới: đặc trưng ảnh contourlet cooccurrence, đặc trưng ảnh phase-based LBP, và đặc trưng ảnh contourlet Harris. Các đặc trưng này được thiết kế để nắm bắt các đặc điểm quan trọng của ảnh, đồng thời giảm thiểu ảnh hưởng của các biến thể về ánh sáng, góc nhìn, và kích thước. Luận án cũng đề xuất bốn giải thuật truy vấn ảnh tương ứng với các đặc trưng này, nhằm tìm kiếm ảnh một cách hiệu quả và chính xác. Các thực nghiệm cho thấy các phương pháp đề xuất có hiệu suất cao hơn so với các phương pháp truyền thống.
Trích dẫn: 'Luận án đã dé xuất ba đặc trưng ảnh mới là: đặc trung ảnh contourlet cooccurrence, đặc trưng ảnh phase-based LBP, đặc trưng ảnh contourlet Harris và 4 giải thuật truy vẫn ảnh là: Giải thuật phối hợp các đặc trưng dé truy vấn ảnh (matching) , Giải thuật truy vấn ảnh dùng đặc trưng contourlet cooccurrence (CC), Giải thuật truy vấn ảnh dùng đặc trưng phase-based LBP (pbLBP), Giải thuật truy van anh dùng đặc trưng contourlet Harris (CH).'

3.1. Trích đặc trưng ảnh contourlet Cooccurrence Wavelet

Đặc trưng ảnh contourlet cooccurrence kết hợp biến đổi contourlets với ma trận GLCM (Gray-Level Co-occurrence Matrix) để trích xuất thông tin về texture của ảnh. Biến đổi contourlets cho phép phân tích ảnh ở nhiều hướng và độ phân giải khác nhau, trong khi ma trận GLCM ghi lại mối quan hệ không gian giữa các pixel có cường độ xám khác nhau. Sự kết hợp này giúp nắm bắt các đặc điểm texture một cách chi tiết và đầy đủ. Phương pháp này đặc biệt hiệu quả trong việc phân biệt các ảnh có texture phức tạp và đa dạng.

3.2. Trích đặc trưng ảnh Phase Based LBP wavelet

Đặc trưng ảnh phase-based LBP kết hợp biến đổi wavelets phức với toán tử LBP để trích xuất thông tin về cấu trúc cục bộ của ảnh. Biến đổi wavelets phức cho phép phân tích pha của ảnh, trong khi toán tử LBP ghi lại các mẫu nhị phân cục bộ. Sự kết hợp này giúp nắm bắt các đặc điểm cấu trúc quan trọng của ảnh, đồng thời giảm thiểu ảnh hưởng của các biến thể về ánh sáng. Giải thuật thích hợp cho truy xuất ảnh trong điều kiện ánh sáng thay đổi.

IV. Kết Hợp Contourlet Harris Wavelet cho Truy Vấn Ảnh CBIR 60 ký tự

Luận án này kết hợp biến đổi Nonsubsampled Contourlet (NSCT) với bộ dò góc Harris để hình thành bộ trích đặc trưng contourlet Harris và thiết kế giải thuật truy vấn. NSCT là một biến đổi contourlet không lấy mẫu con, cho phép phân tích ảnh ở nhiều hướng và độ phân giải khác nhau mà không gây ra hiện tượng răng cưa. Bộ dò góc Harris là một công cụ mạnh mẽ trong việc phát hiện các góc và điểm đặc trưng trong ảnh. Sự kết hợp này giúp nắm bắt các đặc điểm hình học quan trọng của ảnh, đồng thời giảm thiểu ảnh hưởng của các biến thể về góc nhìn. Các thực nghiệm cho thấy phương pháp đề xuất có hiệu suất cao trong việc tìm kiếm ảnh có cấu trúc hình học phức tạp. Trích dẫn: 'Nghiên cứu kết hợp biến đối Nonsubsampled Contourlet (N SCT) va bộ đò góc Harris đê hình thành bộ trích đặc trưng contourlet Harris va thiệt kê giải thuật truy VẤn.'

4.1. Ưu Điểm của Biến Đổi Nonsubsampled Contourlet NSCT

Biến đổi NSCT có nhiều ưu điểm so với các biến đổi contourlet truyền thống. NSCT không lấy mẫu con, do đó không gây ra hiện tượng răng cưa. NSCT có tính linh hoạt cao, cho phép lựa chọn số lượng hướng và độ phân giải phân tích một cách độc lập. NSCT có khả năng nắm bắt các đường cong và đường thẳng trong ảnh một cách hiệu quả. Những ưu điểm này làm cho NSCT trở thành một công cụ mạnh mẽ trong việc xử lý ảnh và phân tích ảnh.

4.2. Ứng dụng bộ dò góc Harris cho truy vấn ảnh

Bộ dò góc Harris có thể được sử dụng để phát hiện các góc và điểm đặc trưng trong ảnh. Các góc và điểm đặc trưng này có thể được sử dụng để biểu diễn hình dạng của các đối tượng trong ảnh. Việc sử dụng bộ dò góc Harris giúp hệ thống truy vấn ảnh có thể tìm kiếm ảnh dựa trên hình dạng của các đối tượng. Phương pháp này đặc biệt hiệu quả trong việc tìm kiếm ảnh có các đối tượng có hình dạng độc đáo và dễ nhận biết.

V. Đánh Giá Hiệu Suất Các Giải Thuật Truy Vấn Ảnh Wavelet 59 ký tự

Luận án này đã thực hiện các thực nghiệm để đánh giá hiệu suất của các giải thuật truy vấn ảnh đề xuất trên các cơ sở dữ liệu ảnh khác nhau, bao gồm UIUC và Brodatz. Các kết quả thực nghiệm cho thấy các giải thuật đề xuất có hiệu suất cao hơn so với các giải thuật truyền thống, đặc biệt là trong việc tìm kiếm ảnh có texture phức tạp và hình dạng độc đáo. Luận án cũng đã so sánh hiệu suất của các giải thuật đề xuất với các giải thuật đã công bố khác, và cho thấy các giải thuật đề xuất có hiệu suất cạnh tranh hoặc tốt hơn. Các kết quả thực nghiệm chứng minh tính hiệu quả và tiềm năng của các phương pháp trích đặc trưng ảnh và giải thuật truy vấn ảnh dựa trên wavelets. Trích dẫn: 'Các thực nghiệm đã chứng minh được hiệu quả cải tiễn của các giải thuật đề xuất.'

5.1. Phương Pháp Đánh Giá Hiệu Suất Truy Vấn Ảnh

Để đánh giá hiệu suất của một giải thuật truy vấn ảnh, cần phải có các phương pháp và tiêu chuẩn đánh giá thích hợp. Luận án đã chọn lựa và giới thiệu bộ các phương pháp và thông số đánh giá được sử dụng rộng rãi trong lĩnh vực truy vấn ảnh, bao gồm độ chính xác, độ phủ, MAP, và R-precision. Các phương pháp này cho phép đánh giá một cách khách quan và đáng tin cậy hiệu suất của các giải thuật truy vấn ảnh. Việc sử dụng các phương pháp đánh giá tiêu chuẩn giúp so sánh hiệu suất của các giải thuật đề xuất với các giải thuật đã công bố khác.

5.2. Kết quả thực nghiệm và so sánh với các phương pháp khác

Các kết quả thực nghiệm cho thấy các giải thuật đề xuất có hiệu suất cao hơn so với các giải thuật truyền thống, đặc biệt là trong việc tìm kiếm ảnh có texture phức tạp và hình dạng độc đáo. Luận án cũng đã so sánh hiệu suất của các giải thuật đề xuất với các giải thuật đã công bố khác, và cho thấy các giải thuật đề xuất có hiệu suất cạnh tranh hoặc tốt hơn. Các kết quả thực nghiệm chứng minh tính hiệu quả và tiềm năng của các phương pháp trích đặc trưng ảnh và giải thuật truy vấn ảnh dựa trên wavelets.

VI. Ứng Dụng Mở Rộng Phân Loại Ảnh bằng Wavelet 55 ký tự

Ngoài ứng dụng trong truy vấn ảnh, luận án này cũng khảo sát khả năng sử dụng các đặc trưng đề xuất vào ứng dụng phân loại ảnh. Phân loại ảnh là một hướng nghiên cứu có liên quan chặt chẽ với truy vấn ảnh. Luận án đề xuất phương pháp MKL (Multiple Kernel Learning) kết hợp các kernel và phương pháp integrate method để chọn những class có độ chính xác cao, từ đó gia tăng độ chính xác phân loại. Các kết quả thực nghiệm cho thấy phương pháp đề xuất có hiệu suất so sánh được với những phương pháp đã công bố gần đây. Việc ứng dụng các đặc trưng đề xuất trong phân loại ảnh mở ra nhiều tiềm năng trong các lĩnh vực như y tế, nông nghiệp, và giám sát an ninh. Trích dẫn: 'Ngoài ra, Luận án đã khảo sát khả năng sử dụng đặc trưng dé xuất vào ứng dụng phân loại anh (image classification) là một hướng nghiên cứu có liên quan chặt chẽ với truy vấn ảnh.'

6.1. Mô hình BoW Bag of Words cho phân loại ảnh

Luận án sử dụng mô hình BoW (Bag of Words) để phân loại ảnh. Mô hình BoW là một phương pháp phổ biến trong phân loại ảnh, trong đó ảnh được biểu diễn bằng một histogram các từ vựng hình ảnh. Các từ vựng hình ảnh được tạo ra bằng cách gom cụm các đặc trưng cục bộ của ảnh. Mô hình BoW có tính đơn giản và hiệu quả, và có thể được sử dụng để phân loại ảnh trong nhiều lĩnh vực khác nhau. Quy trình xử lý phân loại dùng mô hình BOW gồm: Trích đặc trưng->Xây dựng từ điển trực quan -> Biểu diễn ảnh dùng BOW -> Huấn luyện và phân loại.

6.2. Phương pháp MKL Multiple Kernel Learning

Luận án đề xuất phương pháp MKL (Multiple Kernel Learning) để kết hợp các kernel khác nhau trong quá trình phân loại ảnh. MKL cho phép kết hợp thông tin từ nhiều nguồn khác nhau, từ đó cải thiện độ chính xác phân loại. MKL là một phương pháp mạnh mẽ và linh hoạt, và có thể được sử dụng để giải quyết các bài toán phân loại ảnh phức tạp. Kết hợp nhiều kernel giúp tăng độ chính xác cho phân loại ảnh.

27/05/2025

Bạn đang xem trước tài liệu:

Luận án tiến sĩ kỹ thuật điện tử truy vấn ảnh theo nội dung sử dụng trích đặc trưng trên nền wavelets

Tải đầy đủ

Trích đoạn nội dung tài liệu

ĐẠI HỌC QUOC GIA TP. HO CHI MINH TRUONG DAI HOC BACH KHOA NGUYEN DUC HOANG TRUY VAN ANH THEO NOI DUNG SU DUNG TRICH DAC TRUNG TREN NEN WAVELETS LUAN AN TIEN SI KY THUAT TP. HO CHI MINH NAM 2013 ĐẠI HỌC QUOC GIA TP. HCM TRƯỜNG ĐẠI HỌC BÁCH KHOA NGUYÊN ĐỨC HOÀNG TRUY VAN ANH THEO NOI DUNG SỬ DUNG TRICH DAC TRUNG TREN NEN WAVELETS Chuyên ngành: Kỹ thuật điện tử Mã số chuyên ngành: 62527001 Phản biện độc lập 1: PGS.

Nguyễn Văn Khang Phản biện độc lập 2: PGS. Dương Anh Đức Phản biện 1: PGS. Ngô Quốc Tạo Phản biện 2: TS. Nguyễn Thanh Hải Phản biện 3: TS.

Lê Thành Sách NGƯỜI HUONG DAN KHOA HOC 1. Lê Tiến Thường 2. Đỗ Hồng Tuan LỜI CAM ĐOAN Tác giả xin cam đoan đây là công trình nghiên cứu của bản thân tác giả. Các kết quả nghiên cứu và các kết luận trong luận án này là trung thực, và không sao chép từ bat kỳ một nguồn nào và dưới bat kỳ hình thức nào.

Việc tham khảo các nguôn tài liệu (nếu có) đã được thực hiện trích dẫn và ghi nguồn tài liệu tham khảo đúng theo yêu câu. Tác giả luận án Nguyễn Đức Hoàng TOM TAT LUẬN AN Mặc dù, các nhà nghiên cứu đã có nhiều nỗ lực trong những năm gan đây trong việc nghiên cứu hệ thống truy van ảnh, nhưng vẫn chưa có giải thuật thuyết phục được chấp nhận pho biến có thé biểu diễn được các đặc điểm nhìn của con người (human vision), đặc biệt là có thé mô tả ảnh đạt độ chính xác cao theo nội dung cần quan tâm, và điều này luôn là thách thức lớn với tất cả các nhà nghiên cứu. So sánh với các nghiên cứu hệ thống CBIR (Content-based Image Retrieval) công bố trước năm 2000, sự khác biệt có thể thấy trong các nghiên cứu 10 năm gần đây là việc gia tăng của đa dạng các đặc trưng mô tả ảnh. Các dé xuất bắt nguồn từ cải tiến những đặc trưng ảnh cơ bản (như: histogram mau, texture, shape,.) đến phát triển những đặc trưng ảnh mới dựa trên những phép biến đối như wavelets, contourlets.

và kết hợp da dang các mô hình toán học trong thiết kế hệ thống CBIR. Do đó, Luận án tập trung nghiên cứu ứng dụng biến đổi wavelets vào thiết kế hệ thong CBIR mà cụ thé là xây dựng các thuật toán trích đặc trưng anh đùng biến doi wavelets và giải thuật truy vấn phù hợp, cùng khả năng ứng dụng mở rộng của các đặc trưng dé xudt. Trong Luan án này, việc chọn lua hướng nghiên cứu lay biến đôi wavelets làm cơ sở nghiên cứu sâu về thiết kế đặc trưng anh và ứng dụng vào truy van ảnh đã đạt được kết quả nhất định. Theo đó, các bộ mô tả đặc trưng ảnh dựa trên biến đổi wavelets đã được đề xuất kết hợp với thiết kế giải thuật truy vấn.

Cụ thể, Luận án đã dé xuất ba đặc trưng ảnh mới là: đặc trung ảnh contourlet cooccurrence, đặc trưng ảnh phase-based LBP, đặc trưng ảnh contourlet Harris và 4 giải thuật truy vẫn ảnh là: Giải thuật phối hợp các đặc trưng dé truy vấn ảnh (matching) , Giải thuật truy vấn ảnh dùng đặc trưng contourlet cooccurrence (CC), Giải thuật truy vấn ảnh dùng đặc trưng phase-based LBP (pbLBP), Giải thuật truy van anh dùng đặc trưng contourlet Harris (CH). Để có thé đánh giá được mức độ hiệu quả của một giải thuật truy van ảnh cần phải có các phương pháp, tiêu chuẩn đánh giá thích hợp và đặc thù cho lĩnh vực truy van ảnh. Luận án đã chon lựa, giới thiệu bộ các phương pháp, các thông số đánh giá dé sử dụng cho các thực nghiệm của Luận án. Đây là những phương pháp và thông số đánh giá đã được nhiều nhà nghiên cứu trong lĩnh vực truy vẫn ảnh, truy vẫn thông tin ii sử dụng nên có giá trị cao trong việc tham chiếu hiệu quả các kết quả thực nghiệm của giải thuật đề xuất so với các giải thuật đã công bố.

Ngoài ra, Luận án đã khảo sát khả năng sử dụng đặc trưng dé xuất vào ứng dụng phân loại anh (image classification) là một hướng nghiên cứu có liên quan chặt chẽ với truy vấn ảnh. Các đề xuất gồm phương pháp MKL (Multiple Kernel Learning) kết hợp các kernel, integrate method chọn những class có độ chính xác cao dé gia tăng độ chính xác phân loại cho thay mức độ hiệu qua so sánh được với những phương pháp đã công bố gan đây. Nhìn chung, Luận án này đã giới thiệu được tổng hợp các công trình công bố quan trọng có liên quan đến hướng nghiên cứu và có những đề xuất về các bộ trích đặc trưng ảnh, thiết kế các giải thuật truy van anh, va đã kiếm chứng hiệu quả truy van dé xuất thông qua thực nghiệm cho kết quả truy vấn cải tiễn hơn. Luận án cũng đã nghiên cứu ứng dụng mở rộng của đặc trưng đề xuất trong hướng nghiên cứu phân loại ảnh.

Tất cả các công trình giới thiệu và nghiên cứu đề xuất trong Luận án này đáp ứng mục tiêu nghiên cứu theo những “thang độ” khác nhau. Các thực nghiệm đóng vai trò minh chứng để đưa ra các nhận định, kết luận và có giá trị tham khảo cho các nghiên cứu Sau này. Trên cơ sở các mục tiêu đã đề ra, Luận án đã đề xuất được các bộ trích đặc trưng ảnh mới dựa trên biến đôi wavelets, và thiết kế các giải thuật truy vấn, đề xuất các giải pháp ứng dụng trong phân loại ảnh. Các thực nghiệm đã chứng minh được hiệu quả cải tiễn của các giải thuật đề xuất.

Tóm lại, Luận án với kết quả nghiên cứu đạt được là thiệt thực, có đóng góp cụ thê, và đáp ứng được các mục tiêu dé ra cho Luận án. lil ABSTRACT Although researchers have made great efforts in recent years for the study of image retrieval systems, but no algorithm is accepted widely that can extract image features like human visions. This is always the challenge to all researchers. Compared to the previous researches of Content-based Image Retrieval (CBIR) systems published before the year 2000, the differences viewed in the recent decades of studies are the increasing of many image features.

The improvements are based on basic image features (such as color histogram, texture, shape .), to develop new image features based on the transformations such as the wavelets, the contourlets. and combine many mathematical operators to design CBIR systems. Therefore, the thesis is focused into researches based on the wavelet transform to extract image features then using these features to design CBIR systems and the extended application of the proposed features. In the thesis, the choice of using the wavelet transform to extract image features and design CBIR systems have achieved certain results.

Accordingly, the wavelet- based feature extractors have been proposed and used to design the image retrieval algorithms. Three new image features has been proposed as follows: contourlet cooccurrence, phase-based LBP, contourlet Harris; and four image retrieval algorithms as follows: global features matching (matching), using the contourlet cooccurrence feature (CC), using the phase-based LBP feature (pbLBP), using the contourlet Harris feature (CH). To evaluate retrieval effectiveness of an image retrieval algorithm must have evaluation methods, evaluation criteria appropriate to image retrieval algorithms. The thesis presents the evaluation methods based on the experimental parameters.

These methods and parameters have been used commonly in the performance evaluation of information retrieval and image retrieval by many researchers. So that, achieved experimental results have high values to compare between proposed algorithms with other related algorithms. Furthermore, the thesis also examine the possibility of using the proposed features in image classification that is closely to the relation of CBIR. In this extended application, the proposed methods consists of Multiple Kernel Learning iV (MKL) and integrated methods to increase the classification accuracy.

The experiment results show the efficient perfomance compared with the state-of-the-art methods. Overall, the thesis has introduced a combined research has proposed 3 new image features, 4 new image retrieval algorithms. They have been verified the retrieval effectiveness through the experimental simulations that have improved the query results. The thesis also research an extended application of the proposed features applied to the image classification.

All of the introduced and proposed works in the thesis have achieved the research objectives by different levels. The empirical evidences have been used to make remarks, conclusions and maybe referenced to further researches. Based on the research objectives, the thesis has proposed image retrieval algorithms using the wavelet-based feature extraction. The experiments have demonstrated the improved retrieval effectiveness of the proposed algorithms in CBIR and image classification.

In summary, the contributions of the thesis are practical and specific, fulfill all research objectives. LOI CAM ON Trong quá trình thực hiện Luan án, tôi được Trường Dai hoc Bach Khoa Tp. Hồ Chí Minh và Trung tâm Nghiên cứu Ứng Dụng Khoa học Kỹ thuật Truyền hình (BRAC), là don vị nơi tôi công tac, đã hỗ tro và tao mọi điều kiện thuận lợi, tôi xin bày tỏ sự cảm ơn chân thành đến các đơn vị này. Luận án nảy sẽ không thể hoàn thành nếu không có sự hướng dẫn tận tình và giúp đỡ quý báu của PGS.

Lê Tiến Thường, TS. Đỗ Hồng Tuấn là những người Thay ma tôi muốn bảy tỏ lòng biết ơn sâu sắc nhất. Xin được bày tỏ sự trân trọng với những góp ý có giá trị khoa học sâu sắc và hết sức quý báu của PGS. Dương Anh Đức, PGS.

Nguyễn Văn Khang đã có những phân tích xác đáng giúp tôi hoàn thiện các nội dung trong Luận án này. Tôi cũng xin cảm ơn tập thể các thay cô trong Khoa Điện-Điện tử, đặc biệt là các Thây cô trong Bộ môn Viễn Thông đã có những ý kiến đóng góp và phản biện trong suốt quá trình nghiên cứu và hoàn chỉnh Luận án, cảm ơn Phòng Đào tạo sau đại học đã hỗ trợ các thủ tục trong quá trình hoàn thành khóa học Nghiên cứu sinh. Tôi xin tỏ lòng cảm ơn đến PGS. Đặng Thành Tín, PGS.

Hoàng Đình Chiến, TS. Trịnh Hoàng Hơn, TS. Nguyễn Thanh Hải, TS. Nguyễn Thanh Hùng đã có những góp ý quan trọng trong quá trình thực hiện nội dung Luận án.

Xin cảm ơn Ban giám đốc Trung tâm Nghiên cứu Ứng Dụng Khoa học Kỹ thuật Truyền hình (BRAC) — Đài Truyền hình Việt Nam nhất là TS. Trần Dũng Trình, nguyên Giám đốc đơn vị đã có nhiều hỗ trợ về chuyên môn, thời gian, cũng như kinh phí để tôi có thể hoàn thành Luận án này. Tôi cũng xin bày tỏ lòng cảm ơn đến cố PGS. Nguyễn Kim Sách, nguyên Giám đốc Trung tâm Nghiên cứu Ứng Dụng Khoa học Kỹ thuật Truyền hình (BRAC) đã có những dìu dắt, khích lệ tôi trong quá trình nghiên cứu khoa học.

Cuối cùng, tôi cảm ơn tất cả những sự giúp đỡ của người thân, đồng nghiệp, bạn bè đã đóng góp ý kiến, động viên khích lệ, tạo nguồn lực tinh thần to lớn dé tôi có thé thực hiện và hoàn thành được các công trình trong Luận án này. TRAN TRONG - Tháng 12 năm 2013 VỊ MỤC LỤC 1 CHƯƠNGI-_ GIỚI THIỆU.

Nội dung được bảo vệ bản quyền — Tải xuống đầy đủ

Tài liệu có tiêu đề Nghiên Cứu Ứng Dụng Wavelets Trong Hệ Thống Truy Vấn Ảnh khám phá cách mà các phép biến đổi wavelet có thể được áp dụng trong việc xử lý và truy vấn ảnh. Tác giả trình bày các phương pháp sử dụng wavelet để cải thiện độ chính xác và hiệu quả trong việc nhận diện và phân tích hình ảnh. Một trong những điểm nổi bật của nghiên cứu là khả năng giảm thiểu nhiễu và tối ưu hóa việc lưu trữ dữ liệu hình ảnh, từ đó mang lại lợi ích lớn cho các hệ thống truy vấn ảnh hiện đại.

Để mở rộng kiến thức của bạn về lĩnh vực này, bạn có thể tham khảo thêm tài liệu Luận án tiến sĩ kỹ thuật viễn thông xây dựng thuật toán watermarking ảnh số trên phân tích đa phân giải, nơi mà các thuật toán watermarking cũng được áp dụng trong xử lý ảnh. Ngoài ra, tài liệu Mạng nơron wavelet ứng dụng cho xấp xỉ phi tuyến sẽ giúp bạn hiểu rõ hơn về ứng dụng của mạng nơron trong việc xử lý tín hiệu và hình ảnh. Cuối cùng, tài liệu Luận văn thạc sĩ kỹ thuật điện định vị sự cố trên đường dây 110kv bằng phương pháp biến đổi wavelet cũng cung cấp cái nhìn sâu sắc về việc ứng dụng wavelet trong các lĩnh vực kỹ thuật khác. Những tài liệu này sẽ giúp bạn có cái nhìn toàn diện hơn về ứng dụng của wavelet trong nhiều lĩnh vực khác nhau.

#kỹ thuật xử lý ảnh