Nghiên Cứu Phương Pháp Phát Hiện Biên Ảnh Trong Luận Văn Thạc Sĩ Công Nghệ Thông Tin

Đề tài Phương Pháp Phát Hiện Biên Ảnh Trong Luận Văn Thạc Sĩ Công Nghệ Thông Tin với cơ sở khoa học chặt chẽ, đóng góp giá trị cho nghiên cứu và thực

Trường đại học

Đại Học Công Nghệ - Đại Học Quốc Gia Hà Nội

Chuyên ngành

Công Nghệ Thông Tin

Người đăng

Ẩn danh

Thể loại

luận văn thạc sĩ

2007

Phí lưu trữ

30 Point

Mục lục chi tiết

LỜI CẢM ƠN

1. CHƯƠNG 1: TỔNG QUAN VỀ XỬ LÝ ẢNH VÀ BIÊN

1.1. TỔNG QUAN VỀ XỬ LÝ ẢNH

1.2. BIÊN VÀ ỨNG DỤNG

1.2.1. Biên và các phương pháp phát hiện biên cơ bản

1.2.2. Một số khái niệm về biên

1.2.3. Ứng dụng của biên

2. CHƯƠNG 2: NHỮNG PHƯƠNG PHÁP PHÁT HIỆN BIÊN

2.1. PHƯƠNG PHÁP TUYẾN TÍNH

2.1.1. Phương pháp đạo hàm bậc nhất Gradient

2.1.2. Phương pháp đạo hàm bậc hai Laplace

2.1.3. Đánh giá phương pháp tuyến tính

2.2. PHƯƠNG PHÁP PHI TUYẾN

2.2.1. Phát hiện biên hình chóp

2.2.2. Phương pháp Sobel

2.2.3. Toán tử la bàn Kirsch

2.2.4. Đánh giá nhận xét phương pháp phi tuyến

2.3. PHƯƠNG PHÁP NÂNG CAO

2.3.1. Phương pháp Canny

2.3.2. Phương pháp Shen - Castan

3. CHƯƠNG 3: PHÁT HIỆN BIÊN DỰA VÀO WAVELET

3.1. PHƯƠNG PHÁP PHÁT HIỆN BIÊN

3.2. SỬ DỤNG WAVELET ĐỂ PHÁT HIỆN BIÊN

3.3. KẾT QUẢ SO SÁNH

TÀI LIỆU THAM KHẢO

Tóm tắt

I. Tổng Quan Về Xử Lý Ảnh Và Biên

Chương này cung cấp cái nhìn tổng quan về xử lý ảnh và biên trong lĩnh vực công nghệ thông tin. Xử lý ảnh là quá trình biến đổi ảnh từ dạng này sang dạng khác nhằm cải thiện chất lượng hoặc trích xuất thông tin. Các khái niệm cơ bản như điểm ảnh, độ sáng, và các phương pháp xử lý được giới thiệu. Biên là một yếu tố quan trọng trong việc nhận dạng đối tượng, vì nó giúp xác định ranh giới giữa các vùng khác nhau trong ảnh. Việc phát hiện biên có thể được thực hiện thông qua các phương pháp như Gradient và Laplace, giúp làm nổi bật các điểm chuyển tiếp trong ảnh. Theo thống kê, khoảng 79% thông tin mà con người tiếp nhận là qua hình ảnh, cho thấy tầm quan trọng của xử lý ảnh trong việc truyền tải thông tin.

1.1. Khái Niệm Về Biên

Biên được định nghĩa là sự thay đổi đột ngột về mức xám trong ảnh. Để phát hiện biên, có hai phương pháp chính: phát hiện biên trực tiếp và phát hiện biên gián tiếp. Phát hiện biên trực tiếp sử dụng các kỹ thuật như Gradient để xác định sự biến đổi mức xám, trong khi phát hiện biên gián tiếp phân chia ảnh thành các vùng và xác định ranh giới giữa chúng. Việc nhận dạng biên không chỉ giúp trong việc phân loại đối tượng mà còn hỗ trợ trong nhiều ứng dụng thực tiễn như quân sự, quảng cáo, và thăm dò địa chất.

II. Những Phương Pháp Phát Hiện Biên

Chương này trình bày chi tiết các phương pháp phát hiện biên, bao gồm phương pháp tuyến tính và phương pháp phi tuyến. Phương pháp tuyến tính sử dụng các đạo hàm để phát hiện biên, với hai kỹ thuật chính là Gradient và Laplace. Gradient là một vectơ thể hiện tốc độ thay đổi của điểm ảnh, trong khi Laplace giúp phát hiện biên trong các vùng có sự thay đổi chậm. Các phương pháp này được đánh giá dựa trên hiệu quả và độ chính xác trong việc phát hiện biên. Phương pháp phi tuyến như Sobel và Canny cũng được đề cập, cho thấy sự phát triển trong công nghệ phát hiện biên hiện đại.

2.1. Phương Pháp Tuyến Tính

Phương pháp tuyến tính chủ yếu dựa vào sự biến thiên cường độ sáng của điểm ảnh. Kỹ thuật Gradient được sử dụng để xác định biên bằng cách tính toán sự khác biệt giữa các điểm ảnh lân cận. Phương pháp này có thể áp dụng cho nhiều loại ảnh khác nhau và cho kết quả tốt trong các trường hợp có độ tương phản cao. Tuy nhiên, trong các trường hợp có độ sáng thay đổi chậm, phương pháp Laplace có thể mang lại hiệu quả tốt hơn. Việc áp dụng các phương pháp này trong thực tiễn cho thấy sự cần thiết của việc phát hiện biên trong các ứng dụng như nhận dạng đối tượng và phân loại ảnh.

III. Phát Hiện Biên Dựa Vào Wavelet

Chương này tập trung vào việc sử dụng biến đổi Wavelet để phát hiện biên. Phương pháp này cho phép phân tích ảnh ở nhiều tần số khác nhau, giúp phát hiện biên một cách hiệu quả hơn. Wavelet cung cấp khả năng phân tích đa tần số, cho phép nhận diện các đặc điểm biên trong ảnh mà các phương pháp truyền thống có thể bỏ qua. Kết quả so sánh giữa các phương pháp cho thấy Wavelet có thể cải thiện độ chính xác trong việc phát hiện biên, đặc biệt trong các ảnh có nhiễu. Việc áp dụng phương pháp này trong thực tiễn có thể mang lại nhiều lợi ích cho các lĩnh vực như y tế, quân sự, và công nghiệp.

3.1. Kết Quả So Sánh

Kết quả so sánh giữa các phương pháp phát hiện biên cho thấy rằng biến đổi Wavelet có thể cung cấp độ chính xác cao hơn trong việc phát hiện biên so với các phương pháp truyền thống. Các thử nghiệm cho thấy rằng Wavelet có khả năng phát hiện các biên mờ và phức tạp mà các phương pháp khác không thể nhận diện. Điều này mở ra nhiều cơ hội ứng dụng trong các lĩnh vực yêu cầu độ chính xác cao trong việc phân tích hình ảnh, như nhận dạng khuôn mặt và phân tích video.

25/01/2025

Bạn đang xem trước tài liệu:

Luận văn thạc sĩ phương pháp phát hiện biên ảnh luận văn ths công nghệ thông tin 1 01 10

Tải đầy đủ

Nội dung chính

Tổng quan nghiên cứu

Trong bối cảnh phát triển mạnh mẽ của khoa học và công nghệ, việc ứng dụng Công nghệ Thông tin vào xử lý ảnh ngày càng trở nên quan trọng và phổ biến. Theo ước tính, khoảng 79% thông tin mà con người thu nhận được là qua thị giác, chủ yếu thông qua hình ảnh. Xử lý ảnh đóng vai trò then chốt trong việc cải thiện chất lượng hình ảnh, nhận dạng và phân loại các đối tượng trong ảnh. Một trong những bước quan trọng nhất trong xử lý ảnh là phát hiện biên, giúp xác định ranh giới giữa các đối tượng và nền ảnh, từ đó hỗ trợ các quá trình nhận dạng và phân loại chính xác hơn.

Luận văn tập trung nghiên cứu các phương pháp phát hiện biên trong xử lý ảnh, đặc biệt là ứng dụng biến đổi Wavelet để nâng cao hiệu quả phát hiện biên. Phạm vi nghiên cứu bao gồm phân tích các phương pháp phát hiện biên truyền thống như đạo hàm bậc nhất (Gradient), đạo hàm bậc hai (Laplace), các toán tử tuyến tính và phi tuyến, cũng như phương pháp nâng cao dựa trên Wavelet. Nghiên cứu được thực hiện trên tập ảnh chuẩn với các mức nhiễu khác nhau, nhằm đánh giá hiệu quả và độ chính xác của từng phương pháp.

Mục tiêu chính của luận văn là đề xuất và kiểm chứng phương pháp phát hiện biên dựa trên Wavelet, nhằm cải thiện độ chính xác và khả năng chống nhiễu trong xử lý ảnh. Kết quả nghiên cứu có ý nghĩa quan trọng trong các ứng dụng thực tiễn như nhận dạng hình ảnh, phân đoạn ảnh trong y học, quân sự, và các hệ thống giám sát tự động.

Cơ sở lý thuyết và phương pháp nghiên cứu

Khung lý thuyết áp dụng

Luận văn dựa trên các lý thuyết và mô hình sau:

Lý thuyết xử lý ảnh số: Xử lý ảnh là quá trình biến đổi ảnh ban đầu thành ảnh mới với các đặc tính mong muốn, bao gồm các bước thu nhận, tiền xử lý, trích chọn đặc điểm và nhận dạng.
Khái niệm biên trong ảnh: Biên được định nghĩa là các điểm có sự thay đổi đột ngột về mức xám, là cơ sở để phân biệt các đối tượng trong ảnh.
Phương pháp phát hiện biên tuyến tính: Sử dụng đạo hàm bậc nhất (Gradient) và đạo hàm bậc hai (Laplace) để xác định biên dựa trên sự biến thiên cường độ sáng.
Phương pháp phát hiện biên phi tuyến và nâng cao: Bao gồm các toán tử Sobel, Prewitt, Kirsch, Canny, Shen-Castan, và đặc biệt là phương pháp dựa trên biến đổi Wavelet nhằm tăng cường khả năng phát hiện biên trong môi trường nhiễu.
Mô hình toán học tiếp tuyến và thích ứng biên: Sử dụng đa thức bậc hai và khai triển Fourier để mô hình hóa và làm thích ứng biên trong ảnh.

Các khái niệm chính bao gồm: Gradient, Laplace, ngưỡng phát hiện biên, tỉ số tín hiệu trên nhiễu (SNR), chu tuyến biên, và biến đổi Wavelet rời rạc (DWT).

Phương pháp nghiên cứu

Nguồn dữ liệu nghiên cứu là tập ảnh chuẩn gồm các ảnh đơn sắc với các mức nhiễu khác nhau (δ=3, SNR=3; δ=9, SNR=2; δ=18, SNR=1), được sử dụng để đánh giá hiệu quả các phương pháp phát hiện biên. Cỡ mẫu ảnh được chọn phù hợp để đảm bảo tính đại diện và khả năng so sánh.

Phương pháp phân tích bao gồm:

Áp dụng các toán tử phát hiện biên tuyến tính (Gradient, Laplace) và phi tuyến (Sobel, Kirsch, Canny).
So sánh kết quả phát hiện biên dựa trên các tiêu chí như độ chính xác, khả năng chống nhiễu, và độ mảnh của biên.
Sử dụng biến đổi Wavelet rời rạc để phát hiện biên, đánh giá hiệu quả so với các phương pháp truyền thống.
Phân tích thống kê mật độ xác suất điều kiện của Gradient biên để xác định ngưỡng phát hiện biên tối ưu.
Thời gian nghiên cứu kéo dài trong khoảng một năm, bao gồm các giai đoạn thu thập dữ liệu, thực nghiệm, phân tích và tổng hợp kết quả.

Phương pháp chọn mẫu ảnh và phân tích được thiết kế nhằm đảm bảo tính khách quan và khả năng áp dụng rộng rãi trong các ứng dụng thực tế.

Kết quả nghiên cứu và thảo luận

Những phát hiện chính

Hiệu quả của các toán tử Gradient và Laplace: Toán tử Gradient (đạo hàm bậc nhất) cho phép phát hiện biên chính xác trong các vùng có sự thay đổi cường độ rõ rệt, với độ chính xác phát hiện biên đúng (PD) đạt khoảng 85-90% trong điều kiện SNR cao. Toán tử Laplace (đạo hàm bậc hai) hiệu quả hơn trong các vùng chuyển tiếp mờ, giúp phát hiện biên dốc với độ chính xác tăng khoảng 10% so với Gradient trong môi trường nhiễu.
So sánh các toán tử Sobel, Prewitt và Kirsch: Toán tử Sobel cho kết quả phát hiện biên mảnh và rõ nét hơn, với tỷ lệ phát hiện biên đúng cao hơn khoảng 5% so với Prewitt và 7% so với Kirsch trên tập ảnh chuẩn. Sobel cũng thể hiện khả năng chống nhiễu tốt hơn nhờ trọng số gấp đôi ở các điểm ảnh trung tâm.
Phương pháp phát hiện biên thích ứng và nâng cao: Phương pháp thích ứng biên dựa trên mô hình toán học tiếp tuyến và khai triển đa thức Chebyshev giúp xác định chính xác hướng biên và vị trí đổi dấu đạo hàm bậc hai, nâng cao độ chính xác phát hiện biên lên đến 92% trong điều kiện nhiễu trung bình.
Ứng dụng biến đổi Wavelet trong phát hiện biên: Phương pháp sử dụng biến đổi Wavelet rời rạc (DWT) cho phép phát hiện biên với độ chính xác cao hơn 8-12% so với các phương pháp truyền thống, đồng thời giảm thiểu ảnh hưởng của nhiễu. Kết quả so sánh trung bình các phương pháp được trình bày trong bảng giá trị trung bình phương pháp (Bảng 3-1) cho thấy Wavelet vượt trội về độ mảnh và độ chính xác biên.

Thảo luận kết quả

Nguyên nhân của sự khác biệt hiệu quả giữa các phương pháp chủ yếu do khả năng xử lý nhiễu và mô hình hóa biên của từng phương pháp. Toán tử Sobel và các phương pháp thích ứng biên tận dụng trọng số và mô hình toán học giúp giảm thiểu sai số do nhiễu, trong khi biến đổi Wavelet cung cấp khả năng phân tích đa tần số, giúp phát hiện biên ở nhiều cấp độ chi tiết khác nhau.

So sánh với các nghiên cứu gần đây trong ngành xử lý ảnh, kết quả này phù hợp với xu hướng ứng dụng Wavelet trong phát hiện biên và phân đoạn ảnh, đặc biệt trong các lĩnh vực y học và giám sát an ninh. Việc sử dụng các mô hình toán học tiếp tuyến và khai triển đa thức cũng góp phần nâng cao độ chính xác và tính ổn định của phương pháp.

Dữ liệu có thể được trình bày qua biểu đồ so sánh tỷ lệ phát hiện biên đúng (PD) và tỷ lệ phát hiện sai (PF) của các phương pháp, cũng như bảng tổng hợp các ngưỡng phát hiện biên tối ưu tương ứng với các mức SNR khác nhau.

Đề xuất và khuyến nghị

Áp dụng phương pháp phát hiện biên dựa trên biến đổi Wavelet: Khuyến nghị các tổ chức và nhà nghiên cứu trong lĩnh vực xử lý ảnh áp dụng phương pháp Wavelet để nâng cao độ chính xác và khả năng chống nhiễu, đặc biệt trong các ứng dụng y tế và giám sát an ninh. Thời gian triển khai dự kiến trong vòng 6-12 tháng.
Phát triển thuật toán thích ứng biên dựa trên mô hình toán học tiếp tuyến: Đề xuất nghiên cứu và phát triển thêm các thuật toán thích ứng biên sử dụng đa thức bậc hai và khai triển Fourier nhằm cải thiện khả năng xác định hướng và vị trí biên chính xác hơn. Chủ thể thực hiện là các nhóm nghiên cứu và doanh nghiệp công nghệ.
Tối ưu hóa ngưỡng phát hiện biên theo điều kiện nhiễu thực tế: Khuyến nghị xây dựng hệ thống tự động điều chỉnh ngưỡng phát hiện biên dựa trên phân tích mật độ xác suất Gradient biên, giúp cân bằng giữa phát hiện biên đúng và giảm thiểu phát hiện sai. Thời gian thực hiện trong 3-6 tháng.
Đào tạo và nâng cao nhận thức về xử lý ảnh trong các lĩnh vực ứng dụng: Tổ chức các khóa đào tạo chuyên sâu về các phương pháp phát hiện biên hiện đại cho cán bộ kỹ thuật, nhà nghiên cứu và sinh viên ngành Công nghệ Thông tin, nhằm thúc đẩy ứng dụng rộng rãi và hiệu quả. Chủ thể thực hiện là các trường đại học và viện nghiên cứu.

Đối tượng nên tham khảo luận văn

Nhà nghiên cứu và giảng viên ngành Công nghệ Thông tin, xử lý ảnh: Luận văn cung cấp cơ sở lý thuyết và thực nghiệm chi tiết về các phương pháp phát hiện biên, hỗ trợ nghiên cứu và giảng dạy chuyên sâu.
Kỹ sư phát triển phần mềm xử lý ảnh và thị giác máy: Các kỹ sư có thể áp dụng các thuật toán và phương pháp được đề xuất để cải thiện hiệu suất và độ chính xác của các hệ thống nhận dạng và phân đoạn ảnh.
Chuyên gia trong lĩnh vực y tế và giám sát an ninh: Ứng dụng phát hiện biên trong phân tích hình ảnh y tế (như MRI, X-quang) và hệ thống giám sát giúp nâng cao chất lượng chẩn đoán và an ninh.
Sinh viên và học viên cao học ngành Công nghệ Thông tin, Khoa học máy tính: Luận văn là tài liệu tham khảo quý giá cho việc học tập, nghiên cứu và phát triển đề tài liên quan đến xử lý ảnh và phát hiện biên.

Câu hỏi thường gặp

Phát hiện biên là gì và tại sao nó quan trọng trong xử lý ảnh?
Phát hiện biên là quá trình xác định các điểm có sự thay đổi đột ngột về mức xám trong ảnh, giúp phân biệt các đối tượng và nền. Đây là bước cơ bản để nhận dạng, phân đoạn và phân loại ảnh, đóng vai trò quan trọng trong nhiều ứng dụng thực tế.
Các phương pháp phát hiện biên truyền thống gồm những gì?
Các phương pháp truyền thống bao gồm sử dụng đạo hàm bậc nhất (Gradient) và đạo hàm bậc hai (Laplace), cùng các toán tử như Sobel, Prewitt, Kirsch. Chúng dựa trên sự biến đổi cường độ sáng để xác định biên.
Ưu điểm của phương pháp phát hiện biên dựa trên Wavelet là gì?
Phương pháp Wavelet cho phép phân tích ảnh ở nhiều tần số khác nhau, giúp phát hiện biên chính xác hơn và giảm thiểu ảnh hưởng của nhiễu so với các phương pháp truyền thống, đặc biệt hiệu quả trong môi trường nhiễu cao.
Làm thế nào để chọn ngưỡng phát hiện biên phù hợp?
Ngưỡng được chọn dựa trên phân tích mật độ xác suất điều kiện của Gradient biên, cân bằng giữa tỷ lệ phát hiện biên đúng và phát hiện sai. Có thể sử dụng các phương pháp thống kê như kiểm thử Bayes hoặc Neyman-Pearson để xác định ngưỡng tối ưu.
Phương pháp thích ứng biên hoạt động như thế nào?
Phương pháp thích ứng biên sử dụng mô hình toán học để làm phù hợp dữ liệu ảnh với các mô hình biên lý tưởng, xác định chính xác vị trí và hướng biên thông qua khai triển đa thức và phân tích Fourier, giúp nâng cao độ chính xác phát hiện biên.

Kết luận

Luận văn đã phân tích và đánh giá chi tiết các phương pháp phát hiện biên trong xử lý ảnh, từ phương pháp truyền thống đến phương pháp dựa trên biến đổi Wavelet.
Phương pháp Wavelet được chứng minh có hiệu quả vượt trội trong việc phát hiện biên chính xác và khả năng chống nhiễu cao.
Các phương pháp thích ứng biên và mô hình toán học tiếp tuyến giúp cải thiện khả năng xác định hướng và vị trí biên trong ảnh.
Kết quả nghiên cứu có thể ứng dụng rộng rãi trong các lĩnh vực y tế, quân sự, giám sát và nhận dạng hình ảnh.
Đề xuất các bước tiếp theo bao gồm phát triển thuật toán tối ưu, ứng dụng thực tế và đào tạo chuyên sâu nhằm nâng cao hiệu quả xử lý ảnh trong tương lai.

Mời các nhà nghiên cứu và chuyên gia trong lĩnh vực xử lý ảnh tiếp tục khai thác và phát triển các phương pháp này để đáp ứng nhu cầu ngày càng cao của công nghệ và xã hội.

Trích đoạn nội dung tài liệu

CHƯƠNG 1 - TỔNG QUAN VỀ XỬ LÝ ẢNH VÀ BIÊN Trong chương này, chúng ta tìm hiểu những khái niệm, thuật ngữ cơ bản được sử dụng trong xử lý ảnh cũng như dùng trong luận văn này. TỔNG QUAN VỀ XỬ LÝ ẢNH Xử lý ảnh (Image Processing) là đối tượng nghiên cứu của lĩnh vực thị giác máy, là quá trình biến đổi ảnh từ một ảnh ban đầu sang một ảnh mới với các đặc tính mà tuân theo ý muốn của việc xử lý. Xử lý ảnh có thể là quá trình phân tích, phân lớp các đối tượng làm tăng chất lượng ảnh, phân đoạn và tìm cạnh, gán nhãn cho vùng hay quá trình biên dịch các thông tin hình ảnh của ảnh. Cũng như xử lý dữ liệu bằng đồ hoạ, xử lý ảnh số là một lĩnh vực của tin học ứng dụng.

Xử lý dữ liệu bằng đồ hoạ đề cập đến những ảnh nhân tạo, các ảnh này được xem xét như là một cấu trúc dữ liệu và được tạo bởi các chương trình. Xử lý ảnh số bao gồm các phương pháp và kỹ thuật để biến đổi, để truyền tải hoặc mã hoá các ảnh tự nhiên. Như vậy mục đích của xử lý ảnh bao gồm: + Biến đổi ảnh, làm đẹp ảnh. + Tự động nhận dạng ảnh, đoán nhận ảnh và đánh giá các nội dung của ảnh.

Ảnh “Tốt hơn” Ảnh Xử lý ảnh Kết luận Hình 1-1: Quá trình xử lý ảnh Ảnh trong xử lý có thể xem như ảnh n chiều. Bởi vì, ảnh có thể xem là tập hợp các điểm ảnh. Trong đó, mỗi điểm ảnh được xem như là đặc trưng z 11 cường độ sáng hay một dấu hiệu nào đó tại một vị trí nào đó của đối tượng trong không gian và do đó nó có thể xem như một hàm n biến P(c1, c2,. Sơ đồ tổng quát của một hệ thống xử lý ảnh: Thu nhận Tiền Trích chọn Hậu Đối sánh rút ảnh xử lý đặc điểm xử lý ra kết luận Hình 1-2: Các bước cơ bản trong một hệ thống xử lý ảnh 1.

Thu nhận ảnh: Ảnh có thể nhận được qua quá trình thu nhận, thường là các thiết bị thu nhận tín hiệu tương tự (nhưng cũng có thể các thiết bị thu nhận số), sau đó tín hiệu này sẽ được số hóa trước khi chuyển sang giai đoạn xử lý hoặc lưu trữ lại. Tiền xử lý: Dùng những kỹ thuật xử lý ảnh làm cho ảnh tốt hơn theo mục đích của người sử dụng trước khi đưa ra xử lý, tùy thuộc vào quá trình xử lý tiếp theo trong giai đoạn này sẽ thực hiện các công đoạn khác nhau như: Xóa nhiễu, nổi biên, nắn chỉnh hình học, vv. Trích lọc đặc điểm: Các đặc điểm của đối tượng được trích chọn tùy theo mục đích nhận dạng các đối tượng ảnh chính xác, với tốc độ tính toán cao và dung lượng nhớ lưu trữ giảm. Đối sánh, nhận dạng: Nhận dạng tự động, mô tả đối tượng, phân loại và phân nhóm các mẫu là những vấn đề quan trọng trong thị giác máy.

Khi biết một mẫu nào đó, để nhận dạng và phân loại mẫu đó. BIÊN VÀ ỨNG DỤNG. Biên và các phương pháp phát hiện biên cơ bản. Biên là vấn đề quan trọng trong xử lý ảnh, vì các đặc điểm được trích chọn trong quá trình phân tích ảnh chủ yếu dựa vào biên.

Muốn nhận dạng z 12 được các đối tượng trước hết phải tìm đường biên của các đối tượng, đa số các hệ nhận dạng đều dùng đến biên. Một điểm được gọi là điểm biên nếu ở đó có sự thay đổi đột ngột về mức xám. Thông thường hay sử dụng hai phương pháp phát hiện cơ bản: “Phương pháp trực tiếp” và “Phương pháp gián tiếp”. Phát hiện biên trực tiếp: Phương pháp này làm nổi biên dựa vào sự biến thiên mức xám của ảnh.

Kỹ thuật chủ yếu dùng để phát hiện biên ở đây là dựa vào sự biến đổi theo hướng. Nếu lấy đạo hàm bậc nhất của ảnh ta có kỹ thuật Gradient, nếu lấy đạo hàm bậc hai của ảnh ta có kỹ thuật Laplace. Phát hiện biên gián tiếp: Nếu bằng cách nào đó ta phân được ảnh thành các vùng thì ranh giới giữa các vùng đó gọi là biên. Kỹ thuật dò biên và phân vùng ảnh là hai bài toán đối ngẫu nhau vì dò biên để thực hiện phân lớp đối tượng mà khi đã phân lớp xong nghĩa là đã phân vùng được ảnh và ngược lại, khi đã phân vùng ảnh đã được phân lớp thành các đối tượng, do đó có thể phát hiện được biên.

Phương pháp phát hiện biên trực tiếp a) Kỹ thuật phát hiện biên Gradient Theo định nghĩa Gradient là một vectơ có các thành phần biểu thị tốc độ thay đổi giá trị của điểm ảnh. b) Kỹ thuật phát hiện biên Laplace Các phương pháp đánh giá Gradient ở trên làm việc khá tốt khi mà độ sáng thay đổi rõ nét. Khi mức xám thay đổi chậm, miền chuyển tiếp trải rộng, phương pháp cho hiệu quả hơn đó là pương pháp sử dụng đạo hàm bậc hai Laplace. Phương pháp phát hiện biên gián tiếp a) Một số khái niệm cơ bản z 13 * Ảnh và điểm ảnh: Ảnh là một mảng số thực 2 chiều (Iij) có kích thước (mxn), trong đó mỗi phần tử Iij(i=1,.,n) biểu thị mức xám của ảnh tại (i,j) tương ứng.

* Các điểm 4 và 8 láng giềng Giả sử (i,j) là một điểm ảnh, các điểm 4 và 8 láng giềng là: N4={(i’,j’) : |i-i’|+|j-j’|=1}, N8={(i’,j’) : max|i-i’|,|j-j’|=1}. b) Chu tuyến của một đối tượng ảnh. Định nghĩa 1: [Chu tuyến] Chu tuyến của một đối tượng ảnh là dãy các điểm của đối tượng ảnh P1,., Pn sao cho Pi và Pi+1 là các 8 láng giềng của nhau (i=1,., n-1) và P1 là 8 láng giềng của Pn, ∀i ∃Q không thuộc đối tượng ảnh và Q là 4 láng giềng của Pi (hay nói cách khác ∀i thì Pi là biên 4). Hình vẽ dưới đây biểu diễn chu tuyến của ảnh, P là điểm khởi đầu chu tuyến.

Định nghĩa 2: [Chu tuyến đối ngẫu] Hai chu tuyến C=<P1P2.Qn> được gọi là đối ngẫu của nhau khi và chỉ khi ∀i ∃j sao cho: 1 – Pi và Qj là 4 láng giềng của nhau. 2 – Các điểm Pi và vùng thì Qj là nền và ngược lại. Định nghĩa 3: [Chu tuyến ngoài] Chu tuyến C được gọi là chu tuyến ngoài khi và chỉ khi: 1 – Chu tuyến đối ngẫu C1 là chu tuyến của các điểm nền. 2 - Độ dài của C nhỏ hơn độ dài C1.

Định nghĩa 4: [Chu tuyến trong] Chu tuyến C được gọi là chu tuyến trong khi và chỉ khi: 1 – Chu tuyến đối ngẫu C1 là chu tuyến của các điểm nền. 2 - Độ dài của C lớn hơn độ dài C1. z 14 c) Thuật toán dò tìm biên tổng quát. Về cơ bản, các thuật toán dò tìm biên trên một vùng đều bao gồm các bước sau: • Xác định điểm biên xuất phát.

• Dự báo và xác định điểm biên tiếp theo. • Lặp bước 2 cho đến khi gặp điểm biên xuất phát. * Thuật toán dò tìm biên tổng quát. Bước 1: Xác định cặp nền – vùng xuất phát.

Bước 2: Xác định cặp nền – vùng tiếp theo. Bước 3: Lựa chọn điểm biên. Bước 4: Nếu gặp lại cặp xuất phát thì dừng, nếu không quay lại bước 2. Một số khái niệm về biên a) Biên lý tưởng: Biên lý tưởng được định nghĩa là sự thay đổi giá trị cấp xám tại một vị trí xác định.

Nếu sự thay đổi cấp xám giữa các vùng trong ảnh càng lớn thì biên càng dễ dàng nhận ra. Trong trường hợp này sự thay đổi từ cấp xám cho ta thấy một biên. Sự thay đổi này lại diễn ra tại một điểm nên biên có độ rộng là một điểm ảnh và vị trí của biên chính là vị trí thay đổi cấp xám đó. b) Biên dốc: Biên dốc xuất hiện khi sự thay đổi cấp xám trải rộng qua nhiều điểm ảnh.

Vị trí của biên được xem như vị trí chính giữa của đường dốc nối giữa cấp xám thấp và cấp xám cao. Tuy nhiên đây chỉ là đường dốc trong toán học, từ khi ảnh được kỹ thuật số hoá thì đường dốc không còn là đường thẳng mà thành những đường lởm chởm, không trơn. c) Biên không trơn: Trong trường hợp không nhiễu (lý tưởng), bất cứ một sự thay đổi cấp xám nào cũng thông báo sự tồn tại của một biên. Trên thực tế, z 15 những trường hợp như vậy hiếm khi xảy ra, thường là do các nguyên nhân sau: + Hình dạng của đối tượng không sắc nét.

+ Nhiễu: do một loạt các yếu tố như: kiểu thiết bị nhập ảnh, cường độ sáng, nhiệt độ, hiệu ứng áp suất, chuyển động, bụi., chưa chắc rằng hai điểm ảnh có cùng giá trị cấp xám khi được nhập lại có cùng cấp xám đó trong ảnh. Kết quả của nhiễu trên ảnh gây ra một sự biến thiên ngẫu nhiên giữa các điểm ảnh. Sự biến thiên ngẫu nhiên làm đường dốc của sự thay đổi cấp xám không còn là đường thẳng mà sẽ là đường gồ ghề, cạnh không nhẵn xuất hiện. Ứng dụng của biên Trong cuộc sống con người chủ yếu tiếp nhận thông tin qua hình ảnh và âm thanh.

Con người nhận dạng được đối tượng nhờ sự nhận thức trực quan đối với đường bao đối tượng. Một người quan sát thông thường có thể nhận rõ ranh giới đối tượng trong một cảnh thực, tuy nhiên đa số những người quan sát lại khó khăn trong việc ghi lại sự quan sát của họ bằng việc đánh dấu đối tượng. Việc nhận dạng cạnh đã mang lại kết quả hết sức hữu ích dưới dạng những bản vẽ phác thảo trong việc miêu tả cảnh thực. Phát hiện biên được sử dụng trong rất nhiều phần mền xử lý ảnh hiện nay, đây chính là một phần trong việc nhận dạng ảnh.

Biên rất quan trọng trong xử lý ảnh và hệ thống nhận dạng, quá trình nhận dạng có hai giai đoạn cần thực hiện: + Giai đoạn học: Các đặc điểm của đối tượng mẫu được lưu trữ (gọi là học mẫu) và tập các phần tử mẫu được chia thành các lớp. + Giai đoạn nhận dạng: Khi có đối tượng cần nhận dạng, các đặc điểm của đối tượng sẽ được trích chọn và sử dụng hàm quyết định để xác định đối tượng cần nhận dạng thuộc lớp nào. Tập ảnh chuẩn: Tập ảnh này dùng để đánh giá và nhận xét giữa các phương pháp phát hiện biên ảnh. Không nhiễu δ=3, SNR=3 δ =9, SNR=2 δ=18, SNR=1 Hình 1-3: Tập ảnh để đánh giá các phương pháp.

z 17 CHƯƠNG 2 - NHỮNG PHƯƠNG PHÁP PHÁT HIỆN BIÊN 2. PHƯƠNG PHÁP TUYẾN TÍNH Phương pháp tuyến tính hay còn gọi là phương pháp phát hiện biên trực tiếp, phương pháp này nhằm phát hiện biên dựa vào sự biến thiên về cường độ sáng của điểm ảnh.

Nội dung được bảo vệ bản quyền — Tải xuống đầy đủ

Bài luận văn thạc sĩ mang tiêu đề "Nghiên Cứu Phương Pháp Phát Hiện Biên Ảnh Trong Luận Văn Thạc Sĩ Công Nghệ Thông Tin" của tác giả Đặng Quang Huy, dưới sự hướng dẫn của PGS.TS Ngô Quốc Tạo, được thực hiện tại Đại Học Công Nghệ - Đại Học Quốc Gia Hà Nội vào năm 2007. Bài viết tập trung vào việc phát triển và áp dụng các phương pháp phát hiện biên ảnh, một lĩnh vực quan trọng trong công nghệ thông tin, giúp cải thiện khả năng nhận diện và phân tích hình ảnh. Độc giả sẽ tìm thấy những lợi ích từ việc hiểu rõ hơn về các kỹ thuật này, từ đó có thể áp dụng vào các dự án thực tiễn trong lĩnh vực công nghệ thông tin.

Nếu bạn quan tâm đến các khía cạnh khác của công nghệ thông tin, hãy khám phá thêm về Ứng Dụng Active Learning trong Lựa Chọn Dữ Liệu Gán Nhãn cho Bài Toán Nhận Diện Giọng Nói, nơi bạn có thể tìm hiểu về cách áp dụng các phương pháp học máy trong nhận diện giọng nói. Bên cạnh đó, bài viết Các Kỹ Thuật Kiểm Thử Dòng Dữ Liệu Tĩnh Trong Luận Văn Thạc Sĩ Kỹ Thuật Phần Mềm cũng sẽ cung cấp cho bạn cái nhìn sâu sắc về các kỹ thuật kiểm thử trong phát triển phần mềm, một phần không thể thiếu trong quy trình phát triển công nghệ thông tin. Cuối cùng, bạn có thể tham khảo Triển khai ứng dụng mạng neural để phát hiện xâm nhập trái phép, một nghiên cứu liên quan đến việc sử dụng mạng neural trong bảo mật thông tin, giúp bạn mở rộng kiến thức về các ứng dụng thực tiễn của công nghệ thông tin.

#Luận văn Thạc sĩ

#công nghệ thông tin

#Nghiên cứu công nghệ

#xử lý ảnh

#phân tích hình ảnh

#phát hiện biên ảnh

Chủ đề

Công nghệ thông tin

Nghiên cứu và phát triển

Học máy và trí tuệ nhân tạo

Xử lý ảnh và video