Luận văn thạc sĩ: Nghiên cứu phương pháp nhận dạng mặt người dựa trên PCA, LDA và mạng nơron

Luận văn thạc sĩ VNU UET nghiên cứu phương pháp nhận dạng mặt người bằng PCA, LDA và mạng neural trong lĩnh vực truyền dữ liệu và mạng máy tính.

Trường đại học

Đại học Quốc gia Hà Nội

Chuyên ngành

Công nghệ thông tin

Người đăng

Ẩn danh

Thể loại

luận văn thạc sĩ

2015

Phí lưu trữ

30 Point

Mục lục chi tiết

LỜI CẢM ƠN

LỜI CAM ĐOAN

1. CHƯƠNG 1: TỔNG QUAN VỀ NHẬN DẠNG MẶT NGƯỜI

1.1. Giới thiệu về xử lý ảnh

1.1.1. Khái niệm xử lý ảnh số

1.1.2. Các ứng dụng của xử lý ảnh số

1.1.3. Các bước cơ bản trong xử lý ảnh số

1.2. Giới thiệu chung về phân tích ảnh

1.2.1. Các ứng dụng của phân tích ảnh

1.3. Nhận dạng mặt người

1.3.1. Khái niệm nhận dạng mặt người qua ảnh

1.3.2. Các ứng dụng của nhận dạng mặt người

1.4. Các hướng tiếp cận trong nhận dạng mặt người

1.4.1. Trích chọn đặc trưng sử dụng Eigenface

1.4.2. Trích chọn đặc trưng sử dụng mô hình Markov ẩn

1.4.3. Mẫu nhị phân cục bộ (LBP)

1.4.4. Phương pháp phân tích thành phần chính

2. CHƯƠNG 2: NHẬN DẠNG KHUÔN MẶT DỰA TRÊN PCA-LDA VÀ MẠNG NƠRON

2.1. Phương pháp phân tích thành phần chính (PCA)

2.1.1. Cơ sở toán học

2.1.2. Kỹ thuật trích chọn đặc trưng PCA

2.2. Phương pháp LDA

2.3. Phương pháp mạng neural

2.3.1. Giới thiệu mạng nơron

2.3.2. Hàm kích hoạt và các quy tắc xác định tín hiệu ra

2.3.3. Thuật toán học lan truyền ngược

3. CHƯƠNG 3: THỰC NGHIỆM

3.1. Thiết kế hệ thống

3.1.1. Cơ sở dữ liệu ảnh

3.1.2. Môi trường cài đặt

3.1.3. Giao diện chương trình

3.2. Kiểm thử và đánh giá

TÀI LIỆU THAM KHẢO

Tóm tắt

I. Tổng quan về nghiên cứu nhận dạng mặt người bằng PCA LDA và mạng nơron

Nghiên cứu về nhận dạng khuôn mặt đã trở thành một lĩnh vực quan trọng trong công nghệ thông tin. Việc áp dụng các phương pháp như PCA (Phân tích thành phần chính) và LDA (Phân tích phân lớp tuyến tính) kết hợp với mạng nơron sâu đã mở ra nhiều cơ hội mới trong việc nhận diện khuôn mặt. Những phương pháp này không chỉ giúp cải thiện độ chính xác mà còn tăng tốc độ xử lý hình ảnh. Bài viết này sẽ đi sâu vào các phương pháp và ứng dụng thực tiễn của chúng trong nhận dạng khuôn mặt.

1.1. Ứng dụng của nhận dạng khuôn mặt trong đời sống

Nhận dạng khuôn mặt được ứng dụng rộng rãi trong nhiều lĩnh vực như an ninh, giám sát, và marketing. Hệ thống nhận diện khuôn mặt giúp nhận diện người trong đám đông, hỗ trợ trong việc xác thực danh tính và cải thiện trải nghiệm người dùng.

1.2. Tầm quan trọng của PCA và LDA trong nhận dạng khuôn mặt

PCA và LDA là hai phương pháp chính trong việc trích chọn đặc trưng khuôn mặt. PCA giúp giảm chiều dữ liệu, trong khi LDA tối ưu hóa việc phân loại giữa các lớp khác nhau. Sự kết hợp của chúng mang lại hiệu quả cao trong việc nhận diện khuôn mặt.

II. Vấn đề và thách thức trong nhận dạng khuôn mặt

Mặc dù công nghệ nhận dạng khuôn mặt đã phát triển mạnh mẽ, nhưng vẫn tồn tại nhiều thách thức. Các yếu tố như ánh sáng, góc chụp và sự thay đổi về hình thái khuôn mặt có thể ảnh hưởng đến độ chính xác của hệ thống. Việc xử lý các yếu tố này là rất quan trọng để cải thiện hiệu suất của các thuật toán nhận dạng.

2.1. Ảnh hưởng của điều kiện ánh sáng đến nhận dạng khuôn mặt

Ánh sáng không đồng đều có thể làm giảm chất lượng hình ảnh, dẫn đến khó khăn trong việc nhận diện. Các thuật toán cần được tối ưu hóa để xử lý các điều kiện ánh sáng khác nhau.

2.2. Thách thức từ sự thay đổi hình thái khuôn mặt

Sự thay đổi về hình thái khuôn mặt do tuổi tác, cảm xúc hoặc trang điểm có thể gây khó khăn cho hệ thống nhận diện. Cần có các phương pháp học sâu để nhận diện chính xác hơn trong các tình huống này.

III. Phương pháp PCA trong nhận dạng khuôn mặt

Phương pháp PCA là một trong những kỹ thuật phổ biến nhất trong việc trích chọn đặc trưng khuôn mặt. PCA giúp giảm số lượng biến trong dữ liệu mà vẫn giữ lại được thông tin quan trọng. Điều này giúp tăng tốc độ xử lý và cải thiện độ chính xác của hệ thống nhận diện.

3.1. Cơ sở toán học của PCA

PCA dựa trên việc tìm kiếm các vector riêng của ma trận hiệp phương sai. Các vector này đại diện cho các phương hướng chính trong không gian dữ liệu, giúp giảm chiều dữ liệu mà không làm mất thông tin quan trọng.

3.2. Quy trình thực hiện PCA trong nhận dạng khuôn mặt

Quy trình thực hiện PCA bao gồm các bước như chuẩn hóa dữ liệu, tính toán ma trận hiệp phương sai, và tìm kiếm các vector riêng. Các bước này giúp xác định các đặc trưng chính của khuôn mặt.

IV. Phương pháp LDA trong nhận dạng khuôn mặt

Phương pháp LDA được sử dụng để tối ưu hóa việc phân loại giữa các lớp khác nhau trong dữ liệu khuôn mặt. LDA giúp tăng cường khả năng phân biệt giữa các khuôn mặt khác nhau, từ đó cải thiện độ chính xác của hệ thống nhận diện.

4.1. Nguyên lý hoạt động của LDA

LDA tìm kiếm các vector phân loại tối ưu bằng cách tối đa hóa khoảng cách giữa các lớp và tối thiểu hóa khoảng cách trong cùng một lớp. Điều này giúp tăng cường khả năng phân loại của hệ thống.

4.2. Ứng dụng LDA trong nhận dạng khuôn mặt

LDA được áp dụng trong nhiều hệ thống nhận diện khuôn mặt hiện đại, giúp cải thiện độ chính xác và khả năng phân loại trong các điều kiện khác nhau.

V. Mạng nơron sâu trong nhận dạng khuôn mặt

Mạng nơron sâu đã trở thành một công cụ mạnh mẽ trong nhận dạng khuôn mặt. Với khả năng học từ dữ liệu lớn, mạng nơron có thể nhận diện khuôn mặt với độ chính xác cao hơn so với các phương pháp truyền thống.

5.1. Cấu trúc của mạng nơron sâu

Mạng nơron sâu bao gồm nhiều lớp nơron, mỗi lớp thực hiện các phép toán khác nhau để trích chọn đặc trưng từ dữ liệu đầu vào. Cấu trúc này giúp mạng nơron học được các đặc trưng phức tạp của khuôn mặt.

5.2. Lợi ích của việc sử dụng mạng nơron trong nhận dạng khuôn mặt

Mạng nơron sâu có khả năng tự động trích chọn đặc trưng mà không cần phải xác định trước. Điều này giúp cải thiện độ chính xác và khả năng nhận diện trong các điều kiện khác nhau.

VI. Kết luận và tương lai của nghiên cứu nhận dạng mặt người

Nghiên cứu về nhận dạng mặt người bằng PCA, LDA và mạng nơron đang mở ra nhiều cơ hội mới trong công nghệ thông tin. Tương lai của lĩnh vực này hứa hẹn sẽ có nhiều tiến bộ với sự phát triển của trí tuệ nhân tạo và học sâu. Việc cải thiện độ chính xác và khả năng xử lý trong các điều kiện khác nhau sẽ là mục tiêu chính trong nghiên cứu tiếp theo.

6.1. Xu hướng phát triển trong nhận dạng khuôn mặt

Các nghiên cứu hiện tại đang tập trung vào việc cải thiện độ chính xác và khả năng nhận diện trong các điều kiện khó khăn. Sự phát triển của công nghệ học sâu sẽ tiếp tục thúc đẩy lĩnh vực này.

6.2. Ứng dụng tiềm năng trong tương lai

Nhận dạng khuôn mặt có thể được ứng dụng trong nhiều lĩnh vực như an ninh, y tế, và marketing. Việc phát triển các hệ thống nhận diện chính xác sẽ mang lại nhiều lợi ích cho xã hội.

22/07/2025

Bạn đang xem trước tài liệu:

Luận văn thạc sĩ vnu uet nghiên cứu phương pháp nhận dạng mặt người dựa trên pca lda và mạng neural luận văn ths truyền dữ liệu và mạng máy tính chuyên ngành đào tạo thí điểm

Tải đầy đủ

Nội dung chính

Tổng quan nghiên cứu

Nhận dạng mặt người là một lĩnh vực nghiên cứu quan trọng trong ngành Công nghệ Thông tin, đặc biệt trong các ứng dụng an ninh và sinh trắc học. Theo ước tính, khoảng 70% thông tin mà con người tiếp nhận đến từ kênh thị giác, do đó việc phát triển các hệ thống nhận dạng mặt người có ý nghĩa thiết thực trong nhiều lĩnh vực như giám sát an ninh, kiểm soát truy cập, và tương tác người-máy. Luận văn tập trung nghiên cứu phương pháp nhận dạng mặt người dựa trên sự kết hợp giữa Phân tích thành phần chính (PCA), Phân tích phân lớp tuyến tính (LDA) và mạng nơron nhân tạo nhằm nâng cao hiệu quả nhận dạng trong điều kiện thay đổi về ánh sáng, góc độ và hình thái khuôn mặt.

Mục tiêu nghiên cứu là xây dựng và đánh giá một hệ thống nhận dạng mặt người có khả năng trích chọn đặc trưng hiệu quả và nhận dạng chính xác dựa trên cơ sở dữ liệu ảnh mặt người phổ biến như ORL (AT&T) và Yale A. Phạm vi nghiên cứu tập trung vào các ảnh mặt người thu thập trong điều kiện ánh sáng và biểu cảm đa dạng, với kích thước ảnh chuẩn 112×92 pixel. Ý nghĩa của nghiên cứu được thể hiện qua việc cải thiện độ chính xác nhận dạng, giảm thiểu sai số và tăng tính ổn định của hệ thống trong các ứng dụng thực tế như kiểm soát an ninh, chấm công tự động và tương tác người-máy.

Cơ sở lý thuyết và phương pháp nghiên cứu

Khung lý thuyết áp dụng

Luận văn áp dụng ba lý thuyết và mô hình chính trong nhận dạng mặt người:

Phân tích thành phần chính (PCA): PCA là phương pháp giảm chiều dữ liệu bằng cách tìm các vector riêng (eigenvectors) tương ứng với các giá trị riêng lớn nhất của ma trận hiệp phương sai dữ liệu. PCA giúp trích chọn các đặc trưng quan trọng nhất của ảnh mặt người, giảm thiểu số chiều dữ liệu từ 10304 điểm ảnh xuống còn khoảng 49 thành phần chính, giữ lại phần lớn thông tin cần thiết cho nhận dạng.
Phân tích phân lớp tuyến tính (LDA): LDA được sử dụng để tối ưu hóa khả năng phân biệt giữa các lớp dữ liệu (các cá nhân khác nhau) bằng cách tìm không gian đặc trưng mà trong đó sự phân tán giữa các lớp được tối đa hóa, đồng thời sự phân tán trong cùng một lớp được tối thiểu hóa. LDA giúp nâng cao hiệu quả phân loại so với PCA khi các lớp có sự chồng lấn.
Mạng nơron nhân tạo (Neural Network): Mạng nơron đa lớp được sử dụng để nhận dạng khuôn mặt dựa trên các đặc trưng đã được trích chọn từ PCA-LDA. Mạng nơron có khả năng học và thích nghi với các biến đổi về ánh sáng, góc độ và biểu cảm khuôn mặt thông qua thuật toán học lan truyền ngược (backpropagation).

Các khái niệm chính bao gồm: eigenface (khuôn mặt riêng), ma trận hiệp phương sai, vector riêng và giá trị riêng, mẫu nhị phân cục bộ (LBP) như một phương pháp trích chọn đặc trưng bổ trợ, và mô hình Markov ẩn (HMM) trong việc mô hình hóa chuỗi quan sát ảnh mặt.

Phương pháp nghiên cứu

Nguồn dữ liệu chính sử dụng trong nghiên cứu là cơ sở dữ liệu ảnh mặt người ORL (AT&T) gồm 400 ảnh của 40 người, mỗi người có 10 ảnh với các biểu cảm và điều kiện ánh sáng khác nhau, cùng với cơ sở dữ liệu Yale A với 165 ảnh của 15 người. Ảnh được chuẩn hóa kích thước 112×92 pixel và chuyển sang ảnh xám để thuận tiện cho xử lý.

Phương pháp phân tích bao gồm các bước: tiền xử lý ảnh (lọc nhiễu, chuẩn hóa), trích chọn đặc trưng bằng PCA để giảm chiều dữ liệu, tiếp tục sử dụng LDA để tối ưu hóa phân lớp, và cuối cùng nhận dạng bằng mạng nơron nhân tạo. Cỡ mẫu huấn luyện và kiểm thử được chia theo tỷ lệ phù hợp để đảm bảo tính khách quan và độ tin cậy của kết quả.

Phân tích dữ liệu được thực hiện bằng các thuật toán toán học trên ma trận hiệp phương sai, tính toán vector riêng và giá trị riêng, đồng thời huấn luyện mạng nơron với thuật toán lan truyền ngược. Quá trình nghiên cứu kéo dài trong khoảng thời gian từ năm 2013 đến 2015, với các giai đoạn thiết kế hệ thống, thực nghiệm và đánh giá hiệu suất.

Kết quả nghiên cứu và thảo luận

Những phát hiện chính

Hiệu quả trích chọn đặc trưng PCA-LDA: Việc kết hợp PCA và LDA giúp giảm chiều dữ liệu từ 10304 điểm ảnh xuống còn khoảng 49 thành phần chính, đồng thời tăng khả năng phân biệt giữa các cá nhân. Kết quả thực nghiệm trên cơ sở dữ liệu ORL cho thấy tỷ lệ nhận dạng đạt khoảng 92%, cao hơn so với chỉ sử dụng PCA (khoảng 85%).
Độ chính xác nhận dạng bằng mạng nơron: Mạng nơron nhân tạo được huấn luyện trên các đặc trưng PCA-LDA đạt tỷ lệ nhận dạng chính xác lên đến 95% trong điều kiện ảnh không bị nhiễu và biến đổi ánh sáng nhẹ. Khi có nhiễu hoặc thay đổi hình thái khuôn mặt, tỷ lệ này giảm nhẹ còn khoảng 88%, cho thấy tính ổn định và khả năng thích nghi của mạng.
So sánh với các phương pháp khác: So với phương pháp nhận dạng dựa trên mẫu nhị phân cục bộ (LBP) hoặc mô hình Markov ẩn (HMM), phương pháp PCA-LDA kết hợp mạng nơron cho kết quả nhận dạng ổn định hơn, đặc biệt trong các điều kiện ánh sáng và góc chụp thay đổi. Tỷ lệ nhận dạng của LBP và HMM dao động trong khoảng 80-85%.
Ảnh hưởng của số lượng thành phần chính: Thử nghiệm với số lượng thành phần chính khác nhau cho thấy khi giữ lại từ 40 đến 50 thành phần, hệ thống đạt hiệu suất tối ưu. Giữ quá ít thành phần làm giảm độ chính xác, trong khi giữ quá nhiều thành phần làm tăng chi phí tính toán mà không cải thiện đáng kể kết quả.

Thảo luận kết quả

Nguyên nhân chính giúp phương pháp PCA-LDA kết hợp mạng nơron đạt hiệu quả cao là do PCA giúp giảm chiều dữ liệu, loại bỏ nhiễu và các đặc trưng không cần thiết, trong khi LDA tối ưu hóa khả năng phân biệt giữa các lớp cá nhân. Mạng nơron nhân tạo với khả năng học phi tuyến giúp nhận dạng chính xác trong các điều kiện biến đổi phức tạp.

So với các nghiên cứu trước đây, kết quả này phù hợp với xu hướng ứng dụng kết hợp các phương pháp trích chọn đặc trưng và mô hình học máy để nâng cao hiệu quả nhận dạng. Dữ liệu có thể được trình bày qua biểu đồ so sánh tỷ lệ nhận dạng giữa các phương pháp PCA, LDA, LBP, HMM và mạng nơron, cũng như bảng thống kê tỷ lệ nhận dạng theo số lượng thành phần chính.

Ý nghĩa của kết quả là mở ra hướng phát triển các hệ thống nhận dạng mặt người có độ chính xác cao, ổn định và khả năng ứng dụng rộng rãi trong thực tế, đặc biệt trong các hệ thống an ninh và tương tác người-máy.

Đề xuất và khuyến nghị

Tăng cường tiền xử lý ảnh: Áp dụng các kỹ thuật lọc nhiễu nâng cao và chuẩn hóa ánh sáng để cải thiện chất lượng ảnh đầu vào, từ đó nâng cao độ chính xác nhận dạng. Chủ thể thực hiện: nhóm phát triển phần mềm; Thời gian: 6 tháng.
Mở rộng cơ sở dữ liệu huấn luyện: Thu thập thêm ảnh mặt người với đa dạng biểu cảm, góc độ và điều kiện ánh sáng để mạng nơron học được nhiều mẫu hơn, tăng khả năng tổng quát hóa. Chủ thể thực hiện: phòng nghiên cứu; Thời gian: 12 tháng.
Tối ưu cấu trúc mạng nơron: Nghiên cứu và áp dụng các kiến trúc mạng nơron sâu (deep learning) hoặc mạng tích chập (CNN) để nâng cao khả năng nhận dạng trong điều kiện phức tạp. Chủ thể thực hiện: nhóm nghiên cứu AI; Thời gian: 9 tháng.
Phát triển giao diện người dùng thân thiện: Thiết kế giao diện trực quan, dễ sử dụng cho các hệ thống nhận dạng mặt người trong các ứng dụng thực tế như kiểm soát ra vào, chấm công tự động. Chủ thể thực hiện: bộ phận phát triển sản phẩm; Thời gian: 6 tháng.

Đối tượng nên tham khảo luận văn

Nhà nghiên cứu và sinh viên ngành Công nghệ Thông tin: Có thể áp dụng các phương pháp PCA-LDA và mạng nơron trong các đề tài về xử lý ảnh và nhận dạng mẫu.
Chuyên gia phát triển hệ thống an ninh và giám sát: Sử dụng kết quả nghiên cứu để xây dựng các hệ thống nhận dạng khuôn mặt chính xác, ổn định trong môi trường thực tế.
Doanh nghiệp công nghệ và phần mềm: Áp dụng các thuật toán và mô hình trong phát triển sản phẩm nhận dạng khuôn mặt phục vụ thị trường bảo mật và tương tác người-máy.
Cơ quan quản lý và tổ chức đào tạo: Tham khảo để xây dựng chương trình đào tạo, nâng cao năng lực chuyên môn cho cán bộ kỹ thuật trong lĩnh vực xử lý ảnh và trí tuệ nhân tạo.

Câu hỏi thường gặp

Phương pháp PCA-LDA có ưu điểm gì so với các phương pháp khác?
PCA-LDA kết hợp giúp giảm chiều dữ liệu hiệu quả và tối ưu hóa khả năng phân biệt giữa các lớp, từ đó nâng cao độ chính xác nhận dạng so với chỉ dùng PCA hoặc các phương pháp như LBP, HMM.
Mạng nơron nhân tạo có thể xử lý các biến đổi về ánh sáng và góc độ khuôn mặt như thế nào?
Mạng nơron học được các mẫu đa dạng trong quá trình huấn luyện, từ đó có khả năng nhận dạng chính xác ngay cả khi ảnh đầu vào có sự thay đổi về ánh sáng, góc độ hoặc biểu cảm khuôn mặt.
Cơ sở dữ liệu ORL và Yale A có đặc điểm gì nổi bật?
ORL gồm 400 ảnh của 40 người với đa dạng biểu cảm và điều kiện ánh sáng; Yale A gồm 165 ảnh của 15 người với các điều kiện ánh sáng thay đổi, phù hợp để đánh giá hiệu quả các phương pháp nhận dạng.
Làm thế nào để chọn số lượng thành phần chính trong PCA?
Số lượng thành phần chính được chọn dựa trên tỷ lệ phương sai được giữ lại, thường giữ từ 40 đến 50 thành phần để cân bằng giữa giảm chiều dữ liệu và giữ lại thông tin quan trọng.
Phương pháp này có thể áp dụng trong các ứng dụng thực tế nào?
Phương pháp phù hợp cho các hệ thống kiểm soát an ninh, chấm công tự động, hệ thống giám sát, và các ứng dụng tương tác người-máy yêu cầu nhận dạng khuôn mặt chính xác và ổn định.

Kết luận

Đã xây dựng thành công hệ thống nhận dạng mặt người dựa trên phương pháp PCA-LDA kết hợp mạng nơron nhân tạo với tỷ lệ nhận dạng chính xác lên đến 95%.
Phương pháp trích chọn đặc trưng PCA-LDA giúp giảm chiều dữ liệu hiệu quả và tối ưu hóa khả năng phân biệt giữa các cá nhân.
Mạng nơron nhân tạo thể hiện khả năng thích nghi tốt với các biến đổi về ánh sáng, góc độ và biểu cảm khuôn mặt.
Kết quả thực nghiệm trên cơ sở dữ liệu ORL và Yale A chứng minh tính khả thi và hiệu quả của phương pháp trong các điều kiện thực tế.
Đề xuất các hướng phát triển tiếp theo bao gồm mở rộng cơ sở dữ liệu, tối ưu mạng nơron và phát triển giao diện người dùng thân thiện nhằm ứng dụng rộng rãi trong thực tế.

Để tiếp tục phát triển, các nhà nghiên cứu và doanh nghiệp nên tập trung vào việc tích hợp các kỹ thuật học sâu và mở rộng dữ liệu huấn luyện nhằm nâng cao độ chính xác và tính ổn định của hệ thống nhận dạng mặt người. Hãy bắt đầu áp dụng các giải pháp này để nâng cao hiệu quả trong các ứng dụng an ninh và tương tác người-máy hiện đại.

Trích đoạn nội dung tài liệu

CHƯƠNG I TỔNG QUAN VỀ NHẬN DẠNG MẶT NGƯỜI 1.1 Giới thiệu về xử lý ảnh Xử lý ảnh là một lĩnh vực mang tính khoa học và công nghệ. Nó là một ngành khoa học mới mẻ so với nhiều ngành khoa học khác nhưng tốc độ phát triển của nó rất nhanh, kích thích các trung tâm nghiên cứu, ứng dụng, đặc biệt là máy tính chuyên dụng riêng cho nó. Cùng với ngôn ngữ tự nhiên, hình ảnh đã đóng góp một vai trò hết sức quan trọng trong việc trao đổi thông tin. Tính trực quan của hình ảnh đã giúp cho con người hiểu rõ và sâu sắc hơn các thông tin cần thu thập.

Người ta đã chứng minh được rằng, trong tất cả các kênh thu nhận thông tin của con người thì lượng thông tin thu nhận qua kênh thị giác chiếm khoảng 70%. Hình ảnh là kết quả của việc thu nhận và biểu diễn của năng lượng ánh sáng trải dài từ tia gamma (có bước sóng nhỏ) đến sóng radio (có bước sóng lớn). Tuy nhiên, mắt người chỉ cảm nhận được một vùng giới hạn rất nhỏ trong phổ điện từ. Ngược lại, máy tính có thể đọc được một vùng rất rộng trong phổ điện từ, từ tia gamma đến sóng radio.

Nó có thể biểu diễn và xử lý những bức ảnh được sinh ra bởi những nguồn mà con người không thể nhận biết được, như ảnh siêu âm, ảnh hồng ngoại, ảnh trong vùng tia X, … Do đó xử lý ảnh có một phạm vi ứng dụng tương đối rộng. Xử lý ảnh là một trong những cách tiếp cận phân tích, tổng hợp hình ảnh theo ý tưởng và mục đích của người sử dụng. Tuy xử lý ảnh là một trong những khoa học còn tương đối mới so với nhiều ngành kho học khác, song những năm gần đây, xử lý ảnh và đồ họa đã phát triển một cách mạnh mẽ và đã gặt hái được nhiều thành công góp phần vào sự phát triển chung của ngành công nghệ thông tin. Các phương pháp xử lý ảnh bắt nguồn từ hai ứng dụng: nâng cao chất lượng thông tin hình ảnh đối với mắt người và xử lý số liệu cho máy tự động.

Một trong những ứng dụng đầu tiên của xử lý ảnh là nâng cao chất lượng ảnh báo truyền qua cáp giữa London và NewYork vào những năm 192x. Thiết bị đặc biệt mã hóa hình ảnh (báo), truyền qua cáp và khôi phục lại ở phía thu. Vấn đề nâng cao chất lượng hình ảnh lúc đầu có liên quan đến việc lựa chọn quá trình in và phân bố các mức sáng (tông và độ phân giải của ảnh). LUAN VAN CHAT LUONG download : add luanvanchat@agmail.com 12 Hệ thống đầu tiên (Bartlane) có khả năng mã hóa hình ảnh với 5 mức sáng.

Khả năng này tăng lên 15 mức vào 1929. Việc nâng cao chất lượng ảnh bằng các phương pháp xử lý để truyền ảnh được nghiên cứu 35 năm sau đó. Năm 1964, các bức ảnh chụp mặt trăng được vệ tinh Ranger 7 (Mỹ) truyền về trái đất, được xử lý bằng máy tính để sửa méo (gây ra do camera truyền hình đặt trên vệ tinh ở các góc độ khác nhau). Các kỹ thuật cơ bản cho phép nâng cao chất lượng hình ảnh như làm nổi đường biên và lưu hình ảnh.

Từ năm 1964 đến nay, phạm vi xử lý ảnh lớn mạnh không ngừng. Các kỹ thuật xử lý ảnh hiện nay được sử dụng để giải quyết hàng loạt các vấn đề, nhằm nâng cao chất lượng thông tin hình ảnh. Trong y học, các thuật toán máy tính nâng cao độ tương phản, hoặc mã hóa các mức sáng thành các màu để nội suy ảnh X-Quang và các hình ảnh y sinh học dễ dàng.Các nhà địa vật lý sử dụng kỹ thuật tương tự để nghiên cứu các mẫu vật chất từ vệ tinh.Các thuật toán nâng cao chất lượng ảnh và khôi phục hình ảnh được sử dụng để xử lý hình ảnh giảm chất lượng. Trong thiên văn học, các phương pháp xử lý ảnh nhằm khôi phục hình ảnh bị nhiễu hoặc bị mất do bóng (artifacts) sau khi chụp.

Trong vật lý và các lĩnh vực có liên quan, kỹ thuật máy tính nâng cao được chất lượng ảnh trong các lĩnh vực như Plamas (có năng lượng cao) và microscopy điện tử. Tương tự, người ta đã ứng dụng xử lý ảnh có kết quả tốt trong viễn thám, sinh học, y tế hạt nhân, quân sự, công nghiệp … Nâng cao chất lượng và khôi phục ảnh bị nhiễu là quá trình xử lý ảnh dùng cho mục đích nội suy của mắt người. Lĩnh vực ứng dụng quan trọng thứ hai là xử lý ảnh số gắn liền với việc cảm nhận của máy. Trong lĩnh vực thứ hai, các cố gắng đều tập trung vào các quá trình trích thông tin ảnh và chuyển thành dạng thích hợp cho xử lý máy tính.

Những vẫn đề tiêu biểu của kỹ thuật xử lý ảnh được ứng dụng nhiều trong thực tế, có thể kể như: tự động nhận dạng đặc trưng, máy nhìn công nghiệp để điều khiển và kiểm tra sản phẩm, nhận dạng mục tiêu quân sự, tự động xử lý vân tay, hiển thị lên màn hình ảnh X-Quang và các mẫu máu, xử lý bằng máy các hình ảnh chụp từ vệ tinh để dự báo thời tiết, nén ảnh để lưu và truyền được nhiều hơn tín hiệu ảnh trong thông tin, máy tính, truyền hình thông thường và truyền hình có độ phân giải cao. LUAN VAN CHAT LUONG download : add luanvanchat@agmail.1 Khái niệm xử lý ảnh số Xử lý ảnh số là một ngành khoa học nhằm trang bị phương pháp luận, kỹ thuật để trang bị cho máy tính xử lý ảnh đầu vào trên máy tính với mục tiêu nhận được ảnh kết quả ở đầu ra theo mong muốn của con người… Như vậy xử lý ảnh là một quá trình từ ảnh thu nhận đầu vào xử lý tăng cường và nâng cao chất lượng ảnh, phân tích ảnh, hiểu ảnh, mã hóa, nén ảnh… cho đến khi thu nhận được ảnh kết quả tốt hơn theo mong muốn của con người. Từ đó giúp cho con người có được cách nhìn trực quan hơn và sinh động hơn về hình ảnh. Xử lý ảnh số còn là việc sử dụng các thuật toán máy tính để xử lý các ảnh số dưới sự trợ giúp của máy tính.

Xử lý ảnh số có thể chia làm bốn lĩnh vực, tùy thuộc vào loại công việc. Đó là cải thiện và nâng cao chất lượng ảnh, phục hồi ảnh, mã hóa ảnh và hiểu ảnh. Trong cải thiện và nâng cao chất lượng ảnh, ảnh được xử lý để xem, như trong truyền hình, hoặc là được xử lý trước để trợ giúp hoạt động của máy móc, như trong nhận dạng đối tượng. Trong phục hồi ảnh, ảnh bị xuống cấp một số trường hợp, chẳng hạn bị nhòe, và mục đích là để giảm bớt hoặc loại bỏ hẳn ảnh hưởng sự xuống cấp.

Phục hồi ảnh có liên quan mật thiết đến cải thiện ảnh. Khi ảnh xuống cấp, việc cải thiện ảnh thường đem lại kết quả làm giảm sự xuống cấp. Tuy nhiên có một số sự khác nhau giữa phục hồi ảnh và cải thiện ảnh. Trong phục hồi ảnh, một số ảnh lý tưởng thường bị xuống cấp và mục đích phục hồi là tạo ra ảnh sau xử lý giống như ảnh ban đầu.

Trong việc cải thiện ảnh, mục đích cải thiện ảnh là làm cho ảnh sau khi xử lý trong đẹp hơn ảnh chưa xử lý. Để minh học sự khác nhau này, lưu ý rằng một ảnh gốc chưa xuống cấp không thể phục chế hơn nữa nhưng vẫn có thể được cải thiện bằng cách tăng độ nét. Trong mã hóa ảnh, mục đích là biểu diễn với một số ít bit nhất trong điều kiện chất lượng ảnh và độ rõ chấp nhận được cho từng ứng dụng cụ thể, chẳng hạn như hội nghị video. Mã hóa ảnh liên quan đến cải thiện ảnh và phục hồi ảnh.

Nếu có thể cải tiến dáng vẻ bề ngoài của ảnh được phục hồi, hoặc làm giảm sự xuống cấp do các nguồn nhiễu, như nhiễu lượng tử mà thuật toán mã hóa ảnh gây ra, thì ta có thể làm giảm số lượng bit cần thiết để đại diện ảnh ở một mức chất lượng và độ rõ chấp nhận được. Trong việc hiểu (understanding) ảnh, đầu vào là ảnh, mục đích là diễn đạt nội dung ảnh bằng một hệ ký hiệu nào đó. Những ứng dụng của “hiểu ảnh” bao gồm thị giác máy tính, kỹ thuật rô-bốt và nhận dạng mục tiêu.“Hiểu ảnh” khác với ba lĩnh vực khác của xử lý LUAN VAN CHAT LUONG download : add luanvanchat@agmail.com 14 ảnh ở một khía cạnh chính. Trong cải tiến, phục hồi và mã hóa ảnh cả đầu vào và đầu ra đều là ảnh và khâu xử lý tín hiệu là phần then chốt của các hệ thống đã thành công trên các lĩnh vực đó.

Trong “hiểu ảnh”, đầu vào là ảnh, nhưng đầu ra thường là một biểu diễn bằng ký hiệu nội dung của ảnh đầu vào. Sự phát triển thành công của các hệ thống trong lĩnh vực này cần đến cả xử lý tín hiệu và những khái niệm trí tuệ nhân tạo. Trong hệ “hiểu ảnh” điển hình, xử lý tín hiệu được dùng cho công việc xử lý mức thấp như làm giảm sự xuống cấp và trích chọn các đường biên ảnh hoặc các đặc tính khác của ảnh, còn trí tuệ nhân tạo được dùng cho những công việc xử lý mức cao như thao tác kí hiệu và quản lý cơ sở tri thức.2 Các ứng dụng của xử lý ảnh số Xử lý ảnh có nhiều ứng dụng trong thực tế.Một trong những ứng dụng sớm nhất là xử lý ảnh từ nhiệm vụ Ranger 7 tại phòng thí nghiệm JetPulsion vào những năm đầu của thập kỷ 60. Hệ thống chụp hình gắn trên tàu vũ trụ có một số hạn chế về kích thước và trọng lượng, do đó ảnh nhận được bị giảm chất lượng như bị mờ, méo hình học và nhiễu nền.

Các ảnh đó được xử lý thành công nhờ máy tính số. Hình ảnh của mặt trăng và sao hỏa mà chúng ta thấy trong tất cả các tạp chí đều được xử lý bằng những máy tính số. Ngày nay, hầu hết các thông tin ảnh đều được chuyển sang dạng ảnh số. Vì vậy, trong gần như tất cả các lĩnh vực của các ngành kỹ thuật đều có ít nhiều liên quan đến ảnh số và sử dụng kỹ thuật xử lý ảnh số.Ứng dụng của xử lý ảnh có khả năng tác động mạnh mẽ nhất đến cuộc sống của chúng ta là lĩnh vực y tế.

Soi chụp ảnh bằng máy tính dựa trên cơ sở định lý cắt lớp (project slice) được dùng thường xuyên trong xét nghiệm lâm sàng, ví dụ phát hiện và nhận dạng u não. Những ứng dụng y khoa khác của xử lý ảnh gồm cải thiện ảnh X-Quang và nhận dạng đường biênmạch máu từ những ảnh chụp bằng tia X.

Nội dung được bảo vệ bản quyền — Tải xuống đầy đủ

Chủ đề

Xử lý ảnh và thị giác máy tính

nhận dạng khuôn mặt và sinh trắc học

thuật toán học máy và mạng nơron