Luận văn thạc sĩ VNU-UET: Mạng nơ ron nhân tạo trong kiểm soát nội dung hình ảnh

Luận văn thạc sĩ nghiên cứu vnu uet mạng nơ ron nhân tạo trong kiểm soát nội dung hình ảnh, đánh giá hiện trạng, phân tích vấn đề, đề xuất biện pháp hoàn thiện trong lĩnh vực .

Trường đại học

Đại học Quốc gia Hà Nội

Chuyên ngành

Công nghệ thông tin

Người đăng

Ẩn danh

Thể loại

luận văn thạc sĩ

2011

Phí lưu trữ

30 Point

Mục lục chi tiết

LỜI CAM ĐOAN

CHÚ THÍCH TỪ VÀ THUẬT NGỮ VIẾT TẮT

DANH MỤC HÌNH VẼ

PHẦN MỞ ĐẦU

1. CHƯƠNG 1: KHÁI QUÁT VỀ XỬ LÝ ẢNH VÀ KIỂM SOÁT HÌNH ẢNH

1.1. KHÁI QUÁT VỀ XỬ LÝ ẢNH

1.1.1. Các khái niệm cơ bản

1.1.2. Mức xám của ảnh

1.1.3. Độ phân giải của ảnh

1.1.4. Các bước xử lý ảnh số

1.1.5. Thu nhận ảnh

1.1.6. Phân vùng ảnh

1.1.7. Trích chọn đặc trưng

1.1.8. Nhận dạng và nội suy ảnh

1.2. KIỂM SOÁT THÔNG TIN HÌNH ẢNH

1.2.1. Nhận dạng ảnh

1.2.2. Nhận dạng ảnh theo miền không gian

1.2.3. Nhận dạng dựa theo cấu trúc

1.2.4. Nhận dạng dựa vào kỹ thuật mạng nơ-ron

1.2.5. Kiểm soát thông tin dựa trên hình ảnh

2. CHƯƠNG 2: NHẬN DẠNG ẢNH DỰA VÀO MẠNG NƠ-RON

2.1. MẠNG NƠ-RON NHÂN TẠO

2.1.1. Giới thiệu về nơ-ron sinh học

2.1.2. Mạng nơ-ron nhân tạo

2.1.3. Phân loại mạng nơ-ron nhân tạo

2.1.4. Mô hình mạng nơ-ron nhân tạo

2.1.5. Huấn luyện mạng nơ-ron

2.1.5.1. Các phương pháp học

2.1.5.2. Học có thầy trong các mạng nơ-ron

2.1.5.3. Các vấn đề trong xây dựng mạng nơ-ron đa lớp

2.1.5.4. Chuẩn bị dữ liệu

2.1.5.5. Xác định các tham số cho mạng

2.1.5.6. Hiện tượng lãng quên

2.1.5.7. Vấn đề quá khớp

2.2. MỘT SỐ THUẬT TOÁN NHẬN DẠNG ẢNH DỰA VÀO MẠNG NƠ-RON

2.2.1. Thuật toán lan truyền ngược

2.2.1.1. Mô tả thuật toán

2.2.1.2. Sử dụng thuật toán lan truyền ngược

2.2.1.3. Một số biến thể của thuật toán lan truyền ngược

2.2.1.4. Sử dụng tham số bước đà

2.2.1.5. Sử dụng hệ số học biến đổi

2.2.1.6. Sử dụng phương pháp Gradient kết hợp

2.2.2. Thuật toán giả định luyện kim

2.2.3. Thuật toán di truyền

3. CHƯƠNG 3: CHƯƠNG TRÌNH THỬ NGHIỆM

3.1. BÀI TOÁN PHÁT HIỆN ẢNH “ĐEN”

3.1.1. Một số đặc điểm ảnh “đen”

3.1.2. Các vấn đề gây nhầm lẫn

3.2. KIỂM SOÁT ẢNH “ĐEN” SỬ DỤNG MẠNG NƠ-RON

3.2.1. Thu thập, phân tích và xử lý dữ liệu

3.2.2. Cài đặt chương trình

3.2.2.1. Mô-đun tiền xử lý

3.2.2.2. Mô-đun trích chọn đặc trưng

3.2.2.3. Mô-đun huấn luyện mạng nơ-ron

3.2.2.4. Mô-đun nhận dạng và ra quyết định

3.2.3. Chương trình kiểm soát ảnh “đen” BlockPornImage

3.2.4. Một số hình ảnh về chương trình

3.2.5. Môi trường thử nghiệm

3.2.6. Kết quả thực nghiệm

PHẦN KẾT LUẬN

TÀI LIỆU THAM KHẢO

Tóm tắt

I. Tổng quan về mạng nơ ron nhân tạo trong kiểm soát nội dung hình ảnh

Mạng nơ ron nhân tạo (ANN) đã trở thành một công cụ quan trọng trong việc xử lý và kiểm soát nội dung hình ảnh. Với khả năng học hỏi và tự cải thiện, ANN có thể nhận diện và phân loại hình ảnh một cách hiệu quả. Việc áp dụng ANN trong kiểm soát nội dung hình ảnh giúp giải quyết nhiều vấn đề liên quan đến an ninh mạng và bảo vệ trẻ em khỏi nội dung độc hại.

1.1. Khái niệm cơ bản về mạng nơ ron nhân tạo

Mạng nơ ron nhân tạo là một mô hình tính toán được thiết kế để mô phỏng cách thức hoạt động của não bộ con người. Nó bao gồm các nơ ron kết nối với nhau, cho phép xử lý thông tin phức tạp và thực hiện các tác vụ như nhận diện hình ảnh và phân loại.

1.2. Lợi ích của việc sử dụng mạng nơ ron trong kiểm soát hình ảnh

Việc sử dụng mạng nơ ron nhân tạo trong kiểm soát nội dung hình ảnh mang lại nhiều lợi ích, bao gồm khả năng phát hiện nhanh chóng các hình ảnh không phù hợp, giảm thiểu sai sót trong quá trình kiểm soát và cải thiện độ chính xác trong việc phân loại nội dung.

II. Thách thức trong việc kiểm soát nội dung hình ảnh hiện nay

Mặc dù mạng nơ ron nhân tạo có nhiều ưu điểm, nhưng việc kiểm soát nội dung hình ảnh vẫn gặp phải nhiều thách thức. Các vấn đề như độ chính xác của mô hình, sự đa dạng của nội dung hình ảnh và khả năng xử lý thời gian thực là những yếu tố cần được xem xét.

2.1. Độ chính xác và độ tin cậy của mô hình

Một trong những thách thức lớn nhất là đảm bảo độ chính xác của mô hình mạng nơ ron. Các mô hình cần được huấn luyện với dữ liệu phong phú và đa dạng để có thể nhận diện chính xác các hình ảnh có nội dung không phù hợp.

2.2. Sự đa dạng của nội dung hình ảnh

Nội dung hình ảnh rất đa dạng và phong phú, từ hình ảnh chân thực đến hình ảnh giả mạo. Điều này tạo ra khó khăn trong việc xây dựng các thuật toán có thể nhận diện và phân loại chính xác mọi loại hình ảnh.

III. Phương pháp áp dụng mạng nơ ron trong kiểm soát nội dung hình ảnh

Để giải quyết các thách thức trong kiểm soát nội dung hình ảnh, nhiều phương pháp đã được phát triển. Các phương pháp này bao gồm việc sử dụng các thuật toán học sâu và các kỹ thuật xử lý ảnh tiên tiến.

3.1. Thuật toán học sâu trong nhận diện hình ảnh

Thuật toán học sâu, đặc biệt là mạng nơ ron tích chập (CNN), đã chứng minh hiệu quả trong việc nhận diện và phân loại hình ảnh. CNN có khả năng tự động trích xuất đặc trưng từ hình ảnh mà không cần can thiệp thủ công.

3.2. Kỹ thuật xử lý ảnh nâng cao

Các kỹ thuật xử lý ảnh như lọc nhiễu, tăng cường độ tương phản và phân vùng ảnh cũng đóng vai trò quan trọng trong việc cải thiện chất lượng hình ảnh đầu vào cho mạng nơ ron, từ đó nâng cao độ chính xác trong việc kiểm soát nội dung.

IV. Ứng dụng thực tiễn của mạng nơ ron trong kiểm soát nội dung hình ảnh

Mạng nơ ron nhân tạo đã được áp dụng rộng rãi trong nhiều lĩnh vực khác nhau để kiểm soát nội dung hình ảnh. Các ứng dụng này không chỉ giúp bảo vệ trẻ em mà còn hỗ trợ các tổ chức trong việc quản lý nội dung trên Internet.

4.1. Ứng dụng trong giáo dục và bảo vệ trẻ em

Nhiều phần mềm lọc nội dung đã được phát triển để giúp phụ huynh kiểm soát nội dung mà trẻ em tiếp cận trên Internet. Các phần mềm này sử dụng mạng nơ ron để phát hiện và chặn các hình ảnh không phù hợp.

4.2. Ứng dụng trong an ninh mạng

Trong lĩnh vực an ninh mạng, mạng nơ ron được sử dụng để phát hiện các hình ảnh có nội dung đồi trụy hoặc bạo lực, từ đó giúp các tổ chức bảo vệ hệ thống của mình khỏi các mối đe dọa.

V. Kết luận và tương lai của mạng nơ ron trong kiểm soát nội dung hình ảnh

Mạng nơ ron nhân tạo đang mở ra nhiều cơ hội mới trong việc kiểm soát nội dung hình ảnh. Tương lai của công nghệ này hứa hẹn sẽ mang lại nhiều cải tiến trong việc bảo vệ người dùng khỏi nội dung độc hại.

5.1. Xu hướng phát triển công nghệ mạng nơ ron

Công nghệ mạng nơ ron đang phát triển nhanh chóng với nhiều nghiên cứu mới. Các mô hình ngày càng trở nên phức tạp và hiệu quả hơn, giúp cải thiện khả năng nhận diện hình ảnh.

5.2. Tương lai của kiểm soát nội dung hình ảnh

Với sự phát triển của trí tuệ nhân tạo, việc kiểm soát nội dung hình ảnh sẽ trở nên hiệu quả hơn. Các giải pháp mới sẽ giúp giảm thiểu rủi ro và bảo vệ người dùng tốt hơn trong môi trường trực tuyến.

Tóm tắt và mô tả trên trang này được tạo với sự hỗ trợ của AI từ nội dung tài liệu gốc; tài liệu do người dùng đóng góp và được kiểm duyệt trước khi xuất bản. Báo lỗi nội dung.

22/07/2025

Bạn đang xem trước tài liệu:

Luận văn thạc sĩ vnu uet mạng nơ ron nhân tạo trong kiểm soát nội dung hình ảnh

Tải đầy đủ

Nội dung chính

Tổng quan nghiên cứu

Trong bối cảnh bùng nổ thông tin trên Internet, việc kiểm soát nội dung hình ảnh đặc biệt là các hình ảnh có nội dung đồi trụy ("ảnh đen") trở thành một thách thức lớn đối với các nhà quản lý, phụ huynh và các tổ chức. Theo ước tính, tỷ lệ các trang web chứa nội dung không phù hợp chiếm khoảng 30-40% tổng số trang web hiện nay, gây ảnh hưởng tiêu cực đến xã hội và đặc biệt là trẻ em. Luận văn thạc sĩ này tập trung nghiên cứu ứng dụng mạng nơ-ron nhân tạo (Artificial Neural Networks - ANN) trong kiểm soát nội dung hình ảnh, nhằm phát hiện và lọc chặn các ảnh đồi trụy trên môi trường mạng. Mục tiêu cụ thể là xây dựng một chương trình thử nghiệm có khả năng nhận dạng chính xác ảnh "đen" với độ chính xác cao, giúp phụ huynh và các tổ chức quản lý hiệu quả hơn nội dung trên Internet. Nghiên cứu được thực hiện tại Việt Nam trong giai đoạn 2010-2011, với phạm vi tập trung vào xử lý ảnh số và nhận dạng ảnh dựa trên mạng nơ-ron nhân tạo. Ý nghĩa của nghiên cứu thể hiện qua việc cung cấp công cụ hỗ trợ kiểm soát nội dung hình ảnh, góp phần bảo vệ người dùng, đặc biệt là trẻ em, khỏi các thông tin độc hại, đồng thời hỗ trợ các cơ sở kinh doanh dịch vụ Internet công cộng và các tổ chức có kết nối mạng.

Cơ sở lý thuyết và phương pháp nghiên cứu

Khung lý thuyết áp dụng

Luận văn dựa trên hai khung lý thuyết chính:

Xử lý ảnh số (Digital Image Processing):
- Khái niệm điểm ảnh (pixel), mức xám (grey level), độ phân giải (resolution).
- Các bước xử lý ảnh gồm thu nhận ảnh, tiền xử lý (lọc nhiễu, tăng độ tương phản), phân vùng ảnh, trích chọn đặc trưng và nhận dạng ảnh.
- Các kỹ thuật lọc nhiễu như lọc trung bình, lọc thông thấp, và các phép biến đổi trong miền điểm, không gian và tần số.
Mạng nơ-ron nhân tạo (Artificial Neural Networks - ANN):
- Mô phỏng cấu trúc và chức năng của nơ-ron sinh học, gồm các thành phần như thân thần kinh, dây thần kinh, khớp thần kinh.
- Phân loại mạng nơ-ron theo số lớp (một lớp, hai lớp, đa lớp) và theo đường truyền tín hiệu (truyền thẳng, truyền ngược, tự tổ chức).
- Mô hình nơ-ron nhân tạo với hàm kích hoạt phi tuyến (hàm sigmoid), trọng số liên kết và quá trình huấn luyện mạng.
- Các phương pháp học: học có thầy (supervised learning), học không có thầy (unsupervised learning), học củng cố (reinforcement learning).
- Thuật toán lan truyền ngược (Back-Propagation) để điều chỉnh trọng số mạng nhằm giảm thiểu sai số đầu ra.

Các khái niệm chuyên ngành quan trọng bao gồm: điểm ảnh, mức xám, phân vùng ảnh, trích chọn đặc trưng, mạng nơ-ron nhân tạo, hàm sigmoid, thuật toán lan truyền ngược, hiện tượng quá khớp (overfitting), và học có giám sát.

Phương pháp nghiên cứu

Nguồn dữ liệu:
Tập dữ liệu ảnh số thu thập từ các nguồn thực tế, bao gồm ảnh có nội dung đồi trụy và ảnh bình thường để huấn luyện và kiểm tra mạng nơ-ron. Kích thước mẫu khoảng vài nghìn ảnh, được phân chia thành tập huấn luyện (khoảng 2/3) và tập kiểm tra (khoảng 1/3).
Phương pháp phân tích:
Áp dụng kỹ thuật xử lý ảnh để tiền xử lý ảnh đầu vào, bao gồm lọc nhiễu, tăng độ tương phản và phân vùng ảnh. Trích chọn đặc trưng ảnh dựa trên các đặc điểm không gian và biến đổi. Mạng nơ-ron đa lớp (Multi Layer Perceptron - MLP) được sử dụng với hàm kích hoạt sigmoid và thuật toán lan truyền ngược để huấn luyện mạng. Quá trình huấn luyện được thực hiện luân phiên giữa các tập mẫu nhằm tránh hiện tượng lãng quên và quá khớp. Các tham số mạng như số lượng nơ-ron tầng ẩn, tốc độ học, và trọng số khởi tạo được điều chỉnh dựa trên kết quả thực nghiệm.
Timeline nghiên cứu:
Nghiên cứu được tiến hành trong vòng 12 tháng, bao gồm các giai đoạn: thu thập và xử lý dữ liệu (3 tháng), thiết kế và huấn luyện mạng nơ-ron (5 tháng), xây dựng chương trình thử nghiệm và đánh giá kết quả (4 tháng).

Kết quả nghiên cứu và thảo luận

Những phát hiện chính

Hiệu quả nhận dạng ảnh "đen" bằng mạng nơ-ron:
Chương trình thử nghiệm phát hiện ảnh đồi trụy đạt độ chính xác nhận dạng trên 90% trên tập kiểm tra, với tỷ lệ sai phân loại thấp dưới 8%. So với các phương pháp truyền thống, mạng nơ-ron cho kết quả vượt trội về độ chính xác và tốc độ xử lý.
Ảnh hưởng của kích thước mẫu và số lượng nơ-ron tầng ẩn:
Khi tăng kích thước mẫu huấn luyện từ khoảng 1000 lên 3000 ảnh, độ chính xác nhận dạng tăng từ 85% lên 92%. Số lượng nơ-ron tầng ẩn tối ưu được xác định là 8-12 nơ-ron, giúp cân bằng giữa khả năng học và tránh hiện tượng quá khớp.
Tác động của tiền xử lý ảnh:
Ảnh sau khi được lọc nhiễu và tăng độ tương phản có tỷ lệ nhận dạng chính xác cao hơn khoảng 7% so với ảnh gốc chưa xử lý. Điều này chứng tỏ vai trò quan trọng của bước tiền xử lý trong hệ thống nhận dạng.
Khả năng tổng quát hóa của mạng:
Qua đánh giá trên tập kiểm tra chưa từng xuất hiện trong tập huấn luyện, mạng vẫn duy trì độ chính xác trên 88%, cho thấy khả năng tổng quát hóa tốt, phù hợp ứng dụng thực tế.

Thảo luận kết quả

Nguyên nhân chính giúp mạng nơ-ron đạt hiệu quả cao là do khả năng học và tổng quát hóa tốt, cùng với cấu trúc mạng đa lớp và hàm kích hoạt sigmoid giúp mô hình hóa các quan hệ phi tuyến phức tạp trong dữ liệu ảnh. Kết quả phù hợp với các nghiên cứu trong ngành xử lý ảnh và nhận dạng mẫu, đồng thời vượt trội hơn các phương pháp nhận dạng dựa trên tham số hoặc cấu trúc truyền thống. Việc áp dụng kỹ thuật tiền xử lý ảnh làm tăng chất lượng dữ liệu đầu vào, giảm nhiễu và làm nổi bật đặc trưng ảnh, từ đó nâng cao độ chính xác nhận dạng. Biểu đồ so sánh độ chính xác nhận dạng giữa các phương pháp và các cấu hình mạng có thể minh họa rõ nét sự cải thiện này. Kết quả nghiên cứu có ý nghĩa thực tiễn lớn trong việc phát triển các phần mềm lọc chặn nội dung hình ảnh đồi trụy, góp phần bảo vệ người dùng Internet, đặc biệt là trẻ em và các tổ chức công cộng.

Đề xuất và khuyến nghị

Phát triển phần mềm lọc chặn ảnh đồi trụy tích hợp mạng nơ-ron:
Đề xuất xây dựng và triển khai phần mềm ứng dụng mạng nơ-ron nhân tạo để phát hiện và lọc chặn ảnh "đen" trên các hệ thống mạng Internet công cộng, trường học, doanh nghiệp trong vòng 12 tháng.
Tăng cường thu thập và mở rộng tập dữ liệu huấn luyện:
Khuyến nghị các tổ chức thu thập thêm dữ liệu ảnh đa dạng, phong phú để nâng cao độ chính xác và khả năng tổng quát hóa của mạng, đặc biệt là các ảnh có biến thể phức tạp, trong vòng 6-9 tháng.
Đào tạo và nâng cao năng lực cho cán bộ kỹ thuật:
Tổ chức các khóa đào tạo chuyên sâu về xử lý ảnh và mạng nơ-ron nhân tạo cho đội ngũ kỹ thuật viên nhằm đảm bảo vận hành và phát triển hệ thống hiệu quả, trong vòng 3-6 tháng.
Nghiên cứu mở rộng ứng dụng mạng nơ-ron trong kiểm soát nội dung đa phương tiện:
Khuyến khích nghiên cứu áp dụng mạng nơ-ron cho nhận dạng video, âm thanh và các dạng nội dung đa phương tiện khác để kiểm soát toàn diện hơn, với lộ trình 2-3 năm.

Đối tượng nên tham khảo luận văn

Các nhà nghiên cứu và sinh viên ngành Công nghệ Thông tin, Hệ thống Thông tin:
Luận văn cung cấp kiến thức chuyên sâu về xử lý ảnh số và mạng nơ-ron nhân tạo, hỗ trợ nghiên cứu và phát triển các ứng dụng nhận dạng ảnh.
Chuyên gia an ninh mạng và quản lý nội dung Internet:
Cung cấp giải pháp kỹ thuật để kiểm soát và lọc chặn nội dung hình ảnh không phù hợp, giúp nâng cao hiệu quả quản lý mạng.
Các tổ chức giáo dục và phụ huynh:
Giúp hiểu rõ công nghệ kiểm soát nội dung ảnh, từ đó áp dụng các công cụ bảo vệ trẻ em khỏi các thông tin độc hại trên Internet.
Doanh nghiệp cung cấp dịch vụ Internet và phần mềm bảo mật:
Tham khảo để phát triển các sản phẩm lọc chặn nội dung hình ảnh, nâng cao chất lượng dịch vụ và đáp ứng yêu cầu pháp lý.

Câu hỏi thường gặp

Mạng nơ-ron nhân tạo là gì và tại sao lại phù hợp cho nhận dạng ảnh?
Mạng nơ-ron nhân tạo là mô hình tính toán mô phỏng hoạt động của bộ não con người, có khả năng học và tổng quát hóa từ dữ liệu. Nó phù hợp cho nhận dạng ảnh vì có thể xử lý các quan hệ phi tuyến phức tạp và thích nghi với dữ liệu nhiễu.
Làm thế nào để tránh hiện tượng quá khớp khi huấn luyện mạng nơ-ron?
Hiện tượng quá khớp được hạn chế bằng cách chia dữ liệu thành tập huấn luyện và tập kiểm tra, sử dụng tập kiểm tra để dừng huấn luyện khi sai số trên tập kiểm tra bắt đầu tăng, đồng thời điều chỉnh số lượng nơ-ron tầng ẩn và thời gian huấn luyện.
Tiền xử lý ảnh có vai trò gì trong hệ thống nhận dạng?
Tiền xử lý ảnh giúp loại bỏ nhiễu, tăng độ tương phản và chuẩn hóa dữ liệu đầu vào, từ đó nâng cao chất lượng đặc trưng ảnh và cải thiện độ chính xác nhận dạng của mạng nơ-ron.
Thuật toán lan truyền ngược hoạt động như thế nào?
Thuật toán lan truyền ngược điều chỉnh trọng số mạng dựa trên sai số giữa đầu ra thực tế và đầu ra mong muốn, lan truyền sai số ngược từ tầng ra về các tầng ẩn để cập nhật trọng số nhằm giảm thiểu sai số tổng thể.
Ứng dụng thực tế của nghiên cứu này là gì?
Nghiên cứu giúp phát triển các phần mềm lọc chặn ảnh đồi trụy trên Internet, hỗ trợ phụ huynh, nhà trường và các tổ chức quản lý mạng trong việc bảo vệ người dùng khỏi nội dung độc hại, đồng thời nâng cao an ninh mạng.

Kết luận

Mạng nơ-ron nhân tạo là công cụ hiệu quả trong nhận dạng và kiểm soát nội dung hình ảnh đồi trụy với độ chính xác trên 90%.
Tiền xử lý ảnh đóng vai trò quan trọng trong việc nâng cao chất lượng nhận dạng.
Kích thước mẫu huấn luyện và cấu trúc mạng ảnh hưởng trực tiếp đến hiệu quả của hệ thống.
Thuật toán lan truyền ngược là phương pháp học chủ đạo giúp mạng hội tụ và tổng quát hóa tốt.
Nghiên cứu mở ra hướng phát triển các giải pháp kiểm soát nội dung hình ảnh đa phương tiện trong tương lai.

Next steps: Triển khai phần mềm thử nghiệm trên quy mô rộng, mở rộng tập dữ liệu và nghiên cứu ứng dụng mạng nơ-ron cho các dạng nội dung đa phương tiện khác.

Các tổ chức, nhà nghiên cứu và doanh nghiệp trong lĩnh vực công nghệ thông tin nên hợp tác phát triển và ứng dụng các giải pháp mạng nơ-ron nhân tạo để nâng cao hiệu quả kiểm soát nội dung trên Internet.

Trích đoạn nội dung tài liệu

Chương 1: KHÁI QUÁT VỀ XỬ LÝ ẢNH VÀ KIỂM SOÁT HÌNH ẢNH 1. KHÁI QUÁT VỀ XỬ LÝ ẢNH 1. Các khái niệm cơ bản 1. Xử lý ảnh Xử lý ảnh là một lĩnh vực mang tính khoa học và công nghệ.

Tuy là một ngành khoa học mới mẻ so với nhiều ngành khoa học khác, nhưng tốc độ phát triển rất nhanh, được rất nhiều các viện nghiên cứu, ứng dụng. Những năm trở lại đây với sự phát triển của phần cứng máy tính, xử lý ảnh và đồ hoạ đã phát triển một cách mạnh mẽ và có nhiều ứng dụng được áp dụng trong cuộc sống. Xử lý ảnh và đồ hoạ đóng một vai trò quan trọng trong tương tác người - máy. Mục đích của xử lý ảnh là nâng cao chất lượng ảnh phục vụ con người và xử lý ảnh dữ liệu dạng hình ảnh để máy tính có thể hiểu được từ đó đưa ra những quyết định cần thiết.1: Quá trình xử lý ảnh Xử lý ảnh có nhiều ứng dụng trong đời sống như: nhận dạng ảnh, vệ tinh dự báo thời tiết, viễn thám, ảnh y tế, khoa học hình sự, điện ảnh… 1.

Điểm ảnh Điểm ảnh (pixel) là một phần tử của ảnh số tại toạ độ (x, y) với độ xám hoặc màu nhất định. Kích thước và khoảng cách giữa các điểm ảnh đó được chọn thích hợp sao cho mắt người cảm nhận sự liên tục về không gian và mức xám (hoặc màu) của ảnh số gần như ảnh thật, mỗi phần tử trong ma trận được gọi là một phần tử ảnh. Ảnh Ảnh số là tập hợp các điểm ảnh với mức xám phù hợp dùng để mô tả ảnh gần giống với ảnh thật. Ảnh được tạo nên từ hàng trăm ngàn cho đến hàng triệu ô vuông rất nhỏ- được coi là những nhân tố của bức ảnh và thường được biết dưới tên gọi là điểm ảnh.

Máy tính hay máy in sử dụng những ô vuông nhỏ này để hiển thị hay in ra bức ảnh. Để làm được điều đó máy tính hay máy in chia màn hình, trang giấy thành một mạng lưới chứa các ô vuông, sau đó sử dụng các giá trị chứa trong file ảnh để định ra mầu sắc, độ sáng tối của từng pixel trong mạng lưới đó, đó là cơ sở để ảnh số được hình thành. LUAN VAN CHAT LUONG download : add luanvanchat@agmail.com 9 Việc kiểm soát, định ra địa chỉ theo mạng lưới như trên được gọi là bit mapping và ảnh số còn được gọi là ảnh bitmap. Mức xám của ảnh  Định nghĩa: Mức xám (grey level) của điểm ảnh là cường độ sáng của nó được gán bằng giá trị số tại điểm đó.

 Các thang giá trị mức xám thông thường:16, 32, 64, 128, 256 (mức 256 là mức phổ dụng bởi vì trong kỹ thuật máy tính dùng 1 byte (8 bit) để biểu diễn mức xám: Mức xám dùng một byte biểu diễn: 28=256 mức, tức là từ 0 đến 255).  Ảnh đen trắng: là ảnh có hai màu đen, trắng (không chứa màu khác) với mức xám ở các điểm ảnh có thể khác nhau.  Ảnh nhị phân: ảnh chỉ có hai mức đen trắng phân biệt tức dùng một bit mô tả 21 mức khác nhau. Nói cách khác: mỗi điểm ảnh của ảnh nhị phân chỉ có thể là 0 hoặc 1.

 Ảnh màu:trong khuôn khổ lý thuyết ba màu (Red, Blue, Green) để tạo nên thế giới màu, người ta thường dùng ba byte để mô tả mức màu, khi đó các giá trị màu: 28*3=224≈16,7 triệu màu. Độ phân giải của ảnh Định nghĩa: Độ phân giải (resolution) của ảnh là mật độ điểm ảnh được ấn định trên một ảnh số được hiển thị. Theo định nghĩa, khoảng cách giữa các điểm ảnh phải được chọn sao cho mắt người vẫn thấy được sự liên tục của ảnh. Việc lựa chọn khoảng cách thích hợp tạo nên một mật độ phân bổ, đó chính là độ phân giải và được phân bố theo trục x và y trong không gian hai chiều.

Ví dụ: Độ phân giải của ảnh trên màn hình CGA (Color Graphic Adaptor) là một lưới điểm theo chiều ngang màn hình: 320 điểm chiều dọc × 200 điểm ảnh (320×200). Rõ ràng, cùng màn hình CGA 12” ta nhận thấy mịn hơn màn hình CGA 17” độ phân giải 320×200 bởi vì cùng một mật độ (độ phân giải) nhưng diện tích màn hình rộng hơn thì độ mịn (liên tục của các điểm) kém hơn. Các bước xử lý ảnh số Một hệ thống xử lý ảnh có sơ đồ tổng quát như sau: LUAN VAN CHAT LUONG download : add luanvanchat@agmail.2: Các bước cơ bản trong một hệ thống xử lý ảnh Hình 1.3: Sơ đồ phân tích, xử lý ảnh và lưu đồ thông tin giữa các khối Sau đây sẽ trình bày một số kỹ thuật xử lý ảnh cần thiết phục vụ cho việc cài đặt chương trình thử nghiệm (theo các bước trong hình 1.2), còn các thành phần khác sẽ được giới thiệu ở mức cơ bản. Thu nhận ảnh Các thiết bị thu nhận ảnh bao gồm camera, scanner các thiết bị thu nhận này có thể cho ảnh đen trắng.

Các thiết bị thu nhận ảnh có hai loại chính ứng với hai loại ảnh thông dụng Raster, Vector. Các thiết bị thu nhận ảnh Raster thông thường là camera, các thiết bị thu nhận ảnh thông thường Vector là sensor hoặc bàn số hoá Digitalizer hoặc được chuyển đổi từ ảnh Raster. Nhìn chung các hệ thống thu nhận ảnh thực hiện 1 quá trình:  Cảm biến: biến đổi năng lượng quang học thành năng lượng điện  Tổng hợp năng lượng điện thành ảnh LUAN VAN CHAT LUONG download : add luanvanchat@agmail. Tiền xử lý Sau bộ thu nhận, ảnh có thể nhiễu và độ tương phản thấp nên cần đưa vào bộ tiền xử lý (image processing) để nâng cao chất lượng.

Chức năng chính của bộ tiền xử lý là nắn chỉnh biến dạng, lọc nhiễu, chỉnh mức xám, nâng độ tương phản để làm ảnh rõ hơn, nét hơn. Các thuật toán triển khai việc nâng cao chất lượng ảnh hầu hết dựa trên các kỹ thuật trong miền điểm, không gian và tần số. Toán tử điểm là phép biến đổi đối với từng điểm ảnh đang xét, không liên quan đến các điểm lân cận khác, trong khi đó, toán tử không gian sử dụng các điểm lân cận để quy chiếu tới điểm ảnh đang xét. Một số phép biến đổi có tính toán phức tạp được chuyển sang miền tần số để thực hiện, kết quả cuối cùng được chuyển trở lại miền không gian nhờ các biến đổi ngược.

Nắn chỉnh biến dạng Ảnh thu nhận thường bị biến dạng do các thiết bị quang học và điện tử. Ảnh thu nhận Ảnh mong muốn Hình 1.4: Ảnh thu nhận và ảnh mong muốn Các nguyên nhân biến dạng do:  Do camera, đầu thu ảnh chất lượng kém.  Do môi trường, ánh sáng, hiện trường (scene), khí quyển, nhiễu xung.  Do chất lượng.

Để khắc phục người ta sử dụng các phép chiếu, các phép chiếu thường được xây dựng trên tập các điểm điều khiển. Giả sử (Pi, Pi’) với i = có n các tập điều khiển Tìm hàm f: Pi → f (Pi) sao cho: Giả sử ảnh bị biến đổi chỉ bao gồm: Tịnh tiến, quay, tỷ lệ, biến dạng bậc nhất tuyến tính. Khi đó hàm f có dạng: f (x, y) = (a1x + b1y + c1, a2x + b2y + c2) Ta có: LUAN VAN CHAT LUONG download : add luanvanchat@agmail.com 12 Để cho φ → min Giải hệ phương trình tuyến tính tìm được a1, b1, c1, tương tự tìm được a2, b2, c; từ đó ta xác định được hàm f. Lọc nhiễu Thường ảnh thu nhận được có nhiễu nên cần phải loại bỏ nhiễu.

Từ bản chất của nhiễu (thường tương ứng với tần số cao) và từ cơ sở lý thuyết lọc là: bộ lọc chỉ cho tín hiệu có tần số nào đó thông qua do đó, để lọc nhiễu người ta thường dùng lọc thông thấp (theo quan điểm tần số không gian) hay lấy tổ hợp tuyến tính để san bằng (lọc trung bình). Trước khi xem xét chi tiết các kỹ thuật áp dụng, cần phân biệt các loại nhiễu hay can thiệp trong quá trình xử lý ảnh. Trên thực tế tồn tại nhiều loại nhiễu; tuy nhiên người ta thường xem xét ba loại nhiễu chính: nhiễu cộng, nhiễu nhân và nhiễu xung:  Nhiễu cộng: Nhiễu cộng thường phân bố khắp ảnh. Nếu gọi ảnh quan sát (ảnh thu được) là Xqs, ảnh gốc là X gốc, nhiễu là η, ảnh thu được có thể biểu diễn bởi: Xqs = Xgốc + η  Nhiễu nhân: Nhiễu nhân thường phân bố khắp ảnh và ảnh thu được sẽ biểu diễn với công thức: Xqs = Xgốc * η  Nhiễu xung: Nhiễu xung thường gây đột biến tại một số điểm ảnh.

Làm trơn nhiễu bằng lọc tuyến tính: lọc trung bình và lọc dải thông thấp Do có nhiều loại nhiễu can thiệp vào quá trình xử lý ảnh nên cần có nhiều bộ lọc thích hợp.Với nhiễu cộng và nhiễu nhân ta dùng các bộ lọc thông thấp, trung bình và lọc đồng hình (homomorphie); với nhiễu xung ta dùng lọc trung bị, giả trung vị, lọc ngoài (outlier). LUAN VAN CHAT LUONG download : add luanvanchat@agmail. Lọc trung bình không gian Với lọc trung bình, mỗi điểm ảnh được thay thế bằng trung bình trọng số của các điểm lân cận và được định nghĩa như sau: Nếu trong kỹ thuật lọc trên, ta dùng các trọng số như nhau, phương trình trên sẽ trở thành: với : y(m, n): ảnh đầu vào, v(m, n): ảnh đầu ra, a(k, l) : là cửa sổ lọc. với ak,1 = và Nw là số điểm ảnh trong cửa sổ lọc W.

Lọc trung bình có trọng số chính là thực hiện chập ảnh đầu vào với nhân chập H. Nhân chập H trong trường hợp này có dạng: Trong lọc trung bình, thường người ta ưu tiên cho các hướng để bảo vệ biên của ảnh khỏi bị mờ khi làm trơn ảnh. Các kiểu mặt nạ được sử dụng tùy theo các trường hợp khác nhau. Các bộ lọc trên là bộ lọc tuyến tính theo nghĩa là điểm ảnh ở tâm cửa số sẽ được thay bởi tổ hợp các điểm lân cận chập với mặt nạ.

Giả sử đầu vào biểu diễn bởi ma trận I: Ảnh số thu được bởi lọc trung bình Y = H ⊗ I có dạng: LUAN VAN CHAT LUONG download : add luanvanchat@agmail.com 14 Một bộ lọc trung bình không gian khác cũng hay được sử dụng. Phương trình của bộ lọc đó có dạng: Ở đây, nhân chập H có kích thuớc 2×2 và mỗi điểm ảnh kết quả có giá trị bằng trung bình cộng của nó với trung bình cộng của bốn lân cận gần nhất. Lọc trung bình trọng số là một trường hợp riêng của lọc thông thấp. Lọc thông thấp Lọc thông thấp thường được sử dụng để làm trơn nhiễu.Về nguyên lý của bộ lọc thông thấp giống như đã trình bày trên.

Nội dung được bảo vệ bản quyền — Tải xuống đầy đủ

Chủ đề

Trí tuệ nhân tạo và học máy

Xử lý ảnh và thị giác máy tính

Công nghệ thông tin ứng dụng