i LỜI CAM ĐOAN Tôi xin cam đoan luận văn thạc sĩ khoa học máy tính: “Phát hiện ảnh giả mạo dạng lồng ghép trên miền tần số và sai phân cấp hai” là kết quả của quá trình học tập, nghiên cứu khoa học độc lập, nghiêm túc. Các số liệu trong luận văn là trung thực, có nguồn gốc rõ ràng, được trích dẫn và có tính kế thừa, phát triển từ các tài liệu, tạp chí, các công trình nghiên cứu đã được công bố trên các website, … Các phương pháp nêu trong luận văn được rút ra từ những cơ sở lý luận và quá trình nghiên cứu tìm hiểu của tác giả. Học viên Nguyễn Hoàng Long Số hóa bởi Trung tâm Học liệu – ĐHTN http://www.vn ii LỜI CẢM ƠN Luận văn này được thực hiện tại Trường Đại học Công nghệ Thông tin và Truyền thông Thái Nguyên dưới sự hướng dẫn, chỉ bảo tận tình của PGS. Phạm Văn Ất và các cộng sự, những người mà từ đó học viên đã học được rất nhiều điều quý báu, các thầy là tấm gương sáng cho em trong nghiên cứu chuyên môn cũng như trong cuộc sống. Em xin gửi gửi lời cảm ơn thầy PGS. Phạm Văn Ất và các cộng sự đã tận tình giúp đỡ em trong suốt thời gian học tập vừa qua, đặc biệt là định hướng nghiên cứu và tận tình hướng dẫn cho em trong suốt quá trình làm luận văn. Nếu không có sự giúp đỡ tận tình của thầy, em khó có thể hoàn thành luận văn này. Bên cạnh đó em cũng xin chân thành cảm ơn các thầy cô T r ư ờ ng Đạ i h ọc Công nghệ Thông tin & Tr u y ề n t h ô n g đã tận tình giảng dạy, chỉ bảo và cung cấp cho e7m những kiến thức cần thiết trong suốt thời gian học và cũng xin gửi lời cám ơn chân thành đến những người thân, bạn bè và đồng nghiệp đã giúp đỡ và động viên tôi trong suốt thời gian học tập cũng như trong thời gian thực hiện luận văn. Chân thành cảm ơn ! Thái Nguyên, ngày 10 tháng 6 năm 2016 Học viên Nguyễn Hoàng Long Số hóa bởi Trung tâm Học liệu – ĐHTN http://www.vn iii MỤC LỤC LỜI CAM ĐOAN . ii DANH MỤC CÁC HÌNH VẼ . vi DANH MỤC KÝ HIỆU VÀ CHỮ VIẾT TẮT.vii MỞ ĐẦU. Đối tượng, phạm vi nghiên cứu . Hướng nghiên cứu của đề tài . Những nội dung nghiên cứu chính: . 2 CHƯƠNG 1: TỔNG QUAN VỀ XỬ LÝ ẢNH VÀ BÀI TOÁN PHÁT HIỆN ẢNH GIẢ MẠO . TỔNG QUAN VỀ XỬ LÝ ẢNH . Xử lý ảnh là gì?. Thu nhận ảnh . Phân đoạn ảnh . Hệ quyết định . Trích chọn đặc điểm . Các khái niệm cơ bản trong xử lý ảnh. Các vấn đề cơ bản trong xử lý ảnh . Biểu diễn ảnh . Nắn chỉnh biến dạng . Nhận dạng ảnh . BÀI TOÁN PHÁT HIỆN ẢNH GIẢ MẠO . Khái niệm về ảnh giả mạo . Phân loại ảnh giả mạo. 14 Số hóa bởi Trung tâm Học liệu – ĐHTN http://www. KỸ THUẬT PHÒNG CHỐNG VÀ PHÁT HIỆN ẢNH GIẢ MẠO . Kỹ thuật phòng chống ảnh giả mạo.Giới thiệu và phân loại thủy vân . Tính chất của lược đồ thủy vân .Ứng dụng của thủy vân. Một số kỹ thuật phát hiện ảnh giả mạo . Dựa vào sự không tương thích hướng nguồn sáng . Dựa vào sự không tương thích về nhiễu . Dựa vào sự không tương thích về các pixel . Dựa vào sự không tương thích về màu sắc . Dựa vào sự xuất hiện nhiều lần của một vùng trên ảnh . Dựa vào dấu vết của việc lấy mẫu lại . MỘT SỐ PHƯƠNG PHÁP PHÁT HIỆN VÙNG ẢNH ĐƯỢC LẤY MẪU LẠI. Khái niệm lấy mẫu lại (Resample) . Lấy mẫu lại tín hiệu . Lấy mẫu lại trên ảnh .3 Tính chất của phép lấy mẫu tăng trên ảnh . Giới thiệu về phương pháp phát hiện vùng ảnh được lấy mẫu lại . Phương pháp của Popescu và Kichner . Phương pháp dựa trên mật độ năng lượng . Phương pháp dựa trên phép phân tích SVD . Phương pháp dựa trên sai phân cấp hai . Phương pháp sử dụng phép biến đổi DCT, DWT.29 CHƯƠNG II: PHÁT HIỆN ẢNH GIẢ MẠO ĐƯỢC LẤY MẪU TĂNG BẰNG CÁC PHÉP BIẾN ĐỔI TRÊN MIỀN TẦN SỐ VÀ SAI PHÂN CẤP HAI. PHƯƠNG PHÁP DỰA TRÊN PHÉP BIẾN ĐỔI COSIN RỜI RẠC (DCT) . Phép biến đổi Cosin rời rạc (DCT) của ma trận ảnh . Phương pháp phát hiện dựa trên phép biến đổi DCT . PHƯƠNG PHÁP DỰA TRÊN PHÉP BIẾN ĐỔI DWT . Một số ký hiệu và khái niệm .34 Số hóa bởi Trung tâm Học liệu – ĐHTN http://www. Ý tưởng chung của phép biến đổi DWT trực chuẩn. Phép biến đổi DWT dạng Haar (DWT Haar) . Phép biến đổi DWT dạng Daubechies D4 (DWT D4) . PHÁT HIỆN ẢNH GIẢ MẠO BẰNG PHÉP BIẾN ĐỔI SONG TRỰC GIAO BIOR3.5 VÀ LỌC THÔNG CAO CỦA PHÉP BIẾN ĐỔI DWT. Phát hiện vùng giả mạo bằng phép biến đổi song trưc giao Bior 3. Phương pháp dựa trên lọc thông cao của phép biến đổi DWT . Phép biến đổi DWT theo bộ lọc . Phương pháp giảm độ phức tạp tính toán (ký hiệu LTC) . PHƯƠNG PHÁP PHÁT HIỆN BẰNG PHÉP BIẾN ĐỔI HIỆU:. Xây dựng phép biến đổi hiệu trên ma trận điểm ảnh. Phương pháp phát hiện ảnh giả mạo dựa trên phép biến đổi hiệu (ký hiệu BĐH) 44 2. PHƯƠNG PHÁP SAI PHÂN CẤP HAI (Ký hiệu là SPB2): . Đánh giá độ phức tạp tính toán và tính bền vững của các phương pháp.45 CHƯƠNG III: THỬ NGHIỆM VÀ ỨNG DỤNG. LỰA CHỌN BỘ ẢNH THỬ NGHIỆM . TẠO ẢNH GIẢ MẠO DẠNG LỒNG GHÉP . XÂY DỰNG CHƯƠNG TRÌNH THỬ NGHIỆM TRÊN MATLAB. MỘT SỐ ỨNG DỤNG PHÁT HIỆN ẢNH GIẢ MẠO DẠNG LỒNG GHÉP . 55 Hướng phát triển của luận văn . 56 TÀI LIỆU THAM KHẢO . 57 Số hóa bởi Trung tâm Học liệu – ĐHTN http://www.vn vi DANH MỤC CÁC HÌNH VẼ Hình 1. Các giai đoạn trong xử lý ảnh . Các thành phần chính trong hệ thống xử lý ảnh . Minh họa về việc giả mạo ảnh . Minh họa cho loại ảnh giả mạo tăng cường ảnh: . Ảnh che phủ và bỏ đi đối tượng . Hai hướng trong phòng chống và phát hiện ảnh số giả mạo . Quá trình nhúng thủy vân . Quá trình trích thủy vân . Kết quả mô tả do độ đồng đều của các khối ảnh sau khi lấy mẫu tăng.1 : Sơ đồ phương pháp phát hiện dựa theo phép biến đổi DCT .2: Áp dụng phép biến đổi DWT theo hàng và cột .3: Áp dụng phép biến đổi DWT theo hai mức . Sơ đồ các bước trong phương pháp dựa trên phép biến đổi DWT song trực giao 3. Sơ đồ thực hiện phép biến đổi DWT thuận. Sơ đồ phép biến đổi DWT ngược. Sơ đồ các bước trong phương pháp LTC. Một số hình ảnh giả mạo được dùng để thực nghiệm. Một số hình ảnh giả mạo và kết quả phát hiện. Minh họa tính bền vững của các phương pháp. Thời gian thực hiện của 3 phương pháp (đơn vị là giây).52 Số hóa bởi Trung tâm Học liệu – ĐHTN http://www.vn vii DANH MỤC KÝ HIỆU VÀ CHỮ VIẾT TẮT Ký hiệu/ chữ viết Ý nghĩa tắt BMP Bitmap (định dạng ảnh) DCT Discrete Cosine Transform (biến đổi cosine rời rạc) DFT Discrete Fourier Transform (Phép biến đổi Fourier rời rạc) DWT Discrete Wavelet Transform (biến đổi wavelet rời rạc) IDCT Inverse Discrete Cosine Transform (phép biến đổi DCT ngược) IDWT Inverse Discrete Wavelet Transform (biến đổi DWT ngược) JPEG Joint Photographic Experts Group (một định dạng ảnh nén) NMF Non-negative Matrix Factorization (khai triển ma trận không âm) SVD Singular Value Decomposition (phân tích giá trị đặc trưng) TIFF Tagged Image File Format (định dạng ảnh) Số hóa bởi Trung tâm Học liệu – ĐHTN http://www.vn 1 MỞ ĐẦU 1. Đặt vấn đề Ngày nay, ảnh số là phương tiện truyền thông được sử dụng rộng rãi, đóng vai trò quan trọng trong đời sống con người, có tác động đến xã hội, tham gia vào các quá trình pháp lý và kinh tế như: làm bằng chứng trong điều tra, xử án, bảo hiểm, gian lận khoa học,… Hơn nữa, với sự phổ biến của máy ảnh kĩ thuật số và các phần mềm chỉnh sửa (Photoshop, GIMP,…) dẫn đến ảnh số có thể dễ dàng được chỉnh sửa mà không cần đến các kiến thức chuyên gia và việc chỉnh sửa hầu như không để lại dấu vết mà mắt thường có thể nhận biết được. Kết quả là khi những hình ảnh được chỉnh sửa sử dụng cho mục đích xấu nó có thể dẫn đến những hậu quả nghiêm trọng. Do vậy, việc phát hiện ảnh giả mạo là vấn đề đặt ra ngày càng cấp bách và càng trở nên khó khăn. Có nhiều cách để tạo ra hình ảnh giả mạo, trong đó lồng ghép các vùng ảnh từ các ảnh khác nhau là một cách rất phổ biến. Trong khi làm như vậy, để tạo ra hình ảnh thuyết phục, người ta thường phải sửa kích thước, quay, hay co giãn các phần của ảnh, quá trình này đòi hỏi lấy mẫu lại (resampling). Mặc dù việc lấy mẫu lại thường không thể nhìn thấy bằng mắt thường nhưng nó vẫn để lại các dấu vết về mặt tương quan giữa các điểm ảnh. Vì vậy, dựa vào dấu vết của việc lấy mẫu lại để phát hiện ảnh giả mạo có các vùng được lồng chép từ các nguồn khác nhau là một hướng quan trọng, thu hút nhiều sự quan tâm nghiên cứu. Đã có nhiều nghiên cứu để phát hiện ra dạng giả mạo này, tuy nhiên hiệu quả chưa cao và đòi hỏi thời gian tính toán lớn. Gần đây có một số phương pháp dựa trên miền tần số và sai phân cấp hai để phát hiện ảnh giả mạo dạng lồng ghép và khoanh được vùng giả mạo. So với các phương pháp khác thì các phương pháp này có đặc điểm là đơn giản và khoanh được vùng giả mạo khá rõ Số hóa bởi Trung tâm Học liệu – ĐHTN http://www. Chính vì những ưu điểm trên và đây là một hướng nghiên cứu mới có nhiều ứng dụng nên em đã chọn đề tài “Phát hiện ảnh giả mạo dạng lồng ghép trên miền tần số và sai phân cấp hai” cho luận văn của mình. Đối tượng, phạm vi nghiên cứu - Đối tượng : Ảnh giả dạng lồng ghép : là ảnh nhận được bằng cách ghép các phần của ảnh khác vào một ảnh đa mức xám gốc (phần được chèn vào gọi là vùng giả mạo). - Phạm vi nghiên cứu : Ảnh có các vùng giả mạo được lấy mẫy tăng (phóng to) cho phù hợp với kích thước và độ phân giải của ảnh gốc. Hướng nghiên cứu của đề tài - Nghiên cứu việc phát hiện và khoanh vùng giả mạo được lấy mẫu tăng bằng phương pháp DCT, DWT và sai phân cấp 2. - Xây dựng chương trình thử nghiệm để so sánh tính hiệu quả của các phương pháp trên.