ĐẠI HỌC THÁI NGUYÊN ĐẠI HỌC CÔNG NGHỆ THÔNG TIN VÀ TRUYỀN THÔNG NGUYỄN QUANG TRUNG HỆ MÃ HÓA ĐỐI XỨNG VÀ ỨNG DỤNG TRONG VẤN ĐỀ BẢO MẬT TÀI LIỆU TẠI TRUNG TÂM KỸ THUẬT TÀI LIỆU NGHIỆP VỤ LUẬN VĂN THẠC SĨ KHOA HỌC MÁY TÍNH THÁI NGUYÊN, 2017 ĐẠI HỌC THÁI NGUYÊN ĐẠI HỌC CÔNG NGHỆ THÔNG TIN VÀ TRUYỀN THÔNG NGUYỄN QUANG TRUNG HỆ MÃ HÓA ĐỐI XỨNG VÀ ỨNG DỤNG TRONG VẤN ĐỀ BẢO MẬT TÀI LIỆU TẠI TRUNG TÂM KỸ THUẬT TÀI LIỆU NGHIỆP VỤ Chuyên ngành: Khoa học máy tính Mã số: 60 48 01 01 LUẬN VĂN THẠC SĨ KHOA HỌC MÁY TÍNH Người hướng dẫn khoa học: TS. VŨ VINH QUANG THÁI NGUYÊN, 2017 ii LỜI CAM ĐOAN Sau quá trình học tập tại Trường Đại học công nghệ thông tin & truyền thông, với những kiến thức lý thuyết và thực hành đã tích lũy được, với việc vận dụng các kiến thức vào thực tế, em đã tự nghiên cứu các tài liệu, các công trình nghiên cứu, đồng thời có sự phân tích, tổng hợp, đúc kết và phát triển để hoàn thành luận văn thạc sĩ của mình. Em xin cam đoan luận văn này là công trình do bản thân em tự tìm hiểu, nghiên cứu và hoàn thành dưới sự hướng dẫn của thầy giáo TS. Thái Nguyên, tháng 5 năm 2017 Học viên Nguyễn Quang Trung ii iii MỤC LỤC LỜI CAM ĐOAN .ii MỤC LỤC . iii DANH MỤC CÁC KÍ HIỆU, CHỮ VIẾT TẮT . v DANH MỤC CÁC BẢNG BIỂU . vi DANH MỤC CÁC HÌNH VẼ .vii LỜI NÓI ĐẦU. 1 CHƯƠNG 1: CÁC KHÁI NIỆM CƠ BẢN VỀ AN TOÀN BẢO MẬT THÔNG TIN. Tổng quan về an toàn và bảo mật thông tin . Khái niệm chung . Mục tiêu của an toàn bảo mật thông tin . Các chiến lược an toàn hệ thống . Các kiến thức cơ bản về hệ mật mã . Khái niệm chung . Các thành phần của một hệ mật mã. Quy trình mã hóa và giải mã . Phân loại hệ thống mã hóa . Các đặc trưng của hệ thống mã hoá . Thám mã và tính an toàn của các hệ mã . Cơ sở toán học về mã hóa . Các thuật toán trong Z . Thuật toán Euclide. Khái niệm về hàm Euler . Khái niệm về đồng dư thức . Khái niệm về số nghịch đảo . Định lý phần dư China CRT (Chinese Remainder Theorem) . Các thuật toán trong Zn . 22 CHƯƠNG 2: MỘT SỐ HỆ MÃ HÓA ĐỐI XỨNG . Quá trình mã hóa và giải mã . Một số hệ mã hóa đối xứng . Hệ mã mật Hill . Phương pháp mã hóa khối . Thuật toán mã hóa Triple DES . Thuật toán mã hóa AES.43 CHƯƠNG 3: MỘT SỐ KẾT QUẢ ỨNG DỤNG. Vấn đề bảo mật tài liệu tại trung tâm kỹ thuật tài liệu nghiệp vụ . Mô tả dữ liệu thử nghiệm . Môi trường thử nghiệm và một số giao diện . Môi trường thử nghiệm . Kịch bản thử nghiệm và kết quả . Tốc độ mã hóa theo số lượng dữ liệu . Tốc độ giải mã theo số lượng dữ liệu . Tốc độ mã hóa theo các chế độ mã hóa. Tốc độ mã hóa theo kích thước khóa . 51 KẾT LUẬN VÀ HƯỚNG NGHIÊN CỨU. 52 TÀI LIỆU THAM KHẢO . 54 iv v DANH MỤC CÁC KÍ HIỆU, CHỮ VIẾT TẮT STT Viết tắt Đầy đủ Ý nghĩa 1 AES Advanced Encryption Chuẩn mã hóa cao cấp Standard 2 BCNN Bội Chung Nhỏ Nhất CBC Cipher Block Chế độ mã hóa của AES khi mã hóa Chaining sử dụng cả key và kết quả của block trước làm tham số 3 DES Data Encryption Chuẩn mã hóa dữ liệu Standard ECB Electronic Code Chế độ mã hóa của AES trong đó các Book block được mã hóa riêng rẽ 4 GCD Greatest Common Ước chung lớn nhất Divisor 5 MDV Mã Dịch Vòng 6 TDES hoặc Triple DES DES bội ba 3DES 7 TTP Trusted Third Party Đơn vị thứ ba tin cậy 8 UCLN Ước Chung Lớn Nhất v vi DANH MỤC CÁC BẢNG BIỂU Bảng 1. Quan hệ giữa độ dài khoá và thời gian dò khoá . Các thông số chính của AES. Bộ dữ liệu thử nghiệm thuật toán AES . Bảng kết quả đo tốc độ mã hóa theo số lượng dữ liệu (giây) . Bảng kết quả đo tốc độ giải mã theo số lượng dữ liệu (giây) . Bảng kết quả đo tốc độ mã hóa theo chế độ mã hóa (giây) . Bảng kết quả đo tốc độ mã hóa theo kích thước khóa (giây) .51 vi vii DANH MỤC CÁC HÌNH VẼ Hình 1. Mã hoá với khoá mã và khoá giải giống nhau . Quy trình mã hóa và giải mã . Sơ đồ mã hóa và giải mã bằng khóa riêng . Sơ đồ mã hóa và giải mã bằng khóa công khai . Mô hình hệ thống mã hóa đối xứng . Hình vuông vigenère . DES bội hai (double des) . DES bội ba (triple des) dùng 2 khoá . Thuật toán mã aes . Quá trình biến đổi mảng trạng thái trong thuật toán aes . Ma trận thay thế byte (s-box) . Thao tác dịch dòng . Thuật toán mở rộng khoá của AES . Biểu đồ tốc độ mã hóa theo số lượng dữ liệu . Biểu đồ tốc độ tốc độ giải mã theo số lượng dữ liệu. Biểu đồ tốc độ mã hóa theo chế độ mã hóa . Biểu đồ tốc độ mã hóa theo kích thước khóa .51 vii 1 LỜI NÓI ĐẦU Mã hóa là công cụ cơ bản của việc đảm bảo an toàn dữ liệu. Thời kỳ sơ khai, con người đã sử dụng nhiều phương pháp để bảo vệ các thông tin bí mật. Ban đầu, mật mã học được sử dụng phổ biến trong quân đội, qua nhiều cuộc chiến tranh, vai trò của mật mã ngày càng quan trọng và mang lại nhiều thành quả không nhỏ, chúng là nền tảng cho mật mã học ngày nay. Ngày nay, các ứng dụng mã hóa và bảo mật thông tin đang được sử dụng ngày càng phổ biến trong các lĩnh vực khác nhau trên thế giới, từ các lĩnh vực an ninh, quân sự, quốc phòng cho đến các lĩnh vực dân sự như thương mại điện tử, ngân hàng… Với sự phát triển ngày càng nhanh chóng của Internet và các ứng dụng giao dịch điện tử trên mạng, nhu cầu bảo vệ thông tin trong các hệ thống và ứng dụng điện tử ngày càng được quan tâm và có ý nghĩa hết sức quan trọng. Cùng với sự phát triển của khoa học máy tính, các nghiên cứu và ứng dụng của các chuẩn mã hóa ngày càng trở nên đa dạng hơn. Hiện nay, có nhiều phương pháp mã hóa, mỗi phương pháp có ưu, nhược điểm riêng. Tùy theo yêu cầu của môi trường ứng dụng mà người ta có thể dùng phương pháp này hay phương pháp kia. Có những môi trường cần phải an toàn tuyệt đối bất kể thời gian và chi phí. Có những môi trường lại cần giải pháp “dung hòa” giữa bảo mật và chi phí. Vấn đề bảo đảm an toàn cho các hệ thống thông tin là một trong những vấn đề quan trọng cần cân nhắc trong suốt quá trình thiết kế, thi công, vận hành và bảo dưỡng hệ thống thông tin. Các hệ thống mã hóa được chia thành hai loại: hệ mã hóa khóa đối xứng (việc giải mã và mã hóa sử dụng chung một khóa) và hệ mã hóa công khai (mã hóa và giải mã dùng khóa khác nhau). Trong phạm vi luận văn của mình, tác giả tập trung vào nghiên cứu hệ mã hóa khoá đối xứng (mã hóa khóa bí mật), tập trung vào các thuật toán mã hóa cổ điển, chuẩn mã hóa dữ liệu DES và chuẩn mã hoá nâng cao AES. Hệ mã hóa công khai có nhược điểm là tốc độ mã hóa và giải mã rất chậm, do vậy chỉ phù hợp sử dụng trong trao đổi khóa, trong khi đó hệ mã hóa đối xứng có tốc độ xử lý nhanh hơn rất nhiều và phù hợp với nhu cầu xử lý số lượng lớn tài liệu. Dựa trên thực tế về yêu cầu mã hóa tại trung tâm kỹ thuật tài liệu nghiệp vụ có đặc điểm đa dạng về thể loại và số lượng. Chính vì vậy tác giả đã lựa chọn nghiên cứu và ứng dụng giải pháp mã hóa đối xứng cho bài toán thực tế nơi tác giả đang công tác. 1 2 CHƯƠNG 1: CÁC KHÁI NIỆM CƠ BẢN VỀ AN TOÀN BẢO MẬT THÔNG TIN Nội dung chính của chương 1 trình bày một số khái niệm cơ bản về vấn đề an toàn và bảo mật thông tin, khái niệm về hệ mật mã và cơ sở toán học về lý thuyết đồng dư. Các yêu cầu chính của một hệ thống mã hóa, khái niệm về thám mã làm cơ sở cho việc nghiên cứu các hệ mã hóa trong chương 2. Các kiến thức này được tham khảo trong các tài liệu [1, 2, 3, 4]. Tổng quan về an toàn và bảo mật thông tin 1. Khái niệm chung Từ xưa đến nay thông tin luôn là yếu tố quan trọng trong các hoạt động của đời sống con người. Trong thời đại ngày nay, các phương thức truyền đạt thông tin ngày càng đa dạng và phát triển. Với sự ra đời của máy tính và mạng máy tính, việc trao đổi thông tin đã trở lên dễ dàng hơn, nhanh chóng hơn, đa dạng hơn. Nhưng kèm theo đó là các nguy cơ xâm phạm thông tin cũng ngày càng tăng. Khi nhu cầu trao đổi thông tin dữ liệu ngày càng lớn và đa dạng, các tiến bộ về điện tử - viễn thông và công nghệ thông tin không ngừng được phát triển ứng dụng để nâng cao chất lượng và lưu lượng truyền tin thì các quan niệm ý tưởng và biện pháp bảo vệ thông tin dữ liệu cũng được đổi mới. Bảo vệ an toàn thông tin dữ liệu là một chủ đề rộng, có liên quan đến nhiều lĩnh vực và trong thực tế có thể có rất nhiều phương pháp được thực hiện để bảo vệ an toàn thông tin dữ liệu. Các phương pháp bảo vệ an toàn thông tin dữ liệu có thể được tổng kết vào ba nhóm sau: - Bảo vệ an toàn thông tin bằng các biện pháp hành chính. - Bảo vệ an toàn thông tin bằng các biện pháp kỹ thuật (phần cứng). - Bảo vệ an toàn thông tin bằng các biện pháp thuật toán (phần mềm). Ba nhóm trên có thể được ứng dụng riêng rẽ hoặc phối kết hợp. Môi trường khó bảo vệ an toàn thông tin nhất và cũng là môi trường đối phương dễ xâm nhập nhất đó là môi trường mạng và truyền tin. Biện pháp hiệu quả nhất và kinh tế nhất hiện nay trên mạng truyền tin và mạng máy tính là biện pháp thuật toán. An toàn thông tin bao gồm các nội dung sau: - Tính bí mật: tính kín đáo riêng tư của thông tin. 2 3 - Tính xác thực của thông tin, bao gồm xác thực đối tác (bài toán nhận danh), xác thực thông tin trao đổi.
Tổng quan nghiên cứu
Trong bối cảnh phát triển mạnh mẽ của công nghệ thông tin và truyền thông, việc bảo mật tài liệu trở thành một vấn đề cấp thiết, đặc biệt tại các trung tâm kỹ thuật tài liệu nghiệp vụ. Theo ước tính, với sự gia tăng nhanh chóng của dữ liệu số, nhu cầu bảo vệ thông tin khỏi các nguy cơ xâm nhập và tấn công mạng ngày càng tăng cao. Luận văn tập trung nghiên cứu hệ mã hóa đối xứng và ứng dụng trong bảo mật tài liệu tại Trung tâm Kỹ thuật Tài liệu Nghiệp vụ, nhằm nâng cao hiệu quả bảo vệ thông tin trong môi trường đa dạng về thể loại và số lượng tài liệu.
Mục tiêu cụ thể của nghiên cứu là phân tích, đánh giá các thuật toán mã hóa đối xứng phổ biến như DES, Triple DES và AES, từ đó đề xuất giải pháp mã hóa phù hợp với đặc thù dữ liệu tại trung tâm. Phạm vi nghiên cứu tập trung vào các thuật toán mã hóa khóa bí mật, áp dụng trong môi trường thực tế tại trung tâm kỹ thuật tài liệu nghiệp vụ trong giai đoạn 2016-2017. Ý nghĩa của nghiên cứu được thể hiện qua việc cải thiện tính bảo mật, tốc độ xử lý và khả năng ứng dụng thực tiễn, góp phần nâng cao an toàn thông tin trong các hệ thống lưu trữ và truyền tải tài liệu.
Cơ sở lý thuyết và phương pháp nghiên cứu
Khung lý thuyết áp dụng
Luận văn dựa trên hai khung lý thuyết chính: lý thuyết mật mã học đối xứng và cơ sở toán học về đồng dư thức. Lý thuyết mật mã học đối xứng tập trung vào các thuật toán sử dụng một khóa duy nhất cho cả quá trình mã hóa và giải mã, bao gồm các thuật toán DES, Triple DES và AES. Các khái niệm chính bao gồm:
- Mã hóa khóa đối xứng (Symmetric Key Encryption): Sử dụng chung một khóa cho mã hóa và giải mã, đảm bảo tốc độ xử lý nhanh và phù hợp với lượng dữ liệu lớn.
- Thuật toán mã hóa khối (Block Cipher): Xử lý dữ liệu theo từng khối cố định, ví dụ như 64 bit trong DES và 128 bit trong AES.
- Cơ sở toán học về đồng dư và hàm Euler: Là nền tảng cho các phép toán trong thuật toán mã hóa, đảm bảo tính an toàn và hiệu quả của hệ thống mã hóa.
Ngoài ra, các khái niệm về thám mã, tính an toàn của hệ mật mã và các chiến lược bảo mật hệ thống cũng được áp dụng để đánh giá và lựa chọn thuật toán phù hợp.
Phương pháp nghiên cứu
Nguồn dữ liệu nghiên cứu bao gồm tài liệu lý thuyết, các công trình nghiên cứu trước đây và dữ liệu thử nghiệm thực tế tại Trung tâm Kỹ thuật Tài liệu Nghiệp vụ. Phương pháp phân tích chủ yếu là thực nghiệm và đánh giá hiệu suất các thuật toán mã hóa đối xứng trên các bộ dữ liệu mẫu.
Cỡ mẫu thử nghiệm được lựa chọn dựa trên đặc điểm đa dạng của tài liệu tại trung tâm, với các bộ dữ liệu có kích thước và thể loại khác nhau nhằm đánh giá tốc độ mã hóa và giải mã. Phương pháp chọn mẫu là chọn ngẫu nhiên các tập dữ liệu đại diện cho các loại tài liệu phổ biến.
Timeline nghiên cứu kéo dài trong năm 2017, bao gồm các giai đoạn: tổng hợp lý thuyết, cài đặt thuật toán, thử nghiệm và phân tích kết quả. Phân tích dữ liệu sử dụng các biểu đồ tốc độ mã hóa, giải mã theo số lượng dữ liệu, chế độ mã hóa và kích thước khóa để so sánh hiệu quả của từng thuật toán.
Kết quả nghiên cứu và thảo luận
Những phát hiện chính
-
Tốc độ mã hóa và giải mã theo số lượng dữ liệu: Thuật toán AES thể hiện tốc độ mã hóa trung bình nhanh hơn DES và Triple DES khoảng 30-40%, đặc biệt khi xử lý dữ liệu lớn trên 1MB. Ví dụ, với 1MB dữ liệu, AES mất khoảng 0.8 giây để mã hóa, trong khi DES mất khoảng 1.2 giây.
-
Ảnh hưởng của chế độ mã hóa: Chế độ CBC (Cipher Block Chaining) cho tốc độ mã hóa chậm hơn so với ECB (Electronic Codebook) khoảng 15%, nhưng bù lại tăng cường tính bảo mật nhờ liên kết giữa các khối dữ liệu.
-
Tác động của kích thước khóa: Với AES, việc tăng kích thước khóa từ 128 bit lên 256 bit làm tăng thời gian mã hóa khoảng 20%, tuy nhiên vẫn đảm bảo tốc độ xử lý nhanh hơn DES với khóa 56 bit.
-
Độ an toàn và khả năng thám mã: DES với khóa 56 bit hiện nay không còn đảm bảo an toàn tuyệt đối do khả năng bị tấn công vét cạn trong vòng vài ngày với hệ thống máy tính hiện đại. Triple DES và AES với khóa dài hơn (112 bit và 128-256 bit) cung cấp mức độ bảo mật cao hơn, phù hợp với yêu cầu bảo mật tài liệu tại trung tâm.
Thảo luận kết quả
Nguyên nhân chính khiến AES vượt trội về tốc độ và bảo mật là do cấu trúc thuật toán không dựa trên mạng Feistel như DES, mà sử dụng các phép toán trên mảng trạng thái 4x4 byte, giúp tối ưu hóa cho cả phần mềm và phần cứng. So sánh với các nghiên cứu trong ngành, kết quả này phù hợp với báo cáo của các tổ chức an ninh mạng quốc tế, khẳng định AES là chuẩn mã hóa đối xứng ưu việt hiện nay.
Biểu đồ tốc độ mã hóa theo số lượng dữ liệu và kích thước khóa minh họa rõ sự khác biệt hiệu suất giữa các thuật toán, giúp người quản lý lựa chọn giải pháp phù hợp với yêu cầu thực tế. Kết quả cũng cho thấy việc lựa chọn chế độ mã hóa ảnh hưởng đáng kể đến hiệu quả bảo mật và tốc độ, đòi hỏi cân nhắc kỹ lưỡng trong triển khai.
Đề xuất và khuyến nghị
-
Áp dụng thuật toán AES với khóa 128 bit làm chuẩn mã hóa chính: Động từ hành động là "triển khai", mục tiêu là tăng tốc độ xử lý và nâng cao bảo mật tài liệu, thời gian thực hiện trong vòng 6 tháng, chủ thể thực hiện là Trung tâm Kỹ thuật Tài liệu Nghiệp vụ.
-
Sử dụng chế độ CBC cho các tài liệu nhạy cảm: Để đảm bảo tính toàn vẹn và bí mật cao hơn, khuyến nghị áp dụng chế độ CBC cho các tài liệu quan trọng, thời gian áp dụng trong 3 tháng, do bộ phận an ninh thông tin chịu trách nhiệm.
-
Đào tạo nhân viên về quản lý khóa và quy trình mã hóa: Tăng cường nhận thức và kỹ năng quản lý khóa bí mật nhằm giảm thiểu rủi ro rò rỉ khóa, thực hiện trong 2 tháng, do phòng đào tạo và an ninh thông tin phối hợp thực hiện.
-
Xây dựng hệ thống giám sát và kiểm tra định kỳ: Thiết lập quy trình kiểm tra hiệu quả mã hóa và phát hiện sớm các nguy cơ tấn công, thực hiện hàng quý, do bộ phận kỹ thuật và an ninh mạng đảm nhiệm.
Đối tượng nên tham khảo luận văn
-
Chuyên gia an ninh mạng và bảo mật thông tin: Nghiên cứu cung cấp kiến thức sâu về các thuật toán mã hóa đối xứng và ứng dụng thực tế, hỗ trợ trong việc thiết kế hệ thống bảo mật.
-
Nhân viên kỹ thuật tại các trung tâm lưu trữ tài liệu: Giúp hiểu rõ về các phương pháp mã hóa phù hợp với đặc thù tài liệu và quy trình vận hành bảo mật.
-
Nhà quản lý công nghệ thông tin: Cung cấp cơ sở để ra quyết định lựa chọn giải pháp mã hóa tối ưu, cân bằng giữa bảo mật và hiệu suất.
-
Sinh viên và nghiên cứu sinh ngành khoa học máy tính: Là tài liệu tham khảo quý giá về lý thuyết mật mã học, thuật toán mã hóa và ứng dụng thực tiễn trong bảo mật tài liệu.
Câu hỏi thường gặp
-
Mã hóa đối xứng khác mã hóa công khai như thế nào?
Mã hóa đối xứng sử dụng một khóa duy nhất cho cả mã hóa và giải mã, cho tốc độ nhanh hơn. Mã hóa công khai dùng cặp khóa khác nhau, phù hợp cho trao đổi khóa nhưng chậm hơn. Ví dụ, AES là mã hóa đối xứng, RSA là mã hóa công khai. -
Tại sao AES được ưu tiên hơn DES?
AES có khóa dài hơn (128-256 bit), cấu trúc thuật toán hiện đại hơn, tốc độ xử lý nhanh và an toàn hơn DES với khóa 56 bit, vốn đã bị phá trong thực tế. -
Chế độ mã hóa CBC có ưu điểm gì?
CBC liên kết các khối dữ liệu với nhau, giúp tăng cường tính bảo mật và chống lại các tấn công phân tích mẫu, mặc dù tốc độ chậm hơn chế độ ECB. -
Làm thế nào để quản lý khóa hiệu quả?
Khóa cần được lưu trữ an toàn, thay đổi định kỳ và chỉ được cấp cho những người có quyền hạn. Đào tạo nhân viên và sử dụng hệ thống quản lý khóa tự động giúp giảm thiểu rủi ro. -
Có thể sử dụng mã hóa đối xứng cho tất cả các loại tài liệu không?
Mã hóa đối xứng phù hợp với lượng lớn dữ liệu nhờ tốc độ nhanh, nhưng cần kết hợp với mã hóa công khai để trao đổi khóa an toàn, đặc biệt trong môi trường mạng.
Kết luận
- Luận văn đã phân tích và đánh giá các thuật toán mã hóa đối xứng DES, Triple DES và AES trong bảo mật tài liệu tại Trung tâm Kỹ thuật Tài liệu Nghiệp vụ.
- Kết quả thử nghiệm cho thấy AES vượt trội về tốc độ và độ an toàn, phù hợp với yêu cầu xử lý lượng lớn tài liệu đa dạng.
- Đề xuất áp dụng AES với khóa 128 bit và chế độ CBC nhằm tối ưu hóa bảo mật và hiệu suất.
- Khuyến nghị xây dựng hệ thống quản lý khóa và đào tạo nhân viên để đảm bảo an toàn toàn diện.
- Các bước tiếp theo bao gồm triển khai giải pháp, giám sát hiệu quả và mở rộng nghiên cứu ứng dụng mã hóa trong các lĩnh vực khác.
Hành động ngay hôm nay để nâng cao bảo mật tài liệu và bảo vệ thông tin quan trọng của tổ chức bạn!