Khóa luận tốt nghiệp: Ứng dụng CycleGAN trong an toàn thông tin và phát hiện tấn công mạng khả lập trình

2021

92
0
0

Phí lưu trữ

30.000 VNĐ

Mục lục chi tiết

LỜI CAM ĐOAN

LỜI CẢM ƠN

1. CHƯƠNG 1: TỔNG QUAN ĐỀ TÀI

1.1. Lý do chọn đề tài

1.2. Mục tiêu của đề tài. Phạm vi nghiên cứu. Đối tượng nghiên cứu. Phương pháp thực hiện

1.3. Cấu trúc khóa luận

2. CHƯƠNG 2: CÁC CÔNG TRÌNH NGHIÊN CỨU LIÊN QUAN

2.1. Các công trình nghiên cứu liên quan

2.2. Ý nghĩa khoa học và thực tiễn của đề tài

2.2.1. Ý nghĩa khoa học

2.2.2. Ý nghĩa thực tiễn

3. CHƯƠNG 3: CƠ SỞ LÝ THUYẾT

3.1. Mạng khả lập trình (SDN). Kiến trúc mạng khả lập trình. Cơ chế hoạt động của mạng khả lập trình. Kỹ thuật lừa dối (Cyber Deception)

3.2. Moving Target Defense (MTD). Phân loại các thuật toán học máy. Phương pháp huấn luyện, đánh giá mô hình học máy. Tiền xử lý dữ liệu, và feature engineering. Overfitting và underfitting

3.3. Mạng thần kinh nhân tạo. Generative Adversarial Networks (GAN). Kiến trúc của GAN. Hàm chi phí (Cost function) của GAN. Quá trình huấn luyện của GAN

3.4. Kiến trúc của CycleGAN. Các giá trị mất mát (loss) của CycleGAN. Hệ thống phát hiện xâm nhập (IDS) dựa trên phương pháp học máy

3.4.1. Các thông số (metrics) thường được sử dụng để đánh giá IDS học máy

3.4.2. Vấn đề của IDS học máy. Phương pháp huấn luyện IDS trên các tập dữ liệu mất cân bằng

4. CHƯƠNG 4: PHƯƠNG PHÁP THỰC HIỆN

4.1. Ý tưởng cho việc sử dụng Cyber Deception và CycleGAN. Thiết kế, phân tích qui trình hoạt động của mô hình kết hợp Cyber Deception và CycleGAN

4.2. Cyber deception trong mạng khả lập trình. Phân tích thiết kế hệ thống

4.3. Ứng dụng quản lý mạng (Controller application). Công cụ giả lập mạng

4.4. Mô hình CycleGAN. Phân tích thiết kế mô hình. Biến đổi và chia nhỏ tập dữ liệu thô. Phương pháp đánh giá

5. CHƯƠNG 5: HIỆN THỰC VÀ ĐÁNH GIÁ

5.1. Hiện thực hệ thống Cyber Deception trên mạng khả lập trình. Sơ đồ triển khai hệ thống. Xây dựng mô hình mạng với Containernet. Xây dựng mô-đun trích xuất thuộc tính. Xây dựng IDS và đọc cảnh báo để gửi về controller. Xây dựng hệ thống SOC (ELK). Xây dựng ứng dụng Controller. Đánh giá mô hình. Triển khai mô hình CycleGAN để tăng cường dữ liệu cho tập huấn luyện IDS

5.2. Môi trường thực nghiệm. Tổng quan về tập dữ liệu CICIDS2017. Tiền xử lý tập dữ liệu CICIDS2017. Chia nhỏ tập dữ liệu hậu tiền xử lý. Huấn luyện CycleGAN bằng tập huấn luyện. Cân bằng tập huấn luyện ban đầu. Tái huấn luyện cho IDS và đánh giá. CycleGAN IDS qua 80 epoch huấn luyện của CycleGAN. Đánh giá các IDS với các kích thước tập huấn luyện khác nhau

6. CHƯƠNG 6: KẾT LUẬN VÀ HƯỚNG PHÁT TRIỂN

TÀI LIỆU THAM KHẢO

PHỤ LỤC

Tóm tắt

I. Kỹ thuật lừa dối và tăng cường dữ liệu với CycleGAN

Kỹ thuật lừa dốităng cường dữ liệu là hai phương pháp chính được áp dụng trong nghiên cứu này để cải thiện hiệu quả của hệ thống phát hiện tấn công mạng. CycleGAN, một biến thể của mô hình GAN, được sử dụng để chuyển đổi dữ liệu bình thường thành dữ liệu độc hại, giúp cân bằng tập dữ liệu huấn luyện. Kỹ thuật lừa dối được triển khai trên mạng khả lập trình (SDN) nhằm thu thập lưu lượng tấn công một cách chủ động. Sự kết hợp này không chỉ giúp tăng cường dữ liệu mà còn cải thiện khả năng phát hiện các cuộc tấn công mới.

1.1. Ứng dụng CycleGAN trong tăng cường dữ liệu

CycleGAN được sử dụng để chuyển đổi dữ liệu bình thường thành dữ liệu độc hại, giúp cân bằng tập dữ liệu huấn luyện. Mô hình này hoạt động dựa trên nguyên lý chuyển đổi giữa hai miền dữ liệu mà không cần cặp dữ liệu tương ứng. Điều này đặc biệt hữu ích trong việc tạo ra dữ liệu giả mạo để bổ sung vào tập dữ liệu huấn luyện, từ đó cải thiện hiệu quả của hệ thống phát hiện tấn công mạng (IDS).

1.2. Kỹ thuật lừa dối trong mạng khả lập trình

Kỹ thuật lừa dối được triển khai trên mạng khả lập trình (SDN) nhằm thu thập lưu lượng tấn công một cách chủ động. Bằng cách sử dụng các honeypot, hệ thống có thể đánh lừa kẻ tấn công, hướng họ vào các bẫy đã được thiết lập sẵn. Điều này không chỉ giúp giảm thiểu rủi ro cho hệ thống mạng mà còn thu thập được các IOCs (Indicators of Compromise) và dữ liệu tấn công, phục vụ cho việc huấn luyện IDS.

II. Phát hiện tấn công mạng với học máy

Học máytrí tuệ nhân tạo đóng vai trò quan trọng trong việc xây dựng các hệ thống phát hiện tấn công mạng hiệu quả. IDS học máy có khả năng phát hiện các cuộc tấn công chưa từng được biết đến với độ chính xác cao. Tuy nhiên, hiệu quả của các hệ thống này bị hạn chế bởi tình trạng thiếu dữ liệu huấn luyện và sự mất cân bằng trong tập dữ liệu. Nghiên cứu này tập trung vào việc sử dụng CycleGANkỹ thuật lừa dối để giải quyết các vấn đề này.

2.1. Thách thức trong phát hiện tấn công mạng

Một trong những thách thức lớn nhất của IDS học máy là tình trạng thiếu dữ liệu huấn luyện và sự mất cân bằng trong tập dữ liệu. Các tập dữ liệu thường chứa nhiều dữ liệu bình thường hơn so với dữ liệu độc hại, dẫn đến việc mô hình học máy không được huấn luyện đầy đủ để phát hiện các cuộc tấn công. Tăng cường dữ liệukỹ thuật lừa dối được đề xuất để giải quyết vấn đề này.

2.2. Ứng dụng học máy trong IDS

Học máy được sử dụng để xây dựng các IDS có khả năng phát hiện các cuộc tấn công mạng với độ chính xác cao. Các mô hình như mạng neuronGAN được áp dụng để cải thiện hiệu quả của hệ thống. Nghiên cứu này tập trung vào việc sử dụng CycleGAN để tạo ra dữ liệu độc hại giả mạo, giúp cân bằng tập dữ liệu huấn luyện và cải thiện khả năng phát hiện tấn công của IDS.

III. Đánh giá và ứng dụng thực tiễn

Nghiên cứu đã tiến hành đánh giá hiệu quả của CycleGANkỹ thuật lừa dối trong việc cải thiện hệ thống phát hiện tấn công mạng. Kết quả cho thấy, việc sử dụng CycleGAN giúp tăng cường dữ liệu độc hại, từ đó cải thiện đáng kể hiệu suất của IDS. Kỹ thuật lừa dối cũng đóng vai trò quan trọng trong việc thu thập dữ liệu tấn công một cách chủ động, giúp giảm thiểu rủi ro cho hệ thống mạng.

3.1. Kết quả thực nghiệm

Kết quả thực nghiệm cho thấy, CycleGAN đã thành công trong việc chuyển đổi dữ liệu bình thường thành dữ liệu độc hại, giúp cân bằng tập dữ liệu huấn luyện. IDS được huấn luyện trên tập dữ liệu cân bằng này cho thấy hiệu suất cao hơn so với IDS được huấn luyện trên tập dữ liệu mất cân bằng ban đầu.

3.2. Ứng dụng thực tiễn

Nghiên cứu này có thể được ứng dụng trong các hệ thống an ninh mạng thực tế, giúp cải thiện khả năng phát hiện và phòng chống các cuộc tấn công mạng. Kỹ thuật lừa dốiCycleGAN là những công cụ hữu ích trong việc tăng cường dữ liệu và thu thập thông tin về các cuộc tấn công, từ đó nâng cao hiệu quả của các hệ thống bảo mật.

21/02/2025
Khóa luận tốt nghiệp an toàn thông tin kỹ thuật lừa dối và tăng cường dữ liệu dựa trên cyclegan cho phát hiện tấn công trong mạng khả lập trình

Bạn đang xem trước tài liệu:

Khóa luận tốt nghiệp an toàn thông tin kỹ thuật lừa dối và tăng cường dữ liệu dựa trên cyclegan cho phát hiện tấn công trong mạng khả lập trình

Tài liệu "Kỹ thuật lừa dối và tăng cường dữ liệu với CycleGAN trong phát hiện tấn công mạng khả lập trình" trình bày một phương pháp sử dụng CycleGAN, một kiến trúc mạng sinh đối kháng, để tăng cường hiệu quả của các hệ thống phát hiện xâm nhập (IDS) trong môi trường mạng khả lập trình (SDN). Điểm mấu chốt là CycleGAN được dùng để tạo ra các mẫu dữ liệu tấn công giả mạo, từ đó giúp huấn luyện IDS trở nên mạnh mẽ hơn trước các cuộc tấn công thực tế. Điều này đặc biệt quan trọng khi lượng dữ liệu tấn công thực tế thường hạn chế. Kỹ thuật này giúp IDS nhận diện chính xác hơn các mẫu tấn công mới hoặc hiếm gặp, giảm thiểu số lượng báo động sai và nâng cao độ tin cậy của hệ thống.

Nếu bạn quan tâm đến việc sử dụng mạng nơ-ron để phát hiện xâm nhập, bạn có thể tham khảo thêm nghiên cứu Nghiên cứu ứng dụng mạng nơron trong bài toán phát hiện truy cập trái phép để có cái nhìn tổng quan về các ứng dụng khác của mạng nơ-ron trong lĩnh vực này.