Nghiên Cứu Phương Pháp Tự Động Hóa Khai Thác Xâm Nhập Hệ Thống Mạng Dựa Trên Học Tăng Cường Phân Cấp

2024

89
0
0

Phí lưu trữ

30.000 VNĐ

Mục lục chi tiết

LỜI CẢM ƠN

1. TÓM TẮT ĐỀ TÀI

2. TỔNG QUAN

2.1. Giới thiệu vấn đề

2.2. Giới thiệu những nghiên cứu liên quan

2.2.1. Công trình nghiên cứu Automating Privilege Escalation with Deep Reinforcement Learning

2.2.2. Công trình nghiên cứu Automating post-exploitation with deep reinforcement learning

2.2.3. Công trình nghiên cứu An Intelligent Penetration Testing Method Using Human Feedback

2.2.4. Công trình nghiên cứu Raiju: Reinforcement Learning-Guided Post-Exploitation for Automating Security Assessment of Network Systems

2.3. Nhận định về các nghiên cứu liên quan

2.4. Định hướng phát triển từ các nghiên cứu liên quan

2.5. Mục tiêu, đối tượng, và phạm vi nghiên cứu

2.5.1. Mục tiêu nghiên cứu

2.5.2. Đối tượng và phạm vi nghiên cứu

2.6. Cấu trúc khóa luận tốt nghiệp

3. CƠ SỞ LÝ THUYẾT

3.1. Kiểm thử xâm nhập

3.2. Hậu khai thác xâm nhập

3.3. Kiểm thử xâm nhập tự động

3.4. Deep Learning hoạt động như thế nào?

3.5. Học tăng cường (Reinforcement Learning)

3.5.1. Quy trình quyết định Markov (Markov Decision Process - MDP)

3.5.2. Tổng quan mô hình học tăng cường

3.5.3. Mô hình học tăng cường sâu

3.5.4. Các thuật toán Deep Reinforcement Learning

3.5.4.1. Value-based và Policy-based
3.5.4.2. Actor và Critic
3.5.4.3. Thuật toán Advantage Actor Critic (A2C)
3.5.4.4. Thuật toán Proximal Policy Optimization (PPO)

3.5.5. Mô hình học tăng cường sâu phân cấp

4. MÔ HÌNH HỌC TĂNG CƯỜNG SÂU PHÂN CẤP CHO QUÁ TRÌNH TỰ ĐỘNG HÓA HẬU KHAI THÁC XÂM NHẬP

4.1. Định nghĩa 2 lớp tác nhân Upper-level Agent và Lower-level Agent của tác nhân học tăng cường sâu phân cấp (HDRL Agent)

4.1.1. Upper-level Agent

4.1.2. Lower-level Agent

4.1.3. Mô hình học tăng cường sâu phân cấp trong tự động hóa hậu khai thác xâm nhập

5. KẾT QUẢ THỰC NGHIỆM, PHÂN TÍCH - ĐÁNH GIÁ

5.1. Thiết lập thí nghiệm

5.1.1. Tổng quan môi trường thí nghiệm

5.1.2. Ý tưởng cho việc tăng tốc quá trình huấn luyện

5.1.3. Chi tiết quá trình huấn luyện

5.2. Kết quả khai thác của công cụ

5.3. Tổng quan quá trình huấn luyện

5.4. Thời gian huấn luyện của hai thuật toán HA2C và HPPO

5.5. Kết quả thực nghiệm trên các môi trường đánh giá (testing)

5.6. Kết luận việc so sánh giữa hai thuật toán HA2C và HPPO từ kết quả của quá trình thực nghiệm

5.6.1. Kết quả đạt được

5.6.2. Khó khăn và thách thức

5.6.3. Hướng phát triển

TÀI LIỆU THAM KHẢO