Luận án tiến sĩ về nâng cao chất lượng phân lớp trong hệ thống phát hiện xâm nhập mạng thông qua học máy và tiền xử lý dữ liệu

Trường đại học

Trường Đại Học Lạc Hồng

Chuyên ngành

Khoa Học Máy Tính

Người đăng

Ẩn danh

Thể loại

luận án tiến sĩ

2022

175
0
0

Phí lưu trữ

30.000 VNĐ

Mục lục chi tiết

LỜI CAM ĐOAN

LỜI CẢM ƠN

TÓM TẮT

ABSTRACT

1. CHƯƠNG 1: HỆ THỐNG PHÁT HIỆN XÂM NHẬP

1.1. Giới thiệu về IDS

1.2. Phân loại IDS

1.3. IDS sử dụng kỹ thuật học máy

1.4. Tính cấp thiết của đề tài luận án

1.5. Mục tiêu nghiên cứu

1.6. Đối tượng và phạm vi nghiên cứu

1.6.1. Đối tượng nghiên cứu

1.6.2. Phạm vi nghiên cứu

1.7. Phương pháp nghiên cứu

1.8. Ý nghĩa khoa học và thực tiễn

1.8.1. Ý nghĩa khoa học

1.8.2. Ý nghĩa thực tiễn

1.9. Những điểm đóng góp mới

1.10. Kết cấu của luận án

2. CÁC NGHIÊN CỨU LIÊN QUAN

2.1. Lựa chọn thuộc tính

2.2. Lấy mẫu lại tập dữ liệu

2.3. Kỹ thuật học máy

2.4. Tập dữ liệu sử dụng cho các IDS

2.5. Chỉ số đánh giá hiệu năng các IDS

2.6. Các nghiên cứu liên quan về học máy cho IDS

2.6.1. Lựa chọn thuộc tính

2.6.2. Lấy mẫu lại tập dữ liệu

2.6.3. Các mô hình học máy cho các IDS

3. GIẢI PHÁP LỰA CHỌN THUỘC TÍNH

3.1. Giải pháp lựa chọn thuộc tính đề xuất

3.1.1. Các chỉ số đo thông tin

3.1.2. Thuật toán loại bỏ thuộc tính ngược BFE

3.1.3. Thuật toán chọn thuộc tính thuận FFC

3.1.4. Thuật toán lựa chọn thuộc tính đề xuất

3.2. Kết quả thực hiện

3.2.1. Lựa chọn thuộc tính với kiểu tấn công Worms

3.2.2. Lựa chọn thuộc tính với kiểu tấn công Shellcode

3.2.3. Lựa chọn thuộc tính với kiểu tấn công Backdoor

3.2.4. Lựa chọn thuộc tính với kiểu tấn công Analysis

3.2.5. Lựa chọn thuộc tính với kiểu tấn công Recce

3.2.6. Lựa chọn thuộc tính với kiểu tấn công DoS

3.2.7. Lựa chọn thuộc tính với kiểu tấn công Fuzzers

3.2.8. Lựa chọn thuộc tính với kiểu tấn công Exploits

3.2.9. Lựa chọn thuộc tính với kiểu tấn công Generic

3.3. So sánh, nhận xét và đánh giá về giải pháp lựa chọn thuộc tính đề xuất

4. GIẢI PHÁP LẤY MẪU LẠI TẬP DỮ LIỆU

4.1. Giải pháp lấy mẫu lại tập dữ liệu đề xuất

4.1.1. Giải pháp tăng mẫu

4.1.2. Giải pháp giảm mẫu

4.2. Kết quả thực hiện

4.2.1. Tăng mẫu tập dữ liệu

4.2.2. Giảm mẫu tập dữ liệu

4.2.3. Tổng hợp kết quả và nhận xét về giải pháp lấy mẫu lại tập dữ liệu

5. KỸ THUẬT PHỐI HỢP CHO MÔ HÌNH IDS

5.1. Kỹ thuật phối hợp đề xuất

5.2. Kết quả thực hiện

5.2.1. Sử dụng kỹ thuật phối hợp với kiểu tấn công Worms

5.2.2. Sử dụng kỹ thuật phối hợp với kiểu tấn công Shellcode

5.2.3. Sử dụng kỹ thuật phối hợp với kiểu tấn công Backdoor

5.2.4. Sử dụng kỹ thuật phối hợp với kiểu tấn công Analysis

5.2.5. Sử dụng kỹ thuật phối hợp với kiểu tấn công Recce

5.2.6. Sử dụng kỹ thuật phối hợp với kiểu tấn công DoS

5.2.7. Sử dụng kỹ thuật phối hợp với kiểu tấn công Fuzzers

5.2.8. Sử dụng kỹ thuật phối hợp với kiểu tấn công Exploits

5.2.9. Sử dụng kỹ thuật phối hợp với kiểu tấn công Generic

5.3. Tổng hợp kết quả và nhận xét về kỹ thuật phối hợp

5.4. Mô hình phân lớp lai đề xuất

6. KẾT LUẬN VÀ HƯỚNG PHÁT TRIỂN

6.1. Đánh giá về các kết quả đạt được, hạn chế và hướng phát triển

6.2. Đánh giá ý nghĩa học thuật và thực tiễn của luận án

DANH MỤC CÁC KÝ HIỆU, CHỮ VIẾT TẮT

DANH MỤC CÁC BẢNG, BIỂU

DANH MỤC CÁC HÌNH VẼ, ĐỒ THỊ

Tóm tắt

I. Giới thiệu về hệ thống phát hiện xâm nhập

Hệ thống phát hiện xâm nhập (IDS) là một phần quan trọng trong việc bảo vệ an ninh mạng. IDS có khả năng giám sát và phân tích lưu lượng mạng để phát hiện các hành vi bất thường hoặc tấn công. Việc phân lớp trong IDS là một yếu tố quyết định đến hiệu quả phát hiện. Các nghiên cứu trước đây đã chỉ ra rằng việc áp dụng kỹ thuật học máy có thể nâng cao khả năng phát hiện xâm nhập. Tuy nhiên, các hệ thống này vẫn gặp phải nhiều thách thức, bao gồm độ chính xác thấp và tỷ lệ cảnh báo sai cao. Do đó, việc cải thiện chất lượng phân lớp là cần thiết để nâng cao hiệu quả của IDS.

1.1. Tính cấp thiết của đề tài luận án

Trong bối cảnh an ninh mạng ngày càng phức tạp, việc phát hiện xâm nhập trở nên cấp thiết hơn bao giờ hết. Các tấn công mạng ngày càng tinh vi, đòi hỏi các hệ thống IDS phải có khả năng phát hiện nhanh chóng và chính xác. Việc áp dụng kỹ thuật học máy trong phát hiện xâm nhập không chỉ giúp cải thiện độ chính xác mà còn giảm thiểu tỷ lệ cảnh báo sai. Nghiên cứu này nhằm mục đích nâng cao chất lượng phân lớp của các hệ thống IDS thông qua việc cải tiến các kỹ thuật tiền xử lý dữ liệu và áp dụng các thuật toán học máy tiên tiến.

II. Các nghiên cứu liên quan

Nghiên cứu về phát hiện xâm nhập đã được thực hiện rộng rãi, với nhiều phương pháp khác nhau được áp dụng. Các nghiên cứu trước đây đã chỉ ra rằng việc lựa chọn thuộc tính và lấy mẫu lại tập dữ liệu là hai yếu tố quan trọng ảnh hưởng đến hiệu quả của IDS. Việc sử dụng các thuật toán học máy như Bagging, Boosting và Stacking đã cho thấy sự cải thiện đáng kể trong chất lượng phân lớp. Tuy nhiên, vẫn còn nhiều vấn đề cần giải quyết, đặc biệt là trong việc xử lý dữ liệu không cân bằng và tối ưu hóa các tham số của thuật toán. Các nghiên cứu gần đây cũng đã chỉ ra rằng việc áp dụng các kỹ thuật tiền xử lý dữ liệu có thể giúp cải thiện đáng kể hiệu suất của IDS.

2.1. Lựa chọn thuộc tính

Lựa chọn thuộc tính là một bước quan trọng trong quá trình phát triển các mô hình học máy. Việc lựa chọn đúng các thuộc tính có thể giúp giảm thiểu độ phức tạp của mô hình và cải thiện chất lượng phân lớp. Các thuật toán như FFC và BFE đã được sử dụng để lựa chọn các thuộc tính có liên quan nhất đến mục tiêu phân lớp. Nghiên cứu này đề xuất cải tiến các thuật toán này để nâng cao hiệu quả lựa chọn thuộc tính, từ đó cải thiện khả năng phát hiện xâm nhập của IDS.

III. Giải pháp cải tiến kỹ thuật tiền xử lý dữ liệu

Kỹ thuật tiền xử lý dữ liệu đóng vai trò quan trọng trong việc nâng cao chất lượng phân lớp của các hệ thống IDS. Nghiên cứu này đề xuất hai giải pháp chính: (1) Cải tiến các thuật toán lựa chọn thuộc tính và (2) Cải thiện các kỹ thuật lấy mẫu lại tập dữ liệu. Việc áp dụng các kỹ thuật như tăng mẫu và giảm mẫu giúp cân bằng dữ liệu, từ đó nâng cao khả năng phát hiện của IDS. Kết quả thử nghiệm cho thấy rằng các giải pháp đề xuất đã cải thiện đáng kể độ chính xác của các mô hình học máy trong phát hiện xâm nhập.

3.1. Cải tiến thuật toán lựa chọn thuộc tính

Nghiên cứu đã đề xuất hai thuật toán lựa chọn thuộc tính mới dựa trên các thuật toán FFC và BFE. Các thuật toán này được thiết kế để tối ưu hóa quá trình lựa chọn thuộc tính, giúp loại bỏ các thuộc tính không liên quan và giữ lại các thuộc tính quan trọng nhất. Kết quả cho thấy rằng việc áp dụng các thuật toán này đã giúp cải thiện đáng kể chất lượng phân lớp của các mô hình học máy, từ đó nâng cao khả năng phát hiện xâm nhập của IDS.

25/01/2025
Luận án tiến sĩ kỹ thuật học máy phối hợp và tiền xử lý dữ liệu trong việc nâng cao chất lượng phân lớp của các hệ thống phát hiện xâm nhập mạng

Bạn đang xem trước tài liệu:

Luận án tiến sĩ kỹ thuật học máy phối hợp và tiền xử lý dữ liệu trong việc nâng cao chất lượng phân lớp của các hệ thống phát hiện xâm nhập mạng

Luận án tiến sĩ mang tiêu đề "Nâng cao chất lượng phân lớp trong hệ thống phát hiện xâm nhập mạng thông qua học máy và tiền xử lý dữ liệu" của tác giả Hoàng Ngọc Thanh, dưới sự hướng dẫn của PGS. Trần Văn Lăng tại Trường Đại Học Lạc Hồng, tập trung vào việc cải thiện hiệu quả của các phương pháp phân lớp trong lĩnh vực phát hiện xâm nhập mạng. Bài viết trình bày các kỹ thuật học máy và quy trình tiền xử lý dữ liệu nhằm nâng cao độ chính xác và khả năng phát hiện các mối đe dọa mạng. Độc giả sẽ tìm thấy những thông tin hữu ích về cách áp dụng học máy trong an ninh mạng, cũng như các phương pháp tối ưu hóa dữ liệu để đạt được kết quả tốt hơn.

Nếu bạn quan tâm đến các khía cạnh khác liên quan đến công nghệ thông tin và quản lý giáo dục, hãy tham khảo thêm bài viết "Các yếu tố ảnh hưởng đến quyết định chọn nơi làm việc của sinh viên công nghệ thông tin tại Đà Nẵng", nơi phân tích các yếu tố tác động đến sự lựa chọn nghề nghiệp của sinh viên trong lĩnh vực công nghệ thông tin. Bên cạnh đó, bài viết "Luận án tiến sĩ về quản lý đổi mới phương pháp dạy học ở trường trung học phổ thông" cũng sẽ cung cấp cái nhìn sâu sắc về việc áp dụng các phương pháp giảng dạy hiện đại trong giáo dục, liên quan đến việc phát triển kỹ năng cho sinh viên. Cuối cùng, bài viết "Luận văn thạc sĩ về quản lý giáo dục và ứng dụng công nghệ thông tin trong dạy học ở huyện Phong Điền, TP Cần Thơ" sẽ giúp bạn hiểu rõ hơn về việc tích hợp công nghệ thông tin trong giáo dục, một chủ đề có liên quan mật thiết đến nghiên cứu của luận án này.