Luận Án Tiến Sĩ Kỹ Thuật: Phát Triển Mô Hình Phát Hiện Bất Thường Mạng Dựa Trên Học Sâu Và Tổng Hợp Dữ Liệu

Chuyên ngành

Hệ thống thông tin

Người đăng

Ẩn danh

Thể loại

luận án tiến sĩ

2021

146
0
0

Phí lưu trữ

30.000 VNĐ

Tóm tắt

I. Giới thiệu và tính cấp thiết của luận án

Luận án tập trung vào phát hiện bất thường mạng (Network Anomaly Detection - NAD) dựa trên học sâu (deep learning) và tổng hợp dữ liệu (data synthesis). Sự phát triển nhanh chóng của mạng máy tính và IoT đã dẫn đến sự gia tăng các cuộc tấn công mạng, đặt ra thách thức lớn cho bảo mật mạng. NAD là lĩnh vực nghiên cứu nhằm tìm ra các giải pháp hiệu quả để phân biệt giữa trạng thái bình thường và bất thường của mạng. Học máy (machine learning) và học sâu được xem là các phương pháp chính để xây dựng các thuật toán phát hiện bất thường. Các mô hình phát hiện bất thường dựa trên phân đơn lớp (One-class Classification - OCC) đã cho thấy hiệu quả cao trong việc phát hiện các bất thường mạng.

1.1. Thách thức trong phát hiện bất thường mạng

Một trong những thách thức lớn nhất trong NAD là việc thiếu dữ liệu tấn công để huấn luyện mô hình. Các tấn công mạng thường không được công bố đầy đủ do các tổ chức muốn giữ bí mật nội bộ. Hơn nữa, việc gán nhãn cho một lượng lớn dữ liệu bất thường là công việc tốn nhiều thời gian và công sức. Do đó, các phương pháp OCC được khuyến nghị sử dụng chỉ dữ liệu bình thường để huấn luyện mô hình, giúp phát hiện các tấn công mới chưa từng xuất hiện.

1.2. Vai trò của học sâu trong phát hiện bất thường

Học sâu đã mang lại nhiều thành tựu trong các lĩnh vực khác nhau, bao gồm phát hiện bất thường mạng. Các kiến trúc như AutoEncoders (AE) và Shrink AutoEncoder (SAE) được công nhận là các phương pháp tiên tiến, có khả năng giải quyết các vấn đề phức tạp trong NAD. Tuy nhiên, các phương pháp này cần được cải tiến liên tục để đáp ứng các nguy cơ an ninh mạng ngày càng tăng.

II. Phương pháp học sâu trong phát hiện bất thường mạng

Luận án đề xuất các giải pháp cải tiến dựa trên học sâu để nâng cao hiệu quả của NAD. Các phương pháp như Clustering-Shrink AutoEncoder (KSAE) và Double-shrink AutoEncoder (DSAE) được phát triển để giải quyết các hạn chế của các mô hình AE truyền thống. Các giải pháp này cho phép xây dựng các mô hình NAD hiệu quả hơn trong điều kiện dữ liệu có tính phân cụm cao và phát hiện các nhóm tấn công mà các mô hình AE truyền thống gặp khó khăn.

2.1. Giải pháp Clustering Shrink AutoEncoder KSAE

KSAE là một giải pháp kết hợp giữa phân cụm và SAE, giúp cải thiện hiệu quả phát hiện bất thường trong các tập dữ liệu có tính phân cụm cao. Phương pháp này cho phép mô hình NAD hoạt động hiệu quả hơn trong việc phân biệt các cụm dữ liệu bình thường và bất thường.

2.2. Giải pháp Double shrink AutoEncoder DSAE

DSAE là một mô hình cải tiến từ SAE, giúp phát hiện hiệu quả hơn các nhóm tấn công mà SAE truyền thống gặp khó khăn. Kết quả thử nghiệm cho thấy DSAE đạt hiệu quả cao hơn so với SAE trong việc phát hiện các nhóm tấn công như R2LU2R.

III. Tổng hợp dữ liệu trong phát hiện bất thường mạng

Luận án đề xuất mô hình OFuseAD, một mô hình khung tổng hợp dữ liệu dựa trên lý thuyết Dempster-Shafer, giúp giải quyết các thách thức trong việc kết hợp các phương pháp OCC. OFuseAD cho phép xác định ngưỡng quyết định và trọng số cho các phương pháp OCC tham gia mô hình tổng hợp mà không cần sự can thiệp của chuyên gia. Kết quả thử nghiệm trên mười tập dữ liệu phổ biến trong lĩnh vực an ninh mạng cho thấy OFuseAD hoạt động hiệu quả và ổn định hơn so với các phương pháp OCC đơn lẻ.

3.1. Cơ chế hoạt động của OFuseAD

OFuseAD sử dụng lý thuyết Dempster-Shafer để kết hợp các phương pháp OCC, giúp xác định ngưỡng quyết định và trọng số một cách tự động. Mô hình này cho phép phát hiện bất thường hiệu quả mà không cần sự can thiệp của chuyên gia, giúp giảm thiểu thời gian và chi phí triển khai.

3.2. Kết quả thử nghiệm và đánh giá

Kết quả thử nghiệm trên mười tập dữ liệu phổ biến cho thấy OFuseAD đạt hiệu quả cao hơn so với các phương pháp OCC đơn lẻ trong việc phát hiện bất thường. Mô hình này cũng cho thấy tính ổn định cao trong các điều kiện dữ liệu khác nhau, đặc biệt là trong việc phát hiện các tấn công mới.

IV. Kết luận và hướng nghiên cứu tương lai

Luận án đã đề xuất các giải pháp cải tiến dựa trên học sâutổng hợp dữ liệu để nâng cao hiệu quả của phát hiện bất thường mạng. Các mô hình như KSAE, DSAEOFuseAD đã cho thấy hiệu quả cao trong việc phát hiện các bất thường mạng, đặc biệt là các tấn công mới. Tuy nhiên, vẫn còn một số hạn chế cần được giải quyết trong tương lai, bao gồm việc cải thiện hiệu suất của các mô hình trong điều kiện dữ liệu phức tạp và mở rộng ứng dụng của các mô hình này trong các hệ thống mạng thực tế.

4.1. Hạn chế của luận án

Một số hạn chế của luận án bao gồm việc các mô hình đề xuất vẫn cần được cải thiện để hoạt động hiệu quả hơn trong các điều kiện dữ liệu phức tạp. Hơn nữa, việc triển khai các mô hình này trong các hệ thống mạng thực tế vẫn cần được nghiên cứu thêm.

4.2. Hướng nghiên cứu tương lai

Hướng nghiên cứu tương lai bao gồm việc cải thiện hiệu suất của các mô hình NAD trong điều kiện dữ liệu phức tạp, cũng như mở rộng ứng dụng của các mô hình này trong các hệ thống mạng thực tế. Ngoài ra, việc kết hợp các phương pháp học sâu với các kỹ thuật tổng hợp dữ liệu khác cũng là một hướng nghiên cứu tiềm năng.

01/03/2025
Luận án tiến sĩ kỹ thuật phát triển một số mô hình phát hiện bất thường mạng dựa trên học sâu và tổng hợp dữ liệu
Bạn đang xem trước tài liệu : Luận án tiến sĩ kỹ thuật phát triển một số mô hình phát hiện bất thường mạng dựa trên học sâu và tổng hợp dữ liệu

Để xem tài liệu hoàn chỉnh bạn click vào nút

Tải xuống

Tài liệu "Phát Triển Mô Hình Phát Hiện Bất Thường Mạng Bằng Học Sâu Và Tổng Hợp Dữ Liệu" tập trung vào việc ứng dụng học sâu và kỹ thuật tổng hợp dữ liệu để xây dựng mô hình phát hiện bất thường trong mạng. Nghiên cứu này mang lại lợi ích lớn cho các chuyên gia an ninh mạng, giúp họ nâng cao khả năng phát hiện và ngăn chặn các mối đe dọa mạng một cách hiệu quả. Bằng cách kết hợp các phương pháp tiên tiến, tài liệu cung cấp một giải pháp toàn diện để xử lý các vấn đề phức tạp trong lĩnh vực an ninh mạng.

Để mở rộng kiến thức về các phương pháp học máy và xử lý dữ liệu, bạn có thể tham khảo thêm Luận văn thạc sĩ khoa học máy tính so sánh hai phương pháp thu gọn tập huấn luyện RHC và Naive Ranking trong phân lớp dữ liệu chuỗi thời gian, hoặc Luận văn thạc sĩ khoa học máy tính cải tiến giải thuật KMeans cho bài toán gom cụm dữ liệu chuỗi thời gian. Ngoài ra, Luận văn thạc sĩ hệ thống thông tin nghiên cứu về các phương pháp học biểu diễn dữ liệu cũng là một tài liệu hữu ích để hiểu sâu hơn về cách biểu diễn và xử lý dữ liệu trong các hệ thống thông tin.