I. Tổng quan đề tài
Khóa luận tốt nghiệp này tập trung vào việc đảm bảo quyền riêng tư và chống lại các tấn công đầu độc trong hệ thống IDS phi tập trung. Với sự phát triển mạnh mẽ của Internet và các thiết bị thông minh, việc bảo vệ dữ liệu và hệ thống mạng trở nên cấp thiết. Hệ thống IDS dựa trên học máy và học sâu đã thu hút sự quan tâm, nhưng việc truyền dữ liệu đến máy chủ trung tâm tiềm ẩn nguy cơ về quyền riêng tư và an ninh mạng. Học liên kết (Federated Learning - FL) được đề xuất như một giải pháp an toàn, không yêu cầu chia sẻ dữ liệu trực tiếp. Tuy nhiên, FL cũng đối mặt với các tấn công đầu độc, đặc biệt là trong môi trường phi tập trung. Nghiên cứu này kết hợp FL với blockchain để nâng cao tính bảo mật và độ tin cậy của hệ thống IDS.
1.1 Lý do chọn đề tài
Trong bối cảnh an ninh mạng ngày càng phức tạp, hệ thống IDS đóng vai trò quan trọng trong việc phát hiện và ngăn chặn các tấn công mạng. Tuy nhiên, các hệ thống IDS truyền thống dựa trên học máy yêu cầu lượng dữ liệu lớn, dẫn đến lo ngại về quyền riêng tư. Học liên kết xuất hiện như một giải pháp tiềm năng, nhưng vẫn tồn tại các tấn công đầu độc có thể làm giảm hiệu suất của hệ thống. Việc kết hợp FL với blockchain nhằm tạo ra một hệ thống IDS phi tập trung vừa đảm bảo quyền riêng tư, vừa chống lại các tấn công đầu độc.
1.2 Phương pháp nghiên cứu
Nghiên cứu này tập trung vào việc xây dựng mô hình hệ thống IDS dựa trên học liên kết phi tập trung (DFL). Các tấn công đầu độc được áp dụng để đánh giá tính bền vững của hệ thống. Giải pháp được đề xuất là sử dụng phân tích không gian tiềm ẩn để phát hiện các mô hình độc hại. Quá trình triển khai và đánh giá hiệu suất được thực hiện để xác định tính khả thi của phương pháp.
II. Cơ sở lý thuyết
Chương này cung cấp các kiến thức nền tảng về hệ thống IDS, học liên kết, học liên kết phi tập trung, và công nghệ blockchain. Hệ thống IDS được phân loại thành network-based và host-based, với mục tiêu phát hiện các hành vi bất thường trong hệ thống mạng. Học liên kết là phương pháp học phân tán, không yêu cầu chia sẻ dữ liệu trực tiếp, giúp bảo vệ quyền riêng tư. Học liên kết phi tập trung loại bỏ sự phụ thuộc vào máy chủ trung tâm, tăng tính bảo mật. Blockchain được sử dụng để đảm bảo tính toàn vẹn dữ liệu và chống lại các tấn công mạng.
2.1 Hệ thống phát hiện xâm nhập IDS
Hệ thống IDS là công cụ quan trọng trong an ninh mạng, giúp phát hiện các tấn công mạng bằng cách theo dõi lưu lượng mạng. Các hệ thống IDS dựa trên học máy yêu cầu lượng dữ liệu lớn để huấn luyện, nhưng việc chia sẻ dữ liệu này tiềm ẩn nguy cơ về quyền riêng tư. Học liên kết được đề xuất như một giải pháp thay thế, giúp bảo vệ dữ liệu cá nhân trong quá trình huấn luyện.
2.2 Học liên kết phi tập trung DFL
Học liên kết phi tập trung là phiên bản nâng cao của FL, loại bỏ sự phụ thuộc vào máy chủ trung tâm. Điều này giúp tăng tính bảo mật và giảm nguy cơ tấn công đầu độc. DFL kết hợp với blockchain tạo ra một hệ thống phân tán, đảm bảo tính toàn vẹn dữ liệu và chống lại các tấn công mạng.
III. Phương pháp thực hiện
Nghiên cứu này đề xuất mô hình PenTiDef, kết hợp học liên kết phi tập trung với blockchain để đảm bảo quyền riêng tư và chống lại các tấn công đầu độc. Mô hình sử dụng phân tích không gian tiềm ẩn để phát hiện các mô hình độc hại. Quá trình huấn luyện được thực hiện trên các bộ dữ liệu CIC-IDS2018 và Edge-IoTset, với các mô hình học sâu như CNN và SqueezeNet. Kết quả thực nghiệm cho thấy hiệu quả của PenTiDef trong việc phát hiện và ngăn chặn các tấn công đầu độc.
3.1 Kiến trúc tổng quát
Mô hình PenTiDef bao gồm các thành phần chính như học liên kết, blockchain, và phân tích không gian tiềm ẩn. Blockchain được sử dụng để lưu trữ và xác thực các tham số mô hình, đảm bảo tính toàn vẹn dữ liệu. Phân tích không gian tiềm ẩn giúp phát hiện các mô hình độc hại thông qua Autoencoder và PLR.
3.2 Quy trình huấn luyện
Quá trình huấn luyện được thực hiện trên các bộ dữ liệu CIC-IDS2018 và Edge-IoTset, với các mô hình học sâu như CNN và SqueezeNet. Kết quả huấn luyện được ghi lại trên blockchain để đảm bảo tính minh bạch và toàn vẹn dữ liệu. Các tấn công đầu độc được áp dụng để đánh giá tính bền vững của mô hình.
IV. Hiện thực và đánh giá
Quá trình hiện thực mô hình PenTiDef được thực hiện trên các bộ dữ liệu CIC-IDS2018 và Edge-IoTset, với các mô hình học sâu như CNN và SqueezeNet. Kết quả thực nghiệm cho thấy hiệu quả của PenTiDef trong việc phát hiện và ngăn chặn các tấn công đầu độc. Mô hình cũng được đánh giá về hiệu suất xử lý giao dịch trên blockchain, với kết quả khả quan.
4.1 Kết quả thực nghiệm
Kết quả thực nghiệm cho thấy PenTiDef đạt hiệu suất cao trong việc phát hiện các tấn công đầu độc, đặc biệt là trên dữ liệu non-IID. Mô hình cũng cho thấy khả năng vượt trội so với các phương pháp phòng thủ trước đó.
4.2 Đánh giá hiệu suất blockchain
Hiệu suất xử lý giao dịch của blockchain được đánh giá với các tốc độ gửi giao dịch khác nhau. Kết quả cho thấy blockchain có khả năng xử lý hiệu quả các giao dịch trong mô hình PenTiDef.
V. Kết luận và hướng phát triển
Nghiên cứu này đã đề xuất mô hình PenTiDef, kết hợp học liên kết phi tập trung với blockchain để đảm bảo quyền riêng tư và chống lại các tấn công đầu độc. Kết quả thực nghiệm cho thấy hiệu quả của mô hình trong việc phát hiện và ngăn chặn các tấn công mạng. Hướng phát triển trong tương lai bao gồm tối ưu hóa hiệu suất của mô hình và mở rộng ứng dụng trong các lĩnh vực khác của an ninh mạng.
5.1 Kết luận
Mô hình PenTiDef đã chứng minh hiệu quả trong việc đảm bảo quyền riêng tư và chống lại các tấn công đầu độc trong hệ thống IDS phi tập trung. Kết quả thực nghiệm cho thấy tính khả thi và hiệu suất cao của mô hình.
5.2 Hướng phát triển
Hướng phát triển trong tương lai bao gồm tối ưu hóa hiệu suất của mô hình, mở rộng ứng dụng trong các lĩnh vực khác của an ninh mạng, và nghiên cứu các phương pháp bảo vệ quyền riêng tư hiệu quả hơn.