I. Giới thiệu đề tài
Luận văn tập trung vào việc phân loại mã độc Android bằng phương pháp học cộng tác (Federated Learning), một hướng tiếp cận mới trong lĩnh vực an toàn thông tin. Đề tài nhằm giải quyết hai vấn đề chính: nâng cao độ chính xác trong phát hiện và phân loại mã độc, đồng thời đảm bảo tính riêng tư và bảo mật của dữ liệu. Phương pháp học cộng tác được áp dụng để huấn luyện mô hình mà không cần tập trung dữ liệu, giảm thiểu rủi ro rò rỉ thông tin.
1.1. Tính khoa học và tính mới
Luận văn mang tính khoa học cao khi kết hợp học sâu (Deep Learning) và học cộng tác để phân loại mã độc. Tính mới thể hiện ở việc áp dụng Federated Learning vào bài toán phân loại mã độc Android, một hướng tiếp cận chưa được nghiên cứu rộng rãi. Phương pháp này không chỉ cải thiện hiệu suất mà còn bảo vệ quyền riêng tư của dữ liệu người dùng.
1.2. Mục tiêu và phạm vi nghiên cứu
Mục tiêu chính của đề tài là thiết kế và triển khai một mô hình học sâu kết hợp học cộng tác để phân loại mã độc Android. Phạm vi nghiên cứu bao gồm các kỹ thuật nhận diện dựa trên đặc trưng của mẫu mã độc và giảm thiểu rủi ro về tính riêng tư của dữ liệu. Đối tượng áp dụng là các thiết bị di động chạy hệ điều hành Android.
II. Tổng quan vấn đề nghiên cứu
Chương này trình bày các vấn đề liên quan đến phát hiện và phân loại mã độc Android, đồng thời giới thiệu các phương pháp và kỹ thuật hiện có. Học cộng tác được đề xuất như một giải pháp tiềm năng để giải quyết các hạn chế của phương pháp truyền thống, đặc biệt là vấn đề bảo mật dữ liệu.
2.1. Các vấn đề nghiên cứu
Sự gia tăng số lượng thiết bị Android kéo theo sự phát triển của các loại mã độc. Các phương pháp truyền thống thường yêu cầu tập trung dữ liệu, dẫn đến nguy cơ rò rỉ thông tin. Học cộng tác được đề xuất để khắc phục vấn đề này, giúp bảo vệ tính riêng tư của dữ liệu trong quá trình huấn luyện mô hình.
2.2. Các nghiên cứu liên quan
Các nghiên cứu trước đây về phát hiện mã độc Android thường sử dụng phương pháp học máy (Machine Learning) và học sâu. Tuy nhiên, các phương pháp này gặp hạn chế về băng thông, độ trễ và đặc biệt là vấn đề bảo mật dữ liệu. Học cộng tác được xem là giải pháp mới, giúp giảm thiểu các hạn chế này.
III. Mô hình đề xuất
Chương này trình bày chi tiết mô hình đề xuất sử dụng học cộng tác để phân loại mã độc Android. Mô hình bao gồm hai phần chính: quá trình huấn luyện trên máy khách và tổng hợp tham số trên máy chủ. Phương pháp này giúp đảm bảo tính riêng tư của dữ liệu trong khi vẫn duy trì độ chính xác cao.
3.1. Quá trình huấn luyện
Mô hình sử dụng học sâu để trích xuất đặc trưng từ các mẫu mã độc. Quá trình huấn luyện được thực hiện trên các máy khách, đảm bảo dữ liệu không bị tập trung. Các tham số được gửi về máy chủ để tổng hợp và cập nhật, giảm thiểu nguy cơ rò rỉ thông tin.
3.2. Tổng hợp tham số
Máy chủ tổng hợp các tham số từ các máy khách và cập nhật mô hình chung. Quá trình này được lặp lại nhiều lần để cải thiện độ chính xác của mô hình. Phương pháp này giúp bảo vệ tính riêng tư của dữ liệu trong khi vẫn đảm bảo hiệu suất cao.
IV. Thực nghiệm và kết quả
Chương này trình bày các kết quả thực nghiệm của mô hình đề xuất. Các bộ dữ liệu thực nghiệm được sử dụng để đánh giá hiệu quả của mô hình. Kết quả cho thấy mô hình đạt độ chính xác cao trong việc phân loại mã độc Android, đồng thời đảm bảo tính riêng tư của dữ liệu.
4.1. Môi trường thực nghiệm
Thực nghiệm được thực hiện trên bộ dữ liệu CICMalDroid2020, một bộ dữ liệu phổ biến trong nghiên cứu mã độc Android. Môi trường thực nghiệm bao gồm các công cụ và thư viện hỗ trợ học sâu và học cộng tác.
4.2. Kết quả đánh giá
Kết quả thực nghiệm cho thấy mô hình đề xuất đạt độ chính xác cao trong việc phân loại mã độc Android. Phương pháp học cộng tác giúp bảo vệ tính riêng tư của dữ liệu trong khi vẫn duy trì hiệu suất cao. Các kịch bản thực nghiệm được thiết kế để kiểm chứng tính hiệu quả của mô hình.
V. Kết luận và hướng phát triển
Luận văn kết luận rằng mô hình đề xuất sử dụng học cộng tác là một giải pháp hiệu quả để phân loại mã độc Android, đồng thời đảm bảo tính riêng tư của dữ liệu. Các hướng phát triển trong tương lai bao gồm cải tiến mô hình và mở rộng ứng dụng sang các lĩnh vực khác.
5.1. Kết quả đạt được
Mô hình đề xuất đạt được độ chính xác cao trong việc phân loại mã độc Android. Phương pháp học cộng tác giúp bảo vệ tính riêng tư của dữ liệu, một yếu tố quan trọng trong bối cảnh hiện nay.
5.2. Hướng phát triển
Các hướng phát triển trong tương lai bao gồm cải tiến mô hình để tăng độ chính xác và mở rộng ứng dụng sang các lĩnh vực khác như phát hiện mã độc IoT hoặc bảo mật dữ liệu đám mây.