I. Giới thiệu
Nghiên cứu tập trung vào tấn công mạng đối nghịch trong điện toán biên cho IoT, đặc biệt là phương pháp tấn công dựa trên mạng đối nghịch tạo sinh (GAN) nhằm vào học liên kết. Học liên kết (Federated Learning - FL) là một phương pháp học máy phân tán, cho phép đào tạo mô hình trên dữ liệu cục bộ mà không cần chia sẻ dữ liệu thô, đảm bảo quyền riêng tư. Tuy nhiên, các hệ thống FL vẫn dễ bị tấn công, đặc biệt là tấn công đầu độc dữ liệu và tấn công đầu độc mô hình. Nghiên cứu này đề xuất phương pháp PoisonGAN để tạo dữ liệu độc hại và đánh giá hiệu quả của nó trong hệ thống FL sử dụng thiết bị IoT như Raspberry Pi.
1.1. Mục tiêu nghiên cứu
Mục tiêu chính của nghiên cứu là phát triển một framework điện toán biên thông minh sử dụng học liên kết để giải quyết các thách thức bảo mật trong IoT. Nghiên cứu tập trung vào tấn công đầu độc trong môi trường edge computing, đặc biệt là việc sử dụng GAN để tạo dữ liệu độc hại nhằm làm suy giảm hiệu suất của mô hình toàn cục trong FL. Hai đóng góp chính là phương pháp Data_Gen để tạo dữ liệu độc hại và mô hình PoisonGAN để thực hiện tấn công đầu độc.
1.2. Phương pháp nghiên cứu
Nghiên cứu sử dụng các phương pháp phân tích - tổng hợp thông tin, mô phỏng, và thử nghiệm phần cứng thực tế. Các thử nghiệm được thực hiện trên hệ thống FL sử dụng thiết bị IoT là Raspberry Pi, với framework FLOWER để hỗ trợ quá trình học liên kết. Phương pháp tấn công đảo nhãn được áp dụng để đánh giá hiệu quả của PoisonGAN.
II. Cơ sở lý thuyết
Nghiên cứu dựa trên các khái niệm cơ bản về học liên kết, mạng đối nghịch tạo sinh (GAN), và tấn công đầu độc. Học liên kết là phương pháp học máy phân tán, cho phép đào tạo mô hình trên dữ liệu cục bộ mà không cần chia sẻ dữ liệu thô. GAN là mạng thần kinh gồm hai phần: Generator (bộ tạo dữ liệu) và Discriminator (bộ phân biệt), được sử dụng để tạo dữ liệu giả mạo. Tấn công đầu độc là phương pháp tấn công trong đó kẻ tấn công thay đổi dữ liệu hoặc mô hình để làm suy giảm hiệu suất của hệ thống.
2.1. Học tập liên kết
Học tập liên kết là phương pháp học máy phân tán, cho phép đào tạo mô hình trên dữ liệu cục bộ mà không cần chia sẻ dữ liệu thô. Quá trình học liên kết bao gồm các bước: khởi tạo mô hình toàn cục, gửi mô hình đến các thiết bị biên, đào tạo mô hình cục bộ, và gửi lại bản cập nhật mô hình cho máy chủ. Phương pháp này đảm bảo quyền riêng tư nhưng vẫn dễ bị tấn công, đặc biệt là tấn công đầu độc.
2.2. Mạng đối nghịch tạo sinh GAN
GAN là mạng thần kinh gồm hai phần: Generator (bộ tạo dữ liệu) và Discriminator (bộ phân biệt). Generator tạo dữ liệu giả mạo, trong khi Discriminator phân biệt dữ liệu thật và giả. GAN được sử dụng rộng rãi trong các nhiệm vụ tạo dữ liệu, đặc biệt là tạo hình ảnh. Trong nghiên cứu này, GAN được sử dụng để tạo dữ liệu độc hại nhằm thực hiện tấn công đầu độc trong hệ thống FL.
III. Thiết kế và triển khai
Nghiên cứu thiết kế một hệ thống FL sử dụng thiết bị IoT là Raspberry Pi và framework FLOWER để hỗ trợ quá trình học liên kết. Phương pháp tấn công đảo nhãn được áp dụng để đánh giá hiệu quả của PoisonGAN. Các bước triển khai bao gồm: thiết lập môi trường thử nghiệm, tạo dữ liệu độc hại bằng GAN, và thực hiện tấn công đầu độc trên hệ thống FL.
3.1. Thiết kế thử nghiệm
Hệ thống thử nghiệm được thiết lập với một số lượng hạn chế các Client (Raspberry Pi) tham gia vào hệ thống FL. Framework FLOWER được sử dụng để hỗ trợ quá trình học liên kết. Phương pháp tấn công đảo nhãn được áp dụng để đánh giá hiệu quả của PoisonGAN.
3.2. Thuật toán tấn công tạo dữ liệu độc hại
Phương pháp Data_Gen được sử dụng để tạo dữ liệu độc hại bằng GAN. PoisonGAN là mô hình tấn công đầu độc được đề xuất, sử dụng dữ liệu độc hại để làm suy giảm hiệu suất của mô hình toàn cục trong FL. Các thử nghiệm được thực hiện để đánh giá hiệu quả của PoisonGAN trong hệ thống FL.
IV. Kiểm tra kết quả và đánh giá
Kết quả thực nghiệm cho thấy PoisonGAN có hiệu quả trong việc làm suy giảm hiệu suất của mô hình toàn cục trong hệ thống FL. Các chỉ số đánh giá bao gồm độ chính xác của mô hình và mức độ lật nhãn. Kết quả cũng cho thấy mức tiêu thụ tài nguyên của hệ thống trong quá trình thực hiện tấn công.
4.1. Đánh giá thử nghiệm
Các thử nghiệm được thực hiện trên hệ thống FL sử dụng thiết bị IoT là Raspberry Pi. Kết quả cho thấy PoisonGAN có hiệu quả trong việc làm suy giảm hiệu suất của mô hình toàn cục. Độ chính xác của mô hình giảm đáng kể sau khi thực hiện tấn công đầu độc.
4.2. Khảo sát trên phần cứng
Kết quả khảo sát cho thấy mức tiêu thụ tài nguyên của hệ thống trong quá trình thực hiện tấn công. Raspberry Pi có khả năng xử lý các tác vụ học liên kết và tấn công đầu độc một cách hiệu quả, mặc dù tài nguyên bị hạn chế.
V. Kết luận và hướng phát triển
Nghiên cứu đã chứng minh hiệu quả của PoisonGAN trong việc thực hiện tấn công đầu độc trên hệ thống FL sử dụng thiết bị IoT. Kết quả thực nghiệm cho thấy mô hình tấn công này có thể làm suy giảm hiệu suất của mô hình toàn cục. Hướng phát triển trong tương lai bao gồm cải tiến phương pháp tấn công và mở rộng quy mô thử nghiệm.
5.1. Kết luận
Nghiên cứu đã chứng minh hiệu quả của PoisonGAN trong việc thực hiện tấn công đầu độc trên hệ thống FL sử dụng thiết bị IoT. Kết quả thực nghiệm cho thấy mô hình tấn công này có thể làm suy giảm hiệu suất của mô hình toàn cục.
5.2. Hướng phát triển
Hướng phát triển trong tương lai bao gồm cải tiến phương pháp tấn công, mở rộng quy mô thử nghiệm, và nghiên cứu các phương pháp bảo vệ hệ thống FL khỏi các cuộc tấn công đầu độc.