I. Giải pháp khai phá dữ liệu
Luận án tập trung vào việc đề xuất các giải pháp khai phá dữ liệu hiệu quả, đặc biệt trong bối cảnh dữ liệu phân tán. Các phương pháp được nghiên cứu nhằm đảm bảo tính riêng tư của dữ liệu trong quá trình khai phá. Luận án đánh giá các phương pháp hiện có và đề xuất các kỹ thuật mới để cải thiện hiệu quả và bảo mật. Các giải pháp khai phá dữ liệu được đề xuất bao gồm việc sử dụng các giao thức tính toán bảo mật nhiều thành viên (SMC) để đảm bảo rằng thông tin riêng tư không bị tiết lộ trong quá trình xử lý dữ liệu.
1.1. Phương pháp biến đổi ngẫu nhiên
Phương pháp này sử dụng các kỹ thuật biến đổi ngẫu nhiên để che giấu thông tin nhạy cảm trong dữ liệu. Bằng cách thêm nhiễu hoặc thay đổi giá trị dữ liệu, phương pháp này giúp đảm bảo tính riêng tư mà vẫn duy trì được tính hữu ích của dữ liệu cho mục đích khai phá.
1.2. Phương pháp ẩn danh dữ liệu
Phương pháp ẩn danh dữ liệu tập trung vào việc loại bỏ hoặc thay thế các thông tin nhận dạng cá nhân trong dữ liệu. Điều này giúp ngăn chặn việc tái định danh cá nhân từ dữ liệu đã được công bố, đảm bảo tính riêng tư của người dùng.
II. Dữ liệu phân tán
Luận án nghiên cứu các mô hình dữ liệu phân tán và cách thức khai phá dữ liệu trong các mô hình này. Dữ liệu phân tán có thể được phân mảnh theo chiều ngang hoặc chiều dọc, và mỗi mô hình đòi hỏi các phương pháp khai phá khác nhau. Luận án đề xuất các giải pháp khai phá dữ liệu phân tán đảm bảo tính riêng tư, đặc biệt là trong các mô hình phân mảnh dọc và ngang.
2.1. Phân mảnh dữ liệu theo chiều ngang
Trong mô hình phân mảnh ngang, dữ liệu được chia thành các phần nhỏ, mỗi phần chứa một số bản ghi với cùng bộ thuộc tính. Luận án đề xuất các giao thức khai phá dữ liệu đảm bảo tính riêng tư trong mô hình này, giúp các bên tham gia có thể hợp tác mà không tiết lộ dữ liệu riêng của mình.
2.2. Phân mảnh dữ liệu theo chiều dọc
Trong mô hình phân mảnh dọc, dữ liệu được chia theo các thuộc tính, mỗi bên sở hữu một phần dọc của dữ liệu. Luận án đề xuất các giao thức khai phá dữ liệu đảm bảo tính riêng tư trong mô hình này, đặc biệt là trong các kịch bản ba thành viên hợp tác.
III. Đảm bảo tính riêng tư
Luận án nhấn mạnh tầm quan trọng của việc đảm bảo tính riêng tư trong quá trình khai phá dữ liệu. Các giải pháp được đề xuất nhằm đảm bảo rằng thông tin nhạy cảm không bị tiết lộ trong quá trình xử lý dữ liệu. Luận án sử dụng các kỹ thuật như mã hóa đồng cấu (Homomorphic Encryption) và tính toán bảo mật nhiều thành viên (SMC) để đạt được mục tiêu này.
3.1. Mã hóa đồng cấu
Mã hóa đồng cấu cho phép thực hiện các phép tính trên dữ liệu đã được mã hóa mà không cần giải mã. Điều này giúp đảm bảo tính riêng tư của dữ liệu trong quá trình khai phá.
3.2. Tính toán bảo mật nhiều thành viên
Các giao thức SMC cho phép nhiều bên tham gia tính toán trên dữ liệu của họ mà không tiết lộ thông tin riêng tư. Luận án đề xuất các giao thức SMC mới để cải thiện hiệu quả và bảo mật trong quá trình khai phá dữ liệu phân tán.
IV. Luận án tiến sĩ
Luận án tiến sĩ này đóng góp vào lĩnh vực khai phá dữ liệu phân tán đảm bảo tính riêng tư bằng cách đề xuất các giải pháp mới và hiệu quả. Các kết quả nghiên cứu có thể được áp dụng trong các ứng dụng thực tế như khai phá dữ liệu y tế, tài chính và mạng xã hội. Luận án cũng mở ra hướng nghiên cứu mới trong việc phát triển các kỹ thuật bảo mật dữ liệu trong tương lai.
4.1. Đóng góp khoa học
Luận án đã phát triển các giao thức tính toán bảo mật nhiều thành viên mới, giúp cải thiện hiệu quả và bảo mật trong quá trình khai phá dữ liệu phân tán.
4.2. Ứng dụng thực tiễn
Các giải pháp được đề xuất trong luận án có thể được áp dụng trong các lĩnh vực như y tế, tài chính và mạng xã hội, giúp đảm bảo tính riêng tư của dữ liệu trong quá trình khai phá.