Luận văn thạc sĩ về bảo mật dữ liệu đồ thị trong cơ sở dữ liệu Neo4j

Trường đại học

Đại học Bách Khoa

Chuyên ngành

Khoa học máy tính

Người đăng

Ẩn danh

2021

44
0
0

Phí lưu trữ

30.000 VNĐ

Tóm tắt

I. Giới thiệu đề tài

Luận văn thạc sĩ này tập trung vào việc bảo mật dữ liệu trong cơ sở dữ liệu đồ thị Neo4j. Dữ liệu đồ thị ngày càng trở nên phổ biến trong các ứng dụng như mạng xã hội và phân tích dữ liệu. Tuy nhiên, việc thu thập và phân tích dữ liệu này có thể dẫn đến việc tiết lộ thông tin cá nhân. Do đó, việc đảm bảo tính riêng tư cho dữ liệu đồ thị là rất quan trọng. Luận văn đề xuất các giải pháp và thuật toán để xây dựng ứng dụng đảm bảo tính riêng tư cho dữ liệu đồ thị trong Neo4j, bao gồm việc áp dụng các thuật toán ẩn danh như k-anonymity và l-diversity.

1.1 Tổng quan về cơ sở dữ liệu đồ thị thuộc tính

Cơ sở dữ liệu đồ thị thuộc tính là hệ thống lưu trữ sử dụng cấu trúc đồ thị với các nút và cạnh để biểu diễn dữ liệu. Mô hình này cho phép lưu trữ thông tin phong phú và có thể mở rộng. Các mối quan hệ giữa các nút được thể hiện qua các cạnh, giúp tạo ra các kết nối có hướng. Việc sử dụng mô hình đồ thị thuộc tính giúp tăng cường khả năng phân tích và truy vấn dữ liệu, đồng thời hỗ trợ việc xử lý dữ liệu kết nối tốc độ cao.

1.2 Cơ sở dữ liệu đồ thị Neo4j

Neo4j là một cơ sở dữ liệu đồ thị gốc, NoSQL, mã nguồn mở, cung cấp khả năng giao dịch tuân thủ ACID. Neo4j cho phép lưu trữ dữ liệu theo mô hình đồ thị thuộc tính, giúp tối ưu hóa việc truy vấn và phân tích dữ liệu. Các tính năng nổi bật của Neo4j bao gồm ngôn ngữ truy vấn Cypher, khả năng mở rộng quy mô và hỗ trợ cho nhiều ngôn ngữ lập trình. Điều này làm cho Neo4j trở thành lựa chọn phổ biến cho các ứng dụng yêu cầu xử lý dữ liệu đồ thị.

1.3 Đặt vấn đề đảm bảo tính riêng tư cho dữ liệu đồ thị thuộc tính

Việc bảo vệ thông tin cá nhân trong dữ liệu đồ thị là một thách thức lớn. Các ứng dụng như mạng xã hội thường chứa thông tin nhạy cảm, và việc tiết lộ thông tin này có thể gây ra hậu quả nghiêm trọng. Luật pháp hiện hành, như GDPR và luật An ninh mạng Việt Nam, yêu cầu các tổ chức phải đảm bảo quyền riêng tư cho cá nhân. Do đó, việc phát triển các công cụ và phương pháp để ẩn danh dữ liệu là cần thiết để bảo vệ quyền lợi của người dùng.

II. Các phương pháp đề xuất

Luận văn đề xuất hai phương pháp chính để đảm bảo tính riêng tư cho dữ liệu đồ thị trong Neo4j. Phương pháp đầu tiên là áp dụng thuật toán k-anonymity, cho phép ẩn danh thông tin cá nhân trong dữ liệu. Phương pháp thứ hai là sử dụng thuật toán k-Degree anonymity, giúp bảo vệ các mối quan hệ giữa các cá nhân trong mạng dữ liệu đồ thị. Cả hai phương pháp này đều nhằm mục đích giảm thiểu khả năng bị tấn công và tiết lộ thông tin cá nhân.

2.1 Thuật toán Mondrian Multidimensional K Anonymity

Thuật toán Mondrian là một trong những phương pháp ẩn danh phổ biến, cho phép phân chia dữ liệu thành các nhóm sao cho mỗi nhóm có ít nhất k cá nhân không thể phân biệt. Phương pháp này giúp bảo vệ thông tin nhạy cảm bằng cách giảm thiểu khả năng nhận diện cá nhân. Việc áp dụng thuật toán này trong dữ liệu đồ thị giúp đảm bảo rằng thông tin cá nhân không bị lộ ra ngoài, đồng thời vẫn giữ được tính hữu ích của dữ liệu cho các nghiên cứu.

2.2 Thuật toán k Degree anonymity

Thuật toán k-Degree anonymity tập trung vào việc bảo vệ các mối quan hệ giữa các cá nhân trong mạng dữ liệu đồ thị. Phương pháp này đảm bảo rằng mỗi cá nhân có ít nhất k mối quan hệ không thể phân biệt với nhau. Điều này giúp ngăn chặn việc xác định danh tính của cá nhân thông qua các mối quan hệ của họ. Việc áp dụng thuật toán này trong Neo4j không chỉ bảo vệ quyền riêng tư mà còn duy trì tính chính xác của dữ liệu trong quá trình phân tích.

III. Tổng quan về ứng dụng

Ứng dụng được phát triển nhằm đảm bảo tính riêng tư cho dữ liệu đồ thị trong Neo4j. Ứng dụng này tích hợp các thuật toán ẩn danh và cung cấp giao diện người dùng thân thiện. Các chức năng chính của ứng dụng bao gồm ẩn danh hóa dữ liệu, quản lý kết nối đến cơ sở dữ liệu đồ thị và xem dữ liệu cơ sở dữ liệu. Ứng dụng không chỉ hỗ trợ các nhà nghiên cứu trong việc bảo vệ thông tin cá nhân mà còn giúp họ khai thác dữ liệu một cách hiệu quả.

3.1 Kiến trúc ứng dụng

Kiến trúc ứng dụng được thiết kế để tối ưu hóa hiệu suất và khả năng mở rộng. Ứng dụng sử dụng các công nghệ hiện đại như ReactJS cho giao diện người dùng và Node.js cho phần backend. Điều này giúp đảm bảo rằng ứng dụng có thể xử lý một lượng lớn dữ liệu đồ thị mà không gặp phải vấn đề về hiệu suất. Kiến trúc này cũng cho phép dễ dàng tích hợp các thuật toán ẩn danh vào quy trình xử lý dữ liệu.

3.2 Các công nghệ để hiện thực ứng dụng

Ứng dụng sử dụng nhiều công nghệ khác nhau để đảm bảo tính hiệu quả và khả năng mở rộng. ReactJS được sử dụng để xây dựng giao diện người dùng, trong khi Node.js đảm nhận vai trò xử lý backend. Python cũng được sử dụng để triển khai các thuật toán ẩn danh. Việc kết hợp các công nghệ này giúp ứng dụng hoạt động mượt mà và đáp ứng nhanh chóng các yêu cầu của người dùng.

IV. Kết quả kiểm thử ứng dụng

Kết quả kiểm thử cho thấy ứng dụng hoạt động hiệu quả trong việc ẩn danh dữ liệu đồ thị. Các thuật toán được áp dụng đã chứng minh khả năng bảo vệ thông tin cá nhân mà không làm giảm chất lượng dữ liệu. Kết quả kiểm thử cũng cho thấy rằng ứng dụng có thể xử lý một lượng lớn dữ liệu mà vẫn duy trì hiệu suất cao. Điều này chứng tỏ rằng ứng dụng có thể đáp ứng nhu cầu ngày càng tăng về việc bảo vệ quyền riêng tư trong phân tích dữ liệu.

4.1 Cấu hình máy tính chạy kiểm thử

Cấu hình máy tính được sử dụng để kiểm thử ứng dụng bao gồm các thông số kỹ thuật cao, đảm bảo khả năng xử lý dữ liệu lớn. Việc sử dụng phần cứng mạnh mẽ giúp ứng dụng hoạt động mượt mà và nhanh chóng trong quá trình kiểm thử. Điều này cũng cho thấy rằng ứng dụng có thể được triển khai trên các hệ thống thực tế mà không gặp phải vấn đề về hiệu suất.

4.2 Kết quả kiểm thử với thuật toán Mondrian

Kết quả kiểm thử với thuật toán Mondrian cho thấy khả năng ẩn danh dữ liệu hiệu quả. Thuật toán này đã thành công trong việc tạo ra các nhóm k-anonymity mà không làm giảm chất lượng dữ liệu. Điều này chứng tỏ rằng thuật toán có thể được áp dụng rộng rãi trong các ứng dụng thực tế mà vẫn đảm bảo tính riêng tư cho người dùng.

09/02/2025
Luận văn thạc sĩ khoa học máy tính ứng dụng đảm bảo tính riêng tư cho dữ liệu đồ thị trong cơ sở dữ liệu neo4j
Bạn đang xem trước tài liệu : Luận văn thạc sĩ khoa học máy tính ứng dụng đảm bảo tính riêng tư cho dữ liệu đồ thị trong cơ sở dữ liệu neo4j

Để xem tài liệu hoàn chỉnh bạn click vào nút

Tải xuống