I. Tổng Quan Về Mạng Nơ ron Đồ Thị và Học Tập LBSN
Các mạng xã hội dựa trên vị trí (LBSN) như Facebook và Instagram đã thu hút hàng triệu người dùng. Chúng cho phép người dùng chia sẻ trải nghiệm theo thời gian thực thông qua các lượt check-in. Trong LBSN, có hai nhiệm vụ quan trọng là dự đoán quan hệ bạn bè và đề xuất địa điểm (POI). Các phương pháp truyền thống thường yêu cầu kiến thức chuyên môn sâu rộng để thiết kế các đặc trưng thủ công từ dữ liệu di động của người dùng hoặc quan hệ bạn bè. Tuy nhiên, những phương pháp này thiếu tính tổng quát. Gần đây, mạng nơ-ron đồ thị (GNN) đã thu hút sự chú ý nhờ khả năng nắm bắt ngữ cảnh cấu trúc phức tạp trong đồ thị. Luận văn này đề xuất HC-LBSN, một mạng nơ-ron đồ thị dị thể cho các tác vụ LBSN. Phương pháp này chứng minh khả năng nắm bắt ngữ nghĩa sâu sắc trong dữ liệu LBSN và xử lý tính dị thể và tính không phân tách được của siêu đồ thị LBSN.
1.1. Mạng Xã Hội Dựa Trên Vị Trí LBSN Là Gì
Mạng xã hội (social network) là một nền tảng nơi người dùng có thể tương tác với nhau thông qua nhiều hình thức, chẳng hạn như tình bạn, sở thích chung và kiến thức được chia sẻ. Các dịch vụ mạng xã hội thường được xây dựng và phản ánh các mạng xã hội thực tế giữa mọi người thông qua các nền tảng trực tuyến, cung cấp các cách để người dùng chia sẻ ý tưởng, hoạt động, sự kiện và sở thích qua Internet. Bằng cách thêm vị trí vào mạng xã hội, khoảng cách giữa mạng xã hội và thực tế trở nên gần hơn, và các mạng xã hội như vậy được gọi là mạng xã hội dựa trên vị trí (LBSN). Trong LBSN, người dùng có thể chia sẻ trải nghiệm theo thời gian thực thông qua check-in, bao gồm thông tin về người dùng, thời gian, hoạt động và địa điểm quan tâm (POI).
1.2. Ứng Dụng Của LBSN Trong Nghiên Cứu và Phân Tích
Dữ liệu LBSN là một nguồn dữ liệu quan trọng để nghiên cứu tính di động của con người và phân tích mạng xã hội. Ví dụ, những người cùng tham gia một hoạt động tại cùng một địa điểm trong cùng một khoảng thời gian có khả năng gặp gỡ và kết bạn với nhau. Mặc dù dữ liệu LBSN đã được nghiên cứu rộng rãi, nhưng việc nắm bắt hiệu quả cấu trúc của đồ thị LBSN vẫn còn nhiều thách thức do tính dị thể và tính không phân tách được của các siêu cạnh. Mô hình hóa dữ liệu không gian và thông tin địa lý đóng vai trò quan trọng trong việc hiểu và khai thác thông tin từ LBSN.
II. Thách Thức Khi Học Biểu Diễn Dữ Liệu LBSN Bằng GNN
Mặc dù có nhiều nghiên cứu về LBSN, các phương pháp này vẫn gặp nhiều vấn đề vì chúng không khai thác triệt để cấu trúc của đồ thị LBSN. Các phương pháp dựa trên đặc trưng thủ công không thể nắm bắt ngữ nghĩa sâu sắc và độ gần bậc cao trong đồ thị LBSN. Các phương pháp tự động học đặc trưng xem xét cả độ gần bậc một và bậc cao, nhưng vẫn dẫn đến mất thông tin và không thể nắm bắt đầy đủ các đặc điểm phức tạp của LBSN. Việc học siêu đồ thị LBSN là một nhiệm vụ đầy thách thức do tính phức tạp của đồ thị LBSN và yêu cầu của các tác vụ hạ nguồn.
2.1. Tính Dị Thể Của Dữ Liệu Trong Mạng LBSN
Dữ liệu LBSN bao gồm nhiều đối tượng thuộc nhiều loại khác nhau, ví dụ: người dùng, địa điểm, dấu thời gian và hoạt động ngữ nghĩa. Các thuật toán nhúng cổ điển như Deepwalk, Node2Vec, GraphSAGE chỉ có thể xử lý đồ thị đồng nhất, trong khi các nút chỉ thuộc một loại. Khi các nút có các loại khác nhau, các mối quan hệ khác nhau trên đồ thị được tạo ra và do đó mỗi kết nối phải được xử lý khác nhau so với các kết nối khác. Ví dụ: trong LBSN, hai kết nối phổ biến là cạnh tình bạn và cạnh check-in. Vì số lượng check-in thường rất lớn so với số lượng tình bạn, nên ảnh hưởng của check-in đối với nhúng người dùng phải khác với mối quan hệ người dùng-người dùng.
2.2. Yêu Cầu Đa Nhiệm Vụ Trong Học Tập LBSN
Trong LBSN, có hai nhiệm vụ thiết yếu đã được nghiên cứu rộng rãi: dự đoán tình bạn và đề xuất POI. Các nhiệm vụ này phản ánh chất lượng nhúng của các phương pháp được đề xuất, do đó, một mô hình mới được đề xuất phải đánh giá trên cả hai nhiệm vụ. Hiểu được những hạn chế của các phương pháp học LBSN, cùng với những thách thức còn lại, thúc đẩy việc đề xuất một phương pháp mới có thể xử lý tính không đồng nhất và tính không phân tách được của siêu đồ thị LBSN. Phương pháp được đề xuất cũng có thể được đào tạo bằng cách học đa nhiệm một cách toàn diện.
III. Phương Pháp HC LBSN Mạng Nơ ron Đồ Thị Dị Thể
Các kỹ thuật gần đây như LBSN2Vec có thể nắm bắt cả độ gần bậc một và bậc cao. Tuy nhiên, LBSN2Vec tạo ra các chuỗi nút lấy cảm hứng từ phương pháp dựa trên random walk và do đó làm mất thông tin về cấu trúc của đồ thị. Một cải tiến của phương pháp dựa trên random walk là phương pháp dựa trên đồ thị con, nắm bắt ngữ cảnh cấu trúc giữa các nút. Động lực từ việc sử dụng ngữ cảnh cấu trúc, chúng tôi phân tích việc sử dụng mạng nơ-ron đồ thị vào LBSN. Gần đây, mạng nơ-ron đồ thị đã thu hút được sự chú ý rộng rãi do khả năng nắm bắt thành công mối quan hệ phức tạp giữa các nút và vượt trội hơn các kỹ thuật khác trong các tác vụ hạ nguồn khác nhau như phân loại nút và dự đoán liên kết.
3.1. Kiến Trúc Encoder Decoder Trong HC LBSN
Phương pháp HC-LBSN tuân theo kiến trúc encoder-decoder, trong đó encoder sử dụng một số lớp tích chập siêu đồ thị để tìm hiểu biểu diễn nút cho các loại nút khác nhau trong một không gian vectơ thống nhất. Bằng cách xếp chồng một số lớp tích chập siêu đồ thị, encoder có thể nắm bắt độ gần bậc cao giữa các nút. Trong HC-LBSN, các loại nút khác nhau nên được nhúng vào các không gian nhúng khác nhau, một không gian thống nhất không thể phản ánh sự tương đồng giữa các nút. Tuy nhiên, trong phương pháp được đề xuất, chúng tôi không so sánh trực tiếp sự tương đồng của các nút trong không gian mã hóa này cho các tác vụ hạ nguồn, mà sử dụng hai bộ giải mã nhằm mục đích cho hai nhiệm vụ thiết yếu, dự đoán tình bạn và đề xuất POI.
3.2. Dự Đoán Siêu Cạnh và Học Đa Nhiệm
Trong HC-LBSN, tình bạn và check-in được biểu diễn bằng các siêu cạnh tình bạn và siêu cạnh check-in, tương ứng, dự đoán siêu cạnh bị thiếu tương đương với dự đoán tình bạn và check-in. Cụ thể, bộ giải mã của chúng tôi trước tiên tạo ra các nhúng siêu cạnh và chuyển chúng đến một hàm phi tuyến tính để đo điểm cho sự tồn tại của một siêu cạnh. Phương pháp được đề xuất của chúng tôi được đào tạo bằng cách sử dụng học đa nhiệm một cách toàn diện. Do đó, nhúng nút được tạo có thể được sử dụng cho các tác vụ hạ nguồn hơn nữa, để dự đoán các mối quan hệ xã hội mới hình thành và đề xuất POI cho người dùng.
IV. Ứng Dụng Thực Tiễn và Kết Quả Nghiên Cứu HC LBSN
Các thí nghiệm mở rộng được thực hiện để hiển thị chất lượng của các nhúng được tạo. Chúng tôi so sánh phương pháp HC-LBSN với các phương pháp cơ sở khác cho cả dự đoán tình bạn và đề xuất POI. Sau đó, chúng tôi phân tích ảnh hưởng của từng thành phần mô hình, một số ứng cử viên thành phần, rất khó thiết lập, được đánh giá trong phần tiếp theo, độ nhạy siêu tham số. Để cân bằng ảnh hưởng của từng loại siêu cạnh vào biểu diễn nút cuối cùng, chúng tôi thêm trọng số vào siêu cạnh, điều chỉnh nó ảnh hưởng đến chất lượng nhúng để chú ý hơn đến mối quan hệ xã hội hoặc tính di động của con người.
4.1. So Sánh HC LBSN Với Các Phương Pháp Cơ Sở
Phương pháp HC-LBSN vượt trội hơn các phương pháp cơ sở trong cả hai nhiệm vụ: dự đoán tình bạn và đề xuất POI. Điều này chứng tỏ rằng HC-LBSN có thể nắm bắt ngữ nghĩa sâu sắc trong dữ liệu LBSN và xử lý tính dị thể và tính không phân tách được của siêu đồ thị LBSN. Các kết quả này cho thấy tiềm năng của HC-LBSN trong việc cải thiện hiệu suất của các ứng dụng LBSN.
4.2. Phân Tích Độ Nhạy Siêu Tham Số
Phân tích độ nhạy siêu tham số cho thấy rằng công việc trong tương lai nên khắc phục các tham số cân bằng để tự động điều chỉnh một tham số thích hợp cho các tập dữ liệu khác nhau, đồng thời áp dụng cơ chế chú ý đồ thị. Việc điều chỉnh các siêu tham số một cách cẩn thận có thể cải thiện đáng kể hiệu suất của HC-LBSN.
V. Kết Luận và Hướng Phát Triển Mạng Nơ ron Đồ Thị LBSN
Luận văn này đã giới thiệu một phương pháp mới áp dụng tích chập siêu đồ thị cho tác vụ LBSN, do đó giải quyết tính không phân tách được của đồ thị LBSN và nắm bắt các cấu trúc bậc cao của mối quan hệ người dùng-check-in. Mô hình tuân theo kiến trúc encoder-decoder, xử lý tính không đồng nhất của nhúng nút và cho phép học đa nhiệm để dự đoán cả tình bạn và check-in trong tương lai. Phương pháp của chúng tôi vượt trội hơn các phương pháp cơ sở trong hai nhiệm vụ: dự đoán tình bạn và đề xuất POI.
5.1. Tóm Tắt Đóng Góp Của Nghiên Cứu
Nghiên cứu này đóng góp một phương pháp mới áp dụng tích chập siêu đồ thị cho tác vụ LBSN, do đó giải quyết tính không phân tách được của đồ thị LBSN và nắm bắt các cấu trúc bậc cao của mối quan hệ người dùng-check-in. Mô hình tuân theo kiến trúc encoder-decoder, xử lý tính không đồng nhất của nhúng nút và cho phép học đa nhiệm để dự đoán cả tình bạn và check-in trong tương lai.
5.2. Hướng Nghiên Cứu Tương Lai Cho GNN Trong LBSN
Công việc trong tương lai nên tập trung vào việc khắc phục các tham số cân bằng để tự động điều chỉnh một tham số thích hợp cho các tập dữ liệu khác nhau, đồng thời áp dụng cơ chế chú ý đồ thị. Ngoài ra, việc khám phá các kiến trúc GNN khác và các phương pháp học tập có thể cải thiện hơn nữa hiệu suất của các mô hình LBSN.