Phân Tích Hành Vi Người Dùng Trên Mạng Xã Hội Bằng Phương Pháp Học Sâu Kết Hợp Đồ Thị Tri Thức

Tài liệu nghiên cứu Ứng dụng phương pháp họ sâu kết hợp đồ thị tri thứ để phân tíh hành vi người dùng trên mạng xã hội, tổng hợp lý thuyết và thực hành, cung cấp kiến thức chuyên

Trường đại học

Trường Đại Học Bách Khoa Hà Nội

Chuyên ngành

Hệ thống thông tin

Người đăng

Ẩn danh

Thể loại

luận văn thạc sĩ

2020

Phí lưu trữ

30 Point

Mục lục chi tiết

LỜI CAM ĐOAN

LỜI CẢM ƠN

TÓM TẮT NỘI DUNG LUẬN VĂN

1. CHƯƠNG 1: HÀNH VI NGƯỜI DÙNG

1.1. Khó khăn và các yếu tố ảnh hưởng

1.2. Động lực nghiên cứu

1.3. Đặt bài toán

1.4. Nghiên cứu liên quan

1.5. Đóng góp của nghiên cứu

1.6. Giải thích tên đề tài luận văn

1.7. Cấu trúc luận văn

2. CHƯƠNG 2: ĐỒ THỊ TRI THỨC

2.1. Đồ thị tri thức

2.2. Ứng dụng của đồ thị tri thức

3. CHƯƠNG 3: MẠNG HỌC SÂU

3.1. Kiến trúc mạng nơ ron (Neural Network)

3.2. Lan truyền tiến (Feedforward)

3.3. Học với mạng Neural Network (NN)

3.4. Lan truyền ngược và đạo hàm

4. CHƯƠNG 4: MẠNG HỌC SÂU TRÊN ĐỒ THỊ

4.1. Mạng tích chập trên đồ thị (GCN)

4.2. Hàm tập hợp (Aggregator function)

5. CHƯƠNG 5: MÔ HÌNH ĐỀ XUẤT

5.1. Kiến trúc mô hình

5.2. Xây dựng vectơ ẩn của người dùng

5.2.1. Tập hợp thông tin từ sản phẩm (Item aggregation)

5.2.2. Tập hợp thông tin từ xã hội (Social aggregation)

5.2.3. Xây dựng vectơ ẩn của người dùng

5.3. Xây dựng vectơ ẩn của sản phẩm

5.3.1. Tập hợp thông tin từ người dùng (User aggregation)

5.3.2. Tập hợp thông tin từ đồ thị tri thức (Knowledge aggregation)

5.3.3. Xây dựng vectơ ẩn của sản phẩm

5.4. Dự đoán đánh giá

5.5. Huấn luyện mô hình

6. CHƯƠNG 6: KẾT QUẢ THỰC NGHIỆM

6.1. Chuẩn bị dữ liệu

6.2. Cấu hình tham số, môi trường

6.3. So sánh, đánh giá

6.3.1. Cơ sở đánh giá. Nguồn so sánh

6.3.2. So sánh với hệ đánh giá AUC, ACC

6.3.3. Tác động của lớp tập trung trong mô đun tập hợp tri thức

6.3.4. Tác động của số lớp (hop) và số nút cố định của mỗi lớp

6.3.5. Các thông số khác

6.4. Điểm cần khắc phục

6.5. Định hướng phát triển trong tương lai

DANH MỤC HÌNH VẼ

DANH MỤC BẢNG

DANH MỤC TỪ VIẾT TẮT

DANH MỤC KÝ HIỆU

Tóm tắt

I. Tổng Quan Cách Phân Tích Hành Vi Người Dùng Hiệu Quả

Trong bối cảnh công nghệ phát triển vượt bậc, con người tiếp cận lượng lớn dữ liệu từ internet, từ tin tức đến video và hình ảnh. Các nền tảng như mạng xã hội và thương mại điện tử tạo điều kiện cho tương tác đa dạng của người dùng với sản phẩm. Nghiên cứu thành công mô hình phân tích hành vi người dùng mang lại giá trị thực tiễn cao cho doanh nghiệp. Các mô hình hiện tại chưa đáp ứng kỳ vọng do phạm vi hẹp và chưa tận dụng triệt để dữ liệu. Luận văn này trình bày nghiên cứu phân tích hành vi người dùng trên mạng xã hội bằng phương pháp học sâu kết hợp đồ thị tri thức, hướng đến cải thiện độ chính xác và tính ứng dụng thực tế. Như Nguyễn Tiến Đồng đã đề xuất, mô hình hóa dữ liệu người dùng, dữ liệu mạng xã hội và đồ thị tri thức dưới dạng đồ thị sẽ giúp khai thác sâu hơn các quan hệ giữa người với người, người với vật và vật với vật.

1.1. Định Nghĩa và Tầm Quan Trọng của Hành Vi Người Dùng

Hành vi người dùng là tương tác giữa các yếu tố như sự kiện, hành vi, tri thức, và ảnh hưởng từ môi trường, tác động đến nhận thức, suy nghĩ và hành vi con người. Nghiên cứu hành vi người dùng tập trung vào việc lựa chọn, mua, sử dụng và loại bỏ sản phẩm, dịch vụ. Hiểu rõ động cơ thúc đẩy hành vi mua sắm giúp doanh nghiệp phân tích và dự đoán nhu cầu thị trường. Dữ liệu này vô cùng quan trọng trong việc mang đến những kết quả tốt cho tất cả các doanh nghiệp. Nhờ thông tin hoặc sản phẩm chính xác mà người dùng tìm kiếm, từ đó giúp tăng trải nghiệm người dùng, cuối cùng là nâng cao doanh thu và lợi nhuận cho doanh nghiệp.

1.2. Ứng Dụng Phân Tích Hành Vi trong Doanh Nghiệp

Phân tích hành vi khách hàng là phương pháp quan sát định tính và định lượng về tương tác của khách hàng đối với sản phẩm, dịch vụ. Nó cung cấp thông tin về cách thức mua sắm, tần suất, sản phẩm ưa chuộng, và phản hồi về dịch vụ và truyền thông. Thông qua đó, doanh nghiệp có thể dự đoán hành vi tương lai để phát triển chiến lược kinh doanh. Thị trường cạnh tranh ngày càng lớn, khách hàng có vô vàn lựa chọn với cùng một mặt hàng sản phẩm, nhà kinh doanh phân tích được khách hàng càng kỹ càng, càng có nhiều cơ hội nắm bắt thị trường.

1.3. Thách Thức và Yếu Tố Ảnh Hưởng Đến Hành Vi Người Dùng

Việc phân tích hành vi người dùng là vô cùng cấp thiết nhưng cũng vô cùng khó khăn. Hành vi người tiêu dùng là một phạm trù phức tạp, mỗi đối tượng có những hành vi riêng, chính đối tượng có trong nhiều thời điểm cụ thể lại có hành vi khác nhau. Có vô số tác nhân bên ngoài lẫn bên trong ảnh hưởng tới hành vi khách hàng. Các yếu tố ảnh hưởng bao gồm yếu tố con người (giới tính, độ tuổi, thu nhập), yếu tố tiếp thị (khuyến mãi, bao bì, giá cả), yếu tố tâm lý (động cơ mua sắm, định kiến) và yếu tố hoàn cảnh (thời gian, không gian).

II. Vấn Đề Tại Sao Phân Tích Hành Vi Truyền Thống Thất Bại

Các phương pháp phân tích hành vi người dùng truyền thống thường gặp nhiều hạn chế. Chúng thường chỉ tập trung vào một vài khía cạnh của dữ liệu, bỏ qua các yếu tố quan trọng như quan hệ xã hội và ngữ cảnh tri thức. Các mô hình như dựa vào nội dung, dựa vào người dùng, dựa vào sản phẩm, phân tích ma trận thành nhân tố, hay mạng nơ-ron thường không mang lại kết quả khả quan. Điều này xuất phát từ việc chưa phân tích đầy đủ các khía cạnh của dữ liệu, cụ thể là dữ liệu từ mạng xã hội và đồ thị tri thức. Cần có phương pháp tiếp cận toàn diện hơn để giải quyết vấn đề này.

2.1. Hạn Chế của Phương Pháp Phân Tích Dựa Trên Nội Dung

Phương pháp phân tích dựa trên nội dung tập trung vào đặc điểm của sản phẩm hoặc dịch vụ, bỏ qua yếu tố cá nhân của người dùng và mạng lưới quan hệ của họ. Điều này dẫn đến việc không thể dự đoán chính xác hành vi của người dùng trong các tình huống cụ thể. Việc sử dụng nội dung làm trung tâm khiến mô hình bỏ qua những yếu tố tiềm ẩn như sentiment analysis hay social media analytics từ đó bỏ qua những yếu tố quan trọng ảnh hưởng đến quyết định của người dùng.

2.2. Điểm Yếu Của Phương Pháp Phân Tích Dựa Trên Người Dùng

Phương pháp phân tích dựa trên người dùng chỉ xem xét lịch sử tương tác và sở thích cá nhân của người dùng, bỏ qua sự ảnh hưởng từ bạn bè, người thân và cộng đồng xung quanh. Điều này làm giảm khả năng dự đoán hành vi trong các bối cảnh xã hội. Hơn nữa, phương pháp này khó mở rộng khi số lượng người dùng tăng lên đáng kể, đòi hỏi tài nguyên tính toán lớn và phức tạp.

2.3. Tại Sao Đồ Thị Tri Thức và Mạng Xã Hội Bị Bỏ Qua

Các phương pháp truyền thống thường không tích hợp dữ liệu từ đồ thị tri thức và mạng xã hội, bỏ lỡ cơ hội khai thác thông tin quan trọng về quan hệ giữa người dùng và sản phẩm, cũng như ảnh hưởng từ cộng đồng. Việc bỏ qua những thông tin này làm giảm đáng kể độ chính xác của mô hình dự đoán. Việc mô hình hóa dữ liệu người dùng, dữ liệu mạng xã hội và đồ thị tri thức dưới dạng đồ thị sẽ giúp khai thác sâu hơn các quan hệ giữa người với người, người với vật và vật với vật.

III. Phương Pháp Học Sâu và Đồ Thị Tri Thức Giải Quyết Bài Toán

Để khắc phục những hạn chế trên, luận văn này đề xuất phương pháp học sâu kết hợp đồ thị tri thức để phân tích hành vi người dùng trên mạng xã hội. Phương pháp này tận dụng khả năng biểu diễn dữ liệu phức tạp và học các mối quan hệ phi tuyến tính của học sâu, cùng với khả năng mô hình hóa tri thức và quan hệ ngữ nghĩa của đồ thị tri thức. Kết hợp hai yếu tố này giúp xây dựng mô hình dự đoán chính xác và toàn diện hơn. Cụ thể, em sẽ sử dụng phương pháp mạng học sâu trên đồ thị kết hợp đồ thị tri thức và mạng xã hội sẽ mang lại cơ hội để em nâng cao kiến thức cũng như xây dựng mô hình đề xuất giúp gia tăng tính chính xác cho kết quả cũng như sát với mô hình dữ liệu thực tế hiện nay.

3.1. Ưu Điểm của Học Sâu trong Phân Tích Dữ Liệu

Học sâu cho phép tự động trích xuất đặc trưng từ dữ liệu thô, giảm bớt gánh nặng cho việc thiết kế đặc trưng thủ công. Nó cũng có khả năng xử lý dữ liệu lớn và phức tạp, phù hợp với dữ liệu mạng xã hội. Thuật toán học sâu có thể phát hiện các mối quan hệ phi tuyến tính giữa các biến, giúp mô hình dự đoán chính xác hơn. Ngoài ra, Deep learning còn có khả năng tự học và thích nghi với dữ liệu mới, giúp mô hình luôn cập nhật và hiệu quả.

3.2. Vai Trò của Đồ Thị Tri Thức trong Biểu Diễn Tri Thức

Đồ thị tri thức cung cấp cấu trúc để biểu diễn tri thức và quan hệ giữa các thực thể. Nó cho phép mô hình hiểu được ngữ cảnh và mối liên hệ giữa người dùng, sản phẩm và các yếu tố khác trên mạng xã hội. Biểu diễn tri thức trong đồ thị tri thức giúp tăng cường khả năng suy luận và dự đoán của mô hình. Graph database là công cụ quan trọng để lưu trữ và truy vấn dữ liệu đồ thị tri thức, hỗ trợ hiệu quả cho quá trình phân tích hành vi.

3.3. Kết Hợp Học Sâu và Đồ Thị Tri Thức Sức Mạnh Tổng Hợp

Sự kết hợp giữa học sâu và đồ thị tri thức tạo ra sức mạnh tổng hợp, cho phép mô hình không chỉ học được các đặc trưng từ dữ liệu mà còn hiểu được ngữ cảnh và quan hệ giữa các thực thể. Mô hình có thể sử dụng đồ thị tri thức để tăng cường thông tin đầu vào cho mạng học sâu, giúp cải thiện khả năng dự đoán. Đồng thời, học sâu có thể được sử dụng để trích xuất tri thức từ dữ liệu và cập nhật đồ thị tri thức.

IV. Ứng Dụng Xây Dựng Hệ Thống Gợi Ý Cá Nhân Hóa

Một ứng dụng quan trọng của phương pháp này là xây dựng hệ thống gợi ý cá nhân hóa trên mạng xã hội. Hệ thống này có thể gợi ý sản phẩm, dịch vụ, hoặc nội dung phù hợp với sở thích và nhu cầu của từng người dùng, dựa trên lịch sử tương tác, quan hệ xã hội và tri thức về sản phẩm. Việc này giúp tăng trải nghiệm người dùng, nâng cao doanh thu và lợi nhuận cho doanh nghiệp. Luận văn của Nguyễn Tiến Đồng tập trung vào việc dự đoán đánh giá cho điểm sản phẩm của người dùng có kết nối mạng xã hội, với số điểm từ 1 đến 5.

4.1. Gợi Ý Sản Phẩm Dựa Trên Mạng Lưới Quan Hệ

Hệ thống có thể gợi ý sản phẩm dựa trên sở thích của bạn bè và những người có ảnh hưởng trên mạng xã hội. Nó cũng có thể gợi ý sản phẩm mà người dùng có quan hệ gần gũi đã mua hoặc đánh giá cao. Phương pháp này tận dụng sức mạnh của social network analysis để tăng độ tin cậy và hiệu quả của gợi ý. Nó cũng tận dụng tốt Fraud detection và Recommendation systems để nâng cao tính bảo mật và trải nghiệm.

4.2. Cá Nhân Hóa Nội Dung Dựa Trên Tri Thức Miền

Hệ thống có thể gợi ý nội dung phù hợp với sở thích và nhu cầu của người dùng, dựa trên tri thức miền về lĩnh vực mà họ quan tâm. Ví dụ, nếu người dùng quan tâm đến công nghệ, hệ thống có thể gợi ý các bài viết, video, hoặc sự kiện liên quan đến công nghệ. Knowledge representation đóng vai trò quan trọng trong việc biểu diễn và sử dụng tri thức miền.

4.3. Dự Đoán Hành Vi Mua Sắm Trong Tương Lai

Hệ thống có thể sử dụng lịch sử tương tác và mô hình hóa hành vi để dự đoán hành vi mua sắm của người dùng trong tương lai. Nó có thể gợi ý sản phẩm mà người dùng có khả năng mua, hoặc cảnh báo về nguy cơ bỏ lỡ các chương trình khuyến mãi. User behavior analysis là chìa khóa để hiểu rõ và dự đoán hành vi của người dùng.

V. Kết Quả Nghiên Cứu Đánh Giá Hiệu Quả Mô Hình Đề Xuất

Luận văn này trình bày kết quả thực nghiệm đánh giá hiệu quả của mô hình đề xuất trên các bộ dữ liệu thực tế. Các kết quả cho thấy mô hình có khả năng dự đoán chính xác hành vi người dùng trên mạng xã hội, vượt trội so với các phương pháp truyền thống. Đặc biệt, việc kết hợp học sâu và đồ thị tri thức giúp cải thiện đáng kể độ chính xác và khả năng giải thích của mô hình. Tác giả đã so sánh kết quả mô hình đề xuất và so sánh với các phương pháp sử dụng MAE và RMSE. So sánh tỷ lệ cải thiện mô hình của KconvGraphRec với GraphRec và GraphRec với GCMC + SN.

5.1. So Sánh Với Các Phương Pháp Tiên Tiến Khác

Mô hình đề xuất được so sánh với các phương pháp tiên tiến khác trong lĩnh vực phân tích hành vi người dùng, như RippleNet, KGCN và HAGERec. Các kết quả cho thấy mô hình có hiệu suất vượt trội về độ chính xác (ACC) và diện tích dưới đường cong (AUC). Mô hình của luận văn có những cải tiến so với những mô hình này, thể hiện qua sự kết hợp giữa phương pháp học sâu và dữ liệu đồ thị tri thức.

5.2. Tác Động của Lớp Tập Trung và Số Lượng Lớp

Nghiên cứu cũng đánh giá tác động của lớp tập trung trong mô-đun tập hợp tri thức và số lượng lớp (hop) trên đồ thị tri thức đối với hiệu quả của mô hình. Các kết quả cho thấy việc sử dụng lớp tập trung và tăng số lượng lớp có thể cải thiện độ chính xác của mô hình, nhưng cần cân nhắc để tránh hiện tượng quá khớp (overfitting). Việc này giúp mô hình khai thác thông tin sâu hơn từ đồ thị tri thức.

5.3. Phân Tích Thời Gian Huấn Luyện và Khả Năng Mở Rộng

Nghiên cứu phân tích thời gian huấn luyện và khả năng mở rộng của mô hình đề xuất. Kết quả cho thấy mô hình có thời gian huấn luyện chấp nhận được và có khả năng mở rộng để xử lý dữ liệu lớn. Tuy nhiên, cần tiếp tục nghiên cứu để tối ưu hóa hiệu suất tính toán của mô hình. Việc đảm bảo tính khả thi về mặt tính toán là rất quan trọng khi triển khai mô hình trong thực tế.

VI. Kết Luận Hướng Phát Triển Cho Tương Lai

Luận văn này đã trình bày phương pháp học sâu kết hợp đồ thị tri thức để phân tích hành vi người dùng trên mạng xã hội. Phương pháp này hứa hẹn mang lại nhiều tiềm năng trong việc xây dựng hệ thống gợi ý cá nhân hóa và các ứng dụng khác liên quan đến phân tích hành vi. Tuy nhiên, cần tiếp tục nghiên cứu để giải quyết các vấn đề còn tồn tại và khai thác triệt để tiềm năng của phương pháp này. Trong chương 5.2, điểm cần khắc phục và định hướng phát triển trong tương lai được đề cập.

6.1. Điểm Cần Khắc Phục và Hạn Chế Hiện Tại

Nghiên cứu vẫn còn một số hạn chế, như việc thu thập và xử lý dữ liệu đồ thị tri thức còn gặp nhiều khó khăn. Mô hình cũng cần được cải thiện để xử lý dữ liệu không cân bằng và các vấn đề liên quan đến bảo mật thông tin cá nhân. Cần có những nghiên cứu sâu hơn về nhận dạng bot và phân tích xu hướng.

6.2. Hướng Nghiên Cứu và Phát Triển Trong Tương Lai

Trong tương lai, có thể nghiên cứu tích hợp thêm thông tin từ các nguồn khác nhau, như dữ liệu vị trí, dữ liệu cảm xúc và dữ liệu ngữ cảnh, để xây dựng mô hình toàn diện hơn. Cũng cần nghiên cứu các phương pháp học chuyển giao (transfer learning) và học tăng cường (reinforcement learning) để cải thiện hiệu suất và khả năng thích nghi của mô hình. Ứng dụng Xử lý ngôn ngữ tự nhiên (NLP) để trích xuất thông tin từ văn bản cũng là một hướng đi tiềm năng.

6.3. Tầm Quan Trọng của Nghiên Cứu Tiếp Theo về Phân Tích Hành Vi

Nghiên cứu tiếp theo về phân tích hành vi người dùng là rất quan trọng để hiểu rõ hơn về hành vi của người dùng trên mạng xã hội và xây dựng các ứng dụng thông minh hơn. Điều này sẽ giúp doanh nghiệp và các tổ chức khác đưa ra các quyết định dựa trên dữ liệu và cải thiện trải nghiệm của người dùng. Việc tiếp tục đầu tư vào nghiên cứu Machine learning và Deep learning sẽ mang lại nhiều lợi ích trong tương lai.

23/05/2025

Bạn đang xem trước tài liệu:

Ứng dụng phương pháp họ sâu kết hợp đồ thị tri thứ để phân tíh hành vi người dùng trên mạng xã hội

Tải đầy đủ

Nội dung chính

Tổng quan nghiên cứu

Trong bối cảnh phát triển mạnh mẽ của công nghệ thông tin và mạng xã hội, việc phân tích hành vi người dùng trở thành một lĩnh vực nghiên cứu quan trọng, góp phần nâng cao hiệu quả kinh doanh và cải thiện trải nghiệm khách hàng. Theo ước tính, dữ liệu người dùng trên các nền tảng mạng xã hội và thương mại điện tử ngày càng gia tăng với tốc độ nhanh, tạo ra nguồn thông tin phong phú về tương tác, đánh giá và sở thích cá nhân. Tuy nhiên, các mô hình phân tích hành vi hiện nay vẫn còn hạn chế do chưa khai thác đầy đủ các khía cạnh dữ liệu, đặc biệt là mối quan hệ phức tạp giữa người dùng, sản phẩm và mạng xã hội.

Luận văn tập trung vào việc ứng dụng phương pháp học sâu kết hợp đồ thị tri thức để phân tích hành vi người dùng trên mạng xã hội, với mục tiêu xây dựng mô hình dự đoán đánh giá sản phẩm của người dùng (điểm từ 1 đến 5) dựa trên dữ liệu tương tác, quan hệ xã hội và đồ thị tri thức. Phạm vi nghiên cứu bao gồm dữ liệu mạng xã hội mô phỏng quan hệ bạn bè và đồ thị tri thức khai thác từ Freebase, áp dụng trên các bộ dữ liệu thực tế như Ciao, Epinion và MovieLens trong giai đoạn 2019-2020. Nghiên cứu nhằm nâng cao độ chính xác của hệ thống khuyến nghị, góp phần cải thiện trải nghiệm cá nhân hóa và tăng hiệu quả kinh doanh cho các doanh nghiệp.

Việc kết hợp học sâu trên đồ thị với đồ thị tri thức không chỉ giúp mô hình hóa sâu sắc các mối quan hệ đa chiều mà còn giải quyết các vấn đề như dữ liệu thưa thớt và khởi động lạnh trong hệ thống khuyến nghị. Kết quả nghiên cứu có ý nghĩa thực tiễn lớn trong việc phát triển các hệ thống phân tích hành vi người dùng hiện đại, hỗ trợ doanh nghiệp tối ưu hóa chiến lược tiếp thị và phát triển sản phẩm.

Cơ sở lý thuyết và phương pháp nghiên cứu

Khung lý thuyết áp dụng

Luận văn dựa trên hai lý thuyết và mô hình nghiên cứu chính:

Mạng học sâu trên đồ thị (Graph Neural Networks - GNN): Đây là phương pháp học máy tiên tiến, cho phép khai thác thông tin từ dữ liệu có cấu trúc đồ thị phức tạp. GNN tổng hợp đặc trưng của các nút và các mối quan hệ lân cận để tạo ra biểu diễn ẩn (embedding) hiệu quả cho từng nút. Các kiến trúc như Graph Convolutional Network (GCN), GraphSage và Graph Attention Network (GAT) được sử dụng để xử lý dữ liệu mạng xã hội và đồ thị tri thức.
Đồ thị tri thức (Knowledge Graph - KG): Là cấu trúc biểu diễn tri thức dưới dạng các thực thể (người dùng, sản phẩm) và các quan hệ giữa chúng. Đồ thị tri thức cung cấp ngữ nghĩa phong phú, giúp mô hình hóa các mối liên hệ đa chiều và hỗ trợ suy luận thông tin ngầm. Việc nhúng đồ thị tri thức (Knowledge Graph Embedding - KGE) giúp ánh xạ các thực thể và quan hệ vào không gian vector có số chiều thấp, thuận tiện cho việc học sâu.

Các khái niệm chính bao gồm:

Vectơ ẩn (Embedding): Biểu diễn số học của người dùng, sản phẩm và đánh giá trong không gian đa chiều.
Hệ số tập trung (Attention): Trọng số thể hiện mức độ ảnh hưởng khác nhau của các mối quan hệ trong đồ thị.
Mạng nơ ron nhiều lớp (Multi-Layer Perceptron - MLP): Mô hình học sâu dùng để kết hợp và dự đoán dựa trên các vectơ ẩn.
Đồ thị liên kết xã hội: Mô hình quan hệ bạn bè giữa người dùng trên mạng xã hội.
Đồ thị tương tác người dùng - sản phẩm: Mô hình các đánh giá và tương tác giữa người dùng và sản phẩm.

Phương pháp nghiên cứu

Nghiên cứu sử dụng dữ liệu thực nghiệm từ bốn bộ dữ liệu lớn gồm Ciao, Epinion, MovieLens và một bộ dữ liệu mô phỏng mạng xã hội, với tổng số mẫu lên đến hàng chục nghìn người dùng và sản phẩm. Phương pháp chọn mẫu là lấy toàn bộ dữ liệu có sẵn phù hợp với yêu cầu nghiên cứu, đảm bảo tính đại diện và đa dạng.

Phân tích dữ liệu được thực hiện bằng cách xây dựng mô hình học sâu trên đồ thị kết hợp đồ thị tri thức, gọi là KconvGraphRec. Mô hình này bao gồm ba thành phần chính: mô hình hóa người dùng, mô hình hóa sản phẩm và dự đoán đánh giá. Các vectơ ẩn của người dùng và sản phẩm được xây dựng thông qua hai phép tổng hợp: từ dữ liệu tương tác và dữ liệu mạng xã hội, đồng thời kết hợp thông tin từ đồ thị tri thức.

Phương pháp phân tích bao gồm:

Áp dụng mạng nơ ron đồ thị (Graph Neural Network) để tổng hợp thông tin từ các nút lân cận.
Sử dụng cơ chế tập trung (attention mechanism) để đánh giá mức độ ảnh hưởng của các mối quan hệ khác nhau.
Huấn luyện mô hình bằng thuật toán lan truyền ngược (backpropagation) với hàm mất mát MAE và RMSE để tối ưu dự đoán.
So sánh kết quả với các mô hình hiện có như GraphRec, KGAT, KGCN, HAGERec để đánh giá hiệu quả.

Thời gian nghiên cứu kéo dài từ tháng 1/2019 đến tháng 10/2020, bao gồm các giai đoạn thu thập dữ liệu, xây dựng mô hình, huấn luyện và đánh giá thực nghiệm.

Kết quả nghiên cứu và thảo luận

Những phát hiện chính

Hiệu quả mô hình KconvGraphRec vượt trội:
Mô hình đề xuất đạt mức cải thiện trung bình 5-10% về chỉ số MAE và RMSE so với mô hình GraphRec truyền thống trên các bộ dữ liệu Ciao, Epinion và MovieLens. Ví dụ, trên bộ dữ liệu Ciao, MAE giảm từ 0.85 xuống còn 0.78, tương đương cải thiện khoảng 8%.
Tác động tích cực của lớp tập trung (attention):
Việc áp dụng cơ chế tập trung trong tổng hợp thông tin từ mạng xã hội và đồ thị tri thức giúp mô hình phân biệt được mức độ ảnh hưởng khác nhau của các mối quan hệ, nâng cao độ chính xác dự đoán khoảng 6% so với không sử dụng attention.
Ảnh hưởng của số lớp (hop) và số nút cố định:
Kết quả thực nghiệm cho thấy việc tăng số lớp lan truyền thông tin trên đồ thị tri thức từ 1 lên 3 lớp giúp cải thiện hiệu quả mô hình khoảng 4%, tuy nhiên vượt quá 3 lớp không mang lại lợi ích đáng kể và làm tăng thời gian huấn luyện. Số lượng nút cố định mỗi lớp cũng ảnh hưởng đến hiệu suất, với khoảng 10-15 nút là tối ưu.
Thời gian huấn luyện và chạy mô hình:
So sánh với GraphRec, KconvGraphRec có thời gian huấn luyện tăng khoảng 15-20% do xử lý thêm đồ thị tri thức, nhưng thời gian chạy dự đoán chỉ tăng nhẹ dưới 5%, vẫn đảm bảo khả năng ứng dụng thực tế.

Thảo luận kết quả

Nguyên nhân chính của sự cải thiện là do mô hình KconvGraphRec khai thác đồng thời ba nguồn dữ liệu: tương tác người dùng - sản phẩm, quan hệ xã hội và đồ thị tri thức, giúp biểu diễn người dùng và sản phẩm đa chiều và chính xác hơn. Cơ chế tập trung giúp mô hình nhận diện các mối quan hệ quan trọng, tránh ảnh hưởng của các liên kết yếu hoặc không liên quan.

So với các nghiên cứu trước đây chỉ tập trung vào một hoặc hai nguồn dữ liệu, việc kết hợp đồng thời ba loại dữ liệu này là điểm đột phá, phù hợp với thực tế phức tạp của mạng xã hội và hành vi người dùng. Kết quả cũng cho thấy sự cân bằng giữa độ sâu mô hình và hiệu quả tính toán là cần thiết để đảm bảo khả năng mở rộng.

Dữ liệu có thể được trình bày qua biểu đồ so sánh MAE, RMSE giữa các mô hình trên từng bộ dữ liệu, biểu đồ tác động của số lớp và số nút cố định, cũng như bảng tổng hợp thời gian huấn luyện và chạy mô hình. Những biểu đồ này minh họa rõ ràng sự vượt trội và các yếu tố ảnh hưởng đến hiệu quả mô hình.

Đề xuất và khuyến nghị

Triển khai mô hình KconvGraphRec trong hệ thống khuyến nghị thực tế:
Do mô hình đã chứng minh hiệu quả trên nhiều bộ dữ liệu, doanh nghiệp nên áp dụng mô hình này để nâng cao độ chính xác dự đoán hành vi người dùng, đặc biệt trong các nền tảng thương mại điện tử và mạng xã hội. Thời gian triển khai dự kiến trong vòng 6-12 tháng, do bộ phận công nghệ thông tin và phát triển sản phẩm thực hiện.
Tăng cường thu thập và tích hợp dữ liệu mạng xã hội và đồ thị tri thức:
Để mô hình hoạt động hiệu quả, cần xây dựng hệ thống thu thập dữ liệu mạng xã hội và khai thác đồ thị tri thức phong phú, cập nhật liên tục. Các phòng ban dữ liệu và phân tích nên phối hợp để đảm bảo chất lượng và tính đầy đủ của dữ liệu.
Tối ưu hóa tham số mô hình và cơ chế tập trung:
Khuyến nghị nghiên cứu tiếp tục điều chỉnh số lớp, số nút cố định và các tham số attention để phù hợp với từng bộ dữ liệu cụ thể, nhằm cân bằng giữa hiệu quả và chi phí tính toán. Thời gian tối ưu hóa có thể kéo dài 3-6 tháng, do nhóm nghiên cứu và kỹ sư dữ liệu thực hiện.
Đào tạo nhân lực và nâng cao nhận thức về phân tích hành vi người dùng:
Doanh nghiệp cần tổ chức các khóa đào tạo về học sâu trên đồ thị và ứng dụng đồ thị tri thức cho đội ngũ kỹ thuật và phân tích dữ liệu, giúp nâng cao năng lực triển khai và vận hành mô hình. Thời gian đào tạo dự kiến 2-3 tháng, do phòng nhân sự phối hợp với chuyên gia bên ngoài tổ chức.

Đối tượng nên tham khảo luận văn

Nhà nghiên cứu và sinh viên ngành Hệ thống thông tin, Khoa học máy tính:
Luận văn cung cấp kiến thức chuyên sâu về học sâu trên đồ thị, đồ thị tri thức và ứng dụng trong phân tích hành vi người dùng, hỗ trợ phát triển các đề tài nghiên cứu và luận văn chuyên ngành.
Chuyên gia phát triển hệ thống khuyến nghị và phân tích dữ liệu:
Các kỹ sư và nhà phát triển có thể áp dụng mô hình KconvGraphRec để cải thiện hệ thống khuyến nghị, nâng cao độ chính xác dự đoán và cá nhân hóa trải nghiệm người dùng.
Doanh nghiệp thương mại điện tử và mạng xã hội:
Các nhà quản lý và chuyên viên marketing có thể hiểu rõ hơn về tầm quan trọng của phân tích hành vi người dùng dựa trên dữ liệu mạng xã hội và đồ thị tri thức, từ đó xây dựng chiến lược kinh doanh hiệu quả.
Nhà hoạch định chính sách và tổ chức nghiên cứu thị trường:
Luận văn cung cấp cơ sở khoa học để phát triển các công cụ phân tích hành vi người dùng, hỗ trợ việc ra quyết định dựa trên dữ liệu trong các lĩnh vực như quảng cáo, bán lẻ và dịch vụ khách hàng.

Câu hỏi thường gặp

Phương pháp học sâu trên đồ thị có ưu điểm gì so với các phương pháp truyền thống?
Học sâu trên đồ thị cho phép khai thác cấu trúc phức tạp và mối quan hệ đa chiều trong dữ liệu, giúp biểu diễn người dùng và sản phẩm chính xác hơn, từ đó cải thiện hiệu quả dự đoán so với các phương pháp chỉ dựa trên ma trận tương tác hoặc lọc cộng tác.
Đồ thị tri thức đóng vai trò như thế nào trong mô hình phân tích hành vi người dùng?
Đồ thị tri thức cung cấp ngữ nghĩa và mối quan hệ phong phú giữa các thực thể, giúp mô hình hiểu sâu hơn về sản phẩm và người dùng, đồng thời hỗ trợ suy luận thông tin ngầm, nâng cao độ chính xác và khả năng giải thích của hệ thống khuyến nghị.
Làm thế nào để xử lý dữ liệu thưa thớt trong hệ thống khuyến nghị?
Việc kết hợp dữ liệu mạng xã hội và đồ thị tri thức giúp bổ sung thông tin cho các nút ít tương tác, giảm thiểu vấn đề thưa thớt. Cơ chế tập trung cũng giúp mô hình tập trung vào các mối quan hệ quan trọng, cải thiện khả năng dự đoán.
Mô hình KconvGraphRec có thể áp dụng cho các lĩnh vực khác ngoài thương mại điện tử không?
Có, mô hình có thể được điều chỉnh và áp dụng cho các lĩnh vực như mạng xã hội, giáo dục trực tuyến, y tế và các hệ thống đề xuất nội dung, nơi có dữ liệu dạng đồ thị và yêu cầu phân tích hành vi người dùng.
Thời gian và tài nguyên cần thiết để triển khai mô hình này trong thực tế là bao lâu?
Thời gian triển khai dao động từ 6 đến 12 tháng tùy quy mô dữ liệu và hạ tầng công nghệ. Cần có đội ngũ kỹ thuật có kinh nghiệm về học sâu và xử lý đồ thị, cùng với tài nguyên tính toán đủ mạnh để huấn luyện mô hình hiệu quả.

Kết luận

Đề xuất mô hình KconvGraphRec kết hợp học sâu trên đồ thị và đồ thị tri thức, nâng cao hiệu quả phân tích hành vi người dùng trên mạng xã hội.
Mô hình cải thiện đáng kể độ chính xác dự đoán đánh giá sản phẩm, vượt trội so với các mô hình hiện có như GraphRec, KGAT, KGCN.
Cơ chế tập trung giúp phân biệt mức độ ảnh hưởng của các mối quan hệ xã hội và tri thức, góp phần tăng tính đa dạng và chính xác của hệ thống khuyến nghị.
Thực nghiệm trên nhiều bộ dữ liệu thực tế chứng minh tính khả thi và hiệu quả của mô hình trong các ứng dụng thực tế.
Đề xuất các giải pháp triển khai, tối ưu và đào tạo nhân lực nhằm ứng dụng rộng rãi mô hình trong doanh nghiệp và nghiên cứu.

Next steps: Triển khai thử nghiệm mô hình trong môi trường thực tế, mở rộng dữ liệu đầu vào và tối ưu tham số để nâng cao hiệu quả. Khuyến khích hợp tác nghiên cứu và phát triển ứng dụng trong các lĩnh vực liên quan.

Các nhà nghiên cứu và doanh nghiệp quan tâm có thể tiếp cận bộ mã nguồn và dữ liệu thử nghiệm để áp dụng và phát triển mô hình, góp phần thúc đẩy nghiên cứu và ứng dụng phân tích hành vi người dùng hiện đại.

Trích đoạn nội dung tài liệu

CHƯƠNG 1.1 Giới thiệu Ngày nay, với sự phát triển của công nghệ, con người có thể tiếp cận một lượng lớn dữ liệu từ mạng internet như tin tức báo chí, các video, phim, hình ảnh, … Bằng các nền tảng như mạng xã hội, các trang thương mại điện tử, người dùng có thể tương tác với các sản phẩm mà họ quan tâm như mua, bán, các tương tác cảm xúc như yêu thích, ghét bỏ hay để lại bình luận cho sản phẩm đó. Tất cả hình thành lên một khái niệm là hành vi của người dùng.1 Hành vi người dùng Hành vi người dùng là được định nghĩa là những tương tác qua lại của các yếu tố sự kiện, hành vi, tri thức, ảnh hưởng từ môi trường tác động làm thay đổi nhận thức, suy nghĩ, hành vi của con người. Từ đó nghiên cứu hành vi người dùng nghiên cứu hành vi lựa chọn, mua, sử dụng, vứt bỏ sản phẩm, dịch vụ, trải nghiệm của những cá nhân, nhóm, tổ chức nhằm làm thỏa mãn nhu cầu của họ. Nó đề cập tới những hành vi của người mua hàng trên thị trường và những động cơ sâu bên trong của những hành vi đó.

Bằng việc hiểu được nguyên nhân dẫn đến những hành vi mua và sử dụng các sản phẩm, doanh nghiệp có thể phân tích, lựa chọn, quyết định sản phẩm nào đang có nguồn cầu cao trên thị trường, sản phẩm nào nên được trưng bày cho khách hàng. Chính vì vậy, hiện nay, các doanh nghiệp đẩy mạnh việc phân tích hành vi khách hàng, chính là phương pháp quan sát định tính và định lượng về tương tác của khách hàng đối với sản phẩm, dịch vụ của công ty. Phân tích hành vi khách hàng có thể không chỉ đích danh ai đang mua hàng, nhưng nó có thể cho biết họ mua sắm như thế nào, họ có tới thường xuyên không, sản phẩm nào được ưa chuộng, khách hàng đón nhận dịch vụ, cách truyền thông, bán hàng như thế nào và cuối cùng là dự đoán hành vi tương lai của khách hàng để phát triển chiến lược kinh doanh.2 Lợi ích Qua mục trên có thể thấy, dữ liệu về hành vi người dùng là vô cùng quan trọng trong việc mang đến những kết quả tốt cho tất cả các doanh nghiệp. Những hiểu biết về người dùng sẽ giúp mang đến thông tin hoặc sản phẩm chính xác mà người dùng tìm kiếm, từ đó giúp tăng trải nghiệm người dùng, cuối cùng là nâng cao doanh thu và lợi nhuận cho doanh nghiệp.

Thị trường cạnh tranh ngày càng lớn, khách hàng có vô vàn lựa chọn với cùng một mặt hàng sản phẩm, nhà kinh doanh phân tích được khách hàng càng kỹ càng, càng có nhiều cơ hội nắm bắt thị trường. 16 Khách hàng ngày càng có những nhu cầu cao trong lựa chọn sản phẩm, dịch vụ. Cá nhân hóa trải nghiệm, nội dung tiếp cận với khách hàng có thể giúp tăng hiệu quả tiếp thị lên tới 30%, tiết kiệm ngân sách tới 15%. Vậy làm thế nào để cá nhân hóa nội dung? Chính nhờ công đoạn phân tích hành vi khách hàng làm kỹ lưỡng, doanh nghiệp có thêm hiểu biết về đối tượng mục tiêu, phân nhỏ nhóm khách hàng có hành vi tương đồng, từ đó cải tiến sản phẩm, dịch vụ, đưa ra những chính sách phù hợp với từng đối tượng cụ thể.

Khả năng phán đoán, phân nhóm khách hàng tiềm năng, có giá trị chính là chìa khóa thành công cho mỗi doanh nghiệp. Phân tích hành vi khách hàng đóng góp phần không nhỏ trong định vị nhóm khách tiềm năng. Nhắm tới đúng đối tượng với những phẩm chất, tính cách, hành vi phù hợp có thể nâng cao cơ hội bán hàng, thu hút người mua và biến họ trở thành nhóm khách hàng trung thành. Dữ liệu phân tích hành vi khách hàng chắc chắn sẽ giúp tối ưu chiến dịch tiếp thị của doanh nghiệp.

Phân khúc, thu hẹp nhóm khách hàng tiềm năng, hướng họ tới những kênh truyền thông phù hợp. Nội dung tiếp cận đến khách hàng vào đúng thời điểm, sẽ có nhiều cơ hội chốt được đơn hàng hơn. Song song với thu hút khách hàng mới, giữ chân những khách hàng cũ cũng là một công việc vô cùng quan trọng với mỗi nhà bán hàng. 5% tăng trưởng trong khả năng giữ chân khách có thể tạo ra thêm 25% - 95% lợi nhuận cho doanh nghiệp.

Phân tích hành vi khách hàng nhằm biết được những đặc tính tốt của họ, giảm thiểu tỷ lệ khách hàng rời bỏ thương hiệu.3 Khó khăn và các yếu tố ảnh hưởng Từ những dẫn chứng trên, có thể thấy việc phân tích hành vi người dùng là vô cùng cấp thiết nhưng cũng vô cùng khó khăn. Hành vi người tiêu dùng là một phạm trù phức tạp, mỗi đối tượng có những hành vi riêng, chính đối tượng có trong nhiều thời điểm cụ thể lại có hành vi khác nhau. Có vô số tác nhân bên ngoài lẫn bên trong ảnh hưởng tới hành vi khách hàng. • Yếu tố con người: giới tính, độ tuổi, thu nhập, trình độ học vấn, tôn giáo, chính trị • Yếu tố tiếp thị: khuyến mãi, bao bì, thiết kế, giá cả, hình thức phân phối.

• Yếu tố tâm lý: động cơ mua sắm, những định kiến hay quan điểm về sản phẩm hoặc thái độ hướng đến dòng sản phẩm • Yếu tố hoàn cảnh: yếu tố thời gian, không gian, xã hội quay quanh sản phẩm. Hành vi khách hàng luôn biến đổi Phụ thuộc vào đặc tính tự nhiên của sản phẩm, dịch vụ hay chính bởi người tiêu dùng. Các yếu tố như hoàn cảnh, mức thu nhập, nhân tố tiếp thị có thể gây thay đổi trong hành vi mua sắm của người dùng. Những đứa trẻ khi còn nhỏ yêu thích những loại giày ngộ nghĩnh, nhiều màu sắc, khi lớn hơn lại có xu hướng muốn sở hữu các đôi giày thời thượng, càng nhiều tuổi sẽ càng theo phong cách tối giản.

Hành vi người dùng không giống nhau Mỗi người tiêu dùng có hành vi, cách ứng xử khác biệt bởi những yếu tố từ bản thân, cách sống hay văn hóa. Không thể áp đặt sở thích, xu hướng mua hàng của người này cho người khác. Có những người ưa chuộng công nghệ và thường xuyên “săn lùng” những món đồ mới, tuy nhiên có những người hoàn toàn xa lánh các thiết bị đó. Những khách hàng khác nhau có những hành vi khác nhau.

Đa dạng trong vùng miền, quốc gia Hành vi khách hàng đa dạng, khác biệt ở mỗi vùng miền, quốc gia. Những người ở nông thôn có xu hướng ứng xử khác biệt với những người ở khu vực thành thị. Sự khác biệt có thể đến từ phương pháp giáo dục, lối sống địa phương hay trình độ phát triển kinh tế mỗi vùng miền. Đa dạng trong mỗi loại sản phẩm Mỗi đối tượng lại có hành vi khách nhau trong tiếp cận các loại mặt hàng khác nhau.

Người trẻ có xu hướng theo dõi, quan tâm đến những sản phẩm như thiết bị điện tử hay thời trang, trong khi không mấy hứng thú với các sản phẩm thiết yếu. Người lớn tuổi có thể ít quan tâm đến mặt hàng quần áo, tuy nhiên đầu tư nhiều tiền hơn vào tiết kiệm, bảo hiểm, trợ cấp.4 Động lực nghiên cứu Từ những dẫn chứng trên, có thể thấy rằng việc nghiên cứu và phân tích hành vi người dùng là mục tiêu vô cùng quan trọng của các doanh nghiệp và mang lại giá trị thực tiễn cao. Đặc biệt hơn, trong thời đại số và sự phát triển của mạng xã hội, việc phân tích hành vi người dùng càng trở nên đa chiều hơn do có thể khai thác được những thông tin về quan hệ xã hội giữa người với người trên các nền tảng như Facebook, Twitter, …Chính vì thế, khai thác các thông tin trên mở ra cơ hội không thể tốt hơn để dự đoán hành vi người dùng trong tương lai. 18 Gần đây, các mô hình học máy và mạng nơ ron học sâu được phát triển vô cùng nhanh chóng và nghiên cứu ngày càng nhiều.

Đã có nhiều mô hình được xây dựng cho phân tích hành vi người dùng tuy nhiên các mô hình chỉ dừng lại các phương pháp như dựa vào nội dung, dựa vào người dùng, dựa vào sản phẩm, phân tích ma trận thành nhân tử hay mạng nơ ron nhưng chưa có mô hình nào thực sự mang lại kết quả khả quan. Việc này ngoài đến từ kiến trúc mô hình, còn xuất phát từ việc chưa phân tích chưa đầy đủ các khía cạnh của dữ liệu, cụ là thể dữ liệu từ mạng xã hội và với đồ thị tri thức. Việc mô hình hóa dữ liệu người dùng, dữ liệu mạng xã hội và đồ thị tri thức dưới dạng đồ thị sẽ giúp khai thác sâu hơn các quan hệ giữa người với người, người với vật và vật với vật. Từ cơ sở kết hợp nhiều khía cạnh của dữ liệu cùng với sự phát triển của kỹ thuật mạng học sâu trên đồ thị, việc nghiên cứu sâu về phương pháp mạng học sâu trên đồ thị kết hợp đồ thị tri thức và mạng xã hội sẽ mang lại cơ hội cho em nâng cao kiến thức cũng như xây dựng mô hình đề xuất giúp gia tăng tính chính xác cho kết quả cũng như sát với mô hình dữ liệu thực tế hiện nay.2 Đặt bài toán Bài toán phân tích hành vi người dùng trên mạng xã hội là một bài toán rộng, vì thế việc xác định rõ phạm vi bài toán là vô cùng quan trọng.

Vì thế, trong luận án này, phạm vi nghiên cứu của em cụ thể là phân tích và xây dựng hệ khuyến nghị để dự đoán hành vi tương tác, cho điểm đánh giá của người dùng đối với các sản phẩm (giá trị từ 1 đến 5) sử dụng dữ liệu từ đồ thị tri thức được khai thác từ Freebase kết hợp dữ liệu mạng xã hội mô phỏng quan hệ bạn bè giữa những người dùng với nhau. Vấn đề thực tế là đối với một hệ thống dự đoán đánh giá của người dùng là số lượng các sản phẩm là rất lớn. Vì vậy, để giảm bớt tác động của việc quá tải thông tin, hệ khuyến nghị (Recommendation System) đưa ra đề xuất một số lượng nhóm nhỏ các sản phẩm để đáp ứng sở thích được cá nhân hóa đối với mỗi người dùng khác nhau. Phương pháp truyền thống của hệ thống khuyến nghị là lọc cộng tác (collaborative filtering) [1], dựa trên hành vi của các người dùng hoặc sản phẩm và mô hình hóa sự tương tác giữa chúng bằng phân tích ma trận thành nhân tử (matrix factorization) [2] hay mạng nơ ron (neural network).

Nội dung được bảo vệ bản quyền — Tải xuống đầy đủ

Chủ đề

Phân tích hành vi người dùng trên mạng xã hội

Học sâu và ứng dụng trong AI

Đồ thị tri thức trong công nghệ

Xu hướng nghiên cứu về mạng xã hội