Phân Tích Hành Vi Người Dùng Trên Mạng Xã Hội Bằng Phương Pháp Học Sâu Kết Hợp Đồ Thị Tri Thức

Chuyên ngành

Hệ thống thông tin

Người đăng

Ẩn danh

2020

73
0
0

Phí lưu trữ

30.000 VNĐ

Mục lục chi tiết

LỜI CAM ĐOAN

LỜI CẢM ƠN

TÓM TẮT NỘI DUNG LUẬN VĂN

1. CHƯƠNG 1: HÀNH VI NGƯỜI DÙNG

1.1. Khó khăn và các yếu tố ảnh hưởng

1.2. Động lực nghiên cứu

1.3. Đặt bài toán

1.4. Nghiên cứu liên quan

1.5. Đóng góp của nghiên cứu

1.6. Giải thích tên đề tài luận văn

1.7. Cấu trúc luận văn

2. CHƯƠNG 2: ĐỒ THỊ TRI THỨC

2.1. Đồ thị tri thức

2.2. Ứng dụng của đồ thị tri thức

3. CHƯƠNG 3: MẠNG HỌC SÂU

3.1. Kiến trúc mạng nơ ron (Neural Network)

3.2. Lan truyền tiến (Feedforward)

3.3. Học với mạng Neural Network (NN)

3.4. Lan truyền ngược và đạo hàm

4. CHƯƠNG 4: MẠNG HỌC SÂU TRÊN ĐỒ THỊ

4.1. Mạng tích chập trên đồ thị (GCN)

4.2. Hàm tập hợp (Aggregator function)

5. CHƯƠNG 5: MÔ HÌNH ĐỀ XUẤT

5.1. Kiến trúc mô hình

5.2. Xây dựng vectơ ẩn của người dùng

5.2.1. Tập hợp thông tin từ sản phẩm (Item aggregation)

5.2.2. Tập hợp thông tin từ xã hội (Social aggregation)

5.2.3. Xây dựng vectơ ẩn của người dùng

5.3. Xây dựng vectơ ẩn của sản phẩm

5.3.1. Tập hợp thông tin từ người dùng (User aggregation)

5.3.2. Tập hợp thông tin từ đồ thị tri thức (Knowledge aggregation)

5.3.3. Xây dựng vectơ ẩn của sản phẩm

5.4. Dự đoán đánh giá

5.5. Huấn luyện mô hình

6. CHƯƠNG 6: KẾT QUẢ THỰC NGHIỆM

6.1. Chuẩn bị dữ liệu

6.2. Cấu hình tham số, môi trường

6.3. So sánh, đánh giá

6.3.1. Cơ sở đánh giá. Nguồn so sánh

6.3.2. So sánh với hệ đánh giá AUC, ACC

6.3.3. Tác động của lớp tập trung trong mô đun tập hợp tri thức

6.3.4. Tác động của số lớp (hop) và số nút cố định của mỗi lớp

6.3.5. Các thông số khác

6.4. Điểm cần khắc phục

6.5. Định hướng phát triển trong tương lai

DANH MỤC HÌNH VẼ

DANH MỤC BẢNG

DANH MỤC TỪ VIẾT TẮT

DANH MỤC KÝ HIỆU

Tóm tắt

I. Tổng Quan Cách Phân Tích Hành Vi Người Dùng Hiệu Quả

Trong bối cảnh công nghệ phát triển vượt bậc, con người tiếp cận lượng lớn dữ liệu từ internet, từ tin tức đến video và hình ảnh. Các nền tảng như mạng xã hội và thương mại điện tử tạo điều kiện cho tương tác đa dạng của người dùng với sản phẩm. Nghiên cứu thành công mô hình phân tích hành vi người dùng mang lại giá trị thực tiễn cao cho doanh nghiệp. Các mô hình hiện tại chưa đáp ứng kỳ vọng do phạm vi hẹp và chưa tận dụng triệt để dữ liệu. Luận văn này trình bày nghiên cứu phân tích hành vi người dùng trên mạng xã hội bằng phương pháp học sâu kết hợp đồ thị tri thức, hướng đến cải thiện độ chính xác và tính ứng dụng thực tế. Như Nguyễn Tiến Đồng đã đề xuất, mô hình hóa dữ liệu người dùng, dữ liệu mạng xã hội và đồ thị tri thức dưới dạng đồ thị sẽ giúp khai thác sâu hơn các quan hệ giữa người với người, người với vật và vật với vật.

1.1. Định Nghĩa và Tầm Quan Trọng của Hành Vi Người Dùng

Hành vi người dùng là tương tác giữa các yếu tố như sự kiện, hành vi, tri thức, và ảnh hưởng từ môi trường, tác động đến nhận thức, suy nghĩ và hành vi con người. Nghiên cứu hành vi người dùng tập trung vào việc lựa chọn, mua, sử dụng và loại bỏ sản phẩm, dịch vụ. Hiểu rõ động cơ thúc đẩy hành vi mua sắm giúp doanh nghiệp phân tích và dự đoán nhu cầu thị trường. Dữ liệu này vô cùng quan trọng trong việc mang đến những kết quả tốt cho tất cả các doanh nghiệp. Nhờ thông tin hoặc sản phẩm chính xác mà người dùng tìm kiếm, từ đó giúp tăng trải nghiệm người dùng, cuối cùng là nâng cao doanh thu và lợi nhuận cho doanh nghiệp.

1.2. Ứng Dụng Phân Tích Hành Vi trong Doanh Nghiệp

Phân tích hành vi khách hàng là phương pháp quan sát định tính và định lượng về tương tác của khách hàng đối với sản phẩm, dịch vụ. Nó cung cấp thông tin về cách thức mua sắm, tần suất, sản phẩm ưa chuộng, và phản hồi về dịch vụ và truyền thông. Thông qua đó, doanh nghiệp có thể dự đoán hành vi tương lai để phát triển chiến lược kinh doanh. Thị trường cạnh tranh ngày càng lớn, khách hàng có vô vàn lựa chọn với cùng một mặt hàng sản phẩm, nhà kinh doanh phân tích được khách hàng càng kỹ càng, càng có nhiều cơ hội nắm bắt thị trường.

1.3. Thách Thức và Yếu Tố Ảnh Hưởng Đến Hành Vi Người Dùng

Việc phân tích hành vi người dùng là vô cùng cấp thiết nhưng cũng vô cùng khó khăn. Hành vi người tiêu dùng là một phạm trù phức tạp, mỗi đối tượng có những hành vi riêng, chính đối tượng có trong nhiều thời điểm cụ thể lại có hành vi khác nhau. Có vô số tác nhân bên ngoài lẫn bên trong ảnh hưởng tới hành vi khách hàng. Các yếu tố ảnh hưởng bao gồm yếu tố con người (giới tính, độ tuổi, thu nhập), yếu tố tiếp thị (khuyến mãi, bao bì, giá cả), yếu tố tâm lý (động cơ mua sắm, định kiến) và yếu tố hoàn cảnh (thời gian, không gian).

II. Vấn Đề Tại Sao Phân Tích Hành Vi Truyền Thống Thất Bại

Các phương pháp phân tích hành vi người dùng truyền thống thường gặp nhiều hạn chế. Chúng thường chỉ tập trung vào một vài khía cạnh của dữ liệu, bỏ qua các yếu tố quan trọng như quan hệ xã hội và ngữ cảnh tri thức. Các mô hình như dựa vào nội dung, dựa vào người dùng, dựa vào sản phẩm, phân tích ma trận thành nhân tố, hay mạng nơ-ron thường không mang lại kết quả khả quan. Điều này xuất phát từ việc chưa phân tích đầy đủ các khía cạnh của dữ liệu, cụ thể là dữ liệu từ mạng xã hộiđồ thị tri thức. Cần có phương pháp tiếp cận toàn diện hơn để giải quyết vấn đề này.

2.1. Hạn Chế của Phương Pháp Phân Tích Dựa Trên Nội Dung

Phương pháp phân tích dựa trên nội dung tập trung vào đặc điểm của sản phẩm hoặc dịch vụ, bỏ qua yếu tố cá nhân của người dùng và mạng lưới quan hệ của họ. Điều này dẫn đến việc không thể dự đoán chính xác hành vi của người dùng trong các tình huống cụ thể. Việc sử dụng nội dung làm trung tâm khiến mô hình bỏ qua những yếu tố tiềm ẩn như sentiment analysis hay social media analytics từ đó bỏ qua những yếu tố quan trọng ảnh hưởng đến quyết định của người dùng.

2.2. Điểm Yếu Của Phương Pháp Phân Tích Dựa Trên Người Dùng

Phương pháp phân tích dựa trên người dùng chỉ xem xét lịch sử tương tác và sở thích cá nhân của người dùng, bỏ qua sự ảnh hưởng từ bạn bè, người thân và cộng đồng xung quanh. Điều này làm giảm khả năng dự đoán hành vi trong các bối cảnh xã hội. Hơn nữa, phương pháp này khó mở rộng khi số lượng người dùng tăng lên đáng kể, đòi hỏi tài nguyên tính toán lớn và phức tạp.

2.3. Tại Sao Đồ Thị Tri Thức và Mạng Xã Hội Bị Bỏ Qua

Các phương pháp truyền thống thường không tích hợp dữ liệu từ đồ thị tri thứcmạng xã hội, bỏ lỡ cơ hội khai thác thông tin quan trọng về quan hệ giữa người dùng và sản phẩm, cũng như ảnh hưởng từ cộng đồng. Việc bỏ qua những thông tin này làm giảm đáng kể độ chính xác của mô hình dự đoán. Việc mô hình hóa dữ liệu người dùng, dữ liệu mạng xã hội và đồ thị tri thức dưới dạng đồ thị sẽ giúp khai thác sâu hơn các quan hệ giữa người với người, người với vật và vật với vật.

III. Phương Pháp Học Sâu và Đồ Thị Tri Thức Giải Quyết Bài Toán

Để khắc phục những hạn chế trên, luận văn này đề xuất phương pháp học sâu kết hợp đồ thị tri thức để phân tích hành vi người dùng trên mạng xã hội. Phương pháp này tận dụng khả năng biểu diễn dữ liệu phức tạp và học các mối quan hệ phi tuyến tính của học sâu, cùng với khả năng mô hình hóa tri thức và quan hệ ngữ nghĩa của đồ thị tri thức. Kết hợp hai yếu tố này giúp xây dựng mô hình dự đoán chính xác và toàn diện hơn. Cụ thể, em sẽ sử dụng phương pháp mạng học sâu trên đồ thị kết hợp đồ thị tri thứcmạng xã hội sẽ mang lại cơ hội để em nâng cao kiến thức cũng như xây dựng mô hình đề xuất giúp gia tăng tính chính xác cho kết quả cũng như sát với mô hình dữ liệu thực tế hiện nay.

3.1. Ưu Điểm của Học Sâu trong Phân Tích Dữ Liệu

Học sâu cho phép tự động trích xuất đặc trưng từ dữ liệu thô, giảm bớt gánh nặng cho việc thiết kế đặc trưng thủ công. Nó cũng có khả năng xử lý dữ liệu lớn và phức tạp, phù hợp với dữ liệu mạng xã hội. Thuật toán học sâu có thể phát hiện các mối quan hệ phi tuyến tính giữa các biến, giúp mô hình dự đoán chính xác hơn. Ngoài ra, Deep learning còn có khả năng tự học và thích nghi với dữ liệu mới, giúp mô hình luôn cập nhật và hiệu quả.

3.2. Vai Trò của Đồ Thị Tri Thức trong Biểu Diễn Tri Thức

Đồ thị tri thức cung cấp cấu trúc để biểu diễn tri thức và quan hệ giữa các thực thể. Nó cho phép mô hình hiểu được ngữ cảnh và mối liên hệ giữa người dùng, sản phẩm và các yếu tố khác trên mạng xã hội. Biểu diễn tri thức trong đồ thị tri thức giúp tăng cường khả năng suy luận và dự đoán của mô hình. Graph database là công cụ quan trọng để lưu trữ và truy vấn dữ liệu đồ thị tri thức, hỗ trợ hiệu quả cho quá trình phân tích hành vi.

3.3. Kết Hợp Học Sâu và Đồ Thị Tri Thức Sức Mạnh Tổng Hợp

Sự kết hợp giữa học sâuđồ thị tri thức tạo ra sức mạnh tổng hợp, cho phép mô hình không chỉ học được các đặc trưng từ dữ liệu mà còn hiểu được ngữ cảnh và quan hệ giữa các thực thể. Mô hình có thể sử dụng đồ thị tri thức để tăng cường thông tin đầu vào cho mạng học sâu, giúp cải thiện khả năng dự đoán. Đồng thời, học sâu có thể được sử dụng để trích xuất tri thức từ dữ liệu và cập nhật đồ thị tri thức.

IV. Ứng Dụng Xây Dựng Hệ Thống Gợi Ý Cá Nhân Hóa

Một ứng dụng quan trọng của phương pháp này là xây dựng hệ thống gợi ý cá nhân hóa trên mạng xã hội. Hệ thống này có thể gợi ý sản phẩm, dịch vụ, hoặc nội dung phù hợp với sở thích và nhu cầu của từng người dùng, dựa trên lịch sử tương tác, quan hệ xã hội và tri thức về sản phẩm. Việc này giúp tăng trải nghiệm người dùng, nâng cao doanh thu và lợi nhuận cho doanh nghiệp. Luận văn của Nguyễn Tiến Đồng tập trung vào việc dự đoán đánh giá cho điểm sản phẩm của người dùng có kết nối mạng xã hội, với số điểm từ 1 đến 5.

4.1. Gợi Ý Sản Phẩm Dựa Trên Mạng Lưới Quan Hệ

Hệ thống có thể gợi ý sản phẩm dựa trên sở thích của bạn bè và những người có ảnh hưởng trên mạng xã hội. Nó cũng có thể gợi ý sản phẩm mà người dùng có quan hệ gần gũi đã mua hoặc đánh giá cao. Phương pháp này tận dụng sức mạnh của social network analysis để tăng độ tin cậy và hiệu quả của gợi ý. Nó cũng tận dụng tốt Fraud detectionRecommendation systems để nâng cao tính bảo mật và trải nghiệm.

4.2. Cá Nhân Hóa Nội Dung Dựa Trên Tri Thức Miền

Hệ thống có thể gợi ý nội dung phù hợp với sở thích và nhu cầu của người dùng, dựa trên tri thức miền về lĩnh vực mà họ quan tâm. Ví dụ, nếu người dùng quan tâm đến công nghệ, hệ thống có thể gợi ý các bài viết, video, hoặc sự kiện liên quan đến công nghệ. Knowledge representation đóng vai trò quan trọng trong việc biểu diễn và sử dụng tri thức miền.

4.3. Dự Đoán Hành Vi Mua Sắm Trong Tương Lai

Hệ thống có thể sử dụng lịch sử tương tác và mô hình hóa hành vi để dự đoán hành vi mua sắm của người dùng trong tương lai. Nó có thể gợi ý sản phẩm mà người dùng có khả năng mua, hoặc cảnh báo về nguy cơ bỏ lỡ các chương trình khuyến mãi. User behavior analysis là chìa khóa để hiểu rõ và dự đoán hành vi của người dùng.

V. Kết Quả Nghiên Cứu Đánh Giá Hiệu Quả Mô Hình Đề Xuất

Luận văn này trình bày kết quả thực nghiệm đánh giá hiệu quả của mô hình đề xuất trên các bộ dữ liệu thực tế. Các kết quả cho thấy mô hình có khả năng dự đoán chính xác hành vi người dùng trên mạng xã hội, vượt trội so với các phương pháp truyền thống. Đặc biệt, việc kết hợp học sâuđồ thị tri thức giúp cải thiện đáng kể độ chính xác và khả năng giải thích của mô hình. Tác giả đã so sánh kết quả mô hình đề xuất và so sánh với các phương pháp sử dụng MAE và RMSE. So sánh tỷ lệ cải thiện mô hình của KconvGraphRec với GraphRec và GraphRec với GCMC + SN.

5.1. So Sánh Với Các Phương Pháp Tiên Tiến Khác

Mô hình đề xuất được so sánh với các phương pháp tiên tiến khác trong lĩnh vực phân tích hành vi người dùng, như RippleNet, KGCN và HAGERec. Các kết quả cho thấy mô hình có hiệu suất vượt trội về độ chính xác (ACC) và diện tích dưới đường cong (AUC). Mô hình của luận văn có những cải tiến so với những mô hình này, thể hiện qua sự kết hợp giữa phương pháp học sâu và dữ liệu đồ thị tri thức.

5.2. Tác Động của Lớp Tập Trung và Số Lượng Lớp

Nghiên cứu cũng đánh giá tác động của lớp tập trung trong mô-đun tập hợp tri thức và số lượng lớp (hop) trên đồ thị tri thức đối với hiệu quả của mô hình. Các kết quả cho thấy việc sử dụng lớp tập trung và tăng số lượng lớp có thể cải thiện độ chính xác của mô hình, nhưng cần cân nhắc để tránh hiện tượng quá khớp (overfitting). Việc này giúp mô hình khai thác thông tin sâu hơn từ đồ thị tri thức.

5.3. Phân Tích Thời Gian Huấn Luyện và Khả Năng Mở Rộng

Nghiên cứu phân tích thời gian huấn luyện và khả năng mở rộng của mô hình đề xuất. Kết quả cho thấy mô hình có thời gian huấn luyện chấp nhận được và có khả năng mở rộng để xử lý dữ liệu lớn. Tuy nhiên, cần tiếp tục nghiên cứu để tối ưu hóa hiệu suất tính toán của mô hình. Việc đảm bảo tính khả thi về mặt tính toán là rất quan trọng khi triển khai mô hình trong thực tế.

VI. Kết Luận Hướng Phát Triển Cho Tương Lai

Luận văn này đã trình bày phương pháp học sâu kết hợp đồ thị tri thức để phân tích hành vi người dùng trên mạng xã hội. Phương pháp này hứa hẹn mang lại nhiều tiềm năng trong việc xây dựng hệ thống gợi ý cá nhân hóa và các ứng dụng khác liên quan đến phân tích hành vi. Tuy nhiên, cần tiếp tục nghiên cứu để giải quyết các vấn đề còn tồn tại và khai thác triệt để tiềm năng của phương pháp này. Trong chương 5.2, điểm cần khắc phục và định hướng phát triển trong tương lai được đề cập.

6.1. Điểm Cần Khắc Phục và Hạn Chế Hiện Tại

Nghiên cứu vẫn còn một số hạn chế, như việc thu thập và xử lý dữ liệu đồ thị tri thức còn gặp nhiều khó khăn. Mô hình cũng cần được cải thiện để xử lý dữ liệu không cân bằng và các vấn đề liên quan đến bảo mật thông tin cá nhân. Cần có những nghiên cứu sâu hơn về nhận dạng botphân tích xu hướng.

6.2. Hướng Nghiên Cứu và Phát Triển Trong Tương Lai

Trong tương lai, có thể nghiên cứu tích hợp thêm thông tin từ các nguồn khác nhau, như dữ liệu vị trí, dữ liệu cảm xúc và dữ liệu ngữ cảnh, để xây dựng mô hình toàn diện hơn. Cũng cần nghiên cứu các phương pháp học chuyển giao (transfer learning)học tăng cường (reinforcement learning) để cải thiện hiệu suất và khả năng thích nghi của mô hình. Ứng dụng Xử lý ngôn ngữ tự nhiên (NLP) để trích xuất thông tin từ văn bản cũng là một hướng đi tiềm năng.

6.3. Tầm Quan Trọng của Nghiên Cứu Tiếp Theo về Phân Tích Hành Vi

Nghiên cứu tiếp theo về phân tích hành vi người dùng là rất quan trọng để hiểu rõ hơn về hành vi của người dùng trên mạng xã hội và xây dựng các ứng dụng thông minh hơn. Điều này sẽ giúp doanh nghiệp và các tổ chức khác đưa ra các quyết định dựa trên dữ liệu và cải thiện trải nghiệm của người dùng. Việc tiếp tục đầu tư vào nghiên cứu Machine learningDeep learning sẽ mang lại nhiều lợi ích trong tương lai.

23/05/2025