Trường đại học
Trường Đại Học Bách Khoa Hà NộiChuyên ngành
Hệ thống thông tinNgười đăng
Ẩn danhThể loại
luận văn thạc sĩ2020
Phí lưu trữ
30.000 VNĐMục lục chi tiết
Tóm tắt
Trong bối cảnh công nghệ phát triển vượt bậc, con người tiếp cận lượng lớn dữ liệu từ internet, từ tin tức đến video và hình ảnh. Các nền tảng như mạng xã hội và thương mại điện tử tạo điều kiện cho tương tác đa dạng của người dùng với sản phẩm. Nghiên cứu thành công mô hình phân tích hành vi người dùng mang lại giá trị thực tiễn cao cho doanh nghiệp. Các mô hình hiện tại chưa đáp ứng kỳ vọng do phạm vi hẹp và chưa tận dụng triệt để dữ liệu. Luận văn này trình bày nghiên cứu phân tích hành vi người dùng trên mạng xã hội bằng phương pháp học sâu kết hợp đồ thị tri thức, hướng đến cải thiện độ chính xác và tính ứng dụng thực tế. Như Nguyễn Tiến Đồng đã đề xuất, mô hình hóa dữ liệu người dùng, dữ liệu mạng xã hội và đồ thị tri thức dưới dạng đồ thị sẽ giúp khai thác sâu hơn các quan hệ giữa người với người, người với vật và vật với vật.
Hành vi người dùng là tương tác giữa các yếu tố như sự kiện, hành vi, tri thức, và ảnh hưởng từ môi trường, tác động đến nhận thức, suy nghĩ và hành vi con người. Nghiên cứu hành vi người dùng tập trung vào việc lựa chọn, mua, sử dụng và loại bỏ sản phẩm, dịch vụ. Hiểu rõ động cơ thúc đẩy hành vi mua sắm giúp doanh nghiệp phân tích và dự đoán nhu cầu thị trường. Dữ liệu này vô cùng quan trọng trong việc mang đến những kết quả tốt cho tất cả các doanh nghiệp. Nhờ thông tin hoặc sản phẩm chính xác mà người dùng tìm kiếm, từ đó giúp tăng trải nghiệm người dùng, cuối cùng là nâng cao doanh thu và lợi nhuận cho doanh nghiệp.
Phân tích hành vi khách hàng là phương pháp quan sát định tính và định lượng về tương tác của khách hàng đối với sản phẩm, dịch vụ. Nó cung cấp thông tin về cách thức mua sắm, tần suất, sản phẩm ưa chuộng, và phản hồi về dịch vụ và truyền thông. Thông qua đó, doanh nghiệp có thể dự đoán hành vi tương lai để phát triển chiến lược kinh doanh. Thị trường cạnh tranh ngày càng lớn, khách hàng có vô vàn lựa chọn với cùng một mặt hàng sản phẩm, nhà kinh doanh phân tích được khách hàng càng kỹ càng, càng có nhiều cơ hội nắm bắt thị trường.
Việc phân tích hành vi người dùng là vô cùng cấp thiết nhưng cũng vô cùng khó khăn. Hành vi người tiêu dùng là một phạm trù phức tạp, mỗi đối tượng có những hành vi riêng, chính đối tượng có trong nhiều thời điểm cụ thể lại có hành vi khác nhau. Có vô số tác nhân bên ngoài lẫn bên trong ảnh hưởng tới hành vi khách hàng. Các yếu tố ảnh hưởng bao gồm yếu tố con người (giới tính, độ tuổi, thu nhập), yếu tố tiếp thị (khuyến mãi, bao bì, giá cả), yếu tố tâm lý (động cơ mua sắm, định kiến) và yếu tố hoàn cảnh (thời gian, không gian).
Các phương pháp phân tích hành vi người dùng truyền thống thường gặp nhiều hạn chế. Chúng thường chỉ tập trung vào một vài khía cạnh của dữ liệu, bỏ qua các yếu tố quan trọng như quan hệ xã hội và ngữ cảnh tri thức. Các mô hình như dựa vào nội dung, dựa vào người dùng, dựa vào sản phẩm, phân tích ma trận thành nhân tố, hay mạng nơ-ron thường không mang lại kết quả khả quan. Điều này xuất phát từ việc chưa phân tích đầy đủ các khía cạnh của dữ liệu, cụ thể là dữ liệu từ mạng xã hội và đồ thị tri thức. Cần có phương pháp tiếp cận toàn diện hơn để giải quyết vấn đề này.
Phương pháp phân tích dựa trên nội dung tập trung vào đặc điểm của sản phẩm hoặc dịch vụ, bỏ qua yếu tố cá nhân của người dùng và mạng lưới quan hệ của họ. Điều này dẫn đến việc không thể dự đoán chính xác hành vi của người dùng trong các tình huống cụ thể. Việc sử dụng nội dung làm trung tâm khiến mô hình bỏ qua những yếu tố tiềm ẩn như sentiment analysis hay social media analytics từ đó bỏ qua những yếu tố quan trọng ảnh hưởng đến quyết định của người dùng.
Phương pháp phân tích dựa trên người dùng chỉ xem xét lịch sử tương tác và sở thích cá nhân của người dùng, bỏ qua sự ảnh hưởng từ bạn bè, người thân và cộng đồng xung quanh. Điều này làm giảm khả năng dự đoán hành vi trong các bối cảnh xã hội. Hơn nữa, phương pháp này khó mở rộng khi số lượng người dùng tăng lên đáng kể, đòi hỏi tài nguyên tính toán lớn và phức tạp.
Các phương pháp truyền thống thường không tích hợp dữ liệu từ đồ thị tri thức và mạng xã hội, bỏ lỡ cơ hội khai thác thông tin quan trọng về quan hệ giữa người dùng và sản phẩm, cũng như ảnh hưởng từ cộng đồng. Việc bỏ qua những thông tin này làm giảm đáng kể độ chính xác của mô hình dự đoán. Việc mô hình hóa dữ liệu người dùng, dữ liệu mạng xã hội và đồ thị tri thức dưới dạng đồ thị sẽ giúp khai thác sâu hơn các quan hệ giữa người với người, người với vật và vật với vật.
Để khắc phục những hạn chế trên, luận văn này đề xuất phương pháp học sâu kết hợp đồ thị tri thức để phân tích hành vi người dùng trên mạng xã hội. Phương pháp này tận dụng khả năng biểu diễn dữ liệu phức tạp và học các mối quan hệ phi tuyến tính của học sâu, cùng với khả năng mô hình hóa tri thức và quan hệ ngữ nghĩa của đồ thị tri thức. Kết hợp hai yếu tố này giúp xây dựng mô hình dự đoán chính xác và toàn diện hơn. Cụ thể, em sẽ sử dụng phương pháp mạng học sâu trên đồ thị kết hợp đồ thị tri thức và mạng xã hội sẽ mang lại cơ hội để em nâng cao kiến thức cũng như xây dựng mô hình đề xuất giúp gia tăng tính chính xác cho kết quả cũng như sát với mô hình dữ liệu thực tế hiện nay.
Học sâu cho phép tự động trích xuất đặc trưng từ dữ liệu thô, giảm bớt gánh nặng cho việc thiết kế đặc trưng thủ công. Nó cũng có khả năng xử lý dữ liệu lớn và phức tạp, phù hợp với dữ liệu mạng xã hội. Thuật toán học sâu có thể phát hiện các mối quan hệ phi tuyến tính giữa các biến, giúp mô hình dự đoán chính xác hơn. Ngoài ra, Deep learning còn có khả năng tự học và thích nghi với dữ liệu mới, giúp mô hình luôn cập nhật và hiệu quả.
Đồ thị tri thức cung cấp cấu trúc để biểu diễn tri thức và quan hệ giữa các thực thể. Nó cho phép mô hình hiểu được ngữ cảnh và mối liên hệ giữa người dùng, sản phẩm và các yếu tố khác trên mạng xã hội. Biểu diễn tri thức trong đồ thị tri thức giúp tăng cường khả năng suy luận và dự đoán của mô hình. Graph database là công cụ quan trọng để lưu trữ và truy vấn dữ liệu đồ thị tri thức, hỗ trợ hiệu quả cho quá trình phân tích hành vi.
Sự kết hợp giữa học sâu và đồ thị tri thức tạo ra sức mạnh tổng hợp, cho phép mô hình không chỉ học được các đặc trưng từ dữ liệu mà còn hiểu được ngữ cảnh và quan hệ giữa các thực thể. Mô hình có thể sử dụng đồ thị tri thức để tăng cường thông tin đầu vào cho mạng học sâu, giúp cải thiện khả năng dự đoán. Đồng thời, học sâu có thể được sử dụng để trích xuất tri thức từ dữ liệu và cập nhật đồ thị tri thức.
Một ứng dụng quan trọng của phương pháp này là xây dựng hệ thống gợi ý cá nhân hóa trên mạng xã hội. Hệ thống này có thể gợi ý sản phẩm, dịch vụ, hoặc nội dung phù hợp với sở thích và nhu cầu của từng người dùng, dựa trên lịch sử tương tác, quan hệ xã hội và tri thức về sản phẩm. Việc này giúp tăng trải nghiệm người dùng, nâng cao doanh thu và lợi nhuận cho doanh nghiệp. Luận văn của Nguyễn Tiến Đồng tập trung vào việc dự đoán đánh giá cho điểm sản phẩm của người dùng có kết nối mạng xã hội, với số điểm từ 1 đến 5.
Hệ thống có thể gợi ý sản phẩm dựa trên sở thích của bạn bè và những người có ảnh hưởng trên mạng xã hội. Nó cũng có thể gợi ý sản phẩm mà người dùng có quan hệ gần gũi đã mua hoặc đánh giá cao. Phương pháp này tận dụng sức mạnh của social network analysis để tăng độ tin cậy và hiệu quả của gợi ý. Nó cũng tận dụng tốt Fraud detection và Recommendation systems để nâng cao tính bảo mật và trải nghiệm.
Hệ thống có thể gợi ý nội dung phù hợp với sở thích và nhu cầu của người dùng, dựa trên tri thức miền về lĩnh vực mà họ quan tâm. Ví dụ, nếu người dùng quan tâm đến công nghệ, hệ thống có thể gợi ý các bài viết, video, hoặc sự kiện liên quan đến công nghệ. Knowledge representation đóng vai trò quan trọng trong việc biểu diễn và sử dụng tri thức miền.
Hệ thống có thể sử dụng lịch sử tương tác và mô hình hóa hành vi để dự đoán hành vi mua sắm của người dùng trong tương lai. Nó có thể gợi ý sản phẩm mà người dùng có khả năng mua, hoặc cảnh báo về nguy cơ bỏ lỡ các chương trình khuyến mãi. User behavior analysis là chìa khóa để hiểu rõ và dự đoán hành vi của người dùng.
Luận văn này trình bày kết quả thực nghiệm đánh giá hiệu quả của mô hình đề xuất trên các bộ dữ liệu thực tế. Các kết quả cho thấy mô hình có khả năng dự đoán chính xác hành vi người dùng trên mạng xã hội, vượt trội so với các phương pháp truyền thống. Đặc biệt, việc kết hợp học sâu và đồ thị tri thức giúp cải thiện đáng kể độ chính xác và khả năng giải thích của mô hình. Tác giả đã so sánh kết quả mô hình đề xuất và so sánh với các phương pháp sử dụng MAE và RMSE. So sánh tỷ lệ cải thiện mô hình của KconvGraphRec với GraphRec và GraphRec với GCMC + SN.
Mô hình đề xuất được so sánh với các phương pháp tiên tiến khác trong lĩnh vực phân tích hành vi người dùng, như RippleNet, KGCN và HAGERec. Các kết quả cho thấy mô hình có hiệu suất vượt trội về độ chính xác (ACC) và diện tích dưới đường cong (AUC). Mô hình của luận văn có những cải tiến so với những mô hình này, thể hiện qua sự kết hợp giữa phương pháp học sâu và dữ liệu đồ thị tri thức.
Nghiên cứu cũng đánh giá tác động của lớp tập trung trong mô-đun tập hợp tri thức và số lượng lớp (hop) trên đồ thị tri thức đối với hiệu quả của mô hình. Các kết quả cho thấy việc sử dụng lớp tập trung và tăng số lượng lớp có thể cải thiện độ chính xác của mô hình, nhưng cần cân nhắc để tránh hiện tượng quá khớp (overfitting). Việc này giúp mô hình khai thác thông tin sâu hơn từ đồ thị tri thức.
Nghiên cứu phân tích thời gian huấn luyện và khả năng mở rộng của mô hình đề xuất. Kết quả cho thấy mô hình có thời gian huấn luyện chấp nhận được và có khả năng mở rộng để xử lý dữ liệu lớn. Tuy nhiên, cần tiếp tục nghiên cứu để tối ưu hóa hiệu suất tính toán của mô hình. Việc đảm bảo tính khả thi về mặt tính toán là rất quan trọng khi triển khai mô hình trong thực tế.
Luận văn này đã trình bày phương pháp học sâu kết hợp đồ thị tri thức để phân tích hành vi người dùng trên mạng xã hội. Phương pháp này hứa hẹn mang lại nhiều tiềm năng trong việc xây dựng hệ thống gợi ý cá nhân hóa và các ứng dụng khác liên quan đến phân tích hành vi. Tuy nhiên, cần tiếp tục nghiên cứu để giải quyết các vấn đề còn tồn tại và khai thác triệt để tiềm năng của phương pháp này. Trong chương 5.2, điểm cần khắc phục và định hướng phát triển trong tương lai được đề cập.
Nghiên cứu vẫn còn một số hạn chế, như việc thu thập và xử lý dữ liệu đồ thị tri thức còn gặp nhiều khó khăn. Mô hình cũng cần được cải thiện để xử lý dữ liệu không cân bằng và các vấn đề liên quan đến bảo mật thông tin cá nhân. Cần có những nghiên cứu sâu hơn về nhận dạng bot và phân tích xu hướng.
Trong tương lai, có thể nghiên cứu tích hợp thêm thông tin từ các nguồn khác nhau, như dữ liệu vị trí, dữ liệu cảm xúc và dữ liệu ngữ cảnh, để xây dựng mô hình toàn diện hơn. Cũng cần nghiên cứu các phương pháp học chuyển giao (transfer learning) và học tăng cường (reinforcement learning) để cải thiện hiệu suất và khả năng thích nghi của mô hình. Ứng dụng Xử lý ngôn ngữ tự nhiên (NLP) để trích xuất thông tin từ văn bản cũng là một hướng đi tiềm năng.
Nghiên cứu tiếp theo về phân tích hành vi người dùng là rất quan trọng để hiểu rõ hơn về hành vi của người dùng trên mạng xã hội và xây dựng các ứng dụng thông minh hơn. Điều này sẽ giúp doanh nghiệp và các tổ chức khác đưa ra các quyết định dựa trên dữ liệu và cải thiện trải nghiệm của người dùng. Việc tiếp tục đầu tư vào nghiên cứu Machine learning và Deep learning sẽ mang lại nhiều lợi ích trong tương lai.
Bạn đang xem trước tài liệu:
Ứng dụng phương pháp họ sâu kết hợp đồ thị tri thứ để phân tíh hành vi người dùng trên mạng xã hội