Ứng Dụng Mô Hình Học Sâu Vào Kỹ Thuật Lọc Cộng Tác Cho Các Hệ Thống Khuyến Nghị Thương Mại

Khám phá ứng dụng mô hình học sâu trong kỹ thuật lọc cộng tác cho hệ thống khuyến nghị thương mại, nâng cao trải nghiệm người dùng.

Trường đại học

Đại học Quốc gia Hà Nội

Chuyên ngành

Công nghệ thông tin

Người đăng

Ẩn danh

Thể loại

luận văn thạc sĩ

2020

Phí lưu trữ

30 Point

Tóm tắt

I. Tổng Quan Ứng Dụng Học Sâu Cho Hệ Thống Khuyến Nghị

Trong kỷ nguyên số, việc nắm bắt thị hiếu người tiêu dùng là yếu tố then chốt để thành công trong thương mại. Trước khi có máy tính, các nhà bán lẻ đã sử dụng hóa đơn, phỏng vấn để hiểu khách hàng. Ngày nay, Internet mang đến vô vàn thông tin, sản phẩm, khiến người dùng khó khăn trong việc lựa chọn. Ví dụ, Youtube có hàng trăm giờ video tải lên mỗi phút. Các doanh nghiệp cần cung cấp sản phẩm đúng sở thích để tối đa doanh thu và tối ưu chi phí. Hệ thống khuyến nghị giải quyết bài toán này bằng cách dự đoán xếp hạng và gợi ý danh sách sản phẩm. Nhiệm vụ dự đoán xếp hạng rất quan trọng vì nó phản ánh mức độ hài lòng của người dùng. Luận văn này tập trung vào giải quyết bài toán dự đoán xếp hạng sản phẩm. Các hệ thống khuyến nghị (RS) sử dụng kỹ thuật và công cụ phần mềm để xử lý dữ liệu người dùng và sản phẩm, đáp ứng nhu cầu của người dùng. Dựa trên lịch sử hành vi, hệ thống khai phá thông tin về sở thích và đưa ra gợi ý. Item là thuật ngữ chung để chỉ những gì người dùng tương tác.

1.1. Các Phương Pháp Thu Thập Dữ Liệu Người Dùng

Có hai phương pháp chính để thu thập hồ sơ người dùng: phản hồi tường minh (explicit feedback) và phản hồi ẩn (implicit feedback). Phản hồi tường minh yêu cầu người dùng xếp hạng sản phẩm, cung cấp dữ liệu trực tiếp và đáng tin cậy. Tuy nhiên, nó có thể làm giảm trải nghiệm người dùng. Phản hồi ẩn ghi nhận dấu vết người dùng để lại, như lịch sử mua hàng, thời gian xem trang web, để suy luận sở thích. Phương pháp này cải thiện trải nghiệm người dùng, nhưng khả năng mô tả sở thích có thể không tốt bằng phản hồi tường minh. Việc lựa chọn phương pháp phụ thuộc vào mục tiêu và đặc điểm của hệ thống khuyến nghị.

1.2. Vai Trò của Ma Trận Tương Tác Người Dùng Sản Phẩm

Ma trận tương tác Người dùng – Sản phẩm (Utility Matrix) mô tả sở thích của User với Item. Nó có thể biểu diễn dưới dạng ma trận, mỗi hàng là User, mỗi cột là Item, giá trị tại ô là rating của User cho Item. Tuy nhiên, ma trận này thường bị khuyết giá trị, gọi là vấn đề dữ liệu thưa (data sparsity). Vấn đề này làm cho các thuật toán khuyến nghị dựa trên bộ nhớ (memory-based recommendation algorithms) hoạt động không hiệu quả. Ngoài ra, khi có User hoặc Item mới chưa có tương tác, sẽ xuất hiện hàng/cột trống hoàn toàn, gọi là vấn đề khởi động nguội (cold-start problem). Các kỹ thuật học sâu có thể giúp giải quyết các vấn đề này.

II. Vấn Đề Khó Khăn Với Hệ Thống Lọc Cộng Tác Truyền Thống

Hệ thống khuyến nghị mô phỏng quá trình ra quyết định của người dùng thông qua hai cách tiếp cận chính: lọc theo nội dung và lọc theo cộng tác. Lọc theo nội dung dựa trên lịch sử tương tác và thuộc tính của đối tượng để tìm ra các thuộc tính có ảnh hưởng lớn đến đánh giá của người dùng. Cách tiếp cận dựa trên lọc theo cộng tác khai phá những nhóm người dùng “tương tự” nhau dựa trên hành vi quá khứ. Hệ thống RS sẽ dự đoán độ phù hợp giữa người dùng hiện tại với đối tượng thông qua độ phù hợp của những người dùng khác có cùng sở thích với họ. Bài toán khuyến nghị tìm cách xây dựng hàm ước lượng giá trị xếp hạng của người dùng sao cho sai số giữa giá trị dự đoán với các giá trị xếp hạng đã biết là nhỏ nhất. Các phương pháp tiếp cận xây dựng hệ thống khuyến nghị bao gồm lọc nội dung và lọc cộng tác.

2.1. Ưu Điểm và Hạn Chế của Lọc Nội Dung

Lọc nội dung ghi nhận user profile dưới dạng vector trọng số thể hiện mức độ quan tâm của người dùng đối với từng thuộc tính của sản phẩm. Ưu điểm của phương pháp này là không yêu cầu nhiều dữ liệu từ người dùng khác, có thể khuyến nghị sản phẩm mới dựa trên thông tin mô tả, khám phá sở thích đặc thù, và có khả năng giải thích tốt về những nhân tố ảnh hưởng. Tuy nhiên, lọc nội dung yêu cầu chất lượng thông tin sản phẩm cao, có thể gặp hiện tượng “cứng nhắc” (Overspecialization). Khi chất lượng thông tin mô tả đối tượng có chất lượng kém hoặc bị lỗi thì phương pháp khuyến nghị dựa trên nội dung hoạt động không hiệu quả.

2.2. Nhược Điểm Của Lọc Cộng Tác Dựa Trên Bộ Nhớ

Lọc cộng tác dựa trên bộ nhớ (Memory-based Collaborative Filtering) tính toán độ tương đồng giữa người dùng dựa trên giá trị xếp hạng. Ưu điểm của phương pháp này là không yêu cầu kiến thức chuyên biệt miền để xây dựng mô hình người dùng/sản phẩm. Tuy nhiên, hiệu suất giảm khi dữ liệu thưa thớt, khó xử lý vấn đề khởi động nguội, và có thể gặp vấn đề về khả năng mở rộng khi số lượng người dùng và sản phẩm lớn. Vì thế các mô hình học sâu đang được nghiên cứu để vượt qua các hạn chế này.

III. Phương Pháp Học Sâu Giải Pháp Tối Ưu Lọc Cộng Tác

Các phương pháp tiếp cận khác nhau để xây dựng hệ thống khuyến nghị bao gồm lọc theo nội dung và lọc theo cộng tác. Lọc kết hợp tận dụng ưu điểm của cả hai phương pháp. Hệ thống khuyến nghị cần được đánh giá bằng các tiêu chuẩn như trung bình lỗi tuyệt đối (Mean Absolute Error - MAE) và sai số bình phương trung bình (Root Mean Squared Error - RMSE). Chương 2 sẽ đi sâu vào hệ khuyến nghị dựa trên lọc cộng tác sử dụng kỹ thuật học sâu. Bài toán khuyến nghị dựa trên cộng tác, lọc cộng tác dựa vào bộ nhớ, lọc cộng tác dựa trên mô hình. Chương này trình bày các mô hình học sâu kết hợp với hệ khuyến nghị, phân loại hệ thống khuyến nghị dựa trên kiến trúc hệ thống, vai trò của các kỹ thuật học sâu trong bài toán khuyến nghị và một số hạn chế khi áp dụng các mô hình học sâu cho hệ khuyến nghị.

3.1. Các Mô Hình Học Sâu Phổ Biến Trong Hệ Thống Khuyến Nghị

Các mô hình học sâu đang được sử dụng rộng rãi trong hệ thống khuyến nghị bao gồm mạng nơ-ron (Neural Networks), mạng nơ-ron tích chập (Convolutional Neural Networks - CNN), mạng nơ-ron hồi quy (Recurrent Neural Networks - RNN) và autoencoders. Mạng nơ-ron có thể học các biểu diễn phi tuyến tính phức tạp của dữ liệu người dùng và sản phẩm. CNN được sử dụng để trích xuất đặc trưng từ hình ảnh và văn bản, trong khi RNN phù hợp với dữ liệu chuỗi thời gian, chẳng hạn như lịch sử tương tác của người dùng. Autoencoders có thể học các biểu diễn nén của dữ liệu và được sử dụng để giảm chiều và cải thiện hiệu suất của hệ thống khuyến nghị.

3.2. Ưu Điểm Khi Ứng Dụng Học Sâu Vào Lọc Cộng Tác

Ứng dụng học sâu vào lọc cộng tác mang lại nhiều ưu điểm, bao gồm khả năng học các biểu diễn phức tạp của dữ liệu, xử lý dữ liệu thưa thớt, giải quyết vấn đề khởi động nguội, và cải thiện độ chính xác của khuyến nghị. Mô hình học sâu có thể tự động trích xuất các đặc trưng quan trọng từ dữ liệu thô, giảm bớt công sức của kỹ sư. Chúng cũng có khả năng xử lý dữ liệu thưa thớt bằng cách học các biểu diễn chung của người dùng và sản phẩm. Ngoài ra, học sâu có thể giúp giải quyết vấn đề khởi động nguội bằng cách sử dụng thông tin bổ sung, chẳng hạn như thuộc tính của sản phẩm.

IV. Đề Xuất Mô Hình Hệ Thống Khuyến Nghị Sử Dụng Học Sâu

Chương 3 đề xuất một mô hình hệ khuyến nghị sử dụng kỹ thuật học sâu. Mô hình bao gồm các thành phần chính: lớp nhúng (embedding layer), lớp fully connected và lớp đầu ra hồi quy tuyến tính. Lớp nhúng ánh xạ người dùng và sản phẩm vào không gian vector biểu diễn. Các lớp fully connected học các tương tác phi tuyến tính giữa người dùng và sản phẩm. Lớp đầu ra hồi quy tuyến tính dự đoán giá trị xếp hạng. Hàm mục tiêu của mô hình là giảm thiểu sai số giữa giá trị dự đoán và giá trị thực tế. Chương này cũng đưa ra một số nhận xét về mô hình và so sánh với các mô hình khác.

4.1. Kiến Trúc Chi Tiết Của Mô Hình Đề Xuất

Kiến trúc mô hình bao gồm lớp nhúng (embedding layer): Lớp nhúng (Embedding layer) có chức năng ánh xạ người dùng và sản phẩm vào không gian vector có chiều thấp hơn. Đầu ra hồi quy tuyến tính (Linear Regression Output): Lớp này kết hợp các đặc trưng đã học được từ các lớp trước để dự đoán giá trị xếp hạng. Hàm mục tiêu của mô hình: Mục tiêu là tối ưu hóa mô hình để giảm thiểu sai số giữa giá trị dự đoán và giá trị thực tế. Mô hình này cho phép nắm bắt tốt hơn các mối quan hệ phức tạp giữa người dùng và sản phẩm.

4.2. Ưu Điểm Của Kiến Trúc Mô Hình Đề Xuất

Mô hình đề xuất có một số ưu điểm so với các mô hình khác. Thứ nhất, lớp nhúng giúp giảm chiều dữ liệu và cải thiện hiệu suất tính toán. Thứ hai, các lớp fully connected cho phép học các tương tác phi tuyến tính phức tạp giữa người dùng và sản phẩm. Thứ ba, lớp đầu ra hồi quy tuyến tính giúp dự đoán giá trị xếp hạng một cách chính xác. Thứ tư, hàm mục tiêu được thiết kế để giảm thiểu sai số dự đoán.

V. Thực Nghiệm Đánh Giá Hiệu Quả Mô Hình Học Sâu Đề Xuất

Chương 4 trình bày quá trình cài đặt và thử nghiệm mô hình đề xuất. Môi trường và các công cụ được sử dụng bao gồm Python, thư viện MxNet và bộ dữ liệu mẫu Movielens. Mô hình được thử nghiệm trên bộ dữ liệu Movielens-20M. Các thí nghiệm được thiết kế để đánh giá hiệu quả của mô hình trong việc dự đoán giá trị xếp hạng và giải quyết vấn đề khởi động nguội. Kết quả thí nghiệm cho thấy mô hình đề xuất đạt được độ chính xác cao và có khả năng xử lý vấn đề khởi động nguội một cách hiệu quả. Các kết quả thực nghiệm trên bộ dữ liệu Movielens-20M đã chứng minh tính hiệu quả của mô hình học sâu đề xuất.

5.1. Kết Quả Đánh Giá Trên Bộ Dữ Liệu Movielens 20M

Kết quả thí nghiệm trên bộ dữ liệu Movielens-20M cho thấy mô hình đạt độ chính xác cao trong việc dự đoán xếp hạng phim. Mô hình có khả năng khái quát hóa tốt trên dữ liệu chưa thấy và có thể đưa ra khuyến nghị phù hợp cho người dùng mới. Bảng thống kê cho thấy mô hình vượt trội hơn so với các phương pháp lọc cộng tác truyền thống. Các chỉ số đánh giá như RMSE và MAE đều thấp hơn đáng kể so với các phương pháp khác. Thống kê sự ảnh hưởng của việc thay đổi cấu hình MLP lên giá trị RMSE được thể hiện qua bảng số liệu cụ thể.

5.2. Đánh Giá Khả Năng Xử Lý Vấn Đề Khởi Động Nguội

Mô hình đề xuất thể hiện khả năng xử lý vấn đề khởi động nguội tốt hơn so với các phương pháp truyền thống. Thí nghiệm được thực hiện bằng cách loại bỏ một phần dữ liệu tương tác của người dùng và đánh giá hiệu suất của mô hình. Kết quả cho thấy mô hình vẫn có thể đưa ra khuyến nghị chính xác ngay cả khi thiếu thông tin về người dùng mới. Điều này chứng tỏ khả năng học hỏi và khái quát hóa của mô hình học sâu.

VI. Kết Luận Tiềm Năng Phát Triển Của Học Sâu Trong Tương Lai

Luận văn đã trình bày một mô hình hệ thống khuyến nghị sử dụng kỹ thuật học sâu để cải thiện hiệu suất lọc cộng tác. Mô hình đã được thử nghiệm trên bộ dữ liệu Movielens-20M và cho thấy kết quả khả quan. Các kết quả nghiên cứu cho thấy tiềm năng lớn của việc áp dụng học sâu vào lĩnh vực hệ thống khuyến nghị. Trong tương lai, có thể tiếp tục nghiên cứu và phát triển các mô hình học sâu phức tạp hơn để nâng cao độ chính xác và khả năng xử lý vấn đề khởi động nguội.

6.1. Hướng Nghiên Cứu Phát Triển Mô Hình Trong Tương Lai

Các hướng nghiên cứu phát triển mô hình trong tương lai bao gồm tích hợp thêm thông tin ngữ cảnh, sử dụng các kiến trúc mạng nơ-ron tiên tiến, và phát triển các phương pháp tối ưu hóa hiệu quả hơn. Việc tích hợp thêm thông tin ngữ cảnh, chẳng hạn như thời gian, địa điểm, và thiết bị, có thể giúp mô hình hiểu rõ hơn về sở thích của người dùng. Sử dụng các kiến trúc mạng nơ-ron tiên tiến, chẳng hạn như transformers, có thể giúp mô hình học các biểu diễn phức tạp hơn của dữ liệu. Phát triển các phương pháp tối ưu hóa hiệu quả hơn có thể giúp mô hình hội tụ nhanh hơn và đạt được hiệu suất tốt hơn. Cuối cùng, thử nghiệm trên các tập dữ liệu lớn hơn và đa dạng hơn để đánh giá khả năng mở rộng của mô hình.

6.2. Ứng Dụng Thực Tế và Tiềm Năng Thương Mại

Mô hình hệ thống khuyến nghị sử dụng học sâu có tiềm năng ứng dụng rộng rãi trong các lĩnh vực thương mại điện tử, giải trí trực tuyến, và quảng cáo. Trong thương mại điện tử, mô hình có thể được sử dụng để gợi ý sản phẩm phù hợp cho người dùng, tăng doanh số bán hàng, và cải thiện trải nghiệm người dùng. Trong giải trí trực tuyến, mô hình có thể được sử dụng để gợi ý phim, nhạc, và chương trình truyền hình phù hợp cho người dùng. Trong quảng cáo, mô hình có thể được sử dụng để hiển thị quảng cáo phù hợp cho người dùng, tăng tỷ lệ nhấp chuột, và cải thiện hiệu quả quảng cáo. Tiềm năng thương mại của hệ thống này là vô cùng lớn.

23/05/2025

Bạn đang xem trước tài liệu:

Ứng dụng các mô hình học sâu vào kĩ thuật lọc cộng tác dựa trên mô hình cho các hệ thống khuyến nghị thương mại

Tải đầy đủ

Trích đoạn nội dung tài liệu

Chương 1: Tổng quan về hệ thống khuyến nghị 1. Giới thiệu Trong quá trình phát triển của ngành thương mại bán lẻ hàng hóa, dịch vụ, vấn đề nắm bắt thị hiếu, sở thích của người tiêu dùng là một vấn đề có tính nền tảng, sống còn của ngành mà bất kì người bán lẻ nào nếu muốn tồn tại trong thương trường đều cần phải giải quyết thật tốt. Trước khi máy tính ra đời, những người bán lẻ đã thực hiện nhiều biện pháp để ghi nhận thói quen của người tiêu dùng như sử dụng các hóa đơn bán hàng để xem xét các mặt hàng thường được mua sắm cùng nhau, phỏng vấn người mua về sở thích mua sắm của họ để từ đó đưa ra những biện pháp giúp tối đa hóa doanh thu, tối ưu hóa chi phí của doanh nghiệp. Ví dụ, khi đi vào một cửa hàng sách quen thuộc, chủ cửa hàng sẽ giới thiệu cho người khách một vài quyển sách hoặc tờ báo mà người khách đó có thể quan tâm dựa trên sở thích hoặc thói quen của khách.

Hiện nay với sự phát triển bùng nổ của Internet đã làm xuất hiện các nhà cung cấp hàng hóa, dịch vụ hoạt động trực tuyến và mạng xã hội cung cấp vô số thông tin và sản phẩm, dịch vụ mới. Ví dụ, năm 2019 mỗi phút có khoảng 500 giờ phát video clip được tải lên Youtube [35] , danh mục sản phẩm của Amazon năm 2018 vào khoảng 12. Với lượng thông tin đồ sộ như vậy, có thể nói Internet đã làm cho người dùng không còn có đủ thời gian để xem xét lựa chọn tất cả các thông tin, phim, tạp chí hay bài hát… Người dùng không biết mình nên xem phim gì, đọc cuốn sách nào phù hợp với sở thích, nhu cầu của bản thân. Hơn nữa, đối với các doanh nghiệp việc phục vụ hàng hóa, dịch vụ đúng sở thích, thị hiếu của khách hàng giúp tối đa hóa doanh thu, đồng thời giúp lập kế hoạch dự trữ hàng hóa thích hợp để tối ưu hóa chi phí vận hành, từ đó làm gia tăng lợi nhuận cho doanh nghiệp.

Trong lĩnh vực xây dựng hệ tư vấn có 2 nhiệm vụ cơ bản cần được giải quyết là dự đoán xếp hạng cho từng mặt hàng và gợi ý danh sách mặt hàng [1]. Nhiệm vụ dự đoán xếp hạng (rate prediction) nhằm mục tiêu tối ưu hóa dự đoán mức độ ưa thích của người dùng đối với từng mặt hàng cụ thể, trong khi đó nhiệm vụ gợi ý danh sách mặt hàng (ranking) nhằm giải quyết vấn đề gợi ý cho người dùng danh sách mặt hàng mà họ nhiều khả năng 1 có tương tác nhất. Trong hai nhiệm vụ nói trên, nhiệm vụ dự đoán xếp hạng của người dùng cho sản phẩm đóng vai trò quan trọng vì điểm xếp hạng của người dùng phản ánh mức độ hài lòng của người dùng đối với sản phẩm/dịch vụ. Trong luận văn sẽ tập trung giải quyết nhiệm vụ dự đoán xếp hạng của người dùng đối với sản phẩm.

Một số khái niệm chung về hệ thống khuyến nghị Hệ thống khuyến nghị (Recommender System viết tắt là RS) là hệ thống sử dụng các kỹ thuật và công cụ phần mềm xử lý dữ liệu người dùng và dữ liệu về sản phẩm nhằm đáp ứng nhu cầu của người dùng về một sản phẩm hoặc dịch vụ nào đó. Trên cơ sở thông tin trong quá khứ về hành vi của người dùng, hệ thống thực hiện khai phá thông tin về sở thích, thị hiếu tiêu dùng từ đó đưa ra những gợi ý để hỗ trợ người dùng đưa ra quyết định lựa chọn sản phẩm, dịch vụ đáp ứng đúng sở thích của mình. Mặt hàng (Item) là thuật ngữ chung để chỉ những gì người dùng có tương tác trong hệ thống khuyến nghị. Item có thể là sách, phim, truyện, tin tức.

Thông thường hệ thống khuyến nghị sẽ được xây dựng phù hợp với một loại hình sản phẩm nhất định để đảm bảo hiệu quả khuyến nghị cho Item đó. Trên thực tế để thu thập dữ liệu Hồ sơ người dùng (User profile), người ta thường sử dụng theo hai phương pháp chính là phương pháp phản hồi tường minh (explicit feedback) và phương pháp phản hồi ẩn (implicit feedback). Đối với phương pháp phản hồi tường minh, hệ thống yêu cầu người dùng thực hiện xếp hạng cụ thể cho từng Item để xây dựng hồ sơ người dùng. Phương pháp này cung cấp dữ liệu người dùng trực tiếp cho hệ thống khuyến nghị (không phải thực hiện các công đoạn biến đổi trung gian) và kết quả khuyến nghị được đánh giá là đáng tin cậy hơn cả [1].

Tuy được cho là đem lại kết quả khuyến nghị đáng tin cậy hơn nhưng phương pháp này yêu cầu người dùng phải thực hiện thêm một số thao tác với hệ thống, do đó trong một số trường hợp làm giảm trải nghiệm người dùng. Bên cạnh đó, tâm lý chung của người dùng không muốn chia sẻ quá nhiều thông tin mang tính chất riêng tư do đó làm cho phương thức thu thập phản hồi tường minh thường gặp khó khăn trong quá trình triển khai thực tế. Nhằm khắc phục mặt hạn chế của phương pháp thu thập phản hồi tường minh, phương pháp thu thập phản hồi ẩn ghi nhận những dấu vết mà người dùng để lại trên hệ 2 thống như lịch sử mua hàng, lịch sử truy cập website, thời gian xem một trang web, số lần click chuột vào các siêu liên kết,… để suy luận thông tin về sở thích của người dùng. Phương pháp này giúp cải thiện trải nghiệm của người dùng đối với hệ thống tuy nhiên khả năng mô tả sở thích của người dùng được cho là không tốt bằng phương pháp phản hồi tường minh do hệ thống phải thực hiện các khâu biến đổi trung gian để trích xuất thông tin từ hành vi của người dùng [1].

Ma trận tương tác Người dùng – Sản phẩm (Utility Matrix/User – Item matrix) là một cơ sở dữ liệu mô tả sở thích của mỗi User với từng Item trong hệ thống. Về mặt hình thức, cơ sở dữ liệu này có thể biểu diễn dưới dạng ma trận trong đó mỗi hàng tương ứng với một User, mỗi cột tương ứng với một Item, giá trị tại mỗi ô của ma trận chính là giá trị rating của User cho Item đó. Mặt hàng 1 Mặt hàng 2 Mặt hàng 3 Mặt hàng n Người dùng 1 1 3 5 … ? Người dùng 2 2 ? 4 … 2 … … … … … … Người dùng m ? 2 1 … 3 𝑹 Hình 1.1: Ma trận tương tác Người dùng – Sản phẩm Xuất phát từ nguyên nhân tâm lý, người dùng không phải khi nào cũng đánh giá tất cả các Item mà họ đã từng trải nghiệm, thông thường người dùng chỉ đánh giá Item trong trạng thái tích cực (rất thích) hoặc tiêu cực (rất ghét). Vì vậy trên thực tế ma trận tương tác Người dùng – Sản phẩm nói trên thường bị khuyết giá trị ở rất nhiều ô, vấn đề này được gọi là vấn đề dữ liệu thưa (data sparsity)[2].

Vấn đề dữ liệu thưa của ma trận tương tác dẫn đến hệ quả các thuật toán khuyến nghị dựa trên bộ nhớ (memory-based recommendation algorithms)[1] hoạt động không hiệu quả. Bên cạnh đó, trường hợp trong hệ thống xuất hiện người dùng hoặc item mới chưa có tương tác nào thì ma trận Người dùng – Sản phẩm sẽ xuất hiện các hàng/cột bị trống hoàn toàn. Vấn đề này được gọi là vấn đề khởi động nguội (cold-start problem)[2] xảy ra đối với các hệ khuyến nghị dựa trên cộng tác khi hệ thống gặp phải những item hoàn toàn không có tương tác nào, hệ khuyến nghị không thể 3 khai thác được thông tin sở thích giống nhau giữa các nhóm người dùng/item để đưa ra khuyến nghị. Phương thức hoạt động của Hệ khuyến nghị Trong thực tế, khi người tiêu dùng thực hiện hành vi mua hàng, việc ra quyết định của họ thường được đưa ra theo hai cách tiếp cận chính: Một là xem xét những thông tin chi tiết về sản phẩm như tính năng, công dụng, thành phần,… tùy thuộc vào mức độ phù hợp với nhu cầu sử dụng để đưa ra quyết định.

Hai là người dùng có thể tham khảo ý kiến của những người xung quanh về mức độ hài lòng đối với sản phẩm để đưa ra quyết định mua sắm của mình. Xuất phát từ quan sát nêu trên, hệ thống RS mô phỏng lại quá trình ra quyết định của người dùng theo hai cách tiếp cận chính là khuyến nghị dựa trên lọc theo nội dung và khuyến nghị dựa trên lọc theo cộng tác. Trong cách tiếp cận dựa trên lọc theo nội dung, hệ thống RS dựa trên lịch sử tương tác của người dùng với đối tượng và thông tin về thuộc tính của đối tượng (nội dung của đối tượng) để tìm ra các thuộc tính (đặc tính) có ảnh hưởng lớn đến đánh giá của người dùng đó. Đặc điểm sở thích của người dùng dựa trên đặc tính của sản phẩm được biểu diễn bởi vector 𝑃𝑟𝑜𝑓𝑖𝑙𝑒(𝑈) = (𝑤1 , 𝑤2 , … , 𝑤𝑛 ) có các phần tử tương ứng với các yếu tố nội dung cấu tạo nên sản phẩm, giá trị trọng số 𝑤𝑖 mô tả tầm quan trọng của thành phần nội dung thứ 𝑖 ảnh hưởng tới sở thích của người dùng.

Tương tự với việc xây dựng User Profile, hệ thống RS sử dụng các kỹ thuật Truy hồi thông tin (Information Retrieval – IR) nhằm phân tích đối tượng I dưới dạng vector trọng số 𝐶𝑜𝑛𝑡𝑒𝑛𝑡(𝐼) = (𝑤1 , 𝑤2 , … , 𝑤𝑛 ) của các thành phần nội dung. Ví dụ, thông thường thông tin mô tả về đối tượng thường được thể hiện dưới dạng văn bản như các đoạn văn, bài viết, mẩu tin ngắn,… hệ thống RS sẽ sử dụng các kỹ thuật IR trích xuất đặc tính như từ khóa, n-grams, thực thể,… để xây dựng mô hình đối tượng dưới dạng vector từ khóa [3]. Như vậy, theo cách tiếp cận lọc dựa trên nội dung, hệ thống RS đã thực hiện ánh xạ sở thích của người dùng và nội dung của đối tượng vào cùng một không gian vector (không gian thuộc tính của sản phẩm). Do đó để đánh giá độ phù hợp giữa sản phẩm I với người dùng U, hệ thống RS có thể sử dụng độ đo cosine để đo lường sự tương đồng giữa 2 vector: 4 ⃗⃗⃗⃗⃗⃗⃗⃗⃗⃗⃗⃗⃗⃗⃗⃗⃗⃗⃗⃗⃗⃗⃗ , ⃗⃗⃗⃗⃗⃗⃗⃗⃗⃗⃗⃗⃗⃗⃗⃗⃗⃗⃗⃗⃗⃗⃗ 𝑟(𝑈, 𝐼) = 𝑐𝑜𝑠(𝑃𝑟𝑜𝑓𝑖𝑙𝑒(𝑈) 𝐶𝑜𝑛𝑡𝑒𝑛𝑡(𝐼)) (1) Trong cách tiếp cận dựa trên lọc theo cộng tác, hệ thống RS khai phá những nhóm người dùng “tương tự” nhau dựa trên hành vi quá khứ của người dùng được ghi nhận trong ma trận tương tác Người dùng – Sản phẩm.

Hệ thống RS sẽ dự đoán độ phù hợp 𝑟(𝑈, 𝐼) giữa người dùng hiện tại 𝑈 với đối tượng 𝐼 thông qua độ phù hợp 𝑟(𝑈𝑗 , 𝐼) của những người dùng 𝑈𝑗 khác có cùng sở thích với 𝑈.

Nội dung được bảo vệ bản quyền — Tải xuống đầy đủ

Chủ đề

Ứng dụng học sâu trong thương mại

Kỹ thuật lọc cộng tác hiện đại

Phát triển hệ thống khuyến nghị

Tương lai của công nghệ khuyến nghị

Ứng Dụng Mô Hình Học Sâu Vào Kỹ Thuật Lọc Cộng Tác Cho Các Hệ Thống Khuyến Nghị Thương Mại

I. Tổng Quan Ứng Dụng Học Sâu Cho Hệ Thống Khuyến Nghị

1.1. Các Phương Pháp Thu Thập Dữ Liệu Người Dùng

1.2. Vai Trò của Ma Trận Tương Tác Người Dùng Sản Phẩm

II. Vấn Đề Khó Khăn Với Hệ Thống Lọc Cộng Tác Truyền Thống

2.1. Ưu Điểm và Hạn Chế của Lọc Nội Dung

2.2. Nhược Điểm Của Lọc Cộng Tác Dựa Trên Bộ Nhớ

III. Phương Pháp Học Sâu Giải Pháp Tối Ưu Lọc Cộng Tác

3.1. Các Mô Hình Học Sâu Phổ Biến Trong Hệ Thống Khuyến Nghị

3.2. Ưu Điểm Khi Ứng Dụng Học Sâu Vào Lọc Cộng Tác

IV. Đề Xuất Mô Hình Hệ Thống Khuyến Nghị Sử Dụng Học Sâu

4.1. Kiến Trúc Chi Tiết Của Mô Hình Đề Xuất

4.2. Ưu Điểm Của Kiến Trúc Mô Hình Đề Xuất

V. Thực Nghiệm Đánh Giá Hiệu Quả Mô Hình Học Sâu Đề Xuất

5.1. Kết Quả Đánh Giá Trên Bộ Dữ Liệu Movielens 20M

5.2. Đánh Giá Khả Năng Xử Lý Vấn Đề Khởi Động Nguội

VI. Kết Luận Tiềm Năng Phát Triển Của Học Sâu Trong Tương Lai

6.1. Hướng Nghiên Cứu Phát Triển Mô Hình Trong Tương Lai

6.2. Ứng Dụng Thực Tế và Tiềm Năng Thương Mại

THÔNG TIN CHI TIẾT

Tác giả: Trần Anh Dũng

Người hướng dẫn: TS. Trần Trọng Hiếu

Trường học: Đại học Quốc gia Hà Nội

Chuyên ngành: Công nghệ thông tin

Đề tài: Ứng Dụng Mô Hình Học Sâu Trong Lọc Cộng Tác Cho Hệ Thống Khuyến Nghị Thương Mại

Loại tài liệu: luận văn thạc sĩ

Năm xuất bản: 2020

Địa điểm: Hà Nội

Ứng Dụng Mô Hình Học Sâu Vào Kỹ Thuật Lọc Cộng Tác Cho Các Hệ Thống Khuyến Nghị Thương Mại

I. Tổng Quan Ứng Dụng Học Sâu Cho Hệ Thống Khuyến Nghị

1.1. Các Phương Pháp Thu Thập Dữ Liệu Người Dùng

1.2. Vai Trò của Ma Trận Tương Tác Người Dùng Sản Phẩm

II. Vấn Đề Khó Khăn Với Hệ Thống Lọc Cộng Tác Truyền Thống

2.1. Ưu Điểm và Hạn Chế của Lọc Nội Dung

2.2. Nhược Điểm Của Lọc Cộng Tác Dựa Trên Bộ Nhớ

III. Phương Pháp Học Sâu Giải Pháp Tối Ưu Lọc Cộng Tác

3.1. Các Mô Hình Học Sâu Phổ Biến Trong Hệ Thống Khuyến Nghị

3.2. Ưu Điểm Khi Ứng Dụng Học Sâu Vào Lọc Cộng Tác

IV. Đề Xuất Mô Hình Hệ Thống Khuyến Nghị Sử Dụng Học Sâu

4.1. Kiến Trúc Chi Tiết Của Mô Hình Đề Xuất

4.2. Ưu Điểm Của Kiến Trúc Mô Hình Đề Xuất

V. Thực Nghiệm Đánh Giá Hiệu Quả Mô Hình Học Sâu Đề Xuất

5.1. Kết Quả Đánh Giá Trên Bộ Dữ Liệu Movielens 20M

5.2. Đánh Giá Khả Năng Xử Lý Vấn Đề Khởi Động Nguội

VI. Kết Luận Tiềm Năng Phát Triển Của Học Sâu Trong Tương Lai

6.1. Hướng Nghiên Cứu Phát Triển Mô Hình Trong Tương Lai

6.2. Ứng Dụng Thực Tế và Tiềm Năng Thương Mại

Tài liệu liên quan

THÔNG TIN CHI TIẾT

Tác giả: Trần Anh Dũng

Người hướng dẫn: TS. Trần Trọng Hiếu

Trường học: Đại học Quốc gia Hà Nội

Chuyên ngành: Công nghệ thông tin

Đề tài: Ứng Dụng Mô Hình Học Sâu Trong Lọc Cộng Tác Cho Hệ Thống Khuyến Nghị Thương Mại

Loại tài liệu: luận văn thạc sĩ

Năm xuất bản: 2020

Địa điểm: Hà Nội

Có thể bạn quan tâm