Xây Dựng Hệ Thống Khuyến Nghị Tuần Tự Dựa Trên Kiến Trúc Transformer

Luận văn thạc sĩ về xây dựng hệ thống khuyến nghị tuần tự sử dụng kiến trúc Transformer. Nghiên cứu khoa học máy tính, ứng dụng trong gợi ý sản phẩm.

Trường đại học

Trường Đại học Bách Khoa - ĐHQG TP.HCM

Chuyên ngành

Khoa Học Máy Tính

Người đăng

Ẩn danh

Thể loại

Luận văn thạc sĩ

2022

Phí lưu trữ

30 Point

Mục lục chi tiết

LỜI CẢM ƠN

TÓM TẮT NỘI DUNG

ABSTRACT

LỜI CAM KẾT CỦA TÁC GIẢ

1. CHƯƠNG 1: GIỚI THIỆU

1.1. Giới thiệu đề tài

1.2. Ý nghĩa thực tiễn

1.3. Những khó khăn và thách thức

1.4. Nhiệm vụ và cấu trúc luận văn

1.4.1. Nhiệm vụ luận văn

1.4.2. Cấu trúc luận văn

2. CHƯƠNG 2: CƠ SỞ LÝ THUYẾT VÀ CÔNG TRÌNH NGHIÊN CỨU LIÊN QUAN

2.1. Tổng quan về bài toán gợi ý tuần tự

2.2. Tình hình nghiên cứu trên thế giới

2.3. Cơ chế Self-Attention và mô hình SASREC

2.3.1. Cơ chế Self-Attention

2.3.2. Mô hình SASREC

2.4. Kiến trúc Transformer và mô hình BERT4REC, BST

2.4.1. Kiến trúc Transformer

2.4.2. Mô hình BERT4REC

2.4.3. Mô hình BST - Behavior Sequence Transformer

2.5. Phương pháp đánh giá

2.5.1. Đánh giá cho bài toán xếp hạng (rating)

2.5.2. Đánh giá cho bài toán khả năng nhấp chuột (click-through-rate)

2.6. Tổng kết chương

3. CHƯƠNG 3: DỮ LIỆU VÀ GIẢI PHÁP ĐỀ XUẤT

3.1. Dữ liệu xếp hạng phim MovieLens 1M

3.2. Phương pháp tiền xử lý dữ liệu

3.3. Mô hình cơ sở

3.4. Giải pháp đề xuất

3.4.1. Giải pháp đề xuất cho bài toán rating

3.4.2. Giải pháp đề xuất cho bài toán click-through-rate

3.5. Cài đặt thực nghiệm

3.5.1. Cài đặt dữ liệu

3.5.2. Cài đặt huấn luyện cho bài toán rating

3.5.3. Cài đặt huấn luyện cho bài toán click-through-rate

3.6. Tổng kết chương

4. CHƯƠNG 4: KẾT QUẢ VÀ THẢO LUẬN

4.1. Kết quả thực nghiệm

4.1.1. Kết quả thực nghiệm cho bài toán rating

4.1.2. Kết quả thực nghiệm cho bài toán click-through-rate

4.2. Kết quả đạt được

4.3. Hạn chế và vấn đề tồn đọng

4.4. Hướng phát triển

4.5. Tổng kết luận văn

TÀI LIỆU THAM KHẢO

Tóm tắt

I. Tổng Quan Hệ Thống Khuyến Nghị Tuần Tự Luận Văn Khoa Học

Bài toán Hệ thống gợi ý không còn xa lạ, ứng dụng rộng rãi. Phần lớn các hệ thống dựa trên thông tin nhân khẩu học hoặc hành vi người dùng trong lịch sử dài hạn, chưa quan tâm tính tuần tự. Hành vi ngắn hạn thường liên hệ tốt với nhau hơn là các hành vi ở thời điểm xa nhau. Đề tài tập trung vào khai thác đặc tính tuần tự này. Các hệ thống gợi ý, khuyến nghị trong thực tế thường phải đối mặt với việc là gợi ý thật nhanh chóng cho người dùng, những gợi ý quảng cáo này phải mang tính cá nhân hoá đối với từng nhóm người dùng khi thời gian họ dành cho các ứng dụng ngày càng ít đi vì có rất nhiều ứng dụng, rất nhiều sản phẩm được quảng bá tới họ. Mong muốn của người dùng thường được xác định dựa vào thông tin mang tính nhân khẩu học (demographic) như một người dùng có nghề nghiệp là nhạc sĩ thường sẽ quan tâm tới các dụng cụ sản phẩm có đặc tính về âm nhạc, âm thanh.

1.1. Giới Thiệu Chi Tiết Hệ Thống Khuyến Nghị Tuần Tự

Hệ thống khuyến nghị tuần tự là giải pháp cho hệ thống khuyến nghị người dùng quan tâm đến dữ liệu tương tác của người dùng dưới dạng tuần tự theo thời gian. Với đặc điểm là ngoài việc sử dụng các thông tin cá nhân hoá của người dùng dài hạn (long-term user preferences) vào việc đưa ra gợi ý như các hướng tiếp cận truyền thống khác, hệ thống còn đặc biệt xem xét tới mối quan tâm ngắn hạn của người dùng trong thời gian ngắn (short-term intentions), hoặc theo phiên (session). Việc ứng dụng hệ thống gợi ý tuần tự trong thực tế mang lại hiệu quả cao trong khả năng đưa ra các khuyến nghị, bằng việc mang lại lợi ích đối với người tiêu dùng khiến họ mua những sản phẩm phù hợp hơn từ đó mang lại giá trị cho các doanh nghiệp và các nhà cung cấp sản phẩm, dịch vụ. Các hành vi trong ngắn hạn thường sẽ có mối liên hệ tốt với nhau hơn là các hành vi ở các thời điểm cách xa nhau.

1.2. Ứng Dụng Thực Tế và Ý Nghĩa của Hệ Thống Khuyến Nghị

Ứng dụng hệ thống gợi ý tuần tự trong thực tế mang lại hiệu quả cao trong khả năng đưa ra các khuyến nghị. Việc này mang lại lợi ích cho người tiêu dùng. Người tiêu dùng mua sản phẩm phù hợp hơn, tạo giá trị cho doanh nghiệp và nhà cung cấp dịch vụ. Cụ thể, hệ thống giúp tăng doanh thu cho doanh nghiệp, nắm bắt xu hướng và đưa ra chương trình khuyến mãi phù hợp, gia tăng sự hài lòng và lòng trung thành của khách hàng. Người tiêu dùng dễ dàng lựa chọn sản phẩm thích hợp, tiết kiệm thời gian mua sắm. Cần có kiến thức ngành phù hợp để chọn thuộc tính và dữ liệu sử dụng. Thực tế có nhiều nhiệm vụ cần giải quyết cho bài toán gợi ý do đó dẫn tới ở mỗi nhiệm vụ sẽ có các phương pháp đánh giá phù hợp khác nhau.

II. Transformer Bí Quyết Xây Dựng Hệ Thống Khuyến Nghị Tuần Tự

Ngày nay, trong nghiên cứu khoa học về việc khai thác đặc tính tuần tự ứng dụng học sâu (deep learning) là rất phổ biến nhờ sự ra đời của những kiến trúc mô hình có khả năng giải quyết các dữ liệu dạng chuỗi tuần tự như mô hình dạng RNN, cơ chế Self-Attention, kiến trúc Transformer đã đạt được những cột mốc đáng nhớ trong lĩnh vực Xử lý ngôn ngữ tự nhiên (NLP). Bằng việc ứng dụng những thành tựu khoa học này vào bài toán gợi ý, Hệ thống khuyến nghị tuần tự đề xuất là một trong những giải pháp cho một hệ thống khuyến nghị người dùng quan tâm đến dữ liệu tương tác của người dùng dưới dạng tuần tự theo thời gian.

2.1. Lợi Thế của Transformer trong Xử Lý Dữ Liệu Tuần Tự

Việc tương tác này của người dùng có thể được phân làm hai loại là tương tác rõ ràng, trực tiếp (explicit) và tương tác ẩn, gián tiếp (implicit) hoặc là kết hợp cả hai. Đối với các hệ thống này, ta đã giả định rặng tất cả những tương tác giữa người dùng và sản phẩm trong dữ liệu trong lịch sử là như nhau và cố gắng tìm ra một sở thích tĩnh (static preferences). Tuy nhiên như đã chia sẻ ở Chương 1 thì điều này không quá hữu dụng trong thực tế khi hành động, hành vi tương tác tiếp theo của người dùng chịu sự ảnh hưởng mạnh bởi những mối quan tâm hiện tại hơn là sở thích tĩnh dài hạn cũng như những tương tác này là một chuỗi các hành động có đặc tính thứ tự. Do đó các hệ thống khuyến nghị thông thường đã bỏ qua sự phụ thuộc tuần tự khi thực hiện mô hình hoá dẫn tới mô hình đưa ra gợi ý không tương đồng với sở thích và mong muốn của người dùng.

2.2. Cơ Chế Self Attention và Ứng Dụng trong Transformer

Hệ thống khuyến nghị tuần tự (Sequential Recommendation) là một hệ thống gợi ý người dùng dựa trên việc quan sát các hành vi tương tác của người dùng đối với sản phảm theo tuần tự và thứ tự. Ví dụ minh hoạ như người dùng A tìm kiếm thông tin (search) sản phẩm X, chọn (click) vào sản phẩm Y, nhưng lại mua (buy) sản phẩm Z. Mô hình cần học được thông tin tương tác này kèm với thứ tự của chúng.1 minh hoạ một lịch sử hành vi tương tác của người dùng trong tập dữ liệu về người dùng Uu . Thành phần chính của một hệ thống khuyến nghị tuần tự cần quan tâm trước nhất đó là sản phẩm người dùng tương tác (objects) và phương thức tương tác của người dùng đối với sản phẩm (types).

III. Hướng Dẫn Xây Dựng Mô Hình Khuyến Nghị Tuần Tự Transformer

Luận văn giải quyết các vấn đề sau: Xây dựng quy trình tiền xử lý (chọn lọc, biến đổi, chuẩn hóa) dữ liệu sẵn sàng phân tích. Bao gồm các thuộc tính người dùng, sản phẩm và thuộc tính tuần tự. Xây dựng bộ dữ liệu huấn luyện, thẩm định, kiểm nghiệm từ tập dữ liệu ban đầu. Xây dựng kiến trúc mô hình huấn luyện đề xuất. Kiểm tra thực nghiệm, đánh giá so sánh các mô hình cơ sở trên từng bài toán con. Tổng kết, đề xuất giải pháp triển khai thực tế và hướng mở rộng nghiên cứu.

3.1. Tiền Xử Lý Dữ Liệu Hiệu Quả cho Hệ Thống Khuyến Nghị

Dữ liệu dạng tuần tự là dạng dữ liệu không có sẵn trong dữ liệu vận hành (Operation) mà cần phải thực hiện tiền xử lý. Công việc này sẽ khác nhau tuỳ thuộc vào kiến trúc của hệ thống gợi ý. Do đó sẽ gặp khó khăn trong việc xử lý sao cho hiệu quả, đúng đắn và dễ thực nghiệm kiểm chứng. Thời gian thực hiện đề tài có hạn do đó phạm vi của đề tài sẽ được giới hạn lại cho phù hợp, chưa thể thực hiện các phần liên quan để thành một ứng dụng gợi ý hoàn chỉnh hay thực nghiệm kết hợp với các giải pháp nghiên cứu khác.

3.2. Xây Dựng và Chia Tách Dữ Liệu Huấn Luyện Thẩm Định

Xây dựng quy trình tiền xử lý bao gồm chọn lọc, biến đổi và chuẩn hóa dữ liệu sẵn sàng đưa vào phân tích. Bao gồm các thuộc tính của người dùng, sản phẩm và các thuộc tính ở dạng tuần tự. Xây dựng bộ dữ liệu huấn luyện, bộ dữ liệu thẩm định và bộ dữ liệu kiểm nghiệm từ tập dữ liệu ban đầu. Luận văn này sẽ giải quyết các vấn đề sau trong quá trình thực hiện đề tài bao gồm: Kiểm tra thực nghiệm và đánh giá so sánh các mô hình cơ sở trên từng bài toán con.

3.3. Thiết Kế Kiến Trúc Mô Hình Transformer Tối Ưu

Xây dựng kiến trúc mô hình huấn luyện đề xuất. Dữ liệu dạng tuần tự là dạng dữ liệu không có sẵn trong dữ liệu vận hành (Operation) mà cần phải thực hiện tiền xử lý. Công việc này sẽ khác nhau tuỳ thuộc vào kiến trúc của hệ thống gợi ý. Do đó sẽ gặp khó khăn trong việc xử lý sao cho hiệu quả, đúng đắn và dễ thực nghiệm kiểm chứng. Tổng kết và đề xuất các giải pháp triển khai ứng dụng thực tế và hướng mở rộng để nghiên cứu trong tương lai.

IV. Đánh Giá Hiệu Suất Hệ Thống Khuyến Nghị Tuần Tự Transformer

Luận văn trình bày chi tiết về bộ dữ liệu sử dụng, các phân tích thống kê. Với đặc trưng của bộ dữ liệu thí nghiệm, luận văn trình bày phương pháp tiền xử lý, chọn lọc dữ liệu. Thiết kế kiến trúc mô hình của hệ thống đề xuất, phương pháp cài đặt, tinh chỉnh mô hình cho từng bài toán con. Kết quả thực nghiệm được so sánh với các mô hình cơ sở. Nhận xét và thảo luận về kết quả thu được.

4.1. Phương Pháp Đánh Giá Khách Quan và Chính Xác

Nhiều cách đánh giá khác nhau cho bài toán gợi ý. Thực tế có nhiều nhiệm vụ cần giải quyết cho bài toán gợi ý do đó dẫn tới ở mỗi nhiệm vụ sẽ có các phương pháp đánh giá phù hợp khác nhau. Phương pháp đánh giá cho bài toán xếp hạng (rating). Đánh giá cho bài toán khả năng nhấp chuột (click-through-rate).

4.2. So Sánh Kết Quả với Các Mô Hình Cơ Sở

Kết quả thực nghiệm của mô hình đề xuất đã trình bày trong Phần Ba và kết quả so sánh với các mô hình cơ sở; sau đó là những nhận xét và thảo luận về các kết quả thu được này. Dữ liệu xếp hạng phim MovieLens 1M. Kết quả đánh giá cho bài toán rating khi so sánh với các mô hình cơ sở. Kết quả đánh giá cho bài toán click-through-rate khi so sánh với các mô hình cơ sở.

V. Ứng Dụng Thực Tế Triển Khai Hệ Thống Khuyến Nghị Transformer

Bài toán Hệ thống gợi ý đã được ứng dụng rộng rãi trong thực tế, tuy nhiên phần lớn các hệ thống dựa trên các thông tin nhân khẩu học hoặc hành vi người dùng trong lịch sử dài hạn, chưa quan tâm tính tuần tự. Hành vi ngắn hạn thường liên hệ tốt với nhau hơn là các hành vi ở thời điểm xa nhau. Ngày nay, trong nghiên cứu khoa học về việc khai thác đặc tính tuần tự ứng dụng học sâu (deep learning) là rất phổ biến nhờ sự ra đời của những kiến trúc mô hình có khả năng giải quyết các dữ liệu dạng chuỗi tuần tự như mô hình dạng RNN, cơ chế Self-Attention, kiến trúc Transformer đã đạt được những cột mốc đáng nhớ trong lĩnh vực Xử lý ngôn ngữ tự nhiên (NLP).

5.1. Ứng Dụng trong Thương Mại Điện Tử Phim Ảnh

Ứng dụng hệ thống gợi ý tuần tự trong thực tế mang lại hiệu quả cao trong khả năng đưa ra các khuyến nghị. Cụ thể, hệ thống giúp tăng doanh thu cho doanh nghiệp, nắm bắt xu hướng và đưa ra chương trình khuyến mãi phù hợp, gia tăng sự hài lòng và lòng trung thành của khách hàng. Người tiêu dùng dễ dàng lựa chọn sản phẩm thích hợp, tiết kiệm thời gian mua sắm.

5.2. Triển Vọng Phát Triển trong Tương Lai

Tổng kết và đề xuất các giải pháp triển khai ứng dụng thực tế và hướng mở rộng để nghiên cứu trong tương lai. Phần cuối cùng, Kết luận là tổng hợp các kết quả có được từ quá trình thực hiện luận văn từ nghiên cứu và xây dựng giả thuyết, triển khai thực nghiệm. Phần này cũng trình bày những hạn chế và vấn đề tồn đọng, đề xuất khả năng mở rộng, các giải pháp cải tiến bổ sung và tổng kết luận văn.

VI. Kết Luận Hệ Thống Khuyến Nghị Tuần Tự Bước Tiến Khoa Học

Luận văn tổng hợp kết quả nghiên cứu, xây dựng giả thuyết, triển khai thực nghiệm. Trình bày hạn chế, vấn đề tồn đọng. Đề xuất khả năng mở rộng, giải pháp cải tiến. Những khó khăn và thách thức gặp phải trong quá trình thực hiện đề tài bao gồm những điểm sau: Mỗi lĩnh vực khác nhau sẽ có những loại dữ liệu và đặc điểm khác nhau. Do đó việc lựa chọn thuộc tính, dữ liệu sử dụng cần có kiến thức ngành liên quan phù hợp. Nhiều cách đánh giá khác nhau cho bài toán gợi ý. Thực tế có nhiều nhiệm vụ cần giải quyết cho bài toán gợi ý do đó dẫn tới ở mỗi nhiệm vụ sẽ có các phương pháp đánh giá phù hợp khác nhau.

6.1. Tổng Kết và Đánh Giá Toàn Diện

Phần cuối cùng, Kết luận là tổng hợp các kết quả có được từ quá trình thực hiện luận văn từ nghiên cứu và xây dựng giả thuyết, triển khai thực nghiệm. Phần này cũng trình bày những hạn chế và vấn đề tồn đọng, đề xuất khả năng mở rộng, các giải pháp cải tiến bổ sung và tổng kết luận văn.

6.2. Hướng Nghiên Cứu và Phát Triển Tiếp Theo

Thời gian thực hiện đề tài có hạn do đó phạm vi của đề tài sẽ được giới hạn lại cho phù hợp, chưa thể thực hiện các phần liên quan để thành một ứng dụng gợi ý hoàn chỉnh hay thực nghiệm kết hợp với các giải pháp nghiên cứu khác. Tổng kết và đề xuất các giải pháp triển khai ứng dụng thực tế và hướng mở rộng để nghiên cứu trong tương lai.

16/05/2025

Bạn đang xem trước tài liệu:

Luận văn thạc sĩ khoa học máy tính xây dựng hệ thống khuyến nghị tuần tự dựa trên kiến trúc transformer

Tải đầy đủ

Nội dung chính

Tổng quan nghiên cứu

Trong bối cảnh phát triển mạnh mẽ của thương mại điện tử và các nền tảng số, hệ thống khuyến nghị đóng vai trò quan trọng trong việc cá nhân hóa trải nghiệm người dùng. Theo ước tính, tập dữ liệu MovieLens 1M với hơn 3,5 triệu đánh giá từ 6.040 người dùng cho 3.706 bộ phim đã được sử dụng rộng rãi trong nghiên cứu về hệ thống gợi ý. Tuy nhiên, các hệ thống khuyến nghị truyền thống thường dựa trên thông tin nhân khẩu học và lịch sử tương tác dài hạn, chưa khai thác hiệu quả tính tuần tự trong hành vi người dùng. Điều này dẫn đến việc gợi ý không phản ánh đúng nhu cầu ngắn hạn và thay đổi theo thời gian của người dùng.

Mục tiêu của luận văn là xây dựng một hệ thống khuyến nghị tuần tự dựa trên kiến trúc Transformer, tận dụng khả năng xử lý chuỗi tuần tự và kết hợp các thuộc tính bổ sung của người dùng và sản phẩm để nâng cao độ chính xác của gợi ý. Phạm vi nghiên cứu tập trung vào dữ liệu MovieLens 1M, thực hiện trong khoảng thời gian từ tháng 2 đến tháng 6 năm 2022 tại Trường Đại học Bách Khoa, ĐHQG TP.HCM. Nghiên cứu có ý nghĩa thực tiễn lớn trong việc cải thiện trải nghiệm người dùng, tăng doanh thu cho doanh nghiệp và nâng cao hiệu quả các chiến dịch marketing cá nhân hóa.

Cơ sở lý thuyết và phương pháp nghiên cứu

Khung lý thuyết áp dụng

Luận văn dựa trên các lý thuyết và mô hình sau:

Bài toán gợi ý tuần tự (Sequential Recommendation): Tập trung vào việc dự đoán hành vi tiếp theo của người dùng dựa trên chuỗi tương tác theo thời gian, phân loại thành các nhánh như dựa trên kinh nghiệm, giao dịch và tương tác.
Cơ chế Self-Attention: Là thành phần cốt lõi trong kiến trúc Transformer, cho phép mô hình tập trung vào các phần quan trọng trong chuỗi dữ liệu đầu vào bằng cách tính trọng số attention giữa các phần tử.
Kiến trúc Transformer: Sử dụng cơ chế Multi-Head Self-Attention để học các mối quan hệ phức tạp trong chuỗi tuần tự, cho phép xử lý song song và học được các đặc trưng dài hạn và ngắn hạn.
Mô hình SASREC, BERT4REC và BST: Các mô hình học sâu ứng dụng cơ chế Self-Attention và Transformer trong bài toán gợi ý tuần tự, trong đó BST còn kết hợp các thuộc tính bổ sung của người dùng và sản phẩm để nâng cao hiệu quả.

Các khái niệm chính bao gồm: chuỗi tuần tự tương tác, embedding layer, multi-head self-attention, fully-connected layer, và các hàm loss phù hợp với bài toán hồi quy (RMSE, MAE) và phân loại (Accuracy, AUC).

Phương pháp nghiên cứu

Nguồn dữ liệu: Sử dụng tập dữ liệu MovieLens 1M với 3.582.313 đánh giá từ 6.040 người dùng cho 3.706 bộ phim, dữ liệu bao gồm thông tin nhân khẩu học người dùng và đặc điểm phim.
Phương pháp tiền xử lý: Chuyển đổi dữ liệu đánh giá thành chuỗi tuần tự dựa trên timestamp, xác định độ dài chuỗi (sequence_length = 4) và bước nhảy (step_size = 1), kết hợp các thuộc tính bổ sung của người dùng và phim.
Phương pháp phân tích: Xây dựng kiến trúc mô hình dựa trên Transformer với các tầng embedding, multi-head self-attention, và fully-connected layers. Thực hiện huấn luyện mô hình với các siêu tham số như số đầu attention (2), số tầng ẩn (3), kích thước tầng ẩn ([1024, 512, 256]), dropout rate (0.2), learning rate (0.01), batch size (128), và số epoch (40).
Timeline nghiên cứu: Nghiên cứu và xây dựng mô hình từ tháng 2 đến tháng 6 năm 2022, chia dữ liệu thành tập huấn luyện (80%) và kiểm thử (20%), trong đó tập huấn luyện được chia tiếp thành tập huấn luyện chính và tập thẩm định (80/20).
Phương pháp đánh giá: Sử dụng RMSE và MAE cho bài toán xếp hạng (rating), Accuracy và AUC cho bài toán phân loại khả năng nhấp chuột (click-through-rate).

Kết quả nghiên cứu và thảo luận

Những phát hiện chính

Hiệu quả mô hình đề xuất trên bài toán rating: Mô hình Transformer đề xuất kết hợp các thuộc tính bổ sung của người dùng và phim đạt RMSE thấp hơn khoảng 6% so với mô hình cơ sở SASREC, cho thấy khả năng dự đoán chính xác hơn về điểm đánh giá của người dùng.
Hiệu quả trên bài toán click-through-rate: Mô hình đề xuất đạt Accuracy và AUC cao hơn từ 5-7% so với mô hình BST, chứng tỏ khả năng phân loại chính xác hơn về việc người dùng có nhấp chuột vào sản phẩm hay không.
Tốc độ huấn luyện: Nhờ kiến trúc Transformer và cơ chế Multi-Head Self-Attention, mô hình đề xuất có tốc độ huấn luyện nhanh hơn 15 lần so với các mô hình RNN truyền thống như GRU4REC, giúp tiết kiệm thời gian và tài nguyên tính toán.
Khả năng kết hợp thuộc tính: Việc bổ sung các thuộc tính nhân khẩu học và đặc điểm phim vào chuỗi tuần tự giúp mô hình học được cả đặc điểm dài hạn và ngắn hạn của người dùng, nâng cao chất lượng gợi ý.

Thảo luận kết quả

Nguyên nhân của các kết quả tích cực trên là do kiến trúc Transformer cho phép mô hình học được các mối quan hệ phức tạp trong chuỗi tuần tự, đồng thời cơ chế Multi-Head Self-Attention giúp chú ý đến nhiều khía cạnh khác nhau của dữ liệu. So với các nghiên cứu trước đây như SASREC và BST, mô hình đề xuất đã cải tiến bằng cách tích hợp sâu hơn các thuộc tính bổ sung của sản phẩm vào chuỗi tuần tự, thay vì chỉ xem như dữ liệu ngoài mô hình.

Kết quả này phù hợp với xu hướng ứng dụng học sâu trong bài toán gợi ý tuần tự trên thế giới từ năm 2016 đến nay, khi các mô hình Transformer và BERT4REC đã đạt được nhiều thành tựu. Việc cải thiện độ chính xác và tốc độ huấn luyện có ý nghĩa lớn trong thực tế, giúp các doanh nghiệp thương mại điện tử nâng cao trải nghiệm người dùng và tăng doanh thu.

Dữ liệu có thể được trình bày qua các biểu đồ so sánh RMSE, MAE, Accuracy và AUC giữa mô hình đề xuất và các mô hình cơ sở, cũng như bảng thống kê thời gian huấn luyện để minh họa hiệu quả về mặt hiệu suất.

Đề xuất và khuyến nghị

Triển khai hệ thống khuyến nghị tuần tự dựa trên Transformer trong các nền tảng thương mại điện tử: Tập trung vào việc tích hợp dữ liệu tương tác ngắn hạn và thuộc tính người dùng để nâng cao độ chính xác gợi ý, hướng tới tăng tỷ lệ chuyển đổi mua hàng trong vòng 6-12 tháng.
Phát triển công cụ tiền xử lý dữ liệu tự động: Tự động hóa quá trình chuyển đổi dữ liệu tương tác thành chuỗi tuần tự và kết hợp các thuộc tính bổ sung, giúp giảm thời gian chuẩn bị dữ liệu và tăng tính chính xác, thực hiện trong 3-6 tháng bởi bộ phận kỹ thuật dữ liệu.
Tối ưu hóa mô hình và siêu tham số: Thường xuyên tinh chỉnh các siêu tham số như số đầu attention, số tầng ẩn, dropout rate để phù hợp với từng loại dữ liệu và mục tiêu kinh doanh, thực hiện định kỳ hàng quý.
Mở rộng nghiên cứu kết hợp đa nguồn dữ liệu: Kết hợp thêm dữ liệu từ mạng xã hội, lịch sử tìm kiếm, và các kênh tương tác khác để nâng cao khả năng dự đoán hành vi người dùng, triển khai thử nghiệm trong 12-18 tháng tiếp theo.

Đối tượng nên tham khảo luận văn

Nhà nghiên cứu và sinh viên ngành Khoa học Máy tính: Có thể áp dụng kiến thức về Transformer và Self-Attention trong các bài toán xử lý chuỗi tuần tự và học sâu.
Chuyên gia phát triển hệ thống khuyến nghị: Tham khảo mô hình và phương pháp tiền xử lý dữ liệu để cải tiến hệ thống gợi ý cá nhân hóa, đặc biệt trong lĩnh vực thương mại điện tử.
Doanh nghiệp thương mại điện tử và marketing: Áp dụng giải pháp để nâng cao hiệu quả các chiến dịch quảng cáo cá nhân hóa và tăng doanh thu thông qua gợi ý sản phẩm chính xác hơn.
Chuyên viên phân tích dữ liệu và kỹ sư dữ liệu: Học hỏi quy trình tiền xử lý và xây dựng bộ dữ liệu tuần tự từ dữ liệu tương tác thực tế, phục vụ cho các dự án phân tích và mô hình hóa hành vi người dùng.

Câu hỏi thường gặp

Hệ thống khuyến nghị tuần tự khác gì so với hệ thống truyền thống?
Hệ thống tuần tự khai thác tính thứ tự và mối liên hệ giữa các hành vi gần nhau trong chuỗi tương tác, trong khi hệ thống truyền thống thường dựa trên sở thích tĩnh và thông tin nhân khẩu học, không xét đến thứ tự thời gian.
Tại sao chọn kiến trúc Transformer cho bài toán này?
Transformer với cơ chế Multi-Head Self-Attention cho phép xử lý song song, học được các mối quan hệ dài hạn và ngắn hạn trong chuỗi dữ liệu, vượt trội hơn các mô hình RNN truyền thống về hiệu quả và tốc độ.
Dữ liệu MovieLens 1M có đặc điểm gì nổi bật?
Tập dữ liệu này có hơn 3,5 triệu đánh giá từ hơn 6.000 người dùng cho gần 4.000 phim, thuộc loại dữ liệu thưa (khoảng 16% đánh giá so với kỳ vọng), bao gồm cả thông tin nhân khẩu học và đặc điểm phim, phù hợp cho nghiên cứu gợi ý tuần tự.
Các phương pháp đánh giá nào được sử dụng?
Bài toán xếp hạng sử dụng RMSE và MAE để đo sai số dự đoán, bài toán phân loại khả năng nhấp chuột sử dụng Accuracy và AUC để đánh giá độ chính xác và hiệu quả phân loại.
Làm thế nào để tránh hiện tượng quá khớp trong mô hình?
Sử dụng kỹ thuật dropout với tỷ lệ 0.2, chia dữ liệu thành tập huấn luyện và thẩm định để dừng huấn luyện kịp thời, đồng thời tinh chỉnh siêu tham số để cân bằng giữa độ phức tạp và khả năng tổng quát hóa.

Kết luận

Luận văn đã xây dựng thành công hệ thống khuyến nghị tuần tự dựa trên kiến trúc Transformer, kết hợp hiệu quả các thuộc tính bổ sung của người dùng và sản phẩm.
Mô hình đề xuất vượt trội hơn các mô hình cơ sở về độ chính xác dự đoán và tốc độ huấn luyện trên tập dữ liệu MovieLens 1M.
Phương pháp tiền xử lý dữ liệu tuần tự và thiết kế kiến trúc mô hình phù hợp giúp khai thác tốt đặc tính tuần tự trong hành vi người dùng.
Hướng phát triển tiếp theo bao gồm mở rộng dữ liệu đa nguồn và tối ưu hóa mô hình để ứng dụng thực tế hiệu quả hơn.
Khuyến nghị các doanh nghiệp và nhà nghiên cứu áp dụng mô hình để nâng cao trải nghiệm người dùng và hiệu quả kinh doanh.

Next steps: Triển khai thử nghiệm mô hình trong môi trường thực tế, thu thập phản hồi và điều chỉnh mô hình phù hợp với đặc thù từng ngành hàng. Đẩy mạnh nghiên cứu mở rộng tích hợp dữ liệu đa chiều và phát triển các thuật toán học sâu mới.

Các nhà phát triển hệ thống khuyến nghị và doanh nghiệp thương mại điện tử nên cân nhắc áp dụng kiến trúc Transformer trong các giải pháp gợi ý để nâng cao hiệu quả và tính cá nhân hóa cho người dùng.

Trích đoạn nội dung tài liệu

Chương 1 về sự phổ biến của các ứng dụng cần hệ thống gợi ý tuần tự. Khoảng thời gian từ 2015 trở lại đây cũng là giai đoạn phát triển rực rỡ của Học sâu (Deep learning) đặc biệt là sự ra đời của các kiến trúc mạng phù hợp cho các mô hình dạng tuần tự như mô hình dạng RNN, LSTM, cơ chế Attention, kiến trúc Transformer được ứng dụng phổ biến trong các nghiên cứu thuộc lĩnh vực NLP nhờ khả năng xử lý tốt các bài toán có thể biểu diễn dạng một chuỗi tuần tự. Trong quãng thời gian này, kế thừa những thành tựu từ các kiến trúc mô hình này thì bên nhánh các bài toán gợi ý tuần tự cũng xuất hiện nhiều những bài báo liên quan dựa trên kiến trúc mô hình deep learning (Hình 2. Bằng việc xem xét và quan sát dữ liệu dưới dạng tuần tự và kế thừa các kiến trúc mô hình hiện đại, bài toán gợi ý tuần tự đã đạt được những kết quả state-of-the-art (SOTA) và được ứng dụng vào các hệ thống gợi ý trong thực tế.5: Tình hình nghiên cứu trên thế giới về bài toán Gợi ý tuần tự.

Vào năm 2016, với mô hình GRU4REC [7] cho bài toán gợi ý tuần tự theo phiên (session-based) đạt được nhiều kết quả khả quan khi là mô hình ứng dụng Recurrent Neural Networks (RNN) đầu tiên áp dụng cho loại bài toán này. Nhờ việc áp dụng kiến trúc mô hình hướng RNN, mô hình có khả năng ghi nhớ đặc điểm của các sản phẩm (item) xuất hiện ngay trước đưa ra dự đoán cho sản phẩm (item) xuất hiện sau mà nó còn có khả năng tránh được vấn đề triệt tiêu đạo hàm (vanishing gradient) nhờ cải tiến của GRU [17]. Mô hình đã đạt kết quả tốt một thời gian dài và thường được sử dụng làm mô hình cơ sở để so sánh trong các công trình sau đó. Tiếp đến, vào năm 2018, bằng việc áp dụng cơ chế Tự chú ý (Self-Attention) [13] lần đầu tiên vào bài toán gợi ý tuần tự này.

SASREC [9] đã đạt được những kết quả cải tiến đáng kể so với các mô hình cơ sở trước đó như GRU4REC ở cả độ chính xác của hệ thống cũng như tốc độ huấn luyện mô hình nhờ khả năng tính toán song song của kiến trúc 10 2. Tình hình nghiên cứu trên thế giới thay vì tuần tự. Với kiến trúc tổng quan có thể xếp chồng nhiều lớp Self-Attention lên nhau, mục tiêu của nhóm tác giả khi thực hiện là đạt kết quả tốt cho cả những tập dữ liệu thưa (sparse dataset - hầu hết người dùng tương tác với ít sản phẩm) và những tập dữ liệu đặc (dense dataset - hầu hết người dùng tương tác với nhiều sản phẩm) bằng cách sử dụng cơ chế Self-Attention cho phép ghi nhớ những mối liên hệ dài hạn (tương tự như trong GRU4REC) phù hợp với dữ liệu đặc và đưa ra dự đoán dựa trên hành động liên quan gần đó (cải tiến so với mô hình Markov Chains - mô hình sử dụng giả định sản phẩm tiếp theo sẽ được quyết định bởi sản phẩm ngay liền trước nó). Sang đến năm 2019, bằng một cải tiến quan trọng với việc áp dụng kiến trúc Trans- former (được phát triển từ cơ chế Self-Attention với nhiều hơn một đầu) và có thể xếp chồng nhiều tầng trong việc xây dựng mô hình, BERT4REC [10] đã đạt được kết quả state-of-the-art khi so sánh với tất cả các mô hình liên quan trước đó.

Việc mô hình có khả năng học hỏi dữ liệu và tính tuần tự của nó theo hai chiều (trái sang phải và phải sang trái) giúp cho mô hình học được nhiều thông tin hơn về mối quan hệ của các dữ liệu đó với nhau. Việc này cũng phù hợp với thực tế khi không nhất thiết tương tác với sản phẩm phải được diễn ra theo thứ tự trước sau, vì cũng có thể sản phẩm phía sau cũng có ảnh hưởng tới sản phẩm phía trước. Ví dụ như việc mua một chiếc iPhone sau đó mua một chiếc ốp lưng thì ngoài việc sản phẩm iPhone đã ảnh hưởng tới sản phẩm ốp lưng (mua ốp lưng để bảo vệ cho iPhone) thì việc mua ốp lưng cũng ảnh hưởng tới sản phẩm iPhone (có iPhone mới mua ốp lưng). Cũng trong năm này, Mô hình BST [11] ở một nhánh khác được áp dụng thực tế trong sàn thương mại điện tử Alibaba ở dạng bài toán Khả năng click chuột vào sản phẩm (click-through-rate) có khả năng làm giàu thuộc tính huấn luyện cho mô hình khi đã tìm ra cách nhúng các thông tin của người dùng và sản phẩm làm đầu vào của mô hình đồng thời kết hợp với việc sử dụng kiến trúc Transformer ở phần lõi giúp cho mô hình có khả năng học được cả từ các thuộc tính dài hạn lẫn các thuộc tính ngắn hạn khi sử dụng cả những thuộc tính về người dùng và sản phẩm cũng như tính tuần tự của tương tác giữa người dùng và sản phẩm vào trong kiến trúc của mô hình.

Cơ chế Self-Attention và mô hình SASREC 2.3 | Cơ chế Self-Attention và mô hình SASREC 2.1 | Cơ chế Self-Attention Cơ chế tập trung (Attention mechanism) ra đời 2015 [16] với đề xuất của Bahdanau trong của bài toán dịch máy (machine translation) mang lại kết quả tốt. Sau đó, vào năm 2017, Vaswani và nhóm tác giả đã công bố bài báo "Attention Is All You Need"[13]. Cả hai bài báo này đã thực sự gây được tiếng vang rất lớn trong cộng đồng các nhà nghiên cứu về các mô hình học máy. Ý tưởng đặc biệt đằng sau cơ chế này là nó có khả năng ghi nhớ, chú ý vào một phần tuỳ ý nào đó của dữ liệu đầu vào.

Nếu như trong phần trước với mô hình hướng RNN, chúng ta dùng mạng hồi tiếp để mã hóa thông tin của chuỗi nguồn đầu vào thành trạng thái ẩn và truyền nó tới bộ giải mã để sinh chuỗi đích. Tuy nhiên kiến trúc dựa trên RNN gặp phải một số vấn đề như tính tuần tự khi huấn luyện khiến có quá trình huấn luyện không thể thực hiện song song hoá hay việc gặp khó khăn đối với những chuỗi dài (đã được khắc phục bằng mô hình GRU, LSTM nhưng thời gian huấn luyện vẫn là vấn đề). Thực vậy, cơ chế tập trung có thể được coi là phép gộp tổng quát. Nó gộp đầu vào dựa trên các trọng số khác nhau.

Thành phần cốt lõi của cơ chế tập trung là tầng tập trung. Đầu vào của tầng tập trung được gọi ngắn gọn là câu truy vấn (query Q). Với mỗi câu truy vấn, tầng tập trung trả về đầu ra dựa trên bộ nhớ là tập các cặp khóa-giá trị (key-value) được mã hóa trong tầng tập trung này. Có nhiều phương pháp và cách thức thực hiện tầng tập trung, tuy nhiên phổ biến đối với các bài toán gợi ý tuần tự được tập trung nghiên cứu nhiều nhất là cơ chế tự chú ý (Self-Attention) (hay còn gọi là Scaled dot-product Attention) được xác định bởi công thức bên dưới: QK T Attention( Q, K, V ) = so f tmax ( √ )V (2.1) dk Trong đó: ■ Q là đại diện biểu diễn cho vector truy vấn; ■ K là đại điện biểu diễn cho vector khoá; ■ V là đại điện biểu diễn cho vector giá trị.

Theo đó, tầng tập trung (Attention(Q,K,V)) được tính bằng tổng có trong số (weighted sum) của tất các giá trị trong V. Với trọng số giữa qi và v j có liên quan tới trọng số giữa qi √ và k j. Phần d được sử dụng để tránh giá trị lớn trong phép toán. Cơ chế Self-Attention và mô hình SASREC Hình 2.6: Minh hoạ các phép tính toán trong cơ chế Self-Attention.

Các bước áp dụng để tính giá trị tập trung attention score trong cơ chế self-attention (Hình 2.6) và cách sử dụng trong việc tính kết quả output được mô tả bao gồm những bước sau như sau: 1. Tính các vector Key, Value, Query của từng vector Input đầu vào. Tính attention score của lần lượt từng input bằng cách tính dot-product của vector Query tương ứng với input đó với tất cả các vector Key: score( Qt , K ) = Qt K (2. Tính attention weight bằng hàm softmax của toàn bộ attention score: weight = so f tmax (score) (2.

Nhân attention weight với vector Value để thu được giá trị có trọng số (weighted value): weightedValue = weight ∗ V (2. Cơ chế Self-Attention và mô hình SASREC 5. Cuối cùng là tính tổng các weighted value để tạo ra vector Output đầu ra: output = ∑ weightedValue (2.2 | Mô hình SASREC Vào năm 2018, cơ chế self-attention được ứng dụng vào bài toán gợi ý tuần tự thông qua mô hình SASREC. Mục tiêu của bài báo này là xây dựng hệ thống khuyến nghị tuần tự áp dụng cơ chế Self-Attention có khả năng đưa ra gợi ý mà hiệu quả đạt được cao hơn so với các công trình nghiên cứu tương tự trước đó.

Không chỉ vậy, nhóm tác giả còn đề xuất cách áp dụng mô hình học sâu mới Self-Attention có khả năng hoạt động tốt trên cả tập dữ liệu đặc (dense) và dữ liệu thưa (sparse).7: Kiến trúc mô hình SASREC (ứng dụng trong bài toán click-through-rate). Với cách dữ liệu được xử lý và chuyển đổi đã trình bày ở phần trước đó, Hình 2. Cơ chế Self-Attention và mô hình SASREC mô tả kiến trúc tổng quan được áp dụng trong mô hình tham khảo SASREC bao gồm các thành phần: ■ Input: dữ liệu đầu vào của quá trình huấn luyện được sử dụng là chuỗi tuần tự bao gồm hành vi tương tác và vị trí của tương tác đó trong chuỗi tuần tự; ■ Embedding Layer: tầng nhúng là tầng kết hợp dữ liệu bằng phép tính Concatenate dữ liệu đầu vào của quá trình huấn luyện được sử dụng là chuỗi tuần tự bao gồm hành vi tương tác và vị trí của tương tác trong chuỗi tuần tự; ■ Self-Attention Layer: bao gồm khối tự chú ý Self-Attention nhận đầu vào từ lớp nhúng và trả thông tin attention score làm đầu vào cho tầng Point-wise Feed-forward. Các lớp này có thể xếp chồng lên nhau trong trường hợp muốn tăng thêm khả năng học của mô hình sâu hơn; ■ Fully-connected Layer: tuỳ vào yêu cầu và đầu ra dữ liệu mà ta thực hiện gắn các lớp đầy đủ và hàm tối ưu tương ứng.

Như trong bài toán click-through-rate đầu ra sẽ là nhãn dữ liệu phân lớp (có hai giá trị là Có-Không), do đó lớp đầy đủ cuối cùng sẽ có size là 1 và hàm tối ưu là hàm sigmoid. Mô hình SASREC [9] đạt kết quả tốt hơn so với tất cả các mô hình theo hướng tương tự trước đó (trong đó có GRU4REC) khi đạt độ cải tiến từ 6.6 % so với các công trình tốt nhất trước đó.

Nội dung được bảo vệ bản quyền — Tải xuống đầy đủ

Chủ đề

Ứng dụng Transformer trong khuyến nghị

Hệ thống khuyến nghị tuần tự nâng cao

Khoa học máy tính và hệ thống khuyến nghị

Kiến trúc Transformer và chuỗi hành vi