I. Giới thiệu về đề tài
Đề tài 'Phân Tích Cảm Xúc Người Dùng Trên Foody' được thực hiện nhằm mục đích phân tích các đánh giá của người dùng về chất lượng đồ ăn trên trang thương mại điện tử Foody. Việc thu thập và phân tích dữ liệu từ các bình luận của người dùng không chỉ giúp các doanh nghiệp hiểu rõ hơn về nhu cầu và tâm lý của khách hàng mà còn tạo ra những trải nghiệm tốt hơn cho người tiêu dùng. Dữ liệu thu thập được từ hơn 40,000 bình luận dạng văn bản kèm theo đánh giá về sản phẩm sẽ được xử lý bằng các kỹ thuật Natural Language Processing (NLP) để phân tích và dự đoán cảm xúc của người dùng. Mục tiêu cuối cùng là đưa ra những giải pháp nhằm thúc đẩy lượng mua hàng trên nền tảng này.
1.1. Lý do chọn đề tài
Việc phân tích cảm xúc của người dùng trên các nền tảng thương mại điện tử như Foody là một vấn đề quan trọng trong bối cảnh hiện nay. Với sự phát triển mạnh mẽ của công nghệ thông tin, việc thu thập và phân tích dữ liệu từ người tiêu dùng trở nên dễ dàng hơn bao giờ hết. Các doanh nghiệp có thể tận dụng thông tin này để cải thiện sản phẩm và dịch vụ của mình. Đặc biệt, Foody là một trong những nền tảng đặt đồ ăn phổ biến tại Việt Nam, nơi mà người dùng thường xuyên để lại những đánh giá và phản hồi về trải nghiệm của họ. Do đó, nghiên cứu này không chỉ có giá trị lý thuyết mà còn mang lại ứng dụng thực tiễn cao.
II. Phương pháp nghiên cứu
Nghiên cứu này sử dụng các phương pháp phân tích dữ liệu hiện đại để xử lý và phân loại các bình luận của người dùng. Đầu tiên, dữ liệu sẽ được thu thập từ các đánh giá trên Foody, sau đó tiến hành tiền xử lý để làm sạch và chuẩn hóa dữ liệu. Các mô hình như PhoBERT, SVM, Naive Bayes, và Hồi quy Logistic sẽ được áp dụng để phân loại cảm xúc của người dùng thành các nhóm tích cực, trung lập và tiêu cực. Việc sử dụng các mô hình học sâu như PhoBERT giúp nâng cao độ chính xác trong việc phân tích cảm xúc, từ đó cung cấp những thông tin giá trị cho các nhà quản lý và doanh nghiệp.
2.1. Thu thập và xử lý dữ liệu
Dữ liệu cho nghiên cứu được thu thập từ các bình luận của người dùng trên Foody. Những bình luận này thường có độ dài khá ngắn và chứa nhiều thông tin giá trị. Tuy nhiên, một số bình luận thiếu điểm đánh giá, điều này tạo ra thách thức trong việc phân loại cảm xúc. Do đó, nghiên cứu sẽ sử dụng các công cụ xử lý ngôn ngữ tự nhiên để làm sạch và phân đoạn văn bản, từ đó tạo ra các vector dữ liệu phù hợp cho việc phân tích. Việc này không chỉ giúp cải thiện chất lượng dữ liệu mà còn tăng cường độ chính xác của các mô hình phân loại.
III. Kết quả và thảo luận
Kết quả phân tích cho thấy rằng các mô hình học máy có thể phân loại cảm xúc của người dùng với độ chính xác cao. Mô hình PhoBERT cho thấy hiệu suất vượt trội so với các mô hình truyền thống như SVM và Naive Bayes. Điều này chứng tỏ rằng việc áp dụng các công nghệ mới trong phân tích dữ liệu có thể mang lại những hiểu biết sâu sắc hơn về hành vi của người tiêu dùng. Các kết quả này không chỉ có giá trị trong việc cải thiện trải nghiệm người dùng trên Foody mà còn có thể được áp dụng cho các nền tảng thương mại điện tử khác.
3.1. Đánh giá mô hình
Các chỉ số đánh giá mô hình như Precision, Recall và F1-Score cho thấy rằng mô hình PhoBERT đạt được kết quả tốt nhất trong việc phân loại cảm xúc. Điều này cho thấy rằng việc sử dụng các mô hình học sâu có thể cải thiện đáng kể khả năng phân tích cảm xúc từ dữ liệu phi cấu trúc. Kết quả này mở ra hướng đi mới cho các nghiên cứu tiếp theo trong lĩnh vực phân tích cảm xúc và khai thác dữ liệu từ các nền tảng thương mại điện tử.