Nhận Dạng và Phân Tích Nhu Cầu Khách Hàng Trên Mạng Xã Hội Tại Trường Đại Học Lạc Hồng

Nghiên cứu nhận dạng và phân tích nhu cầu khách hàng trên mạng xã hội trong luận văn thạc sĩ công nghệ thông tin, cung cấp cái nhìn sâu sắc.

Trường đại học

Trường Đại Học Lạc Hồng

Chuyên ngành

Công nghệ thông tin

Người đăng

Ẩn danh

Thể loại

luận văn thạc sĩ

2022

Phí lưu trữ

30 Point

Mục lục chi tiết

LỜI CAM ĐOAN

LỜI CẢM ƠN

TÓM TẮT

1. CHƯƠNG 1: TỔNG QUAN

1.1. Đặt vấn đề

1.2. Mục tiêu đề tài

1.2.1. Mục tiêu tổng quát

1.2.2. Mục tiêu cụ thể

1.3. Nội dung nghiên cứu

1.4. Phương pháp nghiên cứu

1.5. Đóng góp đề tài

1.6. Cấu trúc của luận văn

2. CHƯƠNG 2: CƠ SỞ LÝ THUYẾT

2.1. Các công trình nghiên cứu liên quan

2.2. Phương pháp máy học Naïve Bayes

2.3. Phương pháp phân lớp Support Vector Machine

2.4. Phương pháp máy học Cây quyết định – Decision Tree

2.5. Mạng học sâu Convolutional Neural Network

2.6. Mô hình BERT

2.7. Phương pháp biểu diễn văn bản

2.7.1. Tiền xử lý dữ liệu văn bản

2.7.2. Phương pháp Bag Of Words (BoW)

2.7.3. Phương pháp Distributional Embedding

2.7.4. Phương pháp Neural Embedding

2.7.5. Phương pháp Embedding từ với Vector Toàn cục (GloVe)

2.8. Kết luận chương 2

3. CHƯƠNG 3: PHƯƠNG PHÁP NGHIÊN CỨU

3.1. Xây dựng dữ liệu

3.1.1. Thu thập dữ liệu

3.2. Mô hình thí nghiệm

3.2.1. Mô hình máy học truyền thống

3.2.2. Mô hình học sâu CNN

3.2.3. Mô hình BERT

3.3. Chi tiết cài đặt

3.4. Kết luận của chương 3

4. CHƯƠNG 4: KẾT QUẢ THÍ NGHIỆM

4.1. Kết quả thí nghiệm

5. CHƯƠNG 5: CHƯƠNG TRÌNH MINH HỌA

5.1. Thiết kế phần ứng dụng

5.2. Chức năng của ứng dụng

5.3. Giao diện của ứng dụng

6. CHƯƠNG 6: KẾT LUẬN VÀ HƯỚNG PHÁT TRIỂN

6.1. Hướng phát triển

DANH MỤC TỪ VIẾT TẮT

DANH MỤC HÌNH ẢNH, BẢNG BIỂU

DANH MỤC BẢNG

Tóm tắt

I. Tổng Quan Nghiên Cứu Nhu Cầu Khách Hàng Mạng Xã Hội

Nghiên cứu nhu cầu khách hàng trên mạng xã hội đang trở thành một yếu tố then chốt cho sự phát triển của doanh nghiệp trong kỷ nguyên số. Sự bùng nổ của internet và các nền tảng mạng xã hội đã tạo ra một lượng lớn dữ liệu về ý kiến, đánh giá và phản hồi của khách hàng. Việc thu thập và phân tích thông tin này một cách hiệu quả giúp doanh nghiệp hiểu rõ hơn về hành vi người dùng mạng xã hội, từ đó cải thiện sản phẩm, dịch vụ và chiến lược marketing. Các công ty, tổ chức dịch vụ khách hàng ngày càng chú trọng đến việc lắng nghe ý kiến phản hồi từ khách hàng trên các nền tảng trực tuyến. Mỗi bình luận, đánh giá đều mang giá trị quan trọng, ảnh hưởng trực tiếp đến sự phát triển và thành công của doanh nghiệp. Do đó, việc phân tích dữ liệu mạng xã hội không chỉ là một xu hướng mà còn là một yêu cầu tất yếu để duy trì tính cạnh tranh và đáp ứng nhu cầu ngày càng cao của thị trường.

1.1. Tầm quan trọng của nghiên cứu thị trường mạng xã hội

Nghiên cứu thị trường mạng xã hội cung cấp cái nhìn sâu sắc về insight khách hàng mạng xã hội, giúp doanh nghiệp nắm bắt được xu hướng tiêu dùng, sở thích và mong muốn của khách hàng. Thông qua việc social listening, doanh nghiệp có thể theo dõi và đánh giá các cuộc trò chuyện, thảo luận liên quan đến thương hiệu, sản phẩm hoặc dịch vụ của mình. Điều này cho phép doanh nghiệp phản ứng kịp thời với các vấn đề phát sinh, cải thiện chất lượng sản phẩm và dịch vụ, đồng thời xây dựng mối quan hệ tốt đẹp với khách hàng. Đại học Lạc Hồng cũng đã có những nghiên cứu sâu sắc về lĩnh vực này, góp phần vào sự phát triển của ngành marketing trên mạng xã hội tại Việt Nam.

1.2. Ứng dụng phân tích nhu cầu khách hàng trong kinh doanh

Việc ứng dụng phân tích nhu cầu khách hàng mang lại nhiều lợi ích thiết thực cho doanh nghiệp. Nó giúp doanh nghiệp xác định phân khúc khách hàng mạng xã hội mục tiêu, từ đó phát triển các chiến dịch marketing phù hợp và hiệu quả hơn. Ngoài ra, phân tích đối thủ cạnh tranh mạng xã hội cũng là một yếu tố quan trọng, giúp doanh nghiệp hiểu rõ vị thế của mình trên thị trường và đưa ra các quyết định chiến lược đúng đắn. Các công cụ phân tích mạng xã hội hiện đại cho phép doanh nghiệp thu thập và xử lý dữ liệu lớn mạng xã hội (big data) một cách nhanh chóng và chính xác, từ đó đưa ra các dự đoán và quyết định dựa trên dữ liệu thực tế.

II. Thách Thức Phân Tích Nhu Cầu Khách Hàng Trực Tuyến

Mặc dù có nhiều tiềm năng, việc phân tích nhu cầu khách hàng trực tuyến cũng đối mặt với không ít thách thức. Một trong những khó khăn lớn nhất là lượng dữ liệu khổng lồ và đa dạng trên mạng xã hội. Việc thu thập, xử lý và phân tích dữ liệu lớn này đòi hỏi các công cụ và kỹ thuật hiện đại, cũng như đội ngũ chuyên gia có kinh nghiệm. Bên cạnh đó, hành vi người dùng trên mạng xã hội thường xuyên thay đổi, đòi hỏi doanh nghiệp phải liên tục cập nhật và điều chỉnh chiến lược của mình. Các yếu tố như ngôn ngữ, văn hóa và bối cảnh cũng có thể ảnh hưởng đến ý kiến và đánh giá của khách hàng, gây khó khăn cho việc sentiment analysis và phân tích cảm xúc.

2.1. Vấn đề xử lý dữ liệu lớn và đa dạng trên mạng xã hội

Việc xử lý dữ liệu lớn từ mạng xã hội đòi hỏi các giải pháp công nghệ mạnh mẽ và khả năng mở rộng linh hoạt. Các công cụ phân tích dữ liệu mạng xã hội cần có khả năng thu thập dữ liệu từ nhiều nguồn khác nhau, xử lý ngôn ngữ tự nhiên (NLP) để hiểu ý nghĩa của văn bản, và áp dụng các thuật toán máy học để phân tích hành vi người dùng. Ngoài ra, việc đảm bảo tính bảo mật và riêng tư của dữ liệu khách hàng cũng là một yếu tố quan trọng cần được xem xét.

2.2. Khó khăn trong việc hiểu ngôn ngữ và văn hóa địa phương

Ngôn ngữ và văn hóa địa phương có thể tạo ra những rào cản trong việc phân tích nhu cầu khách hàng. Các biểu cảm, thành ngữ, và từ ngữ địa phương có thể mang những ý nghĩa khác nhau trong các bối cảnh khác nhau. Do đó, việc sử dụng các công cụ sentiment analysis và phân tích cảm xúc cần được điều chỉnh để phù hợp với từng ngôn ngữ và văn hóa cụ thể. Các nghiên cứu của Đại học Lạc Hồng cũng đã chỉ ra tầm quan trọng của việc hiểu rõ ngôn ngữ và văn hóa địa phương trong marketing trên mạng xã hội.

III. Phương Pháp Phân Tích Nhu Cầu Khách Hàng Hiệu Quả

Để vượt qua những thách thức trên, doanh nghiệp cần áp dụng các phương pháp phân tích nhu cầu khách hàng một cách khoa học và hiệu quả. Một trong những phương pháp phổ biến là social listening, cho phép doanh nghiệp theo dõi và đánh giá các cuộc trò chuyện, thảo luận liên quan đến thương hiệu, sản phẩm hoặc dịch vụ của mình. Ngoài ra, việc sử dụng các công cụ sentiment analysis và phân tích cảm xúc cũng giúp doanh nghiệp hiểu rõ hơn về thái độ và cảm xúc của khách hàng đối với thương hiệu. Các phương pháp này cần được kết hợp với việc phân tích khách hàng mục tiêu và phân khúc khách hàng để đưa ra các quyết định chiến lược đúng đắn.

3.1. Sử dụng công cụ Social Listening để thu thập dữ liệu

Social listening là một phương pháp quan trọng để thu thập dữ liệu về nhu cầu khách hàng. Các công cụ social listening cho phép doanh nghiệp theo dõi các cuộc trò chuyện, thảo luận, và đánh giá trên mạng xã hội liên quan đến thương hiệu, sản phẩm hoặc dịch vụ của mình. Thông qua việc social listening, doanh nghiệp có thể nắm bắt được những vấn đề mà khách hàng quan tâm, những phản hồi tích cực và tiêu cực, và những xu hướng mới nổi trên thị trường. Dữ liệu thu thập được từ social listening có thể được sử dụng để cải thiện sản phẩm, dịch vụ, và chiến lược marketing.

3.2. Áp dụng Sentiment Analysis để đánh giá cảm xúc khách hàng

Sentiment analysis, hay phân tích cảm xúc, là một kỹ thuật sử dụng NLP và máy học để xác định thái độ và cảm xúc của khách hàng đối với một chủ đề cụ thể. Các công cụ sentiment analysis có thể phân loại các bình luận, đánh giá, và bài viết trên mạng xã hội thành các loại cảm xúc khác nhau, như tích cực, tiêu cực, hoặc trung tính. Thông qua việc sentiment analysis, doanh nghiệp có thể hiểu rõ hơn về mức độ hài lòng của khách hàng, những vấn đề gây khó chịu cho khách hàng, và những yếu tố tạo ra sự yêu thích đối với thương hiệu. Dữ liệu từ sentiment analysis có thể được sử dụng để cải thiện trải nghiệm khách hàng và xây dựng mối quan hệ tốt đẹp với khách hàng.

IV. Ứng Dụng Nghiên Cứu Từ Đại Học Lạc Hồng Case Study

Nghiên cứu của Đại học Lạc Hồng về phân tích nhu cầu khách hàng trên mạng xã hội đã mang lại những đóng góp quan trọng cho lĩnh vực này. Các nghiên cứu này đã tập trung vào việc xây dựng các mô hình và thuật toán để phân tích dữ liệu mạng xã hội một cách hiệu quả, cũng như ứng dụng các kết quả nghiên cứu vào thực tiễn kinh doanh. Một case study phân tích nhu cầu khách hàng điển hình là việc áp dụng các mô hình máy học để dự đoán xu hướng mạng xã hội và hành vi người dùng, từ đó giúp doanh nghiệp đưa ra các quyết định marketing chính xác và kịp thời. Các nghiên cứu này cũng đã chỉ ra tầm quan trọng của việc kết hợp các phương pháp phân tích định lượng và phân tích định tính để hiểu rõ hơn về insight khách hàng.

4.1. Xây dựng mô hình phân tích dữ liệu mạng xã hội hiệu quả

Các nghiên cứu của Đại học Lạc Hồng đã tập trung vào việc xây dựng các mô hình phân tích dữ liệu mạng xã hội hiệu quả, sử dụng các thuật toán máy học và NLP tiên tiến. Các mô hình này có khả năng thu thập, xử lý, và phân tích dữ liệu lớn từ mạng xã hội một cách nhanh chóng và chính xác. Ngoài ra, các mô hình này cũng có khả năng dự đoán xu hướng mạng xã hội và hành vi người dùng, giúp doanh nghiệp đưa ra các quyết định marketing chính xác và kịp thời. Các mô hình này đã được thử nghiệm và đánh giá trên nhiều bộ dữ liệu khác nhau, cho thấy hiệu quả và tính ứng dụng cao.

4.2. Ứng dụng kết quả nghiên cứu vào thực tiễn kinh doanh

Các kết quả nghiên cứu của Đại học Lạc Hồng đã được ứng dụng phân tích nhu cầu khách hàng vào thực tiễn kinh doanh, mang lại những lợi ích thiết thực cho doanh nghiệp. Ví dụ, các mô hình phân tích cảm xúc đã được sử dụng để đánh giá mức độ hài lòng của khách hàng đối với sản phẩm và dịch vụ, từ đó giúp doanh nghiệp cải thiện chất lượng và trải nghiệm khách hàng. Ngoài ra, các mô hình dự đoán xu hướng mạng xã hội đã được sử dụng để phát triển các chiến dịch marketing hiệu quả, giúp doanh nghiệp tăng doanh số và xây dựng thương hiệu.

V. Kết Luận và Hướng Phát Triển Nghiên Cứu Tương Lai

Nghiên cứu phân tích nhu cầu khách hàng trên mạng xã hội là một lĩnh vực đầy tiềm năng và đang phát triển mạnh mẽ. Các nghiên cứu của Đại học Lạc Hồng đã đóng góp quan trọng vào sự phát triển của lĩnh vực này, mang lại những kiến thức và công cụ hữu ích cho doanh nghiệp. Trong tương lai, việc nghiên cứu và phát triển các phương pháp phân tích dữ liệu mạng xã hội tiên tiến hơn, cũng như ứng dụng các kết quả nghiên cứu vào thực tiễn kinh doanh, sẽ tiếp tục là một ưu tiên hàng đầu. Các hướng phát triển tiềm năng bao gồm việc sử dụng trí tuệ nhân tạo (AI) để tự động hóa quá trình phân tích nhu cầu khách hàng, cũng như việc kết hợp các nguồn dữ liệu khác nhau để có được cái nhìn toàn diện hơn về hành vi người dùng.

5.1. Tầm quan trọng của việc liên tục cập nhật và cải tiến

Việc liên tục cập nhật và cải tiến các phương pháp phân tích nhu cầu khách hàng là rất quan trọng, do hành vi người dùng trên mạng xã hội thường xuyên thay đổi. Các công cụ và kỹ thuật phân tích dữ liệu mạng xã hội cần được điều chỉnh để phù hợp với những xu hướng mới nổi và những thay đổi trong ngôn ngữ và văn hóa. Ngoài ra, việc liên tục thử nghiệm và đánh giá các phương pháp mới cũng giúp doanh nghiệp tìm ra những giải pháp hiệu quả hơn để hiểu rõ hơn về nhu cầu khách hàng.

5.2. Ứng dụng trí tuệ nhân tạo để tự động hóa phân tích

Việc ứng dụng trí tuệ nhân tạo (AI) để tự động hóa quá trình phân tích nhu cầu khách hàng là một hướng phát triển đầy tiềm năng. Các thuật toán AI có thể được sử dụng để thu thập, xử lý, và phân tích dữ liệu lớn từ mạng xã hội một cách nhanh chóng và chính xác. Ngoài ra, AI cũng có thể được sử dụng để dự đoán xu hướng mạng xã hội và hành vi người dùng, giúp doanh nghiệp đưa ra các quyết định marketing chính xác và kịp thời. Việc sử dụng AI có thể giúp doanh nghiệp tiết kiệm thời gian và chi phí, đồng thời nâng cao hiệu quả của quá trình phân tích nhu cầu khách hàng.

08/06/2025

Bạn đang xem trước tài liệu:

Nhận dạng và phân tích nhu cầu khách hàng trên mạng xã hội luận văn thạc sĩ công nghệ thông tin

Tải đầy đủ

Nội dung chính

Tổng quan nghiên cứu

Trong bối cảnh sự phát triển bùng nổ của internet và mạng xã hội, việc thu thập và phân tích ý kiến khách hàng trên các nền tảng này trở thành một yếu tố quan trọng đối với các doanh nghiệp. Theo ước tính, hơn 10.000 bình luận của khách hàng đã được thu thập từ trang fanpage Facebook của công ty VNPT, phản ánh đa dạng các ý kiến tích cực, tiêu cực và nhu cầu tiềm năng. Vấn đề nghiên cứu tập trung vào việc nhận dạng và phân tích nhu cầu khách hàng trên mạng xã hội nhằm hỗ trợ doanh nghiệp cải tiến sản phẩm, nâng cao chất lượng dịch vụ và giữ chân khách hàng hiệu quả hơn. Mục tiêu cụ thể của nghiên cứu là xây dựng bộ dữ liệu phân tích cảm xúc từ bình luận khách hàng và áp dụng các mô hình máy học, học sâu để phân loại chính xác các phản hồi này. Phạm vi nghiên cứu tập trung vào dữ liệu thu thập trong năm 2022 từ mạng xã hội Facebook tại Việt Nam, đặc biệt là fanpage của VNPT. Ý nghĩa của nghiên cứu được thể hiện qua việc nâng cao độ chính xác phân tích cảm xúc lên đến 95.26% với mô hình BERT, góp phần thúc đẩy hiệu quả kinh doanh và phát triển thị trường thông qua việc hiểu rõ hơn tâm lý và nhu cầu khách hàng.

Cơ sở lý thuyết và phương pháp nghiên cứu

Khung lý thuyết áp dụng

Phân tích cảm xúc (Sentiment Analysis): Là lĩnh vực nghiên cứu trong xử lý ngôn ngữ tự nhiên (NLP) nhằm xác định thái độ, cảm xúc của người dùng qua văn bản. Đây là nền tảng cho việc nhận dạng nhu cầu khách hàng trên mạng xã hội.
Mô hình máy học truyền thống: Bao gồm Naïve Bayes, Support Vector Machine (SVM), và Cây quyết định (Decision Tree). Các mô hình này dựa trên các thuật toán thống kê và phân lớp dữ liệu dựa trên đặc trưng văn bản như n-gram và TF-IDF.
Mạng nơ-ron tích chập (CNN): Mô hình học sâu được áp dụng để trích xuất đặc trưng cục bộ từ văn bản, sử dụng các bộ lọc kích thước khác nhau để phát hiện các mẫu ngữ nghĩa.
Mô hình BERT (Bidirectional Encoder Representations from Transformers): Mô hình ngôn ngữ tiên tiến sử dụng kiến trúc Transformer, biểu diễn từ theo ngữ cảnh hai chiều, giúp nâng cao hiệu quả phân tích cảm xúc với độ chính xác cao nhất.
Các khái niệm chính: Tiền xử lý dữ liệu văn bản, biểu diễn văn bản (Bag of Words, TF-IDF, Word Embedding), ma trận nhầm lẫn, độ chính xác (Accuracy), độ phủ (Recall), và F1-score.

Phương pháp nghiên cứu

Nguồn dữ liệu: Thu thập 10.086 câu bình luận từ fanpage Facebook của VNPT, trong đó 3.055 câu được gán nhãn cảm xúc tích cực, tiêu cực và khách hàng tiềm năng.
Phương pháp phân tích: Tiền xử lý dữ liệu bao gồm làm sạch văn bản, chuẩn hóa từ ngữ, tách từ tiếng Việt. Biểu diễn dữ liệu bằng TF-IDF và các kỹ thuật nhúng từ. Áp dụng các mô hình máy học truyền thống (Naïve Bayes, SVM, Decision Tree), mô hình học sâu CNN và mô hình BERT để phân loại cảm xúc.
Timeline nghiên cứu: Thu thập và gán nhãn dữ liệu trong năm 2022, xây dựng và huấn luyện mô hình trong vòng 6 tháng, đánh giá và so sánh kết quả trong 3 tháng tiếp theo.

Kết quả nghiên cứu và thảo luận

Những phát hiện chính

Mô hình BERT đạt độ chính xác cao nhất với 95.26% và F1-score là 95, vượt trội so với các mô hình truyền thống và CNN.
Mô hình CNN đạt độ chính xác khoảng 90%, trong khi Naïve Bayes và SVM lần lượt đạt khoảng 81% và 85%.
Bộ dữ liệu có sự mất cân bằng với 47.7% bình luận tích cực, 40.9% khách hàng tiềm năng và 11.4% bình luận tiêu cực, yêu cầu các mô hình phải xử lý tốt tình trạng mất cân bằng này.
Ma trận nhầm lẫn cho thấy mô hình BERT có khả năng phân loại chính xác các bình luận tiêu cực, giúp doanh nghiệp kịp thời xử lý phản hồi xấu.

Thảo luận kết quả

Kết quả cho thấy mô hình BERT với khả năng biểu diễn ngữ cảnh hai chiều vượt trội hơn hẳn các mô hình truyền thống và CNN trong việc nhận dạng cảm xúc khách hàng trên mạng xã hội. Nguyên nhân là do BERT có thể hiểu sâu sắc hơn về ngữ nghĩa và mối quan hệ giữa các từ trong câu, đặc biệt trong ngôn ngữ tiếng Việt có cấu trúc phức tạp. So sánh với các nghiên cứu trước đây, kết quả này phù hợp với xu hướng ứng dụng mô hình Transformer trong NLP. Việc xử lý mất cân bằng dữ liệu cũng góp phần nâng cao hiệu quả phân loại, giúp doanh nghiệp có cái nhìn chính xác hơn về tâm lý khách hàng. Dữ liệu có thể được trình bày qua biểu đồ so sánh độ chính xác của các mô hình và ma trận nhầm lẫn minh họa khả năng phân loại từng nhãn cảm xúc.

Đề xuất và khuyến nghị

Triển khai mô hình BERT vào hệ thống chăm sóc khách hàng: Tự động phân loại và phản hồi các bình luận trên mạng xã hội, nâng cao độ chính xác phân loại lên trên 95%, thực hiện trong vòng 6 tháng, do bộ phận IT và marketing phối hợp thực hiện.
Tăng cường thu thập và làm sạch dữ liệu: Mở rộng nguồn dữ liệu từ các nền tảng mạng xã hội khác như Zalo, TikTok để đa dạng hóa dữ liệu, cải thiện độ bao phủ, hoàn thành trong 12 tháng.
Đào tạo nhân viên sử dụng công cụ phân tích: Tổ chức các khóa đào tạo về công nghệ phân tích cảm xúc và khai thác dữ liệu cho đội ngũ chăm sóc khách hàng, nâng cao hiệu quả xử lý phản hồi, trong vòng 3 tháng.
Phát triển ứng dụng web minh họa: Xây dựng ứng dụng cho phép người dùng nhập bình luận và nhận kết quả phân tích cảm xúc trực tiếp, hỗ trợ marketing và nghiên cứu thị trường, hoàn thành trong 4 tháng.
Theo dõi và cập nhật mô hình định kỳ: Đánh giá hiệu quả mô hình hàng quý, cập nhật dữ liệu và tinh chỉnh mô hình để duy trì độ chính xác cao, do phòng nghiên cứu và phát triển đảm nhiệm.

Đối tượng nên tham khảo luận văn

Doanh nghiệp viễn thông và dịch vụ: Có thể ứng dụng kết quả để nâng cao chất lượng chăm sóc khách hàng, cải tiến sản phẩm dựa trên phản hồi thực tế.
Nhà nghiên cứu và sinh viên ngành Công nghệ Thông tin, NLP: Tham khảo phương pháp xây dựng bộ dữ liệu, áp dụng mô hình máy học và học sâu trong phân tích cảm xúc tiếng Việt.
Chuyên gia marketing và quản lý thương hiệu: Sử dụng công cụ phân tích cảm xúc để đánh giá hiệu quả chiến dịch quảng bá và phản hồi khách hàng trên mạng xã hội.
Phát triển phần mềm và ứng dụng AI: Áp dụng mô hình BERT và CNN để xây dựng các giải pháp tự động phân tích và xử lý dữ liệu ngôn ngữ tự nhiên trong thực tế.

Câu hỏi thường gặp

Phân tích cảm xúc là gì và tại sao quan trọng?
Phân tích cảm xúc là quá trình xác định thái độ, cảm xúc của người dùng qua văn bản. Nó giúp doanh nghiệp hiểu rõ nhu cầu, tâm lý khách hàng để cải tiến sản phẩm và dịch vụ.
Tại sao chọn mô hình BERT cho bài toán này?
BERT biểu diễn từ theo ngữ cảnh hai chiều, giúp hiểu sâu sắc hơn về ý nghĩa câu, nâng cao độ chính xác phân loại cảm xúc lên đến 95.26%, vượt trội so với các mô hình khác.
Bộ dữ liệu được thu thập như thế nào?
Dữ liệu gồm hơn 10.000 câu bình luận từ fanpage Facebook của VNPT, được lọc và gán nhãn thành 3 nhóm: tích cực, tiêu cực và khách hàng tiềm năng.
Làm thế nào để xử lý dữ liệu mất cân bằng?
Sử dụng kỹ thuật tiền xử lý và điều chỉnh mô hình để cân bằng tỷ lệ các nhãn, giúp mô hình không bị thiên lệch và phân loại chính xác hơn.
Ứng dụng thực tế của nghiên cứu này là gì?
Doanh nghiệp có thể tự động phân loại phản hồi khách hàng trên mạng xã hội, nâng cao chất lượng dịch vụ, giảm chi phí nhân lực và tăng hiệu quả kinh doanh.

Kết luận

Đã xây dựng thành công bộ dữ liệu gồm 3.055 câu bình luận được gán nhãn cảm xúc từ mạng xã hội Facebook của VNPT.
So sánh hiệu quả các mô hình máy học truyền thống, học sâu CNN và mô hình BERT cho thấy BERT đạt độ chính xác cao nhất 95.26%.
Nghiên cứu góp phần nâng cao khả năng nhận dạng và phân tích nhu cầu khách hàng trên mạng xã hội, hỗ trợ doanh nghiệp cải tiến sản phẩm và dịch vụ.
Đề xuất triển khai ứng dụng mô hình BERT trong hệ thống chăm sóc khách hàng và phát triển ứng dụng web minh họa.
Các bước tiếp theo bao gồm mở rộng dữ liệu, đào tạo nhân sự và cập nhật mô hình định kỳ để duy trì hiệu quả phân tích.

Hãy áp dụng các giải pháp đề xuất để nâng cao hiệu quả quản lý phản hồi khách hàng và phát triển bền vững doanh nghiệp trong thời đại số.

Trích đoạn nội dung tài liệu

Mở đầu. Trình bày lý do chọn đề tài, mục tiêu, đối tượng và phạm vi nghiên cứu của đề tài. Chương 2 - Cơ sở lý thuyết. Phân tích và đánh giá các hướng nghiên cứu liên quan đến luận văn của nhóm tác giả trong và ngoài nước liên quan đến bài toán.

Trình bày nội dung lý thuyết của những phương pháp máy học truyền thống Support Vector Machine, Cây quyết định – Decision Tree , Naïve Bayes và các phương pháp học sâu như CNN, mô hình BERT. Chương 3 – Phương pháp thử nghiệm. Trình bày quy trình xây dựng bộ dữu liệu và mô hình cho bài toán phân loại cảm xúc dựa trên phương pháp máy học, học sâu. Chương 4 - Thí nghiệm và kết quả.

Trình bày các công đoạn tiền xử lý ngữ liệu, đưa ra các thông số cho ngữ liệu mà học viên đã cài đặt, kết quả thí nghiệm Chương 5 – Xây dựng ứng dụng web minh họa với ngôn ngữ lập trình Python 5 Chương 6 - Kết luận và hướng phát triển. Cuối cùng, luận văn trình bày các kết quả quan trọng trong đề tài mà học viên đã nghiên cứu và thực hiện, đưa ra các hướng phát triển của đề tài. 6 CHƯƠNG 2: CƠ SỞ LÝ THUYẾT Trong chương này, học viên sẽ trình bày tổng quan các kiến thức liên quan đến các mô hình máy học truyền thống, mô hình mạng nhận tạo và mô hình học sâu mạng tích chập (Convolutional Neural Network) và mô hình BERT. Cụ thể hơn là trình bày các công trình nghiên cứu liên quan đến bài toán phân tích cảm xúc, các kiến thức tổng quan về mô hình mạng nơron, đặc điểm mạng nơron, và hoạt động của mạng nơron.

Từ những kiến thức nền tảng này sẽ đi đến việc trình bày chi tiết về mô hình mạng tích chập (Convolutional Neural Networks) được áp dụng chính trong các bài toán thị giác máy tính hiện nay và được áp dụng trong luận văn này.1 Các công trình nghiên cứu liên quan Phân tích ý kiến - Sentiment Analysis là một lĩnh vực nghiên cứu hấp dẫn và đang thu hút cộng đồng nghiên cứu Xử lý Ngôn ngữ Tự nhiên (NLP). Do đó, lĩnh vực này trở thành lĩnh vực nghiên cứu sôi nổi vì một số nguyên nhân sau : (1) Bài toán này có nhiều ứng dụng trong hầu hết các lĩnh vực, đặc biệt trong các ứng dụng thương mại điện tử. (2) Phân tích cảm xúc đặt ra nhiều thách thức. Nhiều vấn đề liên quan đến chúng chưa được nghiên cứu trước đó do sự phổ biến chưa cao.

Ngày nay, với sự quan tâm ngày càng nhiều thì các vấn đề đang dần được giải quyết tốt hơn. (3) Sự phát triển mạnh mẽ của truyền thông xã hội, đặc biệt các dữ liệu chứa thông tin quan điểm trên nền tảng Web và các mạng xã hội rất hữu ích để giải quyết các vấn đề liên quan đến các lĩnh vực kinh tế, xã hội, giáo dục, phát triển con người. Do đó, bài toán này đã được tập trung nghiên cứu trong và ngoài nước như sau: - Trong công trình của tác giả Ilham Esa Tiffani, “Optimization of Naïve Bayes Classifier By Implemented Unigram, Bigram, Trigram for Sentiment Analysis of Hotel Review”, 2020 [1] đã trình bày phương pháp tối ưu hóa bộ phân loại văn bản Naïve Bayes bằng cách sử dụng các đặc trưng N-gram, cụ thể là Unigram, Bigram, Trigram trên tập dữ liệu đánh giá khách sạn OpinRank (bằng tiếng Anh). Bộ dữ liệu gồm 1000 đánh giá, trong đó 500 đánh giá được gán nhãn tích cực và 500 đánh giá được gán nhãn tiêu cực.

Kết quả thử nghiệm, thuật toán Naïve Bayes áp dụng cho Unigram có độ chính xác 81,30%, áp dụng cho Bigram với độ chính xác 71,60% và với Trigram là 71,90% - Thử nghiệm và so sánh các giải thuật máy học phổ biến cho bài toán phân loại cảm xúc nhiều lớp được trình bày trong “Multi-class sentiment classification: The 7 experimental comparisons of feature selection and machine learning algorithms” Expert Systems with Applications, 80 (2017), pp. 323-339 [2] của nhóm tác giả Liu Y. Nhóm tác giả đã kết hợp 4 giải thuật trích chọn đặc trưng văn bản là Document frequency (DF), CHI statistics (CHI), Information gain (IG), Gain ratio (GR) với 5 giải thuật máy học phổ biến Decision tree (DT), Naïve bayes (NB), Support vector machine (SVM), Radial basis function neural network (RBFNN). Kết quả được trình bày và so sánh về độ chính xác và thời gian chạy của các loại thuật toán - Trong nghiên cứu của nhóm tác giả Pavel, M.

Toxic Comment Classification Implementing CNN Combining Word Embedding Technique [3] , kết hợp mạng học sâu CNN và kỹ thuật nhúng từ (word embedding) để phân loại các bình luận độc hại trên trang thảo luận của Wikipedia. Kết quả đạt được với độ chính xác 98.05% - Tác giả Yang và cộng sự [4] nghiên cứu mô hình mạng Capsule Network cho bài toán phân loại văn bản – đây là một mô hình cải tiến của mô hình mạng tích chập CNN cho các bài toán xử lý ảnh và đã được nghiên cứu cho các bài toán phân loại văn bản và cho kết quả tương đối khả quan. Tương tự như vậy, tác giả Wang và các cộng sự [5] cũng áp dụng ý tưởng tương tự nhưng dựa trên mô hình mạng LSTM kết hợp với Capsule và thử nghiệm trên các bài toán khác nhau cho kết quả vượt trội với các công trình nghiên cứu trước đây Còn đối các nghiên cứu trong nước thì bài toán phân tích ý kiến bắt đầu gây chú ý tới giới nghiên cứu Xử lý Ngôn ngữ Tự nhiên và Khai thác Dữ liệu (Data Mining) trong những năm gần đây. Các nghiên cứu chủ yếu đang tập trung vào các đánh giá các sản phẩm như thiết bị di động, máy tính, laptop và đánh giá chất lượng dịch vụ khách sạn.

- Phương pháp nghiên cứu phân tích cảm xúc cho những ngôn ngữ ít tài nguyên phục vụ cho nghiên cứu (Bach, Ngo Xuan and Phuong, Tu Minh, “Leveraging User Ratings for Resource-poor Sentiment Classification”, 2015) [6]. Nghiên cứu này tập trung vào phân tích cảm xúc dựa trên những mô hình học không giám sát, bán giám sát kết hợp với thông tin điểm đánh giá (rating score). Dữ liệu nghiên cứu tập trung trên hai ngôn ngữ tiếng Việt và tiếng Nhật, một lượng nhỏ được gán nhãn và một lượng lớn chưa được gán nhãn. Một số kết quả đạt được: (1) Nghiên cứu trên mô hình học không giám sát đạt độ chính xác 70% cho cả tiếng Nhật và tiếng Việt; 8 (2) Mô hình học bán giám sát tốt hơn, đạt độ chính xác tăng từ 1.7% (giảm tỉ lệ lỗi từ 6.

- Tác giả Duc,Hong-Pham và cộng sự trình bày trong “Exploring the Effect of Word Embeddings and Bag-of-Words for Vietnamese Sentiment Analysis” [7] nghiên cứu các phương pháp biểu diễn từ (word embedding) dựa trên các mô hình học sâu CNN, LSTM trên bài toán phân tích cảm xúc. Bộ dữ liệu thử nghiệm được xây dựng 4009 câu bình luận thực tế trong miền dữ liệu của các sản phẩm điện thoại di động. - Nhóm tác giả Duong, Huu-Thanh, Tram-Anh Nguyen-Thi, and Vinh Truong Hoang. "Vietnamese Sentiment Analysis under Limited Training Data Based on Deep Neural Networks.

[8] Trình bày các thử nghiệm và đánh giá của các phương pháp máy học khác nhau trên các bộ dữ liệu thiếu mẫu huấn luyện bằng cách sử dụng kỹ thuật tiền xử lý để tạo ra dữ liệu mới. Các kỹ thuật tăng cường dữ liệu khác nhau như là thay thế từ vựng, dịch máy, chuyển cú pháp và sử dụng nhúng từ giúp tăng độ chính xác của các mô hình học máy cho lĩnh vực phân tích cảm xúc - Mô hình PhoBERT được đánh giá là cho kết quả cao nhất cho bài toán phân tích cảm xúc tiếng việt khi so sánh và thử nghiệm trong [9] “Stock article title sentiment- based classification using PhoBERT” của tác giả Tung, Nguyen Son và cộng sự. Các mô hình máy học PhoBERT, SVM, Logistic Regression, LSTM, Random Forest và Naive Bayes được thử nghiệm trên bộ dữ liệu là các tiêu đề của bài viết về chứng khoán được thu thập trên CafeF. Kết quả thử nghiệm được công bố với sự vượt trội của PhoBERT với các chỉ số Accuracy : 93.2 Phương pháp máy học Naïve Bayes Naïve Bayes là thuật toán đơn giản, được xếp vào kinh điển dùng để giải quyết các bài toán liên quan đến phân lớp dữ liệu dựa vào phương pháp thống kê.

Từ khoảng những năm đầu thập niên 60, các nhà khoa học đã dùng Naïve Bayes để giải quyết các bài toán liên quan đến phân loại câu [13]. Với các điều kiện giả định độc lập nắm vai trò chủ đạo thì Naïve Bayes đưa kết luận nhanh hơn các mô hình hồi quy logistic (Logistic Regression Model [14]). Nhược điểm chính của Naïve Bayes là không thể tìm ra được sự tương tác giữa các đặc trưng. 9 Bộ phân lớp Naïve Bayes được xây dựng trên nền tảng công thức toán học xác suất thống kê cùng tên.

Giả sử ta đưa dữ liệu d và phân lớp c vào công thức Naïve Bayes, ta được như sau: Bài toán đặt ra là với đầu vào là một câu d bất kỳ thì mô hình sẽ xác định phân lớp c nào phù hợp. Ta có công thức tính xác suất phân lớp c của câu d: Với cMAP là xác suất phân lớp c có thể xảy ra với câu d. Tùy vào đặc trưng được sử dụng mà d được phân rã thành các đơn vị nhỏ hơn xn. Trong phạm vi đề tài này, học viên sử dụng đặc trưng là unigram, bigram, trigram (Bag of Words).

Giả sử với đặc trưng unigram thì x sẽ là các âm tiết đơn lẻ được phân rã ra từ câu d, vị trí các từ x này là độc lập với nhau. Ta có công thức phân lớp câu Naïve Bayes hoàn chỉnh như sau: Với c là phân lớp tích cực, tiêu cực hay tiềm năng. J là vị trí của từ x trong câu đang xét. Đối với một từ xn xuất hiện từ bộ test, thuộc lớp c nhưng không xuất hiện trong bộ dữ liệu huấn luyện thì xác suất từ đó sẽ là 0.

Do đó mô hình triển khai như trên cần được làm mịn dữ liệu bằng phương pháp Laplace (add-1). Kỹ thuật làm mịn Laplace được ứng dụng rất nhiều để giải quyết trường hợp từ chưa xác định của Naïve Bayes.3 Phương pháp phân lớp Support Vector Machine Support Vector Machine (SVM) là mô hình được sử dụng trong nhiều ngành, là một mô hình máy học có giám sát được dùng để phân tích hồi quy và phân lớp dữ liệu. Giả sử một dữ liệu huấn luyện được gán hai loại nhãn, thuật toán huấn luyện SVM xây dựng một mô hình có thể gán dữ liệu mới một trong hai nhãn đó. Vậy nên SVM là bộ phân lớp tuyến tính nhị phân phi xác xuất.

Nội dung được bảo vệ bản quyền — Tải xuống đầy đủ

Tài liệu "Phân Tích Nhu Cầu Khách Hàng Trên Mạng Xã Hội: Nghiên Cứu Từ Trường Đại Học Lạc Hồng" cung cấp cái nhìn sâu sắc về cách mà nhu cầu của khách hàng được hình thành và phát triển trên các nền tảng mạng xã hội. Nghiên cứu này không chỉ giúp người đọc hiểu rõ hơn về hành vi tiêu dùng của khách hàng mà còn chỉ ra các yếu tố ảnh hưởng đến quyết định mua sắm của họ. Những thông tin này rất hữu ích cho các doanh nghiệp trong việc xây dựng chiến lược marketing hiệu quả, từ đó tối ưu hóa trải nghiệm khách hàng và tăng cường sự hài lòng.

Để mở rộng thêm kiến thức về các yếu tố ảnh hưởng đến hành vi tiêu dùng, bạn có thể tham khảo tài liệu Luận văn thạc sĩ các yếu tố ảnh hưởng đến ý định sử dụng internet banking của khách hàng cá nhân tại ngân hàng thương mại cổ phần đầu tư và phát triển việt nam chi nhánh bà rịavũng tàu, nơi phân tích các yếu tố tác động đến việc sử dụng dịch vụ ngân hàng trực tuyến.

Ngoài ra, tài liệu Luận văn thạc sĩ quản trị kinh doanh các yếu tố ảnh hưởng đến ý định tiếp tục sử dụng ví điện tử vnpt money của khách hàng một nghiên cứu ở tỉnh bến tre cũng sẽ cung cấp cái nhìn sâu sắc về việc sử dụng ví điện tử trong bối cảnh hiện đại.

Cuối cùng, bạn có thể tìm hiểu thêm về Luận văn thạc sĩ các nhân tố ảnh hưởng đến sự hài lòng của người nộp thuế về dịch vụ thuế điện tử tại chi cục thuế khu vực vũng tàu côn đảo, tài liệu này sẽ giúp bạn hiểu rõ hơn về sự hài lòng của khách hàng trong lĩnh vực dịch vụ công nghệ.

Mỗi tài liệu đều là cơ hội để bạn khám phá sâu hơn về các khía cạnh khác nhau của hành vi tiêu dùng và sự phát triển của dịch vụ trên mạng xã hội.

#Phân tích dữ liệu

#chiến lược marketing

#mạng xã hội

#nghiên cứu thị trường

#hành vi người tiêu dùng

#tương tác trên mạng xã hội

Chủ đề

Nghiên cứu hành vi người tiêu dùng

Phân tích nhu cầu khách hàng

Chiến lược marketing trên mạng xã hội

tác động của mạng xã hội