Cải thiện Trích xuất Bộ ba Khía cạnh Cảm xúc cho Đánh giá Khách hàng

Luận văn tốt nghiệp nghiên cứu tốt nghiệp khoa học máy tính cải tiến phương pháp trích xuất bộ ba khía cạnh trong phân tích ý kiến, điều tra thực trạng, phân tích số liệu, đề xuất

Chuyên ngành

Khoa học máy tính

Người đăng

Ẩn danh

Thể loại

khóa luận tốt nghiệp

2023

124
3
0

Phí lưu trữ

35 Point

Mục lục chi tiết

LỜI CAM ĐOAN

LỜI CẢM ƠN

1. CHƯƠNG 1: TỔNG QUAN

1.1. Bối cảnh và các công trình liên quan

1.2. Phát biểu bài toán

2. CHƯƠNG 2: PHƯƠNG PHÁP

2.1. Thu thập và xây dựng dữ liệu

2.2. Bộ dữ liệu VLSP

2.3. Bộ dữ liệu Ele-COQE

2.4. Áp dụng tách từ cho mô hình PhoBERT

2.5. Kiến trúc mô hình trích xuất bộ ba khía cạnh cảm xúc

3. CHƯƠNG 3: THỬ NGHIỆM VÀ KẾT QUẢ

3.1. Thống kê dữ liệu

3.2. Độ dài các khía cạnh và từ so sánh

3.3. Các phương pháp đánh giá

3.4. Các thông số cài đặt thử nghiệm

3.5. Kết quả và phân tích

4. CHƯƠNG 4: ĐÁNH GIÁ MÔ HÌNH

4.1. Đánh giá mô hình từ miền nguồn sang miền nguồn

4.2. Đánh giá mô hình từ miền nguồn sang miền đích

4.3. Đánh giá mô hình khi huấn luyện trên bộ dữ liệu tổng hợp từ hai miền

4.4. Đánh giá chi tiết hệ thống

5. CHƯƠNG 5: CHƯƠNG TRÌNH MINH HỌA

5.1. Công nghệ sử dụng

5.2. Quy trình cài đặt

5.3. Giao diện chương trình

KẾT LUẬN VÀ HƯỚNG PHÁT TRIỂN

Tóm tắt

I. Tổng quan về Cải thiện Trích xuất Bộ ba Khía cạnh Cảm xúc

Cải thiện trích xuất bộ ba khía cạnh cảm xúc là một lĩnh vực quan trọng trong phân tích cảm xúc. Nó giúp doanh nghiệp hiểu rõ hơn về cảm nhận của khách hàng thông qua các đánh giá. Việc áp dụng các mô hình ngôn ngữ hiện đại có thể nâng cao độ chính xác trong việc xác định các khía cạnh, cảm xúc và nhãn cảm xúc từ các phản hồi của khách hàng.

1.1. Khái niệm về Trích xuất Bộ ba Khía cạnh Cảm xúc

Trích xuất bộ ba khía cạnh cảm xúc bao gồm ba thành phần: khía cạnh, cảm xúc và nhãn cảm xúc. Mỗi thành phần này đóng vai trò quan trọng trong việc phân tích và hiểu rõ hơn về ý kiến của khách hàng.

1.2. Tầm quan trọng của Trích xuất Bộ ba trong Đánh giá Khách hàng

Việc trích xuất bộ ba khía cạnh cảm xúc giúp doanh nghiệp nắm bắt được cảm xúc của khách hàng một cách chi tiết. Điều này không chỉ giúp cải thiện sản phẩm mà còn nâng cao trải nghiệm khách hàng.

II. Vấn đề và Thách thức trong Trích xuất Bộ ba Khía cạnh Cảm xúc

Mặc dù có nhiều tiến bộ trong lĩnh vực này, nhưng vẫn tồn tại nhiều thách thức. Các bộ dữ liệu hiện có chủ yếu là tiếng Anh, trong khi tiếng Việt còn thiếu hụt. Điều này gây khó khăn cho việc áp dụng các mô hình đã được huấn luyện sẵn.

2.1. Thiếu hụt Dữ liệu cho Tiếng Việt

Các bộ dữ liệu chuẩn cho tiếng Việt trong lĩnh vực trích xuất bộ ba khía cạnh cảm xúc vẫn chưa được công bố rộng rãi. Điều này hạn chế khả năng phát triển và thử nghiệm các mô hình mới.

2.2. Khó khăn trong Việc Đánh giá Mô hình

Việc đánh giá các mô hình trích xuất bộ ba khía cạnh cảm xúc gặp khó khăn do thiếu dữ liệu chuẩn. Điều này ảnh hưởng đến khả năng so sánh và cải thiện mô hình.

III. Phương pháp Cải thiện Trích xuất Bộ ba Khía cạnh Cảm xúc

Để cải thiện trích xuất bộ ba khía cạnh cảm xúc, cần áp dụng các phương pháp học máy hiện đại. Việc sử dụng các mô hình ngôn ngữ đã được huấn luyện sẵn có thể giúp nâng cao độ chính xác và hiệu quả.

3.1. Sử dụng Mô hình Ngôn ngữ Huấn luyện Sẵn

Các mô hình như PhoBERT và XLM-R đã chứng minh được hiệu quả trong việc trích xuất thông tin từ văn bản tiếng Việt. Việc áp dụng chúng có thể cải thiện đáng kể độ chính xác.

3.2. Học Chuyển tiếp Đa miền

Phương pháp học chuyển tiếp đa miền cho phép áp dụng kiến thức từ các miền khác nhau để cải thiện hiệu suất của mô hình trên dữ liệu tiếng Việt.

IV. Ứng dụng Thực tiễn và Kết quả Nghiên cứu

Nghiên cứu đã chỉ ra rằng việc áp dụng các mô hình ngôn ngữ hiện đại có thể cải thiện đáng kể độ chính xác trong việc trích xuất bộ ba khía cạnh cảm xúc. Các ứng dụng thực tiễn cho thấy sự cải thiện trong trải nghiệm khách hàng.

4.1. Kết quả từ Các Thí nghiệm

Các thí nghiệm cho thấy mô hình cải thiện độ chính xác lên đến 85% trong việc trích xuất bộ ba khía cạnh cảm xúc từ các đánh giá khách hàng.

4.2. Ứng dụng trong Doanh nghiệp

Doanh nghiệp có thể sử dụng các mô hình này để phân tích cảm xúc của khách hàng, từ đó đưa ra các quyết định cải tiến sản phẩm và dịch vụ.

V. Kết luận và Hướng phát triển Tương lai

Cải thiện trích xuất bộ ba khía cạnh cảm xúc là một lĩnh vực đầy tiềm năng. Việc phát triển các bộ dữ liệu chuẩn cho tiếng Việt sẽ mở ra nhiều cơ hội nghiên cứu và ứng dụng mới.

5.1. Tương lai của Nghiên cứu

Nghiên cứu trong lĩnh vực này sẽ tiếp tục phát triển, với mục tiêu tạo ra các mô hình chính xác hơn và hiệu quả hơn cho tiếng Việt.

5.2. Cơ hội Ứng dụng trong Thực tế

Các doanh nghiệp có thể tận dụng các mô hình này để nâng cao trải nghiệm khách hàng và cải thiện dịch vụ, từ đó tăng cường sự hài lòng và trung thành của khách hàng.

10/07/2025

Trích đoạn nội dung tài liệu

MỞ ĐẦU 9 Chương 5: Chương trình minh họa. Mô ta các công nghệ sử dụng va qua trình cài đặt mô hình Trích xuất bộ ba khía cạnh cảm xúc để xây dựng chương trình minh họa trong thực tế cho người dùng. Chương 6: Kết luận và hướng phát triển. Tổng kết các kết quả quan trọng đã đạt được trong nghiên cứu, những hạn chế chưa được giải quyết và hướng phát triển trong tương lai.

BOI CẢNH VA CÁC CÔNG TRÌNH LIÊN QUAN 10 Chương 2. BOI CANH VÀ CAC CONG TRÌNH LIÊN QUAN Dé tài nghiên cứu cua sinh viên liên quan đên các lĩnh vực sau: e Phân tích cảm xúc theo khía cạnh: Cụ thê ở nghiên cứu nay là bài toán con Trích xuất bộ ba khía cạnh (ASTE) trên dit liệu chứa các đánh giá của khách hàng về những sản phâm điện tử, công nghệ. e Các mô hình ngôn ngữ được huân luyện san. Trong chương này, sinh viên tiến hành trình bày cơ sở lý thuyết cũng như công trình liên quan đến dé tài.

Sau đó, nêu ra những van dé còn tồn đọng và hướng giải quyết được đề cập trong nghiên cứu của sinh viên. Bài toán Phân tích cảm xúc theo khía cạnh 2. Tổng quan Việc khám phá và thông hiểu quan điểm từ các nội dung trực tuyến do người dùng tạo là rất quan trọng đối với vô số các ứng dụng thực tiễn. Ví dụ, năm bắt được suy nghĩ của khách hàng từ các bài đánh giá trên nền tảng Thương mại điện tử giúp các doanh nghiệp cải thiện sản phẩm hoặc dịch vụ và thực hiện các chiến dịch tiếp thị khách hàng tốt hơn.

Tuy vậy, với lượng lớn nội dung dạng văn bản được tạo ra bởi người dùng hằng ngày, việc xử lý thông tin theo cách thủ công sẽ rất tốn kém về mặt thời gian, nhân lực và chi phi. Vì vậy, thiết kế một hệ thống phân tích tự động BOI CẢNH VA CÁC CÔNG TRÌNH LIÊN QUAN ll các cảm xúc, quan di¢m cua người dùng, khách hàng từ các văn ban phi cau trúc của họ là điêu cân thiệt. Nhu câu này dân đên sự ra đời của lĩnh vực Phân tích cảm xúc và Khai thác quan điểm (Sentiment Analysis and Opinion Mining) [18]. Hon nhiéu thập ky qua, Phân tích cảm xúc là một bai toán nôi bat được đông đảo cộng đồng các nhà nghiên cứu thuộc lĩnh vực NLP cả trong lẫn ngoài nước quan tâm.

Nhiệm vụ chính của bài toán là phân tích và đánh giá bình luận/ý kiến của người dùng thành các loại cảm xúc khác nhau: tích cực, tiêu cực hay trung lập. Bên cạnh đó, không chỉ là một van đề nồi bật nhận được nhiều quan tâm trong lĩnh vực NLP, bài toán Phân tích cảm xúc còn được ứng dụng rộng rãi bởi các doanh nghiệp, cơ quan, tô chức trong các ngành công nghiệp — dịch vụ như một công cụ có thé phân tích, nhận biết thái độ của khách hàng về sản phâm và dịch vụ mà họ cung cấp một cách tự động. Các nghiên cứu về phân tích cảm xúc truyền thống chủ yếu thực hiện dự đoán ở cấp độ câu hoặc cả tài liệu, xác định cảm xúc cho toàn bộ câu hoặc tài liệu [19][20][21]. Dé đưa ra dự đoán, Phân tích cảm xúc truyền thống cho rằng một cảm xúc duy nhất được thé hiện cho một chủ đề duy nhất trong văn bản nhất định.

Việc đó có thé làm mắt đi hoặc làm thay đôi các thông tin cốt lõi trong câu hoặc trong văn bản. Vì vậy, xét về tính thực tiễn, Phân tích cảm xúc truyền thống có thể khó mà áp dụng trong thực tế được. Trong hoàn cảnh này, bài toán xác định các quan điểm và cảm xúc ở cấp độ khía cạnh chỉ tiết hơn được gọi là Phân tích cảm xúc theo khía cạnh, đã nhận được sự chú ý ngày càng tăng trong thập kỷ qua [22][23]. BOI CẢNH VA CÁC CÔNG TRÌNH LIÊN QUAN 12 Nói chung, mục tiêu nghiên cứu chính của ABSA liên quan đên việc xác định các thành phân cảm xúc ở các câp độ khía cạnh khác nhau, cụ thê là: từ chỉ khía cạnh, danh mục khía cạnh, từ chỉ quan điêm và loại cảm xúc [4].

e Vi dụ: “Món mi này ngon qua.” Trong câu ở ví dụ trên, các thành phần cảm xúc tương ứng với từ chỉ khía cạnh, danh mục khía cạnh, từ chỉ quan điểm và loại cảm xúc lần lượt là “Món mì”, “Food”, “ngon quá” và “Tích cực”, trong đó “Món mi” và “ngon quá” được thể hiện rõ ràng trong câu, còn “Food” và “Tích cực” là các nhãn thuộc danh mục hoặc lớp được xác định trước. Món mi này ngon qua Aspect term Món mi Aspect Category Food Opinion term ngon qua HÌNH 2.1: Ví dụ về bốn thành phần cảm xúc chính trong ABSA. Những nghiên cứu ban đầu của Phân tích cảm xúc theo khía cạnh bắt đầu bằng việc xác định từng thành phần cảm xúc riêng biệt. Ví dụ, nhiệm vụ trích xuất từ chỉ khía cạnh [9] với mục đích là trích xuất tất cả các từ hoặc cụm từ chỉ khía cạnh được đề cập trong văn ban đã cho; trong khi bai toán xác định loại cảm xúc [11] dự đoán sự loại cảm xúc cho một khía cạnh cụ thể trong một câu.

Những bài toán Phân tích BOI CẢNH VA CÁC CÔNG TRÌNH LIÊN QUAN 13 cảm xúc theo khía cạnh chỉ xác định hoặc trích xuất đơn lẻ từng loại thành phần cảm xúc được gọi là những bai toán ABSA don (Single ABSA) [24]. Tuy nhiên, việc trích xuất đơn lẻ một thành phần cảm xúc duy nhất vẫn chưa thỏa mãn nhu cầu thấu hiểu quan điểm ở cấp độ khía cạnh chỉ tiết hơn, điều này đòi hỏi không chỉ việc trích xuất nhiều thành phần cảm xúc mà còn phải tìm ra mối quan hệ tương ứng và sự phụ thuộc giữa chúng. Đề đạt được mục tiêu này, các bải toán Phân tích cảm xúc theo khía cạnh mới [4]-[7] và những bộ dữ liệu chuẩn tương ứng đã được giới thiệu trong những năm gần đây dé thúc đây nghiên cứu về trích xuất nhiều thành phần cảm xúc có liên quan với nhau. Những bài toán này được gọi là bài toán ABSA phức hợp (Compound ABSA) [24|, trái ngược với các bài toán ABSA đơn chỉ liên quan đến một thành phần cảm xúc duy nhất.

Ví dụ: bài toán trích xuất bộ đôi khía cạnh — cảm xúc [6][8] thực hiện trích xuất từ chỉ khía cạnh và từ chỉ quan điểm liên quan của nó ở dang ghép, tức là trích xuất cặp (Món mì, ngon quá) từ câu ở ví dụ trên. Từ đó cung cấp sự hiéu biết rõ ràng hơn về khía cạnh được đề cập và cảm xúc được thé hiện tương ứng với khía cạnh đó. Sau sự xuất hiện của số công trình tiên phong, nhiều phương pháp khác nhau đã được đề xuất dé giải quyết các bài toán ABSA phức hợp nhăm cho phép khai thác quan điểm ở những cấp độ khía cạnh trong các tình huống khác nhau. Bên cạnh việc thiết kế các mô hình cụ thê cho các bài toán Phân tích cảm xúc theo khía cạnh khác nhau, sự ra đời của các mô hình ngôn ngữ huấn luyện sẵn (PLM) như BERT [25] và RoBERTa [26] đã mang lại những cải tiến đáng kế cho một loạt các bài toán ABSA trong những năm gần đây.

Với PLM làm nền tảng, khả năng khái quát hóa và độ hiệu quả của các mô hình ABSA đã được cải thiện dang kể. BOI CẢNH VA CÁC CÔNG TRÌNH LIÊN QUAN 14 2. Cac thành phần cảm xúc Theo Liu [18], bài toán phân tích cảm xúc bao gồm hai thành phan chính: mục tiêu và cảm xúc. Đối với ABSA, mục tiêu có thé được mô ta băng danh mục khía cạnh c hoặc từ chỉ khía cạnh a, trong khi cảm xúc liên quan đến biéu hiện quan điểm, tình cảm chỉ tiết — từ chỉ quan điểm o và định hướng tình cảm chung — loại cảm xúc p.

Bốn thành phan cảm xúc này tạo nên các hướng nghiên cứu chính trong ABSA: e Danh mục khía cạnh c xác định một khía cạnh duy nhất của một thực thé và cho là khía cạnh đó thuộc một trong nhiều danh mục của tập C được định nghĩa sẵn cho từng lĩnh vực cụ thể được quan tâm. Ví dụ: “Food” và “Service” có thé là các danh mục khía cạnh cho miền nha hàng. e Từ chỉ khía cạnh a là mục tiêu của cảm xúc được thé hiện rõ rang trong câu hoặc văn bản, ví dụ: “Món mì” trong câu “Món mì này ngon quá” là từ chỉ khía cạnh. Khi khía cạnh được thé hiện một cách không rõ ràng (ví dụ: “Nó được định giá quá cao!”), ta có thé biểu diễn từ chỉ khía cạnh trong ngữ cạnh đặc biệt nay là “null”.

e Từ chỉ quan điểm o là cách diễn dat quan điểm dé bày tỏ cảm xúc đối với mục tiêu liên quan. Ví dụ: “ngon” là từ chỉ quan điểm trong ví dụ đang được sử dụng “Món mì này ngon quá”. e Loại cảm xúc p xác định định hướng cảm xúc đối với một danh mục khía cạnh hoặc một từ chỉ khía cạnh nhất định, thường là tich cực, tiêu cực hoặc trung lập. Với bốn thành phần cảm xúc chính được định nghĩa như trên, Phân tích cảm xúc theo khía cạnh có thé được định nghĩa dựa trên các thành phần cảm xúc như sau: BOI CẢNH VA CÁC CÔNG TRÌNH LIÊN QUAN 15 Phân tích cảm xúc theo khía cạnh là quá trình xác định các thành phần cảm xúc được quan tâm trong câu hoặc văn bản, dù là một thành phần cảm xúc đơn lẻ hoặc nhiều thành phần có quan hệ lẫn nhau.

Do đó, Phân tích cảm xúc theo khía cạnh có thê chia nhỏ thành các bài toán con khác nhau tùy theo các thành phần cảm xúc xét đến. Tùy thuộc vào đầu ra mong muốn là một thành phần cảm xúc đơn lẻ hay nhiều thành phần có quan hệ với nhau, chúng ta có thể phân loại các bài toán ABSA thành các bài toán ABSA đơn lẻ hoặc các bài toán ABSA phức hợp, ví dụ: trích xuất từ chỉ khía cạnh là bài toán ABSA đơn lẻ với mục đích trích xuất tất cả các từ hoặc cụm từ chỉ khía cạnh của một câu cho trước, trong khi nhiệm vụ trích xuất bộ đôi khía cạnh - cảm xúc là một bài toán ABSA phức hợp vi nó trích xuất tất cả các cặp (a,ø). Từ quan điểm này, các bài toán khác nhau của ABSA với mục đích trích xuất các thành phần cảm xúc liên quan được thé hiện trong BANG 2.1 và mối quan hệ giữa chúng được thé hiện trong HÌNH 2.

Nội dung được bảo vệ bản quyền — Tải xuống đầy đủ

Tài liệu "Cải thiện Trích xuất Bộ ba Khía cạnh Cảm xúc cho Đánh giá Khách hàng" tập trung vào việc nâng cao khả năng trích xuất thông tin cảm xúc từ các đánh giá của khách hàng. Bằng cách áp dụng các phương pháp phân tích cảm xúc tiên tiến, tài liệu này giúp người đọc hiểu rõ hơn về cách mà cảm xúc của khách hàng có thể ảnh hưởng đến quyết định mua sắm và sự hài lòng với sản phẩm. Những điểm chính bao gồm việc xác định các khía cạnh cảm xúc quan trọng, cải thiện độ chính xác trong việc phân tích và ứng dụng thực tiễn trong ngành dịch vụ.

Để mở rộng kiến thức của bạn về lĩnh vực này, bạn có thể tham khảo thêm tài liệu Khóa luận tốt nghiệp kỹ thuật phần mềm nghiên cứu bài toán phân tích cảm xúc người dùng trên miền dữ liệu của ngành dịch vụ, nơi cung cấp cái nhìn sâu sắc về phân tích cảm xúc trong ngành dịch vụ. Bên cạnh đó, tài liệu Khóa luận tốt nghiệp khoa học dữ liệu phân tích cảm xúc dựa trên khía cạnh của bình luận về điện thoại thông minh trên tiếng việt sẽ giúp bạn hiểu rõ hơn về cách phân tích cảm xúc trong các bình luận sản phẩm cụ thể. Cuối cùng, tài liệu Khóa luận tốt nghiệp khoa học máy tính nghiên cứu đọc hiểu tự động trên các bình luận sản phẩm tiếng việt sẽ cung cấp thêm thông tin về việc tự động hóa quá trình phân tích bình luận khách hàng. Những tài liệu này sẽ là cơ hội tuyệt vời để bạn khám phá sâu hơn về chủ đề phân tích cảm xúc và ứng dụng của nó trong thực tiễn.