MỞ ĐẦU 9 Chương 5: Chương trình minh họa. Mô ta các công nghệ sử dụng va qua trình cài đặt mô hình Trích xuất bộ ba khía cạnh cảm xúc để xây dựng chương trình minh họa trong thực tế cho người dùng. Chương 6: Kết luận và hướng phát triển. Tổng kết các kết quả quan trọng đã đạt được trong nghiên cứu, những hạn chế chưa được giải quyết và hướng phát triển trong tương lai.
BOI CẢNH VA CÁC CÔNG TRÌNH LIÊN QUAN 10 Chương 2. BOI CANH VÀ CAC CONG TRÌNH LIÊN QUAN Dé tài nghiên cứu cua sinh viên liên quan đên các lĩnh vực sau: e Phân tích cảm xúc theo khía cạnh: Cụ thê ở nghiên cứu nay là bài toán con Trích xuất bộ ba khía cạnh (ASTE) trên dit liệu chứa các đánh giá của khách hàng về những sản phâm điện tử, công nghệ. e Các mô hình ngôn ngữ được huân luyện san. Trong chương này, sinh viên tiến hành trình bày cơ sở lý thuyết cũng như công trình liên quan đến dé tài.
Sau đó, nêu ra những van dé còn tồn đọng và hướng giải quyết được đề cập trong nghiên cứu của sinh viên. Bài toán Phân tích cảm xúc theo khía cạnh 2. Tổng quan Việc khám phá và thông hiểu quan điểm từ các nội dung trực tuyến do người dùng tạo là rất quan trọng đối với vô số các ứng dụng thực tiễn. Ví dụ, năm bắt được suy nghĩ của khách hàng từ các bài đánh giá trên nền tảng Thương mại điện tử giúp các doanh nghiệp cải thiện sản phẩm hoặc dịch vụ và thực hiện các chiến dịch tiếp thị khách hàng tốt hơn.
Tuy vậy, với lượng lớn nội dung dạng văn bản được tạo ra bởi người dùng hằng ngày, việc xử lý thông tin theo cách thủ công sẽ rất tốn kém về mặt thời gian, nhân lực và chi phi. Vì vậy, thiết kế một hệ thống phân tích tự động BOI CẢNH VA CÁC CÔNG TRÌNH LIÊN QUAN ll các cảm xúc, quan di¢m cua người dùng, khách hàng từ các văn ban phi cau trúc của họ là điêu cân thiệt. Nhu câu này dân đên sự ra đời của lĩnh vực Phân tích cảm xúc và Khai thác quan điểm (Sentiment Analysis and Opinion Mining) [18]. Hon nhiéu thập ky qua, Phân tích cảm xúc là một bai toán nôi bat được đông đảo cộng đồng các nhà nghiên cứu thuộc lĩnh vực NLP cả trong lẫn ngoài nước quan tâm.
Nhiệm vụ chính của bài toán là phân tích và đánh giá bình luận/ý kiến của người dùng thành các loại cảm xúc khác nhau: tích cực, tiêu cực hay trung lập. Bên cạnh đó, không chỉ là một van đề nồi bật nhận được nhiều quan tâm trong lĩnh vực NLP, bài toán Phân tích cảm xúc còn được ứng dụng rộng rãi bởi các doanh nghiệp, cơ quan, tô chức trong các ngành công nghiệp — dịch vụ như một công cụ có thé phân tích, nhận biết thái độ của khách hàng về sản phâm và dịch vụ mà họ cung cấp một cách tự động. Các nghiên cứu về phân tích cảm xúc truyền thống chủ yếu thực hiện dự đoán ở cấp độ câu hoặc cả tài liệu, xác định cảm xúc cho toàn bộ câu hoặc tài liệu [19][20][21]. Dé đưa ra dự đoán, Phân tích cảm xúc truyền thống cho rằng một cảm xúc duy nhất được thé hiện cho một chủ đề duy nhất trong văn bản nhất định.
Việc đó có thé làm mắt đi hoặc làm thay đôi các thông tin cốt lõi trong câu hoặc trong văn bản. Vì vậy, xét về tính thực tiễn, Phân tích cảm xúc truyền thống có thể khó mà áp dụng trong thực tế được. Trong hoàn cảnh này, bài toán xác định các quan điểm và cảm xúc ở cấp độ khía cạnh chỉ tiết hơn được gọi là Phân tích cảm xúc theo khía cạnh, đã nhận được sự chú ý ngày càng tăng trong thập kỷ qua [22][23]. BOI CẢNH VA CÁC CÔNG TRÌNH LIÊN QUAN 12 Nói chung, mục tiêu nghiên cứu chính của ABSA liên quan đên việc xác định các thành phân cảm xúc ở các câp độ khía cạnh khác nhau, cụ thê là: từ chỉ khía cạnh, danh mục khía cạnh, từ chỉ quan điêm và loại cảm xúc [4].
e Vi dụ: “Món mi này ngon qua.” Trong câu ở ví dụ trên, các thành phần cảm xúc tương ứng với từ chỉ khía cạnh, danh mục khía cạnh, từ chỉ quan điểm và loại cảm xúc lần lượt là “Món mì”, “Food”, “ngon quá” và “Tích cực”, trong đó “Món mi” và “ngon quá” được thể hiện rõ ràng trong câu, còn “Food” và “Tích cực” là các nhãn thuộc danh mục hoặc lớp được xác định trước. Món mi này ngon qua Aspect term Món mi Aspect Category Food Opinion term ngon qua HÌNH 2.1: Ví dụ về bốn thành phần cảm xúc chính trong ABSA. Những nghiên cứu ban đầu của Phân tích cảm xúc theo khía cạnh bắt đầu bằng việc xác định từng thành phần cảm xúc riêng biệt. Ví dụ, nhiệm vụ trích xuất từ chỉ khía cạnh [9] với mục đích là trích xuất tất cả các từ hoặc cụm từ chỉ khía cạnh được đề cập trong văn ban đã cho; trong khi bai toán xác định loại cảm xúc [11] dự đoán sự loại cảm xúc cho một khía cạnh cụ thể trong một câu.
Những bài toán Phân tích BOI CẢNH VA CÁC CÔNG TRÌNH LIÊN QUAN 13 cảm xúc theo khía cạnh chỉ xác định hoặc trích xuất đơn lẻ từng loại thành phần cảm xúc được gọi là những bai toán ABSA don (Single ABSA) [24]. Tuy nhiên, việc trích xuất đơn lẻ một thành phần cảm xúc duy nhất vẫn chưa thỏa mãn nhu cầu thấu hiểu quan điểm ở cấp độ khía cạnh chỉ tiết hơn, điều này đòi hỏi không chỉ việc trích xuất nhiều thành phần cảm xúc mà còn phải tìm ra mối quan hệ tương ứng và sự phụ thuộc giữa chúng. Đề đạt được mục tiêu này, các bải toán Phân tích cảm xúc theo khía cạnh mới [4]-[7] và những bộ dữ liệu chuẩn tương ứng đã được giới thiệu trong những năm gần đây dé thúc đây nghiên cứu về trích xuất nhiều thành phần cảm xúc có liên quan với nhau. Những bài toán này được gọi là bài toán ABSA phức hợp (Compound ABSA) [24|, trái ngược với các bài toán ABSA đơn chỉ liên quan đến một thành phần cảm xúc duy nhất.
Ví dụ: bài toán trích xuất bộ đôi khía cạnh — cảm xúc [6][8] thực hiện trích xuất từ chỉ khía cạnh và từ chỉ quan điểm liên quan của nó ở dang ghép, tức là trích xuất cặp (Món mì, ngon quá) từ câu ở ví dụ trên. Từ đó cung cấp sự hiéu biết rõ ràng hơn về khía cạnh được đề cập và cảm xúc được thé hiện tương ứng với khía cạnh đó. Sau sự xuất hiện của số công trình tiên phong, nhiều phương pháp khác nhau đã được đề xuất dé giải quyết các bài toán ABSA phức hợp nhăm cho phép khai thác quan điểm ở những cấp độ khía cạnh trong các tình huống khác nhau. Bên cạnh việc thiết kế các mô hình cụ thê cho các bài toán Phân tích cảm xúc theo khía cạnh khác nhau, sự ra đời của các mô hình ngôn ngữ huấn luyện sẵn (PLM) như BERT [25] và RoBERTa [26] đã mang lại những cải tiến đáng kế cho một loạt các bài toán ABSA trong những năm gần đây.
Với PLM làm nền tảng, khả năng khái quát hóa và độ hiệu quả của các mô hình ABSA đã được cải thiện dang kể. BOI CẢNH VA CÁC CÔNG TRÌNH LIÊN QUAN 14 2. Cac thành phần cảm xúc Theo Liu [18], bài toán phân tích cảm xúc bao gồm hai thành phan chính: mục tiêu và cảm xúc. Đối với ABSA, mục tiêu có thé được mô ta băng danh mục khía cạnh c hoặc từ chỉ khía cạnh a, trong khi cảm xúc liên quan đến biéu hiện quan điểm, tình cảm chỉ tiết — từ chỉ quan điểm o và định hướng tình cảm chung — loại cảm xúc p.
Bốn thành phan cảm xúc này tạo nên các hướng nghiên cứu chính trong ABSA: e Danh mục khía cạnh c xác định một khía cạnh duy nhất của một thực thé và cho là khía cạnh đó thuộc một trong nhiều danh mục của tập C được định nghĩa sẵn cho từng lĩnh vực cụ thể được quan tâm. Ví dụ: “Food” và “Service” có thé là các danh mục khía cạnh cho miền nha hàng. e Từ chỉ khía cạnh a là mục tiêu của cảm xúc được thé hiện rõ rang trong câu hoặc văn bản, ví dụ: “Món mì” trong câu “Món mì này ngon quá” là từ chỉ khía cạnh. Khi khía cạnh được thé hiện một cách không rõ ràng (ví dụ: “Nó được định giá quá cao!”), ta có thé biểu diễn từ chỉ khía cạnh trong ngữ cạnh đặc biệt nay là “null”.
e Từ chỉ quan điểm o là cách diễn dat quan điểm dé bày tỏ cảm xúc đối với mục tiêu liên quan. Ví dụ: “ngon” là từ chỉ quan điểm trong ví dụ đang được sử dụng “Món mì này ngon quá”. e Loại cảm xúc p xác định định hướng cảm xúc đối với một danh mục khía cạnh hoặc một từ chỉ khía cạnh nhất định, thường là tich cực, tiêu cực hoặc trung lập. Với bốn thành phần cảm xúc chính được định nghĩa như trên, Phân tích cảm xúc theo khía cạnh có thé được định nghĩa dựa trên các thành phần cảm xúc như sau: BOI CẢNH VA CÁC CÔNG TRÌNH LIÊN QUAN 15 Phân tích cảm xúc theo khía cạnh là quá trình xác định các thành phần cảm xúc được quan tâm trong câu hoặc văn bản, dù là một thành phần cảm xúc đơn lẻ hoặc nhiều thành phần có quan hệ lẫn nhau.
Do đó, Phân tích cảm xúc theo khía cạnh có thê chia nhỏ thành các bài toán con khác nhau tùy theo các thành phần cảm xúc xét đến. Tùy thuộc vào đầu ra mong muốn là một thành phần cảm xúc đơn lẻ hay nhiều thành phần có quan hệ với nhau, chúng ta có thể phân loại các bài toán ABSA thành các bài toán ABSA đơn lẻ hoặc các bài toán ABSA phức hợp, ví dụ: trích xuất từ chỉ khía cạnh là bài toán ABSA đơn lẻ với mục đích trích xuất tất cả các từ hoặc cụm từ chỉ khía cạnh của một câu cho trước, trong khi nhiệm vụ trích xuất bộ đôi khía cạnh - cảm xúc là một bài toán ABSA phức hợp vi nó trích xuất tất cả các cặp (a,ø). Từ quan điểm này, các bài toán khác nhau của ABSA với mục đích trích xuất các thành phần cảm xúc liên quan được thé hiện trong BANG 2.1 và mối quan hệ giữa chúng được thé hiện trong HÌNH 2.