I. Giới thiệu
Bài toán phân giải đồng tham chiếu và phân tích cảm xúc là hai vấn đề quan trọng trong lĩnh vực khoa học máy tính. Chúng có vai trò thiết yếu trong việc hiểu và xử lý ngôn ngữ tự nhiên. Động tham chiếu là việc xác định các từ hoặc cụm từ trong văn bản mà chúng tham chiếu đến cùng một đối tượng. Trong khi đó, phân tích cảm xúc liên quan đến việc xác định cảm xúc hoặc thái độ của người viết đối với một đối tượng cụ thể. Việc kết hợp hai bài toán này giúp nâng cao độ chính xác trong việc phân tích cảm xúc, từ đó mang lại lợi ích thực tiễn cho nhiều ứng dụng như phân tích ý kiến khách hàng, đánh giá sản phẩm, và nhiều lĩnh vực khác.
1.1 Động cơ nghiên cứu
Nhu cầu phân tích cảm xúc trong văn bản ngày càng tăng, đặc biệt trong bối cảnh phát triển mạnh mẽ của công nghệ thông tin và mạng xã hội. Phân tích cảm xúc không chỉ giúp doanh nghiệp hiểu rõ hơn về ý kiến của khách hàng mà còn hỗ trợ trong việc cải thiện sản phẩm và dịch vụ. Tuy nhiên, việc xác định chính xác các khía cạnh và cảm xúc liên quan đến các đối tượng trong văn bản vẫn còn nhiều thách thức. Do đó, nghiên cứu này nhằm mục tiêu phát triển một mô hình phân giải đồng tham chiếu đối tượng cho phân tích cảm xúc, từ đó nâng cao khả năng nhận diện và phân tích các khía cạnh cảm xúc trong văn bản.
II. Các nghiên cứu liên quan
Nhiều nghiên cứu đã chỉ ra rằng việc kết hợp phân giải đồng tham chiếu với phân tích cảm xúc có thể cải thiện đáng kể độ chính xác của các mô hình phân tích. Các phương pháp hiện tại chủ yếu tập trung vào việc xác định các đại từ và thực thể trong văn bản, nhưng chưa chú trọng đến mối quan hệ giữa các đối tượng và cảm xúc. Ontology cảm xúc được đề xuất như một công cụ hữu ích để hỗ trợ trong việc xác định các khía cạnh và cảm xúc liên quan đến các đối tượng. Việc xây dựng một đồ thị đồng tham chiếu cũng giúp cải thiện khả năng nhận diện các mối quan hệ phức tạp giữa các đối tượng và cảm xúc trong văn bản.
2.1 Phân giải đồng tham chiếu
Bài toán phân giải đồng tham chiếu đã được nghiên cứu rộng rãi trong lĩnh vực xử lý ngôn ngữ tự nhiên. Các phương pháp hiện tại thường sử dụng các thuật toán học máy để xác định các đại từ và thực thể trong văn bản. Tuy nhiên, việc áp dụng các phương pháp này cho bài toán phân tích cảm xúc vẫn còn nhiều hạn chế. Cần có những nghiên cứu sâu hơn để phát triển các mô hình có khả năng nhận diện chính xác các đối tượng và cảm xúc trong văn bản.
III. Mô hình đề xuất
Luận án đề xuất một mô hình phân giải đồng tham chiếu đối tượng cho phân tích cảm xúc có khả năng xác định các bộ ba đối tượng, khía cạnh và cảm xúc từ các văn bản cảm xúc. Mô hình này sử dụng ontology cảm xúc để làm giàu thông tin và cải thiện độ chính xác trong việc phân tích. Các kết quả thực nghiệm cho thấy mô hình có khả năng nhận diện chính xác các khía cạnh và cảm xúc liên quan đến các đối tượng trong văn bản, từ đó mang lại giá trị thực tiễn cao cho các ứng dụng trong lĩnh vực này.
3.1 Mô hình phân giải đồng tham chiếu đối tượng
Mô hình phân giải đồng tham chiếu đối tượng được xây dựng dựa trên các thuật toán học sâu và xử lý ngôn ngữ tự nhiên. Mô hình này không chỉ xác định các đối tượng mà còn phân tích các khía cạnh và cảm xúc liên quan đến chúng. Kết quả thực nghiệm cho thấy mô hình có khả năng nhận diện chính xác các khía cạnh và cảm xúc trong văn bản, từ đó nâng cao độ chính xác của phân tích cảm xúc.