I. Giới thiệu
Trong bối cảnh sự phát triển mạnh mẽ của Internet và các nền tảng truyền thông xã hội, phân tích cảm xúc đã trở thành một lĩnh vực nghiên cứu quan trọng trong khoa học máy tính. Sự gia tăng dữ liệu do người dùng tạo ra đã tạo ra nhu cầu lớn về việc hiểu và phân tích các ý kiến, cảm xúc trong các văn bản. Luận án này tập trung vào việc nghiên cứu trị cảm xúc chuyển dịch theo ngữ cảnh trong tiếng Việt, nhằm xây dựng một hệ thống phân tích cảm xúc hiệu quả hơn. Các nghiên cứu trước đây đã chỉ ra rằng việc xử lý các hiện tượng ngôn ngữ phức tạp như dịch chuyển cảm xúc và văn bản mang ý kiến hỗn hợp vẫn còn nhiều hạn chế. Do đó, việc phát triển một kho từ vựng cảm xúc cho tiếng Việt và áp dụng các phương pháp học máy là cần thiết để cải thiện độ chính xác trong phân tích cảm xúc.
1.1. Đề xuất nghiên cứu
Luận án này đề xuất hai mục tiêu chính: đầu tiên là xây dựng một kho từ vựng cảm xúc cho tiếng Việt, phục vụ cho việc phân tích cảm xúc ở mức từ và cụm từ. Thứ hai, nghiên cứu sẽ áp dụng các phương pháp học máy và mô hình học sâu để xử lý bài toán phân lớp cảm xúc ở mức văn bản. Việc chú trọng đến dịch chuyển cảm xúc và sử dụng kết hợp nhiều phương pháp sẽ là chìa khóa để đạt được kết quả chính xác hơn. Các nghiên cứu trước đây đã chỉ ra rằng việc áp dụng các phương pháp định hướng ngữ nghĩa có thể cải thiện đáng kể hiệu suất của hệ thống phân tích cảm xúc.
II. Phân tích cảm xúc và sự dịch chuyển cảm xúc
Chương này sẽ đi sâu vào khái niệm phân tích cảm xúc và các phương pháp tiếp cận hiện có. Phân tích cảm xúc là quá trình tự động xác định giá trị cảm xúc trong văn bản, bao gồm việc phân loại các ý kiến thành tích cực, tiêu cực hoặc trung tính. Các phương pháp tiếp cận chủ yếu bao gồm tiếp cận định hướng ngữ nghĩa và tiếp cận học máy. Đặc biệt, hiện tượng dịch chuyển cảm xúc là một vấn đề quan trọng cần được nghiên cứu kỹ lưỡng. Hiện tượng này xảy ra khi cảm xúc của một từ hoặc cụm từ thay đổi tùy thuộc vào ngữ cảnh mà nó xuất hiện. Việc hiểu rõ về dịch chuyển cảm xúc sẽ giúp cải thiện độ chính xác của các hệ thống phân tích cảm xúc.
2.1. Hiện tượng dịch chuyển cảm xúc
Hiện tượng dịch chuyển cảm xúc trong văn bản tiếng Việt có thể gây khó khăn cho việc xác định chính xác cảm xúc của người viết. Các yếu tố như ngữ cảnh, cấu trúc câu và từ ngữ liên quan đều có thể ảnh hưởng đến cách mà cảm xúc được diễn đạt. Do đó, việc xây dựng một mô hình có khả năng nhận diện và xử lý các hiện tượng này là rất cần thiết. Các nghiên cứu trước đây đã chỉ ra rằng việc áp dụng các kỹ thuật học máy có thể giúp cải thiện khả năng nhận diện cảm xúc trong các văn bản phức tạp.
III. Xác định sự dịch chuyển trị cảm xúc của từ và cụm từ
Chương này tập trung vào việc xác định trị cảm xúc cho từ và cụm từ trong các nhận xét tiếng Việt. Việc xác định trị cảm xúc là một bước quan trọng trong phân tích cảm xúc, giúp hệ thống có thể phân loại chính xác các ý kiến. Mô hình tính toán trị cảm xúc sẽ được xây dựng dựa trên các đặc trưng ngữ nghĩa và ngữ cảnh của từ. Các thực nghiệm cho thấy rằng việc áp dụng các phương pháp học máy có thể giúp cải thiện độ chính xác trong việc xác định trị cảm xúc của từ và cụm từ. Điều này cho thấy rằng việc kết hợp giữa các phương pháp truyền thống và hiện đại là cần thiết để đạt được kết quả tốt nhất.
3.1. Mô hình tính toán trị cảm xúc
Mô hình tính toán trị cảm xúc sẽ được xây dựng dựa trên các từ điển cảm xúc hiện có và các phương pháp học máy. Việc xác định trị cảm xúc cho từ và cụm từ sẽ được thực hiện thông qua việc phân tích ngữ nghĩa và ngữ cảnh. Các thực nghiệm cho thấy rằng việc sử dụng các mô hình học sâu có thể giúp cải thiện đáng kể độ chính xác trong việc xác định cảm xúc. Điều này cho thấy rằng việc áp dụng các phương pháp học máy là một hướng đi đúng đắn trong nghiên cứu phân tích cảm xúc.