I. Phân loại cảm xúc văn bản tiếng Việt
Luận văn tập trung vào phân loại cảm xúc trong văn bản tiếng Việt, đặc biệt là việc xác định cảm xúc theo đối tượng cụ thể. Đây là một bài toán quan trọng trong lĩnh vực xử lý ngôn ngữ tự nhiên và trí tuệ nhân tạo, đặc biệt khi ứng dụng vào các bình luận trên mạng xã hội và diễn đàn. Luận văn sử dụng phương pháp học máy và phân tích ngữ nghĩa để giải quyết bài toán này, với mục tiêu xây dựng một hệ thống tự động phân tích cảm xúc chính xác và hiệu quả.
1.1. Phương pháp phân tích cảm xúc
Luận văn đề cập đến hai phương pháp chính: học máy (sử dụng các thuật toán như SVM, Naive Bayes) và phân tích hướng ngữ nghĩa. Phương pháp phân tích hướng ngữ nghĩa được ưu tiên vì khả năng xử lý các cấu trúc câu phức tạp trong tiếng Việt. Hệ thống sử dụng đồ thị khái niệm và ontology để phân tích cấu trúc câu và xác định cảm xúc theo từng đối tượng.
1.2. Ứng dụng thực tiễn
Hệ thống phân loại cảm xúc được phát triển trong luận văn có thể ứng dụng trong nhiều lĩnh vực như marketing, quản lý thương hiệu, và nghiên cứu thị trường. Ví dụ, các công ty có thể sử dụng hệ thống để phân tích phản hồi của khách hàng về sản phẩm, từ đó điều chỉnh chiến lược kinh doanh. Điều này đặc biệt hữu ích trong bối cảnh bùng nổ thông tin trên mạng xã hội và diễn đàn.
II. Đối tượng và phạm vi nghiên cứu
Luận văn tập trung vào các văn bản tiếng Việt liên quan đến nhiều sản phẩm và dịch vụ khác nhau, đặc biệt là các bình luận trên mạng xã hội và diễn đàn. Đối tượng nghiên cứu chính là các văn bản rõ nghĩa, được viết đúng chính tả và có dấu đầy đủ. Luận văn chưa xử lý các văn bản dài, phức tạp hoặc không dấu, điều này mở ra hướng nghiên cứu tiếp theo trong tương lai.
2.1. Phân tích cảm xúc theo đối tượng
Hệ thống được thiết kế để phân tích cảm xúc ở mức độ khía cạnh, tức là xác định cảm xúc của người viết đối với từng đối tượng cụ thể trong văn bản. Ví dụ, trong một bình luận về nhiều sản phẩm, hệ thống có thể xác định cảm xúc tích cực hay tiêu cực đối với từng sản phẩm. Điều này giúp các nhà sản xuất hiểu rõ hơn về phản hồi của khách hàng.
2.2. Thách thức trong phân tích tiếng Việt
Tiếng Việt là một ngôn ngữ có cấu trúc phức tạp, với nhiều biến thể từ ngữ và cấu trúc ngữ pháp đa dạng. Điều này đặt ra thách thức lớn cho việc phân tích cảm xúc. Luận văn đã đề xuất giải pháp sử dụng ontology và đồ thị khái niệm để xử lý các cấu trúc câu phức tạp, từ đó nâng cao độ chính xác của hệ thống.
III. Kết quả và đánh giá
Luận văn đã xây dựng thành công một hệ thống phân loại cảm xúc dựa trên phân tích ngữ nghĩa, đạt độ chính xác cao trong việc phân tích các văn bản tiếng Việt có nhiều đối tượng. Hệ thống có khả năng xử lý các câu so sánh và cấu trúc câu phức tạp, điều này được chứng minh qua các thử nghiệm thực tế.
3.1. Độ chính xác của hệ thống
Kết quả thử nghiệm cho thấy hệ thống đạt độ chính xác cao trong việc phân tích cảm xúc theo đối tượng. Điều này khẳng định hiệu quả của phương pháp phân tích hướng ngữ nghĩa kết hợp với đồ thị khái niệm và ontology. Hệ thống cũng có khả năng xử lý các văn bản thuộc nhiều miền dữ liệu khác nhau.
3.2. Hướng phát triển tương lai
Luận văn đề xuất hướng phát triển tiếp theo là mở rộng hệ thống để xử lý các văn bản dài, phức tạp và không dấu. Ngoài ra, việc tích hợp thêm các thuật toán học máy tiên tiến có thể giúp nâng cao hiệu quả của hệ thống trong tương lai.