I. Giới thiệu bài toán
Phân tích cảm xúc dựa trên khía cạnh (Aspect Based Sentiment Analysis - ABSA) là một vấn đề quan trọng trong khoa học máy tính, đặc biệt trong lĩnh vực xử lý ngôn ngữ tự nhiên. Với sự phát triển của công nghệ và Internet, việc phân tích các ý kiến từ văn bản về các sản phẩm, dịch vụ và các vấn đề xã hội đã trở nên cần thiết. Việc này không chỉ giúp người tiêu dùng đưa ra quyết định mua sắm mà còn cung cấp thông tin cho các nhà sản xuất về phản hồi từ khách hàng. Đề tài này tập trung vào việc nghiên cứu và xây dựng mô hình phân tích cảm xúc cho ngôn ngữ tiếng Việt, nhằm khai thác thông tin chi tiết từ văn bản. Theo nghiên cứu, việc phân loại các thái cực cảm xúc đối với một khía cạnh cụ thể trong câu có thể mang lại giá trị lớn cho nhiều lĩnh vực trong đời sống và nghiên cứu.
II. Nghiên cứu các công trình liên quan
Trong chương này, tác giả đã tổng hợp và phân tích các công trình nghiên cứu trước đây liên quan đến phân tích cảm xúc. Các nghiên cứu sớm chủ yếu dựa vào việc xây dựng đặc trưng từ câu đầu vào kết hợp với thông tin về ngữ nghĩa và cấu trúc câu. Một số phương pháp đáng chú ý bao gồm việc sử dụng đặc trưng n-grams và từ điển cảm xúc, kết hợp với các mô hình học máy như SVM. Nghiên cứu của Wagner và cộng sự vào năm 2014 đã trình bày phương pháp này, cho thấy độ chính xác cao trong việc phân loại cảm xúc. Hơn nữa, các mô hình như RNN và LSTM cũng đã được áp dụng để cải thiện độ chính xác của phân tích cảm xúc dựa trên khía cạnh. Những nghiên cứu này đã đặt nền móng cho việc phát triển các phương pháp mới trong lĩnh vực này.
III. Cơ sở kiến thức
Chương này trình bày các kiến thức nền tảng về machine learning và các mô hình ngôn ngữ. Một trong những kỹ thuật quan trọng là Word Embedding, cho phép biểu diễn từ dưới dạng các vectơ số, giúp máy tính hiểu được ngữ nghĩa của từ. Kỹ thuật Word2vec là một trong những phương pháp phổ biến nhất trong lĩnh vực này. Ngoài ra, mô hình BERT cũng được thảo luận, với khả năng nắm bắt ngữ cảnh trong câu, từ đó cải thiện độ chính xác của các hệ thống phân tích cảm xúc. Các công cụ và thư viện hỗ trợ cho việc nghiên cứu và xây dựng mô hình cũng được nêu rõ, tạo cơ sở cho việc thực hiện các thí nghiệm trong các chương tiếp theo.
IV. Phương pháp đề xuất
Tác giả đã đề xuất một phương pháp mới cho bài toán phân tích cảm xúc dựa trên khía cạnh, kết hợp giữa mô hình ngôn ngữ BERT và mạng nơ-ron. Phương pháp này được thiết kế để cải thiện khả năng phân loại cảm xúc trong các câu tiếng Việt. Các bước thực hiện bao gồm xây dựng câu phụ trợ, xử lý dữ liệu và huấn luyện mô hình. Đặc biệt, việc sử dụng các phương pháp học sâu giúp tối ưu hóa quá trình phân loại, từ đó nâng cao độ chính xác của mô hình. Các kết quả đạt được từ các thí nghiệm cũng được trình bày, cho thấy tính khả thi và hiệu quả của phương pháp đề xuất trong việc phân tích cảm xúc.
V. Kết quả thực nghiệm
Chương này tập trung vào việc trình bày kết quả thực nghiệm từ mô hình phân tích cảm xúc được xây dựng. Các kết quả cho thấy mô hình đã đạt được độ chính xác cao trong việc phân loại cảm xúc cho các câu tiếng Việt. Việc so sánh với các phương pháp trước đây cũng được thực hiện để đánh giá hiệu quả của mô hình. Đặc biệt, các chỉ số như Precision, Recall và F-measure được sử dụng để đo lường hiệu suất của mô hình. Kết quả này không chỉ khẳng định tính khả thi của phương pháp đề xuất mà còn mở ra hướng nghiên cứu mới cho việc ứng dụng phân tích cảm xúc trong các lĩnh vực khác nhau.
VI. Kết luận
Luận văn đã thành công trong việc nghiên cứu và xây dựng mô hình phân tích cảm xúc dựa trên khía cạnh cho ngôn ngữ tiếng Việt. Những đóng góp của nghiên cứu không chỉ nằm ở việc phát triển mô hình mà còn cung cấp thông tin hữu ích cho các hệ thống phân tích cảm xúc trong tương lai. Hạn chế của nghiên cứu cũng được chỉ ra, cùng với các hướng phát triển tiếp theo, nhằm cải thiện hơn nữa độ chính xác và khả năng ứng dụng của mô hình trong thực tế. Những kết quả đạt được từ nghiên cứu này có thể được áp dụng trong nhiều lĩnh vực, từ thương mại điện tử đến quản lý phản hồi từ khách hàng.