Phân loại cảm xúc trong văn bản tiếng Việt sử dụng phương pháp học sâu

2020

87
0
0

Phí lưu trữ

30.000 VNĐ

Tóm tắt

I. Giới thiệu và mục tiêu nghiên cứu

Luận văn tập trung vào phân loại cảm xúc trong văn bản tiếng Việt bằng phương pháp học sâu, cụ thể là sử dụng mô hình LSTM. Mục tiêu chính là phân loại các bình luận thành hai nhóm: cảm xúc tích cựccảm xúc tiêu cực. Đối tượng nghiên cứu là các bình luận về địa điểm ăn uống hoặc dịch vụ trên nền tảng thương mại điện tử. Phạm vi nghiên cứu giới hạn trong việc xử lý văn bản tiếng Việt, đặc biệt là các bình luận ngắn.

1.1. Mục tiêu cụ thể

Mục tiêu cụ thể của luận văn là đề xuất một mô hình phân loại cảm xúc dựa trên các bình luận của người dùng. Mô hình này sử dụng phương pháp học sâu, đặc biệt là LSTM, để phân loại cảm xúc thành hai nhóm: tích cựctiêu cực. Điều này giúp các doanh nghiệp nhanh chóng nắm bắt được phản hồi của khách hàng, từ đó cải thiện sản phẩm và dịch vụ.

1.2. Đối tượng và phạm vi nghiên cứu

Đối tượng nghiên cứu là các bình luận của người dùng về địa điểm ăn uống hoặc dịch vụ. Dữ liệu được thu thập từ các nền tảng thương mại điện tử. Phạm vi nghiên cứu tập trung vào việc xử lý văn bản tiếng Việt, đặc biệt là các bình luận ngắn và không chính thống, thường xuất hiện trên mạng xã hội.

II. Cơ sở lý thuyết và phương pháp nghiên cứu

Chương này trình bày tổng quan về xử lý ngôn ngữ tự nhiên (NLP) và các phương pháp học sâu được sử dụng trong nghiên cứu. Đặc biệt, mô hình LSTM được giới thiệu như một công cụ hiệu quả để phân loại cảm xúc. Các khái niệm về mạng neuron, CNN, và RNN cũng được đề cập để làm nền tảng cho việc hiểu rõ hơn về LSTM.

2.1. Tổng quan về xử lý ngôn ngữ tự nhiên

Xử lý ngôn ngữ tự nhiên (NLP) là một nhánh của trí tuệ nhân tạo, tập trung vào việc giúp máy tính hiểu và xử lý ngôn ngữ của con người. NLP bao gồm các nhiệm vụ như phân tích văn bản, nhận dạng tiếng nói, và dịch thuật. Trong nghiên cứu này, NLP được sử dụng để phân tích và phân loại cảm xúc từ các bình luận của người dùng.

2.2. Mô hình học sâu và LSTM

Học sâu là một phương pháp machine learning sử dụng các mạng neuron phức tạp để học từ dữ liệu. LSTM (Long Short-Term Memory) là một loại mạng neuron đặc biệt, được thiết kế để xử lý các dữ liệu tuần tự như văn bản. LSTM có khả năng ghi nhớ thông tin trong thời gian dài, giúp cải thiện độ chính xác trong việc phân loại cảm xúc.

III. Xây dựng ứng dụng phân loại cảm xúc

Chương này mô tả chi tiết quy trình xây dựng ứng dụng phân loại cảm xúc. Các bước bao gồm thu thập dữ liệu, tách từ, gán nhãn, và huấn luyện mô hình LSTM. Dữ liệu được thu thập từ các bình luận trên nền tảng thương mại điện tử, sau đó được xử lý và biểu diễn dưới dạng vector đặc trưng sử dụng Word2Vec.

3.1. Thu thập và xử lý dữ liệu

Dữ liệu được thu thập từ các bình luận trên nền tảng thương mại điện tử. Các bình luận này được tách từ bằng công cụ vnTokenizer, sau đó được biểu diễn dưới dạng vector đặc trưng sử dụng Word2Vec. Quá trình này giúp chuyển đổi văn bản thành dữ liệu số, phù hợp để huấn luyện mô hình LSTM.

3.2. Huấn luyện mô hình LSTM

Mô hình LSTM được huấn luyện trên dữ liệu đã được xử lý. Quá trình huấn luyện bao gồm việc tối ưu hóa các tham số của mô hình để đạt được độ chính xác cao nhất trong việc phân loại cảm xúc. Kết quả huấn luyện được đánh giá thông qua các chỉ số như độ chính xác và hàm chi phí.

IV. Kết quả thực nghiệm và đánh giá

Chương này trình bày kết quả thực nghiệm của mô hình LSTM trong việc phân loại cảm xúc. Kết quả được so sánh với các mô hình khác như MLPCNN để đánh giá hiệu quả. Ứng dụng thực tế cũng được giới thiệu, cho phép người dùng phân loại cảm xúc từ các bình luận một cách dễ dàng.

4.1. Kết quả thực nghiệm

Kết quả thực nghiệm cho thấy mô hình LSTM đạt độ chính xác cao trong việc phân loại cảm xúc. So sánh với các mô hình khác như MLPCNN, LSTM cho kết quả tốt hơn, đặc biệt là với các bình luận ngắn và không chính thống. Điều này chứng tỏ hiệu quả của LSTM trong việc xử lý dữ liệu tuần tự như văn bản.

4.2. Ứng dụng thực tế

Ứng dụng thực tế được xây dựng dựa trên mô hình LSTM, cho phép người dùng nhập các bình luận và nhận kết quả phân loại cảm xúc ngay lập tức. Ứng dụng này có tiềm năng lớn trong việc hỗ trợ các doanh nghiệp phân tích phản hồi của khách hàng một cách nhanh chóng và hiệu quả.

21/02/2025
Phân loại cảm xúc trong văn bản tiếng việt sử dụng phương pháp học sâu
Bạn đang xem trước tài liệu : Phân loại cảm xúc trong văn bản tiếng việt sử dụng phương pháp học sâu

Để xem tài liệu hoàn chỉnh bạn click vào nút

Tải xuống