Luận Văn Thạc Sĩ Khoa Học Máy Tính: Ứng Dụng Deep Learning Để Khai Phá Quan Điểm

2017

69
0
0

Phí lưu trữ

30.000 VNĐ

Tóm tắt

I. Giới thiệu chung

Luận văn tập trung vào việc ứng dụng Deep Learning để khai phá quan điểm từ các bình luận và đánh giá của người dùng. Mục tiêu chính là xây dựng một hệ thống có khả năng phân tích và rút trích quan điểm với độ chính xác cao. Deep Learning, đặc biệt là mô hình Convolutional Neural Network (CNN), được sử dụng để xử lý dữ liệu văn bản tiếng Việt. Luận văn cũng đề cập đến các thách thức trong việc khai phá quan điểm, bao gồm sự đa nghĩa của từ ngữ, cách biểu đạt cảm xúc khác nhau, và việc phân tích nhiều khía cạnh trong cùng một câu bình luận.

1.1 Tổng quan về Khai phá phân tích quan điểm

Khai phá quan điểm (Opinion Mining) là một lĩnh vực quan trọng trong xử lý ngôn ngữ tự nhiên, giúp phân tích và đánh giá quan điểm của con người về các sản phẩm, sự kiện, hoặc hiện tượng. Việc này có ứng dụng rộng rãi trong kinh tế, chính trị, và tiếp thị. Luận văn sử dụng Deep Learning để xây dựng hệ thống phân tích quan điểm, với nguồn dữ liệu là các bình luận và đánh giá từ mạng xã hội. Các thách thức chính bao gồm sự đa nghĩa của từ ngữ, cách biểu đạt cảm xúc khác nhau, và việc phân tích nhiều khía cạnh trong cùng một câu bình luận.

1.2 Mô hình Deep Learning

Deep Learning là một mô hình học máy sử dụng mạng neuron với nhiều lớp ẩn để biểu diễn dữ liệu một cách chi tiết và trừu tượng. Các mô hình Deep Learning phổ biến bao gồm Convolutional Neural Network (CNN), Recurrent Neural Network (RNN), và Deep Belief Network. Trong luận văn này, CNN được sử dụng để xử lý dữ liệu văn bản tiếng Việt, với mục tiêu phân tích và rút trích quan điểm từ các bình luận và đánh giá của người dùng.

II. Phương pháp tiếp cận

Luận văn sử dụng phương pháp tiếp cận dựa trên Deep Learning, cụ thể là mô hình CNN, để phân tích và rút trích quan điểm từ các bình luận và đánh giá của người dùng. Dữ liệu được thu thập từ Công ty Younet, sau đó được gán nhãn và chia thành hai phần: một phần dùng để huấn luyện mô hình và một phần dùng để kiểm tra độ chính xác. Luận văn cũng đề cập đến việc sử dụng TensorFlow để thực hiện các tính toán song song trên cả CPU và GPU, nhằm tăng hiệu suất xử lý dữ liệu.

2.1 Nguồn dữ liệu và tiền xử lý

Nguồn dữ liệu được sử dụng trong luận văn là các bình luận và đánh giá của người dùng về các sản phẩm công nghệ, được thu thập từ Công ty Younet. Dữ liệu sau đó được tiền xử lý bằng cách loại bỏ các từ dừng (stopwords), ký hiệu cảm xúc, và các yếu tố không liên quan khác. Dữ liệu được gán nhãn và chia thành hai phần: một phần dùng để huấn luyện mô hình và một phần dùng để kiểm tra độ chính xác.

2.2 Mô hình CNN và TensorFlow

Luận văn sử dụng mô hình CNN để xử lý dữ liệu văn bản tiếng Việt. CNN là một mô hình Deep Learning phù hợp cho việc phân tích và rút trích quan điểm từ các bình luận và đánh giá của người dùng. TensorFlow được sử dụng để thực hiện các tính toán song song trên cả CPU và GPU, nhằm tăng hiệu suất xử lý dữ liệu. Mô hình CNN được huấn luyện trên tập dữ liệu đã được gán nhãn, sau đó được kiểm tra độ chính xác trên tập dữ liệu kiểm tra.

III. Kết quả và đánh giá

Luận văn đạt được kết quả khả quan trong việc phân tích và rút trích quan điểm từ các bình luận và đánh giá của người dùng. Mô hình CNN cho thấy hiệu suất cao hơn so với các phương pháp truyền thống như SVM. Kết quả cũng cho thấy khả năng ứng dụng thực tế của luận văn trong việc phân tích quan điểm từ các bình luận và đánh giá của người dùng trên mạng xã hội.

3.1 So sánh hiệu suất giữa CNN và SVM

Kết quả thực nghiệm cho thấy mô hình CNN đạt hiệu suất cao hơn so với phương pháp SVM trong việc phân tích và rút trích quan điểm từ các bình luận và đánh giá của người dùng. CNN có khả năng xử lý dữ liệu lớn và tận dụng tốt sức mạnh của phần cứng như GPU, giúp tăng hiệu suất xử lý dữ liệu.

3.2 Ứng dụng thực tế

Luận văn có khả năng ứng dụng thực tế cao trong việc phân tích quan điểm từ các bình luận và đánh giá của người dùng trên mạng xã hội. Kết quả phân tích có thể được sử dụng để đưa ra các chiến lược tiếp thị và cải tiến sản phẩm, giúp các doanh nghiệp nắm bắt được nhu cầu và thị hiếu của người dùng.

21/02/2025

TÀI LIỆU LIÊN QUAN

Luận văn thạc sĩ khoa học máy tính dùng deep learning để khai phá quan điểm
Bạn đang xem trước tài liệu : Luận văn thạc sĩ khoa học máy tính dùng deep learning để khai phá quan điểm

Để xem tài liệu hoàn chỉnh bạn click vào nút

Tải xuống

Luận Văn Thạc Sĩ Khoa Học Máy Tính: Ứng Dụng Deep Learning Khai Phá Quan Điểm là một nghiên cứu chuyên sâu về việc áp dụng các kỹ thuật học sâu (deep learning) để phân tích và khai phá quan điểm từ dữ liệu văn bản. Tài liệu này cung cấp cái nhìn chi tiết về cách xây dựng mô hình học máy hiệu quả, giúp nhận diện và phân loại cảm xúc, quan điểm trong các văn bản, đặc biệt là trong bối cảnh tiếng Việt. Đây là nguồn tài liệu hữu ích cho những ai quan tâm đến lĩnh vực xử lý ngôn ngữ tự nhiên (NLP) và ứng dụng AI trong phân tích dữ liệu.

Để mở rộng kiến thức về chủ đề này, bạn có thể tham khảo Luận văn thạc sĩ khoa học máy tính sử dụng contextual valence shifters để phân loại cảm xúc cho các văn bản đơn giản trong một lĩnh vực, nghiên cứu này tập trung vào việc phân loại cảm xúc bằng các phương pháp tiên tiến. Ngoài ra, Luận văn thạc sĩ khoa học máy tính phân loại văn bản dựa trên mô hình tiền xử lý transformer cung cấp thêm góc nhìn về việc sử dụng mô hình transformer trong phân loại văn bản. Cuối cùng, Luận văn thạc sĩ khoa học máy tính ứng dụng học sâu vào xây dựng mô hình rút trích thông tin là tài liệu bổ sung về ứng dụng học sâu trong việc rút trích thông tin từ dữ liệu.

Những tài liệu này không chỉ giúp bạn hiểu sâu hơn về ứng dụng của deep learning mà còn mở rộng kiến thức trong các lĩnh vực liên quan như NLP và AI.

Tải xuống (69 Trang - 1.25 MB)