Khóa luận tốt nghiệp: Phát hiện bình luận xúc phạm ngôn ngữ tiếng Việt trên mạng xã hội

2021

73
0
0

Phí lưu trữ

30.000 VNĐ

Mục lục chi tiết

LỜI CẢM ƠN

1. CHƯƠNG 1: TỔNG QUAN ĐỀ TÀI

1.1. Lý do chọn đề tài

1.2. Phương pháp

1.3. Cấu trúc khóa luận

2. CHƯƠNG 2: KIẾN THỨC TỔNG QUÁT

2.1. Bài toán phát hiện bình luận xúc phạm

2.2. Mô hình phân loại văn bản

2.2.1. Mô hình transfer learning

2.2.2. Mô hình học máy truyền thống

2.2.2.1. Trích xuất đặc trưng TF-IDF
2.2.2.2. Máy véc-tơ hỗ trợ (Support Vector Machine)
2.2.2.3. Hồi quy logistic (Logistic Regression)
2.2.2.4. Phân loại Ridge (Classifier Ridge)

2.2.3. Mô hình học sâu

2.2.3.1. Nhúng từ (Word embedding)

3. CHƯƠNG 3: PHÁT TRIỂN MÔ HÌNH HSD

3.1. Môi trường triển khai

3.2. Bộ dữ liệu

3.3. Đặc trưng của dữ liệu văn bản trên mạng xã hội

3.4. Kết quả thực nghiệm

3.5. Phân tích lỗi

4. CHƯƠNG 4: PHÂN TÍCH ẢNH HƯỞNG CỦA TIỀN XỬ LÝ TRONG HSD

4.1. Xác định yếu tố chính

4.2. Xây dựng kịch bản thí nghiệm

4.3. Thực nghiệm trên các bộ dữ liệu

4.4. Thu thập kết quả

4.5. Phân tích kết quả

5. CHƯƠNG 5: XÂY DỰNG MÔ HÌNH REAL-TIME HSD

5.1. Tổng quan mô hình

5.2. Thu thập, tiền xử lý và phát hiện bình luận xúc phạm

5.3. Stream processing kết hợp phân tích dữ liệu

5.4. Vai trò của Apache Kafka

5.5. Kết quả thực nghiệm mô hình

5.6. Môi trường triển khai

6. CHƯƠNG 6: TỔNG KẾT

6.1. Kết quả

DANH MỤC HÌNH

DANH MỤC BẢNG

DANH MỤC TỪ VIẾT TẮT

TÓM TẮT KHÓA LUẬN

Khóa luận tốt nghiệp khoa học dữ liệu phát hiện bình luận xúc phạm ngôn ngữ tiếng việt trên mạng xã hội trong dữ liệu trực tuyến

Bạn đang xem trước tài liệu:

Khóa luận tốt nghiệp khoa học dữ liệu phát hiện bình luận xúc phạm ngôn ngữ tiếng việt trên mạng xã hội trong dữ liệu trực tuyến

Tài liệu "Phát hiện bình luận xúc phạm tiếng Việt trên mạng xã hội" tập trung vào việc ứng dụng các kỹ thuật học sâu và xử lý ngôn ngữ tự nhiên (NLP) để nhận diện và phân loại các bình luận mang tính xúc phạm trên các nền tảng mạng xã hội. Đây là một vấn đề cấp thiết trong bối cảnh gia tăng các hành vi tiêu cực trực tuyến, giúp các nền tảng quản lý nội dung hiệu quả hơn. Tài liệu cung cấp cái nhìn sâu sắc về cách xây dựng mô hình học máy để tự động hóa quá trình này, đồng thời đề xuất các phương pháp cải thiện độ chính xác và hiệu suất.

Để mở rộng kiến thức về các ứng dụng học sâu trong xử lý ngôn ngữ tiếng Việt, bạn có thể tham khảo Luận văn thạc sĩ khoa học máy tính sử dụng contextual valence shifters để phân loại cảm xúc cho các văn bản đơn giản trong một lĩnh vực, nghiên cứu về phân loại cảm xúc trong văn bản. Ngoài ra, Luận văn thạc sĩ khoa học máy tính phân loại văn bản dựa trên mô hình tiền xử lý transformer cung cấp thêm góc nhìn về việc sử dụng transformer trong phân loại văn bản. Cuối cùng, Luận văn thạc sĩ khoa học máy tính ứng dụng học sâu vào xây dựng mô hình rút trích thông tin sẽ giúp bạn hiểu rõ hơn về cách học sâu được áp dụng trong các bài toán liên quan đến xử lý ngôn ngữ.