Mô Hình Ngôn Ngữ ViSoBERT: Giải Pháp Xử Lý Dữ Liệu Truyền Thông Xã Hội Tiếng Việt

Chuyên ngành

Khoa học dữ liệu

Người đăng

Ẩn danh

Thể loại

khóa luận

2024

82
0
0

Phí lưu trữ

30.000 VNĐ

Mục lục chi tiết

LỜI CẢM ƠN

1. CHƯƠNG 1: TỔNG QUAN

1.1. Khái niệm cơ bản

1.2. Phương pháp nghiên cứu

2. CHƯƠNG 2: CÁC CÔNG TRÌNH NGHIÊN CỨU LIÊN QUAN

2.1. Công trình nghiên cứu về các tác vụ xử lý dữ liệu truyền thông xã hội tiếng Việt

2.2. Mô hình ngôn ngữ cho dữ liệu tiếng Việt

2.3. MHNN cho dữ liệu truyền thông xã hội

2.4. Các công trình nghiên cứu về Mạng Nơ-ron Tích chập Đồ thị

2.5. Mạng nơ-ron Tích chập Đồ thị kết hợp MHNN

2.6. Các công trình nghiên cứu về phương pháp cho tác vụ dữ liệu truyền thông xã hội

2.7. Một số phương pháp cho tác vụ dữ liệu truyền thông xã hội Việt Nam

3. CHƯƠNG 3: VISOBERT: MÔ HÌNH NGÔN NGỮ CHO TÁC VỤ XỬ LÝ DỮ LIỆU TRUYỀN THÔNG XÃ HỘI TIẾNG VIỆT

3.1. Dữ liệu huấn luyện cho mô hình ngôn ngữ ViSoBERT

3.2. Kiến trúc mô hình

3.3. Tokenizer cho dữ liệu truyền thông xã hội Việt Nam

4. CHƯƠNG 4: VISOGCN: MẠNG NƠ-RON TÍCH CHẬP ĐỒ THỊ KẾT HỢP MÔ HÌNH NGÔN NGỮ CHO KHAI THÁC DỮ LIỆU MẠNG XÃ HỘI TIẾNG VIỆT

4.1. Mô-đun ViSoBERT

4.2. Mô-đun Mạng nơ-ron Tích chập Đồ thị (GCN)

4.3. Mô hình ViSoGCN

5. CHƯƠNG 5: THỬ NGHIỆM VÀ KẾT QUẢ

5.1. Các tác vụ đánh giá

5.2. Kết quả thử nghiệm ViSoBERT

5.3. Kết quả thử nghiệm ViSoGCN

5.4. Phân tích kết quả và thảo luận ViSoBERT

5.4.1. Ảnh hưởng của Masking Rate trên các mô hình ngôn ngữ

5.4.2. Ảnh hưởng của các yếu tố của dữ liệu truyền thông xã hội Việt Nam trên các mô hình ngôn ngữ

5.4.3. Ảnh hưởng của Teencode

5.4.4. Ảnh hưởng của Dấu câu

5.4.5. Trích xuất đặc trưng giữa các mô hình ngôn ngữ

5.5. Phân tích kết quả và thảo luận ViSoGCN

5.5.1. Ảnh hưởng của tham số lambda (A)

5.5.2. Thử nghiệm độc lập 02 mô-đun của mô hình đề xuất

5.5.3. So sánh với các nghiên cứu trước đó

5.5.3.1. Các nghiên cứu trước đó trên bộ dữ liệu UIT-VSMEC
5.5.3.2. Các nghiên cứu trước đó trên bộ dữ liệu UITHSD
5.5.3.3. Các nghiên cứu trước đó trên bộ dữ liệu SA-VLSP2016
5.5.3.4. Các nghiên cứu trước đó trên bộ dữ liệu ViSpamReVIEWS
5.5.3.5. Các nghiên cứu trước đó trên bộ dữ liệu ViIHOS

6. CHƯƠNG 6: KẾT LUẬN VÀ HƯỚNG PHÁT TRIỂN

DANH MỤC CÔNG TRÌNH CỦA TÁC GIẢ

TÀI LIỆU THAM KHẢO

PHỤ LỤC A: MÔ HÌNH VISOBERT

A.1. Các kết quả tách từ của các MHNN trên các bình luận MXH thực tế

A.2. Các thông số thiết kế của TN

A.3. PLMs với các phương pháp tiền xử lý dữ liệu truyền thông xã hội

A.4. Trích xuất đặc trưng dựa trên MHNN cho BiLSTM và BiGRU

A.5. Cập nhật các spans mới cho tác vụ Hate Speech Span trong các kỹ thuật tiền xử lý

A.6. Phân tách từ của các MHNN khi loại bỏ dấu trong các bình luận

PHỤ LỤC B: MÔ HÌNH VISOGCN

B.1. Ảnh hưởng của tham số lambda lên các MH kết hợp

Tài liệu có tiêu đề Mô Hình Ngôn Ngữ ViSoBERT Cho Xử Lý Dữ Liệu Truyền Thông Xã Hội Tiếng Việt trình bày một mô hình ngôn ngữ tiên tiến được thiết kế đặc biệt cho việc xử lý dữ liệu truyền thông xã hội bằng tiếng Việt. Mô hình ViSoBERT không chỉ giúp cải thiện độ chính xác trong việc phân tích và hiểu ngữ nghĩa của các bình luận, bài viết trên mạng xã hội, mà còn hỗ trợ các ứng dụng thực tiễn như chatbot và phân loại nội dung.

Độc giả sẽ tìm thấy nhiều lợi ích từ tài liệu này, bao gồm cách thức mà ViSoBERT có thể được áp dụng để tối ưu hóa các chiến lược truyền thông và marketing, cũng như nâng cao trải nghiệm người dùng trong các nền tảng trực tuyến. Để mở rộng thêm kiến thức về lĩnh vực này, bạn có thể tham khảo tài liệu Đồ án tốt nghiệp đại học đề tài áp dụng phobert cho phân loại bình luận và xây dựng chatbot trong mua sắm quần áo trực tuyến, nơi bạn sẽ tìm thấy những ứng dụng thực tiễn của mô hình ngôn ngữ trong lĩnh vực thương mại điện tử.

Khám phá thêm các tài liệu liên quan sẽ giúp bạn nắm bắt sâu hơn về cách mà công nghệ ngôn ngữ có thể thay đổi cách chúng ta tương tác và hiểu biết về dữ liệu trong thời đại số.