Tìm Hiểu Mô Hình Ngôn Ngữ PhoBERT Cho Bài Toán Phân Loại Quan Điểm Bình Luận Tiếng Việt

2021

66
10
0

Phí lưu trữ

30.000 VNĐ

Mục lục chi tiết

LỜI CẢM ƠN

MỞ ĐẦU

1. CHƯƠNG 1: MÔ HÌNH BERT

1.1. Khái niệm BERT

1.2. Tại sao lại cần BERT

1.3. Một số khái niệm

1.3.1. Nhiệm vụ phía sau (Downstream task)

1.3.2. Điểm khái quát đánh giá mức độ hiểu ngôn ngữ (GLUE score benchmark)

1.3.3. Phân tích cảm xúc (Sentiment Analysis)

1.3.4. Hỏi đáp (Question and Answering)

1.3.5. Suy luận ngôn ngữ (Natural Language Inference)

1.3.6. Quan hệ văn bản (Textual Entailment)

1.3.7. Ngữ cảnh (Contextual)

1.3.8. Phương pháp Hiện đại nhất (SOTA)

1.3.9. Mô hình LTR

1.3.10. Mô hình ngôn ngữ được đánh dấu MLM (Masked Language Model)

1.3.11. Ngữ cảnh (Contextual) và vai trò trong NLP

2. CHƯƠNG 2: MÔ HÌNH PHOBERT

2.1. Sự ra đời của PhoBERT

2.2. Cấu trúc của PhoBERT

2.3. Dữ liệu trước khi huấn luyện

2.4. Thiết lập thử nghiệm

2.4.1. Kết quả thực nghiệm

2.5. Ứng dụng của PhoBert

3. CHƯƠNG 3: ỨNG DỤNG PHOBERT VÀO BÀI TOÁN PHÂN TÍCH QUAN ĐIỂM BÌNH LUẬN TIẾNG VIỆT

3.1. Phát biểu bài toán

3.2. Dữ liệu và Công cụ, môi trường thực nghiệm

3.2.1. Công cụ và môi trường thực nghiệm

3.2.2. Ngôn ngữ lập trình Python

3.2.3. Thư viện mã nguồn mở Tensorflow

3.2.4. Thư viện Transformers

3.2.5. Thư viện fastBPE

3.2.6. Thư viện fairseq

3.2.7. Thư viện VnCoreNLP

3.2.8. PhoBERT đã được huấn luyện trước

3.2.9. Môi trường thực nghiệm

3.2.10. Các bước thực hiện

3.2.11. Cài đặt các thư viện cần thiết

3.2.12. Cài đặt thư viện vncorenlp

3.2.13. Tải về bộ dữ liệu huấn luyện từ trang chủ cuộc thi của AIVIVN và pre-trained của PhoBERT

3.2.14. Tải về dữ liệu của cuộc thi Phân tích sắc thái bình luận

3.2.15. Tách dữ liệu ra thành 2 tập train và validation theo tỉ lệ 90:10

3.2.16. Tạo một mask gồm các giá trị 0, 1 để làm đầu vào cho thư viện transformers

3.2.17. Huấn luyện mô hình

3.3. Kết luận

TÀI LIỆU THAM KHẢO

Luận văn tìm hiểu mô hình ngôn ngữ phobert cho bài toán phân loại quan điểm bình luận tiếng việt

Bạn đang xem trước tài liệu:

Luận văn tìm hiểu mô hình ngôn ngữ phobert cho bài toán phân loại quan điểm bình luận tiếng việt

Tài liệu Tìm Hiểu Mô Hình Ngôn Ngữ PhoBERT Trong Phân Loại Quan Điểm Bình Luận Tiếng Việt cung cấp cái nhìn sâu sắc về mô hình ngôn ngữ PhoBERT, một công cụ mạnh mẽ trong việc phân loại quan điểm bình luận bằng tiếng Việt. Tài liệu này không chỉ giải thích cách thức hoạt động của PhoBERT mà còn nêu bật những lợi ích mà nó mang lại cho việc xử lý ngôn ngữ tự nhiên, đặc biệt trong việc phân tích cảm xúc và ý kiến của người dùng. Độc giả sẽ tìm thấy những thông tin hữu ích về cách áp dụng mô hình này trong thực tế, từ đó nâng cao khả năng hiểu biết và ứng dụng công nghệ trong lĩnh vực ngôn ngữ.

Nếu bạn muốn mở rộng kiến thức của mình về các mô hình ngôn ngữ khác, hãy tham khảo tài liệu Một số mô hình họ sâu trong xử lý ngôn ngữ tự nhiên. Tài liệu này sẽ giúp bạn hiểu rõ hơn về các phương pháp và công nghệ tiên tiến trong lĩnh vực xử lý ngôn ngữ tự nhiên, từ đó tạo nền tảng vững chắc cho việc nghiên cứu và ứng dụng các mô hình ngôn ngữ hiện đại.