Khóa luận tốt nghiệp: Tầm ảnh hưởng của tách từ trong nhận dạng chuỗi tiếng Việt

2022

87
0
0

Phí lưu trữ

30.000 VNĐ

Mục lục chi tiết

LỜI CẢM ƠN

1. CHƯƠNG 1: TỔNG QUAN

1.1. ĐẶT VẤN ĐỀ

1.1.1. Đặc điểm ngôn ngữ

1.1.2. Kỹ thuật tách từ

1.1.2.1. Word-based tokenization algorithm (Thuật toán mã hóa dựa trên từ)

1.1.2.2. Subword-based tokenization algorithm (Thuật toán mã hóa dựa trên từ phụ)

1.1.2.3. Character-based tokenization algorithm (Thuật toán mã hóa dựa trên ký tự)

1.2. Đối tượng và phạm vi nghiên cứu

1.2.1. Đối tượng

1.2.2. Phạm vi

1.3. Giới thiệu bài toán

1.4. Bài toán nhận diện cảm xúc theo khía cạnh

1.5. Bài toán hệ thống hỏi đáp

1.6. Cấu trúc khóa luận

1.7. Tính ứng dụng của đề tài

2. CHƯƠNG 2: CÔNG TRÌNH NGHIÊN CỨU LIÊN QUAN

2.1. Công trình trên thế giới

2.1.1. Bài toán phân tích cảm xúc dựa trên khía cạnh

2.1.2. Bài toán đọc hiểu tự động

2.2. Công trình trong nước

2.2.1. Bài toán phân tích tình cảm dựa trên khía cạnh

2.2.2. Bài toán đọc hiểu máy

3. CHƯƠNG 3: CƠ SỞ LÝ THUYẾT, THỬ NGHIỆM

3.1. Dữ liệu sử dụng trong thử nghiệm

3.2. Mô hình BiLSTM-CRF

3.3. Quy trình thực hiện

3.4. Phương pháp đánh giá

3.5. Thông số cài đặt mô hình

3.5.1. Tham số mô hình PhoBERT và mô hình XLM-R

3.5.2. Tham số mô hình BiLSTM-CRF

4. CHƯƠNG 4: KẾT QUẢ

4.1. Bài toán nhận diện cảm xúc theo khía cạnh

4.2. Phân tích kết quả chi tiết

4.3. Bài toán nhận diện khía cạnh

4.4. Bài toán nhận diện cảm xúc

4.5. Kết luận

5. CHƯƠNG 5: KẾT LUẬN VÀ HƯỚNG PHÁT TRIỂN

TÀI LIỆU THAM KHẢO

Khóa luận tốt nghiệp công nghệ thông tin nghiên cứu tầm ảnh hưởng của tách từ trên các bài toán nhận dạng chuỗi tiếng việt

Bạn đang xem trước tài liệu:

Khóa luận tốt nghiệp công nghệ thông tin nghiên cứu tầm ảnh hưởng của tách từ trên các bài toán nhận dạng chuỗi tiếng việt

Tài liệu "Nghiên cứu tách từ và ảnh hưởng đến nhận dạng chuỗi tiếng Việt" tập trung vào việc phân tích quá trình tách từ trong tiếng Việt và tác động của nó đến khả năng nhận dạng chuỗi văn bản. Nghiên cứu này đưa ra các phương pháp tối ưu hóa việc tách từ, giúp cải thiện độ chính xác trong các ứng dụng xử lý ngôn ngữ tự nhiên (NLP) như dịch máy, phân loại văn bản và nhận dạng thực thể. Đây là nguồn tài liệu hữu ích cho những ai quan tâm đến việc nâng cao hiệu quả xử lý ngôn ngữ tiếng Việt trong lĩnh vực khoa học máy tính.

Để mở rộng kiến thức về các phương pháp xử lý ngôn ngữ tiếng Việt, bạn có thể tham khảo Luận văn đề tài xây dựng mô hình ngôn ngữ cho tiếng Việt, nghiên cứu này cung cấp cái nhìn sâu hơn về việc xây dựng các mô hình ngôn ngữ phù hợp với đặc thù của tiếng Việt. Ngoài ra, Luận văn thạc sĩ khoa học máy tính bắt lỗi chính tả bằng phương pháp Transformer cũng là một tài liệu đáng chú ý, giúp bạn hiểu rõ hơn về các kỹ thuật hiện đại trong việc xử lý lỗi chính tả. Cuối cùng, Luận án tiến sĩ khoa học máy tính phân tích cảm xúc trên cơ sở trị cảm xúc chuyển dịch theo ngữ cảnh cho tiếng Việt sẽ mang đến góc nhìn chuyên sâu về phân tích cảm xúc, một ứng dụng quan trọng trong NLP.

Những tài liệu này không chỉ bổ sung kiến thức mà còn giúp bạn khám phá các phương pháp tiên tiến trong lĩnh vực xử lý ngôn ngữ tiếng Việt.