Luận án tiến sĩ: Xây dựng mô hình đánh giá độ khó văn bản tiếng Việt

2023

176
0
0

Phí lưu trữ

30 Point

Mục lục chi tiết

LỜI CÁM ƠN

LỜI CAM ĐOAN

1. TỔNG QUAN

1.1. Độ khó của văn bản

1.2. Các nghiên cứu về độ khó của văn bản

1.2.1. Hướng tiếp cận thống kê

1.2.2. Hướng tiếp cận máy học

1.3. Mục tiêu và phạm vi của luận án

1.4. Đối tượng nghiên cứu

1.5. Nội dung luận án

1.6. Phạm vi nghiên cứu

1.7. Đóng góp của luận án

2. CƠ SỞ LÝ THUYẾT VỀ ĐỘ KHÓ CỦA VĂN BẢN

2.1. Các yếu tố ngôn ngữ ảnh hưởng đến độ khó của văn bản

2.1.1. Yếu tố từ

2.1.2. Yếu tố câu

2.1.3. Yếu tố văn bản

2.2. Các hướng tiếp cận đánh giá độ khó văn bản tự động

2.2.1. Đánh giá độ khó văn bản theo hướng tiếp cận thống kê

2.2.2. Đánh giá độ khó theo hướng tiếp cận máy học

3. MÔ HÌNH ĐÁNH GIÁ ĐỘ KHÓ VĂN BẢN TIẾNG VIỆT

3.1. Các hướng tiếp cận

3.2. Đánh giá độ khó văn bản tiếng Việt theo hướng tiếp cận thống kê

3.2.1. Phân tích tương quan

3.2.2. Phân tích hồi quy

3.3. Đánh giá độ khó văn bản tiếng Việt theo hướng tiếp cận máy học

3.3.1. Sử dụng các thuật toán phân lớp truyền thống

3.3.2. Mô hình đánh giá độ khó văn bản sử dụng kỹ thuật học sâu

3.3.2.1. Tách đoạn văn bản
3.3.2.2. Tinh chỉnh BERT
3.3.2.3. Tổng hợp vector văn bản và phân lớp
3.3.2.4. Tích hợp đặc trưng ngôn ngữ vào mô hình

4. THỰC NGHIỆM VÀ ĐÁNH GIÁ

4.1. Xây dựng ngữ liệu

4.1.1. Thu thập ngữ liệu độ khó văn bản từ sách giáo khoa tiếng Việt

4.1.2. Xây dựng ngữ liệu độ khó của các văn bản lĩnh vực văn học và ngôn ngữ học

4.1.3. Tiền xử lý và gán nhãn ngữ liệu

4.1.4. Thống kê và gom nhóm ngữ liệu

4.1.5. Rút trích đặc trưng

4.2. Phương pháp đánh giá

4.2.1. Công thức đo độ khó văn bản tiếng Việt

4.2.2. Đánh giá độ khó văn bản theo hướng tiếp cận máy học, sử dụng các thuật toán phân lớp truyền thống

4.2.3. Đánh giá độ khó văn bản sử dụng kỹ thuật học sâu

4.2.4. So sánh với các nghiên cứu khác

KẾT LUẬN VÀ HƯỚNG PHÁT TRIỂN

DANH MỤC CÔNG TRÌNH CÔNG BỐ CỦA TÁC GIẢ

DANH MỤC TÀI LIỆU THAM KHẢO

PHỤ LỤC

A.1. DANH MỤC CÁC KÝ HIỆU, CÁC CHỮ VIẾT TẮT

A.2. DANH MỤC CÁC BẢNG

A.3. DANH MỤC CÁC HÌNH VẼ, ĐỒ THỊ

Luận án tiến sĩ khoa học máy tính xây dựng mô hình đánh giá độ khó của văn bản tiếng việt

Tài liệu "Xây dựng mô hình đánh giá độ khó văn bản tiếng Việt trong khoa học máy tính" tập trung vào việc phát triển một mô hình để đo lường và đánh giá mức độ phức tạp của các văn bản tiếng Việt, đặc biệt trong lĩnh vực khoa học máy tính. Nghiên cứu này không chỉ giúp cải thiện khả năng xử lý ngôn ngữ tự nhiên (NLP) mà còn hỗ trợ các nhà phát triển trong việc tối ưu hóa các hệ thống AI để hiểu và phân tích văn bản một cách hiệu quả hơn. Độc giả sẽ nhận được những hiểu biết sâu sắc về cách tiếp cận và phương pháp luận để xây dựng các mô hình đánh giá độ khó, từ đó áp dụng vào các dự án thực tế.

Để mở rộng kiến thức về các ứng dụng của học sâu trong xử lý ngôn ngữ tiếng Việt, bạn có thể tham khảo Luận văn thạc sĩ khoa học máy tính xây dựng hệ thống học sâu tự động thêm dấu cho tiếng Việt, nghiên cứu này tập trung vào việc tự động hóa quá trình thêm dấu cho văn bản tiếng Việt. Ngoài ra, Luận văn thạc sĩ khoa học máy tính ứng dụng học sâu vào xây dựng mô hình rút trích thông tin cung cấp cái nhìn chi tiết về cách học sâu được sử dụng để trích xuất thông tin từ văn bản. Cuối cùng, Luận văn thạc sĩ khoa học máy tính kết hợp học sâu và mô hình ngôn ngữ để nhận dạng giọng nói tiếng Việt là một tài liệu hữu ích để hiểu rõ hơn về việc áp dụng học sâu trong nhận dạng giọng nói.