Luận án tiến sĩ: Nâng cao hiệu quả phân tích cú pháp tiếng Việt theo tiếp cận học máy thống kê

2020

193
0
0

Phí lưu trữ

30.000 VNĐ

Mục lục chi tiết

LỜI CAM ĐOAN

LỜI CẢM ƠN

MỞ ĐẦU

1. CHƯƠNG 1: CƠ SỞ LÝ THUYẾT

1.1. Khái niệm cơ bản trong tiếng Việt

1.2. Cú pháp thành phần

1.2.1. Bài toán phân tích cú pháp thành phần

1.2.2. Phương pháp phân tích cú pháp thành phần

1.2.3. Khảo sát nghiên cứu cho phân tích cú pháp thành phần

1.3. Cú pháp phụ thuộc

1.3.1. Bài toán phân tích cú pháp phụ thuộc

1.3.2. Biểu diễn cú pháp phụ thuộc

1.3.3. Các thuật toán phân tích cú pháp phụ thuộc

1.3.4. Khảo sát nghiên cứu cho phân tích cú pháp phụ thuộc

1.4. Gán nhãn vai nghĩa

1.4.1. Bài toán gán nhãn vai nghĩa

1.4.2. Các công trình liên quan

1.4.3. Khảo sát nghiên cứu cho gán nhãn vai nghĩa

1.5. Biểu diễn phân bố từ

1.5.1. Mô hình Skip-gram

1.5.2. Mô hình túi từ liên tục

1.5.3. Mô hình GloVe

1.5.4. Biểu diễn từ dựa vào ngữ cảnh sâu

2. CHƯƠNG 2: XÂY DỰNG KHO NGỮ LIỆU GÁN NHÃN CÚ PHÁP PHỤ THUỘC VÀ VAI NGHĨA TIẾNG VIỆT

2.1. Kho ngữ liệu Treebank

2.2. Xây dựng kho ngữ liệu gán nhãn cú pháp phụ thuộc

2.2.1. Tập nhãn quan hệ phụ thuộc tiếng Việt

2.2.2. Xác định cụm từ trung tâm

2.2.3. Xác định nhãn phụ thuộc

2.2.4. Thuật toán chuyển từ câu cú pháp thành phần thành cú pháp phụ thuộc

2.3. Xây dựng kho ngữ liệu gán nhãn vai nghĩa tiếng Việt

2.3.1. Bộ nhãn vai nghĩa cho tiếng Việt

2.3.2. Tập luật gán nhãn nhãn vai nghĩa

2.3.3. Xây dựng trang web hiệu chỉnh nhãn vai nghĩa thô

2.3.4. Đánh giá kết quả

3. CHƯƠNG 3: NÂNG CAO HIỆU QUẢ PHÂN TÍCH CÚ PHÁP TIẾNG VIỆT

3.1. Phân tích cú pháp thành phần

3.1.1. Một số văn phạm phổ biến

3.1.2. Phương pháp phân tích Shift-Reduce

3.1.3. Phương pháp self-attention

3.1.4. Đánh giá kết quả

3.1.5. Kết luận phân tích cú pháp thành phần

3.2. Phân tích cú pháp phụ thuộc tiếng Việt

3.2.1. Phân tích cú pháp phụ thuộc dựa trên bước chuyển

3.2.2. Phân tích cú pháp dựa trên đồ thị

3.2.3. Sử dụng BiLSTM trong phân tích cú pháp phụ thuộc

3.2.4. Đánh giá kết quả

3.2.5. Kết luận phân tích cú pháp phụ thuộc

4. CHƯƠNG 4: PHƯƠNG PHÁP QUY HOẠCH TUYẾN TÍNH NGUYÊN GÁN NHÃN VAI NGHĨA TIẾNG VIỆT

4.1. Mô tả thuật toán

4.1.1. Khảo sát một số phương pháp

4.1.2. Phương pháp đề xuất

4.2. Quy hoạch tuyến tính nguyên

4.3. Tập đặc trưng sử dụng

4.3.1. Đặc trưng cơ bản

4.3.2. Đặc trưng mới

4.4. Đánh giá kết quả

4.4.1. Phương pháp đánh giá

4.4.2. Hệ thống cơ bản

4.4.3. Chiến lược gán nhãn

4.4.4. Phân tích đặc trưng

4.4.5. Cải tiến dựa vào ILP

4.4.7. Sử dụng biểu diễn phân bố từ trong SRL

KẾT LUẬN

CÁC CÔNG TRÌNH CÔNG BỐ CỦA LUẬN ÁN

TÀI LIỆU THAM KHẢO

PHỤ LỤC

Luận án tiến sĩ hus nghiên cứu nâng cao hiệu quả phân tích cú pháp tiếng việt theo tiếp cận học máy thống kê

Bạn đang xem trước tài liệu:

Luận án tiến sĩ hus nghiên cứu nâng cao hiệu quả phân tích cú pháp tiếng việt theo tiếp cận học máy thống kê

Tài liệu có tiêu đề Nâng cao hiệu quả phân tích cú pháp tiếng Việt bằng học máy thống kê trình bày những phương pháp và kỹ thuật tiên tiến trong việc cải thiện khả năng phân tích cú pháp cho ngôn ngữ tiếng Việt thông qua ứng dụng học máy thống kê. Bài viết nhấn mạnh tầm quan trọng của việc áp dụng các mô hình học máy để tối ưu hóa quy trình phân tích, từ đó giúp nâng cao độ chính xác và hiệu quả trong việc xử lý ngôn ngữ tự nhiên.

Độc giả sẽ tìm thấy nhiều lợi ích từ tài liệu này, bao gồm việc hiểu rõ hơn về các công nghệ hiện đại trong lĩnh vực ngôn ngữ học và cách chúng có thể được áp dụng để giải quyết các vấn đề thực tiễn trong phân tích cú pháp tiếng Việt.

Để mở rộng kiến thức của mình, bạn có thể tham khảo thêm tài liệu Khóa luận tốt nghiệp khoa học dữ liệu nhận dạng các minh chứng cho bài toán phân tích quan điểm dựa trên khía cạnh tiếng việt, nơi cung cấp cái nhìn sâu sắc về phân tích quan điểm trong ngữ cảnh tiếng Việt. Ngoài ra, tài liệu Khóa luận tốt nghiệp công nghệ thông tin tăng cường dữ liệu tương đồng cho phân loại câu hỏi tiếng việt cũng sẽ giúp bạn hiểu rõ hơn về việc cải thiện dữ liệu cho các ứng dụng phân loại câu hỏi, một khía cạnh quan trọng trong việc phát triển các hệ thống xử lý ngôn ngữ tự nhiên. Những tài liệu này sẽ là nguồn tài nguyên quý giá cho những ai muốn tìm hiểu sâu hơn về lĩnh vực này.