Luận án tiến sĩ: Nâng cao hiệu quả phân tích cú pháp tiếng Việt theo học máy thống kê

Trường đại học

Đại học Quốc gia Hà Nội

Người đăng

Ẩn danh

Thể loại

luận án tiến sĩ

2020

193
0
0

Phí lưu trữ

30.000 VNĐ

Mục lục chi tiết

LỜI CAM ĐOAN

LỜI CẢM ƠN

MỞ ĐẦU

1. CHƯƠNG 1: CƠ SỞ LÝ THUYẾT

1.1. Khái niệm cơ bản trong tiếng Việt

1.2. Cú pháp thành phần

1.2.1. Bài toán phân tích cú pháp thành phần

1.2.2. Phương pháp phân tích cú pháp thành phần

1.2.3. Khảo sát nghiên cứu cho phân tích cú pháp thành phần

1.3. Cú pháp phụ thuộc

1.3.1. Bài toán phân tích cú pháp phụ thuộc

1.3.2. Biểu diễn cú pháp phụ thuộc

1.3.3. Các thuật toán phân tích cú pháp phụ thuộc

1.3.4. Khảo sát nghiên cứu cho phân tích cú pháp phụ thuộc

1.4. Gán nhãn vai nghĩa

1.4.1. Bài toán gán nhãn vai nghĩa

1.4.2. Các công trình liên quan

1.4.3. Khảo sát nghiên cứu cho gán nhãn vai nghĩa

1.5. Biểu diễn phân bố từ

1.5.1. Mô hình Skip-gram

1.5.2. Mô hình túi từ liên tục

1.5.3. Mô hình GloVe

1.5.4. Biểu diễn từ dựa vào ngữ cảnh sâu

2. CHƯƠNG 2: XÂY DỰNG KHO NGỮ LIỆU GÁN NHÃN CÚ PHÁP PHỤ THUỘC VÀ VAI NGHĨA TIẾNG VIỆT

2.1. Kho ngữ liệu Treebank

2.2. Xây dựng kho ngữ liệu gán nhãn cú pháp phụ thuộc

2.2.1. Tập nhãn quan hệ phụ thuộc tiếng Việt

2.2.2. Xác định cụm từ trung tâm

2.2.3. Xác định nhãn phụ thuộc

2.2.4. Thuật toán chuyển từ câu cú pháp thành phần thành cú pháp phụ thuộc

2.3. Xây dựng kho ngữ liệu gán nhãn vai nghĩa tiếng Việt

2.3.1. Bộ nhãn vai nghĩa cho tiếng Việt

2.3.2. Tập luật gán nhãn nhãn vai nghĩa

2.3.3. Xây dựng trang web hiệu chỉnh nhãn vai nghĩa thô

2.3.4. Đánh giá kết quả

3. CHƯƠNG 3: NÂNG CAO HIỆU QUẢ PHÂN TÍCH CÚ PHÁP TIẾNG VIỆT

3.1. Phân tích cú pháp thành phần

3.1.1. Một số văn phạm phổ biến

3.1.2. Phương pháp phân tích Shift-Reduce

3.1.3. Phương pháp self-attention

3.1.4. Đánh giá kết quả

3.1.5. Kết luận phân tích cú pháp thành phần

3.2. Phân tích cú pháp phụ thuộc tiếng Việt

3.2.1. Phân tích cú pháp phụ thuộc dựa trên bước chuyển

3.2.2. Phân tích cú pháp dựa trên đồ thị

3.2.3. Sử dụng BiLSTM trong phân tích cú pháp phụ thuộc

3.2.4. Đánh giá kết quả

3.2.5. Kết luận phân tích cú pháp phụ thuộc

4. CHƯƠNG 4: PHƯƠNG PHÁP QUY HOẠCH TUYẾN TÍNH NGUYÊN GÁN NHÃN VAI NGHĨA TIẾNG VIỆT

4.1. Mô tả thuật toán

4.1.1. Khảo sát một số phương pháp

4.1.2. Phương pháp đề xuất

4.2. Quy hoạch tuyến tính nguyên

4.3. Tập đặc trưng sử dụng

4.3.1. Đặc trưng cơ bản

4.3.2. Đặc trưng mới

4.4. Đánh giá kết quả

4.4.1. Phương pháp đánh giá

4.4.2. Hệ thống cơ bản

4.4.3. Chiến lược gán nhãn

4.4.4. Phân tích đặc trưng

4.4.5. Cải tiến dựa vào ILP

4.4.7. Sử dụng biểu diễn phân bố từ trong SRL

KẾT LUẬN

CÁC CÔNG TRÌNH CÔNG BỐ CỦA LUẬN ÁN

TÀI LIỆU THAM KHẢO

PHỤ LỤC

Luận án tiến sĩ nghiên cứu nâng cao hiệu quả phân tích cú pháp tiếng việt theo tiếp cận học máy thống kê

Bạn đang xem trước tài liệu:

Luận án tiến sĩ nghiên cứu nâng cao hiệu quả phân tích cú pháp tiếng việt theo tiếp cận học máy thống kê

Luận án tiến sĩ mang tiêu đề "Nâng cao hiệu quả phân tích cú pháp tiếng Việt theo học máy thống kê" của tác giả Nguyễn Thị Lương, dưới sự hướng dẫn của TS. Lê Hồng Phương và PGS. Đỗ Trung Tuấn, được thực hiện tại Đại học Quốc gia Hà Nội vào năm 2020. Bài luận án tập trung vào việc cải thiện các phương pháp phân tích cú pháp cho tiếng Việt thông qua các kỹ thuật học máy thống kê, nhằm nâng cao độ chính xác và hiệu quả trong việc xử lý ngôn ngữ tự nhiên. Những kết quả từ nghiên cứu này không chỉ có giá trị trong lĩnh vực ngôn ngữ học mà còn mở ra nhiều ứng dụng thực tiễn trong công nghệ thông tin và trí tuệ nhân tạo.

Để mở rộng thêm kiến thức về các ứng dụng công nghệ thông tin trong giáo dục và nghiên cứu, bạn có thể tham khảo các tài liệu liên quan như "Năng lực ứng dụng công nghệ thông tin để dạy học lịch sử và địa lí trong đào tạo giáo viên tiểu học", nơi đề cập đến việc ứng dụng công nghệ thông tin trong giáo dục, hay "Nghiên cứu phát triển kỹ thuật hỗ trợ phát hiện đạo văn trong văn bản tiếng Việt", một nghiên cứu liên quan đến xử lý văn bản tiếng Việt. Cả hai tài liệu này đều chia sẻ các khía cạnh về công nghệ thông tin và ngôn ngữ, giúp bạn có cái nhìn sâu sắc hơn về lĩnh vực này.