Luận văn thạc sĩ: Nghiên cứu gán nhãn từ loại cho văn bản tiếng Việt bằng phương pháp học máy ...

2012

53
0
0

Phí lưu trữ

30 Point

Mục lục chi tiết

LỜI NÓI ĐẦU

1. CHƯƠNG 1: TỔNG QUAN

1.1. Bài toán gán nhãn từ loại

1.2. Tổng quan về cách tiếp cận giải bài toán

1.2.1. Quá trình gán nhãn từ loại

1.2.2. Ngữ liệu

1.2.3. Các tiếp cận giải bài toán

1.3. Gán nhãn dựa trên luật

1.4. Gán nhãn thống kê

1.5. Các từ chưa biết

1.6. Bài toán gán nhãn từ loại tiếng Việt

2. CHƯƠNG 2: CƠ SỞ TOÁN HỌC

2.1. Định lý Bayes

2.2. Thuật toán cực đại hóa kỳ vọng (EM)

2.3. Mô hình Markov ẩn

2.3.1. Ba bài toán cơ bản của HMM

2.4. Mô hình n-gram

2.5. Khái niệm phân cụm

2.5.1. Các yêu cầu của phân cụm

2.5.2. Các phương pháp phân cụm

2.6. Phân tích giá trị kỳ dị

3. CHƯƠNG 3: MỘT SỐ PHƯƠNG PHÁP TIẾP CẬN KHÔNG CÓ HƯỚNG DẪN CHO GÁN NHÃN TỪ LOẠI

3.1. Gán nhãn sử dụng kỹ thuật Cực đại hóa kỳ vọng

3.1.1. Huấn luyện mô hình Trigram

3.1.2. Kết quả thử nghiệm với tiếng Anh

3.1.3. Các thí nghiệm cơ bản

3.2. Gán nhãn từ loại bằng kỹ thuật phân cụm

3.2.1. Suy luận gán nhãn

3.2.2. Suy luận dựa trên từ loại

3.2.3. Suy luận dựa trên loại từ và ngữ cảnh

3.2.4. Suy luận dựa trên loại từ và ngữ cảnh, sử dụng các véc tơ ngữ cảnh trái và phải tổng quát hoá

3.3. Đề xuất phương pháp không hướng dẫn cho bài toán gán nhãn từ loại tiếng Việt

LỜI CẢM ƠN