Tính Toán Độ Tương Tự Ngữ Nghĩa Văn Bản Dựa Vào Độ Tương Tự Giữa Từ

2010

68
0
0

Phí lưu trữ

30 Point

Mục lục chi tiết

MỞ ĐẦU

0.1. Tính cấp thiết của đề tài

0.2. Mục tiêu của luận văn

0.3. Đối tượng và nhiệm vụ của luận văn

0.4. Phương pháp và nội dung nghiên cứu

0.5. Kết cấu của luận văn

1. CHƯƠNG I: KHÁI NIỆM ĐỘ TƯƠNG TỰ

1.1. Tổng quan về độ tương tự

1.2. Khái niệm độ tương tự

1.3. Định nghĩa độ tương tự (Definition of Similarity)

1.4. Độ tương tự giữa các giá trị có thứ tự ưu tiên (ordinal values)

1.5. Độ tương tự chuỗi (String Similarity - A case study)

1.6. Độ tương tự ngữ nghĩa

2. CHƯƠNG II: ĐỘ TƯƠNG TỰ TỪ-TỪ

2.1. Khái niệm từ, thuật ngữ

2.2. Từ và cấu trúc từ của tiếng Việt

2.3. Định nghĩa từ

2.4. Cấu trúc từ của tiếng Việt

2.5. Nghĩa của từ

2.6. Từ đồng nghĩa

2.7. Các cách tiếp cận xử lý tài liệu theo ngữ nghĩa

2.7.1. Dựa trên trí tuệ nhân tạo (AI-based)

2.7.2. Dựa trên Cơ sở tri thức (Knowledge-based)

2.7.3. Dựa trên ngữ liệu (Corpus-based)

2.8. Độ tương tự ngữ nghĩa từ-từ dựa trên cơ sở tri thức (từ điển WordNet)

2.8.1. Khái quát về từ điển WordNet

2.8.2. Độ tương tự từ-từ dựa trên từ điển WordNet

2.9. Độ tương tự ngữ nghĩa từ-từ dựa trên ngữ liệu

2.9.1. Phương pháp của Dekang Lin

3. CHƯƠNG III: ĐỘ TƯƠNG TỰ VĂN BẢN-VĂN BẢN

3.1. Xử lý văn bản tiếng Việt

3.2. Một số kết quả đã đạt được

3.3. Đặc trưng của cấu trúc ngữ pháp tiếng Việt

3.4. Tách từ trong văn bản tiếng Việt

3.4.1. Các hướng tiếp cận tách từ

3.4.2. Các hướng tiếp cận dựa trên “từ”

3.4.3. Các hướng tiếp cận dựa trên ký tự

3.4.4. Một số phương pháp tách từ tiếng Việt hiện nay

3.4.4.1. Phương pháp Maximum Matching: Forward/Backward
3.4.4.2. Phương pháp Transformation-based Learning (TBL)
3.4.4.3. Mô hình tách từ bằng WFST và mạng Neural
3.4.4.3.1. Tầng mạng Neural
3.4.4.4. Phương pháp tách từ tiếng Việt dựa trên thống kê từ Internet và thuật giải di truyền
3.4.4.5. GA Engine for Text Segmentation

3.5. Độ tương tự văn bản-văn bản

4. CHƯƠNG IV: TÍNH ĐỘ TƯƠNG TỰ NGỮ NGHĨA VĂN BẢN DỰA VÀO ĐỘ TƯƠNG TỰ GIỮA TỪ VỚI TỪ

4.1. Phát biểu bài toán

4.2. Giải quyết bài toán

4.3. Chuẩn bị dữ liệu

4.4. Tách từ: Tách văn bản thành các từ ghép và danh từ riêng

4.4.1. Tách từ ghép trong văn bản

4.4.2. Tách danh từ riêng trong văn bản

4.5. Tính toán độ tương tự văn bản

4.6. Xây dựng hệ thống

4.6.1. Nhập trực tiếp 2 văn bản

4.6.2. Nhập 2 văn bản từ file

4.6.3. Lấy nội dung 2 văn bản từ URL

4.7. Kết quả thử nghiệm và đánh giá

4.7.1. Một số ví dụ cụ thể

4.7.2. Kết quả thử nghiệm

4.7.3. Cách tiến hành

4.7.4. Kết quả thử nghiệm

HƯỚNG PHÁT TRIỂN

TÀI LIỆU THAM KHẢO

Luận văn thạc sĩ vnu uet tính toán độ tương tự ngữ nghĩa văn bản dựa vào độ tương tự giữa từ với từ