Khai Phá Tri Thức Song Ngữ và Ứng Dụng Trong Dịch Máy Anh - Việt

Trường đại học

Đại học Quốc gia Hà Nội

Chuyên ngành

Khoa học máy tính

Người đăng

Ẩn danh

Thể loại

luận án tiến sĩ

2016

129
0
0

Phí lưu trữ

30.000 VNĐ

Mục lục chi tiết

Lời cam đoan

Tóm tắt

Lời cảm ơn

Danh mục các chữ viết tắt

Danh mục các hình vẽ

Danh mục các bảng

MỞ ĐẦU

1. CHƯƠNG 1: TỔNG QUAN

1.1. Khai phá tri thức song ngữ

1.1.1. Xây dựng ngữ liệu song ngữ

1.1.2. Gióng hàng văn bản

1.1.2.1. Gióng hàng đoạn/câu
1.1.2.2. Gióng hàng từ

1.1.3. Xác định cụm từ song ngữ

1.2. Sơ lược về dịch máy

1.3. Dịch máy thống kê

1.3.1. Mô hình hóa bài toán

1.3.2. Mô hình ngôn ngữ

1.3.3. Mô hình dịch

1.3.3.1. Mô hình dịch dựa trên từ
1.3.3.2. Mô hình dịch dựa trên cụm từ
1.3.3.3. Mô hình dịch dựa trên cú pháp

1.3.5. Đánh giá chất lượng dịch

2. CHƯƠNG 2: XÂY DỰNG NGỮ LIỆU SONG NGỮ CHO DỊCH MÁY THỐNG KÊ

2.1. Rút trích văn bản song ngữ từ Web

2.1.1. Thu thập dữ liệu

2.1.2. Thiết kế các đặc trưng dựa vào nội dung

2.1.2.1. Sử dụng cognate
2.1.2.2. Sử dụng các phân đoạn dịch
2.1.2.3. Thiết kế các đặc trưng dựa vào cấu trúc
2.1.2.4. Mô hình hóa bài toán phân loại

2.2. Rút trích câu song ngữ từ sách điện tử

2.3. Gióng hàng đoạn

2.4. Gióng hàng câu

2.4.1. Thực nghiệm về rút trích văn bản song ngữ từ Web

2.4.1.1. Cài đặt thực nghiệm
2.4.1.2. Kết quả thực nghiệm

2.4.2. Thực nghiệm về rút trích câu song ngữ từ sách điện tử

2.4.2.1. Cài đặt thực nghiệm
2.4.2.2. Kết quả thực nghiệm

2.4.3. Thực nghiệm về bổ sung ngữ liệu song ngữ cho dịch máy

2.4.4. Kết luận chương

3. CHƯƠNG 3: GÓNG HÀNG TỪ CHO DỊCH MÁY THỐNG KÊ

3.1. Định nghĩa từ

3.2. Định nghĩa bài toán gióng hàng từ

3.3. Các mô hình IBM

3.4. Thuật toán cực đại kỳ vọng cho mô hình IBM 1

3.5. Một số cải tiến mô hình IBM 1 theo cách tiếp cận dựa trên ràng buộc

3.5.1. Cải tiến mô hình IBM 1 sử dụng ràng buộc neo

3.5.2. Cải tiến mô hình IBM 1 sử dụng ràng buộc về vị trí của từ

3.5.3. Cải tiến mô hình IBM 1 sử dụng ràng buộc về từ loại

3.5.3.1. Quan hệ về từ loại
3.5.3.2. Ràng buộc về từ loại

3.5.4. Cải tiến mô hình IBM 1 sử dụng ràng buộc về cụm từ

3.5.4.1. Mẫu cú pháp song ngữ
3.5.4.2. Ràng buộc về cụm từ

3.5.5. Kết hợp các ràng buộc

3.5.5.1. Cài đặt thực nghiệm
3.5.5.2. Kết quả thực nghiệm với ràng buộc neo và ràng buộc về vị trí của từ
3.5.5.3. Kết quả thực nghiệm với ràng buộc từ loại
3.5.5.4. Kết quả thực nghiệm với ràng buộc cụm từ
3.5.5.5. Kết quả thực nghiệm về kết hợp ràng buộc

3.5.6. Kết luận chương

4. CHƯƠNG 4: XÁC ĐỊNH CỤM TỪ SONG NGỮ CHO DỊCH MÁY THỐNG KÊ

4.1. Bài toán rút trích cụm từ song ngữ

4.2. Phương pháp rút trích cụm từ song ngữ

4.2.1. Tìm cụm từ đích

4.2.2. Rút trích cụm từ

4.2.3. Tích hợp cụm từ song ngữ vào dịch máy

4.3. Thực nghiệm về rút trích cụm từ song ngữ

4.3.1. Cài đặt thực nghiệm

4.3.2. Kết quả thực nghiệm

4.4. Thực nghiệm về tích hợp cụm từ song ngữ vào dịch máy

4.4.1. Cài đặt thực nghiệm

4.4.2. Kết quả thực nghiệm

4.5. Kết luận chương

Kết luận

Danh mục công trình khoa học của tác giả liên quan đến luận án

Tài liệu tham khảo