Luận Văn Về Chương Trình Bắt Lỗi Chính Tả Tiếng Việt

Trường đại học

Hồ Chí Minh

Chuyên ngành

Công nghệ thông tin

Người đăng

Ẩn danh

Thể loại

luận văn

2004

172
0
0

Phí lưu trữ

45 Point

Mục lục chi tiết

LỜI CẢM ƠN

1. CHƯƠNG 1: MỞ ĐẦU

1.1. Nội dung bài toán

1.2. Hướng giải quyết

1.3. Bố cục luận văn

2. CHƯƠNG 2: CƠ SỞ LÝ THUYẾT NGÔN NGỮ

2.1. Nguyên âm và phụ âm

2.2. Chính tả tiếng Việt

2.2.1. Tổng quan về chữ viết tiếng Việt

2.2.2. Chính tả tiếng Việt

2.2.3. Lỗi chính tả

3. CHƯƠNG 3: CƠ SỞ TIN HỌC

3.1. Bắt lỗi chính tả

3.1.1. Phân loại lỗi chính tả

3.1.2. Phát hiện lỗi chính tả

3.1.3. Các sai lầm của trình bắt lỗi chính tả

3.1.4. Vấn đề chữ hoa, chữ thường

3.2. Mô hình HMM

3.3. Mô hình WFST và mạng nơ-ron

3.4. Mô hình Source-Channel cải tiến

3.5. Mô hình TBL

3.6. Tách từ mờ

3.6.1. Mô hình chung

3.6.2. Bắt lỗi non-word

3.6.3. Bắt lỗi real-word

3.6.4. Chữ viết hoa

3.6.5. Từ nước ngoài, từ viết tắt, các ký hiệu

4. CHƯƠNG 4: MÔ HÌNH ĐỀ NGHỊ CHO BẮT LỖI CHÍNH TẢ TIẾNG VIỆT

4.1. Tìm lỗi chính tả

4.2. Lập danh sách từ đề nghị

4.3. Sắp xếp danh sách từ đề nghị

4.4. Các heuristic để cải thiện độ chính xác

4.5. Huấn luyện mô hình ngôn ngữ

4.5.1. Cấu trúc dữ liệu

4.5.2. Cách tách từ

4.5.3. Mô hình ngôn ngữ

5. CHƯƠNG 5: CÁC CHI TIẾT KHI CÀI ĐẶT CHƯƠNG TRÌNH

5.1. Dữ liệu huấn luyện

5.2. Dữ liệu nguồn

5.3. Tiền xử lý ngữ liệu huấn luyện

5.4. Huấn luyện dữ liệu

5.5. So sánh chuỗi

5.6. Xử lý tiếng Việt

6. CHƯƠNG 6: ĐÁNH GIÁ VÀ KẾT LUẬN

6.1. Tóm tắt luận văn

6.2. Các kết quả đạt được

6.3. Tìm hiểu các đặc điểm của mô hình cũng như chương trình cài đặt

6.4. Hướng phát triển

TÀI LIỆU THAM KHẢO

PHỤ LỤC

A. Dữ liệu kiểm tra