Khóa Luận Tốt Nghiệp Về Phân Đoạn Từ Tiếng Việt Sử Dụng Mô Hình CRFs

Trường đại học

Đại học Quốc gia Hà Nội

Chuyên ngành

Công nghệ thông tin

Người đăng

Ẩn danh

2006

52
1
0

Phí lưu trữ

30.000 VNĐ

Mục lục chi tiết

LỜI CẢM ƠN

LỜI NÓI ĐẦU

1. CHƯƠNG 1: PHÂN ĐOẠN TỪ TIẾNG VIỆT

1.1. Từ vựng tiếng Việt

1.1.1. Tiếng – đơn vị cấu tạo lên từ

1.1.1.1. Khái niệm
1.1.1.2. Phân loại
1.1.1.3. Mô hình tiếng trong tiếng Việt và các thành tố của nó

1.1.2. Cấu tạo từ

1.1.2.1. Từ đơn
1.1.2.2. Từ ghép
1.1.2.3. Từ láy
1.1.2.4. Nhập nhằng

1.2. Phân đoạn từ tiếng Việt bằng máy tính

1.2.1. Phương pháp Maximum Matching

2. CHƯƠNG 2: CONDITIONAL RANDOM FIELDS

2.1. Định nghĩa CRF

2.2. Huấn luyện CRF

2.3. Suy diễn CRF

2.4. Tổng kết chương

3. CHƯƠNG 3: PHÂN ĐOẠN TỪ TIẾNG VIỆT VỚI MÔ HÌNH CRF

3.1. Mô tả bài toán phân đoạn từ tiếng Việt

3.2. Thu thập dữ liệu

3.3. Chuẩn bị dữ liệu

3.4. Đầu vào và đầu ra của mô hình CRFs

3.5. Lựa chọn thuộc tính

3.5.1. Mẫu ngữ cảnh từ điển

3.5.2. Mẫu ngữ cảnh từ vựng

3.5.3. Mẫu ngữ cảnh phát hiện tên thực thể

3.5.4. Mẫu ngữ cảnh phát hiện từ láy

3.5.5. Mẫu ngữ cảnh âm tiết tiếng Việt

3.5.6. Mẫu ngữ cảnh dạng regular expression

3.6. Cách đánh giá

3.6.1. Phương pháp đánh giá

3.6.2. Các đại lượng đo độ chính xác

3.7. Tổng kết chương

4. CHƯƠNG 4: THỬ NGHIỆM VÀ ĐÁNH GIÁ

4.1. Môi trường thử nghiệm

4.2. Mô tả thử nghiệm

4.2.1. Thiết lập tham số

4.2.2. Mô tả thử nghiệm

4.3. Kết quả thử nghiệm

4.3.1. Kết quả 5 lần thử nghiệm

4.3.2. Lần thử nghiệm cho kết quả tốt nhất

4.3.3. Trung bình 5 lần thực nghiệm

4.3.4. Phân tích và thảo luận kết quả thử nghiệm

4.4. Tổng kết chương

PHẦN KẾT LUẬN

5. Tổng kết công việc đã làm và đóng góp của luận văn

6. Hướng nghiên cứu tiếp theo

TÀI LIỆU THAM KHẢO

Tài liệu có tiêu đề Phân Đoạn Từ Tiếng Việt Bằng Mô Hình CRFs: Giải Pháp Hiệu Quả trình bày một phương pháp tiên tiến trong việc phân đoạn từ ngữ trong tiếng Việt bằng cách sử dụng mô hình Conditional Random Fields (CRFs). Bài viết nêu bật những ưu điểm của mô hình CRFs, bao gồm khả năng xử lý ngữ cảnh và tính chính xác cao trong việc xác định các đơn vị từ. Điều này không chỉ giúp cải thiện chất lượng phân đoạn từ mà còn hỗ trợ các ứng dụng ngôn ngữ tự nhiên khác như nhận dạng thực thể và phân tích cú pháp.

Để mở rộng kiến thức của bạn về lĩnh vực này, bạn có thể tham khảo thêm tài liệu Luận văn thạc sĩ khoa học máy tính nhận dạng thực thể với phương pháp weak supervision trong văn bản tiếng việt, nơi khám phá các phương pháp nhận dạng thực thể trong văn bản tiếng Việt. Ngoài ra, tài liệu Luận văn phân tách cụm danh từ cơ sở tiếng việt sử dụng mô hình crfs cũng sẽ cung cấp cho bạn cái nhìn sâu sắc hơn về việc áp dụng mô hình CRFs trong phân tách cụm danh từ. Những tài liệu này sẽ giúp bạn có cái nhìn toàn diện hơn về các ứng dụng và tiềm năng của mô hình CRFs trong xử lý ngôn ngữ tự nhiên.