Nghiên cứu các phương pháp tách từ phục vụ phân loại văn bản tiếng Lào trong luận án tiến sĩ

Trường đại học

Đại học Đà Nẵng

Chuyên ngành

Khoa học máy tính

Người đăng

Ẩn danh

Thể loại

luận án tiến sĩ

2017

99
0
0

Phí lưu trữ

30.000 VNĐ

Mục lục chi tiết

LỜI CAM ĐOAN

MỞ ĐẦU

1. CHƯƠNG 1: VẤN ĐỀ XỬ LÝ TIẾNG LÀO

1.1. TÌM HIỂU TIẾNG LÀO

1.1.1. Giới thiệu tiếng Lào

1.1.2. Nguồn gốc của tiếng Lào

1.1.3. Những yếu tố ngữ pháp tiếng Lào

1.2. SO SÁNH TIẾNG LÀO VỚI NGÔN NGỮ LÁNG GIỀNG

1.2.1. So sánh bảng chữ cái

1.2.2. So sánh cấu trúc âm tiết

1.2.3. So sánh cấu trúc từ vựng

1.2.4. So sánh cấu trúc câu

1.3. TIẾNG LÀO TRONG BỐI CẢNH XL NNTN

1.3.1. Giới thiệu một số kết quả xử lý tiếng Lào

1.3.2. Thực trạng và thách thức trong xử lý tiếng Lào

1.3.3. Đặt bài toán phân loại văn bản tiếng Lào

KẾT LUẬN CHƯƠNG 1

2. CHƯƠNG 2: PHÂN LOẠI VĂN BẢN VÀ BÀI TOÁN TÁCH TỪ

2.1. MỞ ĐẦU VỀ VĂN BẢN VÀ SOẠN THẢO VĂN BẢN

2.1.1. Khái niệm văn bản

2.1.2. Khái niệm soạn thảo văn bản (STVB). Xu thế soạn thảo văn bản hiện nay

2.2. BÀI TOÁN PHÂN LOẠI VĂN BẢN

2.2.1. Tìm hiểu bài toán phân loại văn bản

2.2.2. Quy trình giải quyết bài toán PLVB

2.2.3. Các phương pháp giải quyết bài toán PLVB

2.3. BÀI TOÁN TÁCH TỪ TRONG PHÂN LOẠI VĂN BẢN

2.3.1. Tìm hiểu bài toán tách từ

2.3.2. Các phương pháp tách từ

2.3.3. Đánh giá hai phương pháp

2.4. PHÂN LOẠI VĂN BẢN TIẾNG LÀO

2.4.1. Bài toán phân loại văn bản tiếng Lào

2.4.2. Nhu cầu giải quyết bài toán tách từ tiếng Lào

2.4.3. Đề xuất giải pháp triển khai

KẾT LUẬN CHƯƠNG 2

3. CHƯƠNG 3: GIẢI PHÁP TÁCH TỪ TRONG VĂN BẢN TIẾNG LÀO

3.1. NHẬN DIỆN TỪ SỬ DỤNG ĐẶC TRƯNG NGỮ PHÁP

3.1.1. Vấn đề nhận diện từ trong câu tiếng Lào

3.1.2. Xây dựng mô hình cấu trúc của từ đơn. Giải pháp nhận diện từ trong câu

3.2. XÂY DỰNG CƠ SỞ LUẬT NHẬN DIỆN TỪ ĐƠN

3.2.1. Xây dựng vị từ và hàm

3.2.2. Xây dựng cơ sở luật

3.2.3. Xây dựng máy suy diễn nhận diện từ đơn

3.3. TRIỂN KHAI GIẢI PHÁP TÁCH TỪ

3.3.1. Xây dựng kho ngữ vựng tiếng Lào

3.3.2. Áp dụng phương pháp so khớp tối đa. Chiến lược kết hợp luật nhận diện từ với khử bỏ nhập nhằng

KẾT LUẬN CHƯƠNG 3

4. CHƯƠNG 4: THỰC NGHIỆM PLVB VÀ ĐÁNH GIÁ KẾT QUẢ

4.1. CHUẨN BỊ DỮ LIỆU

4.1.1. Phân tích hiện trạng trường ĐH Champasak

4.1.2. Thu thập dữ liệu HCVP tại trường ĐH Champasak

4.1.3. Xây dựng kho văn bản HCVP của trường ĐH Champasak

4.2. TRIỂN KHAI CHUẨN BỊ THỬ NGHIỆM

4.2.1. Xây dụng mô hình thử nghiệm. Chuẩn bị cơ sở thử nghiệm. Đề xuất PLVB sử dụng hai phương pháp SVM và RBF

4.3. CHẠY THỬ NGHIỆM VÀ ĐÁNH GIÁ KẾT QUẢ

4.3.1. Thử nghiệm hai phương pháp tách từ CRF và MM

4.3.2. Thử nghiệm tách từ sử dụng cơ sở luật để xử lý nhập nhằng

4.3.3. Thử nghiệm phân loại văn bản

KẾT LUẬN CHƯƠNG 4

TÀI LIỆU THAM KHẢO

Luận án tiến sĩ nghiên cứu các phương pháp tách từ phục vụ phân loại văn bản tiếng lào

Bạn đang xem trước tài liệu:

Luận án tiến sĩ nghiên cứu các phương pháp tách từ phục vụ phân loại văn bản tiếng lào

Phương pháp tách từ hiệu quả cho phân loại văn bản tiếng Lào trong luận án tiến sĩ là một nghiên cứu chuyên sâu về xử lý ngôn ngữ tự nhiên, tập trung vào việc cải thiện độ chính xác trong phân loại văn bản tiếng Lào. Tài liệu này giới thiệu các kỹ thuật tách từ tiên tiến, giúp tối ưu hóa quá trình xử lý văn bản và nâng cao hiệu suất của các mô hình phân loại. Đây là nguồn tài liệu quý giá cho các nhà nghiên cứu và chuyên gia trong lĩnh vực xử lý ngôn ngữ tự nhiên, đặc biệt là những người quan tâm đến ngôn ngữ ít phổ biến như tiếng Lào.

Để mở rộng kiến thức về các phương pháp xử lý ngôn ngữ tự nhiên, bạn có thể tham khảo Luận văn thạc sĩ khoa học máy tính phân loại văn bản dựa trên mô hình tiền xử lý transformer, nghiên cứu này tập trung vào việc áp dụng mô hình transformer để phân loại văn bản. Ngoài ra, Luận văn thạc sĩ khoa học máy tính ứng dụng học sâu vào xây dựng mô hình rút trích thông tin cung cấp cái nhìn sâu hơn về việc sử dụng học sâu trong xử lý thông tin. Cuối cùng, Luận văn thạc sĩ khoa học máy tính trích xuất thông tin thực thể và quan hệ trong văn bản tiếng việt bằng mô hình đồ thị động là một tài liệu hữu ích để hiểu rõ hơn về trích xuất thông tin từ văn bản.

Những tài liệu này không chỉ bổ sung kiến thức mà còn mở ra các hướng nghiên cứu mới, giúp bạn nắm bắt được xu hướng hiện đại trong lĩnh vực xử lý ngôn ngữ tự nhiên.