TỰ ĐỘNG XÁC ĐỊNH QUAN HỆ NGỮ NGHĨA CỦA TỪ DỰA TRÊN HỌC MÁY THỐNG KÊ

Trường đại học

Trường Đại Học Yale

Chuyên ngành

Công Nghệ Thông Tin

Người đăng

Ẩn danh

Thể loại

Luận Án Tiến Sĩ
154
0
0

Phí lưu trữ

45 Point

Mục lục chi tiết

LỜI CAM ĐOAN

LỜI CẢM ƠN

TÓM TẮT

MỤC LỤC

DANH MỤC CÁC TỪ VIẾT TẮT

DANH MỤC CÁC BẢNG

DANH MỤC CÁC HÌNH VẼ

1. MỞ ĐẦU

1.1. Đặt vấn đề

1.2. Bài toán xác định quan hệ ngữ nghĩa của từ

1.3. Hướng tiếp cận và phương pháp

1.4. Đóng góp của luận án

1.5. Cấu trúc của luận án

2. KIẾN THỨC CƠ SỞ VÀ CÁC NGHIÊN CỨU LIÊN QUAN

2.1. Một số khái niệm cơ bản về từ

2.2. Từ và nghĩa của từ

2.3. Ngữ nghĩa từ vựng

2.4. Quan hệ ngữ nghĩa giữa các từ

2.5. Một số giả thuyết ngữ nghĩa cơ bản

2.6. Mô hình ngữ nghĩa phân phối

2.7. Mô hình nhúng từ

2.7.1. Lịch sử của các mô hình nhúng từ

2.7.2. Một số mô hình nhúng từ tổng quát

2.7.3. Một số mô hình nhúng từ chuyên biệt

2.8. Một số mô hình nhúng từ theo ngữ cảnh

2.9. Mạng nơ-ron hồi quy

2.10. Quan hệ bao thuộc

2.11. Một số nghiên cứu liên quan

2.12. Quan hệ đồng nghĩa - trái nghĩa

2.13. Một số nghiên cứu liên quan

2.14. Đo lường độ tương tự ngữ nghĩa giữa các từ

2.15. Một số nghiên cứu liên quan

2.16. Tóm tắt chương

3. XÁC ĐỊNH QUAN HỆ BAO THUỘC DỰA TRÊN MÔ HÌNH NHÚNG TỪ CHUYÊN BIỆT

3.1. Ý tưởng chính

3.2. Phân tích hạn chế của mô hình DWN

3.3. Đề xuất mô hình LERC

3.3.1. Mô hình DWN cải tiến

3.3.2. Tích hợp đặc trưng ngữ nghĩa mức dưới từ

3.3.3. Mô hình phân lớp quan hệ bao thuộc có giám sát

3.3.4. Phân tích ưu nhược điểm và tính mới của mô hình

3.4. Xây dựng bộ dữ liệu tiếng Việt DtVLE-999, DrVLE-999, DetVLE-999

3.4.1. Lựa chọn các cặp từ ứng viên

3.4.2. Đánh giá dữ liệu

3.4.3. Thống kê dữ liệu

3.5. Bộ dữ liệu đánh giá

3.6. Huấn luyện các mô hình nhúng từ

3.7. Đánh giá mô hình

3.8. Phân tích thống kê

3.9. Tóm tắt chương

4. PHÂN TÁCH QUAN HỆ ĐỒNG NGHĨA – TRÁI NGHĨA DỰA TRÊN NGỮ CẢNH ĐỒNG HIỆN VÀ MẪU CẤU TRÚC TỪ

4.1. Ý tưởng chính

4.2. Các mẫu cấu trúc từ tiếng Việt

4.2.1. Mẫu cấu trúc từ trái nghĩa

4.2.2. Mẫu cấu trúc từ đồng nghĩa

4.3. Đề xuất mô hình DVASNet

4.3.1. Các đặc trưng tĩnh

4.3.2. Mô hình DVASNet

4.4. Xây dựng bộ dữ liệu ASC tiếng Việt

4.4.1. Các mô hình cơ sở

4.4.2. Cài đặt thực nghiệm

4.4.3. Kết quả thực nghiệm

4.5. Tóm tắt chương

5. ĐO LƯỜNG ĐỘ TƯƠNG TỰ NGỮ NGHĨA CỦA CẶP TỪ

5.1. Ý tưởng chính

5.2. Đề xuất độ đo tương tự

5.2.1. Độ đo tương tự ExtLeskSim

5.2.2. Kỹ thuật GraphSim

5.3. Xây dựng bộ dữ liệu tiếng Việt

5.3.1. Dịch bộ dữ liệu SimLex-999 sang tiếng Việt

5.3.2. Đánh giá độ tương tự của cặp từ

5.3.3. Một số thống kê trên bộ dữ liệu

5.4. Thực nghiệm với mô hình ExtLeskSim

5.5. Thực nghiệm với mô hình GraphSim

5.6. Tóm tắt chương

6. KẾT LUẬN

6.1. Các đóng góp của luận án

6.2. Hướng phát triển

DANH MỤC CÁC CÔNG TRÌNH KHOA HỌC

TÀI LIỆU THAM KHẢO

Tài liệu TỰ ĐỘNG XÁC ĐỊNH QUAN HỆ NGỮ NGHĨA CỦA TỪ DỰA TRÊN HỌC MÁY THỐNG KÊ trình bày phương pháp hiện đại trong xử lý ngôn ngữ tự nhiên, tập trung vào việc tự động nhận diện các quan hệ ngữ nghĩa giữa từ vựng thông qua kỹ thuật học máy thống kê. Nghiên cứu này mang lại giá trị thiết thực trong xây dựng hệ thống hiểu ngôn ngữ, phân tích văn bản và tổ chức tri thức theo cấu trúc ontology. Các mô hình thống kê được áp dụng giúp giảm thiểu can thiệp thủ công, đồng thời tăng độ chính xác khi phân loại quan hệ từ vựng như đồng nghĩa, trái nghĩa, bao hàm và liên kết ngữ nghĩa. Đây là tài liệu tham khảo quan trọng cho sinh viên và nhà nghiên cứu ngôn ngữ học tính toán. Những ai muốn mở rộng ứng dụng sang bài toán tiếng Việt có thể tham khảo thêm công trình về kiểm lỗi chính tả ngữ cảnh tiếng Việt để hiểu rõ hơn cách NLP được triển khai thực tế.