Khóa Luận Tốt Nghiệp: Ứng Dụng Khoa Học Dữ Liệu Tích Hợp Ngữ Nghĩa Để Phát Hiện Kế Thừa Văn Bản Tiếng Việt

2022

78
0
0

Phí lưu trữ

30 Point

Mục lục chi tiết

LỜI CAM ĐOAN

LỜI CẢM ƠN

TÓM TẮT

1. CHƯƠNG 1: MỞ ĐẦU

1.1. Đặt vấn đề

1.2. Mục tiêu và phạm vi nghiên cứu

1.2.1. Mục tiêu

1.2.2. Phạm vi nghiên cứu

1.3. Các đóng góp chính của khóa luận

1.3.1. Về khía cạnh thực tiễn

1.3.2. Về khía cạnh khoa học

1.4. Cấu trúc luận văn

2. CHƯƠNG 2: BÀI TOÁN PHÁT HIỆN KẾ THỪA VĂN BẢN (RECOGNIZING TEXTUAL ENTAILMENT)

2.1. Cơ sở kế thừa văn bản

2.2. Phát hiện kế thừa văn bản

2.3. Ứng dụng của Phát hiện kế thừa văn bản

2.4. Các công trình liên quan

2.4.1. Các nghiên cứu trên tiếng Anh

2.4.2. Các nghiên cứu trên tiếng Việt

2.5. Bài toán Gán nhãn vai nghĩa

2.5.1. Gán nhãn vai nghĩa (Semantic role labeling)

2.5.2. Thuật toán dựa trên đặc trưng cho tác vụ Gán nhãn vai nghĩa

2.5.3. Mạng nơ-ron nhân tạo cho bài toán Gán nhãn vai nghĩa

2.6. Các công trình liên quan

2.6.1. Các công trình liên quan trên tiếng Anh

2.6.2. Các công trình liên quan trên tiếng Việt

3. CHƯƠNG 3: MÔ HÌNH NGÔN NGỮ TIỀN HUẤN LUYỆN VÀ BIỂU DIỄN NGỮ NGHĨA

3.1. Tiền huấn luyện mô hình BERT

3.2. Tinh chỉnh mô hình BERT

3.3. Mô hình học không giám sát biểu diễn đa ngôn ngữ - XLM-R

3.4. Mô hình học biểu diễn ngữ cảnh nhận thức ngữ nghĩa

3.4.1. Mô hình SemBERT

3.4.2. Mô hình biến thể của SemBERT

4. CHƯƠNG 4: THÍ NGHIỆM VÀ KẾT QUẢ

4.1. Bộ dữ liệu Lorelei

4.2. Tổng quan về nhãn ngữ nghĩa

4.3. Tiền xử lí dữ liệu

4.4. Bộ dữ liệu VLSP-2021

4.5. Quá trình thực hiện

4.5.1. Tinh chỉnh mô hình cho tác vụ Gán nhãn vai nghĩa

4.5.2. Rút trích thông tin ngữ nghĩa

4.5.3. Tinh chỉnh mô hình biến thể của SemBERT cho bài toán Gán nhãn vai nghĩa

4.6. Kết quả

4.6.1. Ảnh hưởng của số lượng vị từ

4.6.2. Kết luận và hướng phát triển của thí nghiệm

4.6.2.1. Kết luận và hướng phát triển
4.6.2.2. Hướng phát triển

TÀI LIỆU THAM KHẢO

PHỤ LỤC A: CÔNG BỐ KHOA HỌC

DANH MỤC CÁC BẢNG

DANH MỤC CÁC HÌNH VẼ VÀ ĐỒ THỊ

Khóa luận tốt nghiệp khoa học dữ liệu tích hợp thông tin ngữ nghĩa cho bài toán phát hiện kế thừa văn bản tiếng việt

Khóa Luận Tốt Nghiệp: Khoa Học Dữ Liệu Tích Hợp Ngữ Nghĩa Phát Hiện Kế Thừa Văn Bản Tiếng Việt là một nghiên cứu chuyên sâu về việc ứng dụng khoa học dữ liệu và ngữ nghĩa để phát hiện sự kế thừa trong văn bản tiếng Việt. Tài liệu này không chỉ cung cấp cái nhìn toàn diện về các phương pháp tích hợp ngữ nghĩa mà còn đề xuất các giải pháp hiệu quả để xử lý văn bản phức tạp. Đây là nguồn tài liệu quý giá cho những ai quan tâm đến xử lý ngôn ngữ tự nhiên và khoa học dữ liệu.

Để mở rộng kiến thức về các phương pháp xử lý dữ liệu, bạn có thể tham khảo Luận văn thạc sĩ khoa học máy tính phân lớp dữ liệu chuỗi thời gian dựa vào mạng nơron tích chập CNN, nghiên cứu này tập trung vào việc phân lớp dữ liệu chuỗi thời gian bằng mạng nơron tích chập. Ngoài ra, Luận văn thạc sĩ khoa học máy tính cải tiến giải thuật KMeans cho bài toán gom cụm dữ liệu chuỗi thời gian cung cấp những cải tiến mới trong việc gom cụm dữ liệu, một kỹ thuật quan trọng trong khoa học dữ liệu. Cuối cùng, Luận văn thạc sĩ khoa học máy tính khai phá cụm hướng thời gian trên dữ liệu giáo dục sẽ giúp bạn hiểu rõ hơn về việc khai phá dữ liệu theo hướng thời gian, một chủ đề liên quan mật thiết đến nghiên cứu của bạn.

Những tài liệu này không chỉ bổ sung kiến thức mà còn mở ra các hướng nghiên cứu mới, giúp bạn nắm bắt sâu hơn về lĩnh vực khoa học dữ liệu và xử lý thông tin.