Luận Án Tiến Sĩ Về Đánh Giá Mức Độ Giống Nhau Của Văn Bản Tiếng Việt

Trường đại học

Đại học Đà Nẵng

Chuyên ngành

Khoa Học Máy Tính

Người đăng

Ẩn danh

2019

151
0
0

Phí lưu trữ

30 Point

Mục lục chi tiết

LỜI CAM ĐOAN

1. CHƯƠNG 1: TỔNG QUAN TÌNH HÌNH NGHIÊN CỨU

1.1. Một số khái niệm sử dụng trong luận án

1.2. Một số đặc điểm của ngôn ngữ tiếng Việt

1.3. Một số khó khăn và nhập nhằng trong xử lý văn bản tiếng Việt

1.4. Mô hình biểu diễn văn bản

1.4.1. Mô hình biểu diễn văn bản

1.4.2. Nhận xét và đánh giá

1.5. Các phương pháp tính độ tương tự văn bản

1.5.1. Hướng tiếp cận

1.5.2. Bài toán so khớp chuỗi

1.5.3. So sánh văn bản và ứng dụng trong phát hiện sao chép

1.5.4. Các vấn đề liên quan về sao chép

1.5.5. Phát hiện sao chép tại PAN

1.6. Kết luận Chương 1

2. CHƯƠNG 2: SO SÁNH VĂN BẢN DỰA TRÊN MÔ HÌNH VECTOR

2.1. Tính độ tương tự văn bản trong mô hình vector

2.2. Biểu diễn văn bản theo mô hình vector

2.3. Phương pháp tính trọng số từ chỉ mục

2.4. Phương pháp tính độ tương tự

2.5. Một số phương pháp so sánh văn bản dựa trên mô hình vector

2.6. Mô hình vector hóa văn bản

2.7. Phương pháp cải tiến sử dụng độ đo Cosine

2.8. Đánh giá các phương pháp dựa trên mô hình vector

2.9. Tạo bộ dữ liệu để đánh giá các thuật toán

2.10. Đánh giá các thuật toán dựa trên mô hình vector

2.11. Kết luận Chương 2

3. CHƯƠNG 3: PHÁT HIỆN SAO CHÉP VĂN BẢN DỰA TRÊN BIẾN ĐỔI WAVELET RỜI RẠC

3.1. Phát biểu bài toán

3.2. Cơ sở lý thuyết về DWT và bộ lọc Haar

3.2.1. Cơ sở lý thuyết về DWT

3.2.2. Bộ lọc Haar

3.3. Đề xuất mô hình hệ thống phát hiện sao chép

3.3.1. Đề xuất mô hình hệ thống áp dụng cho phương pháp dựa trên DWT

3.3.2. Đề xuất quy trình chuyển đổi dữ liệu

3.3.3. Đề xuất phương pháp và giải thuật xử lý

3.3.3.1. Tiền xử lý dữ liệu
3.3.3.2. Quy trình số hóa
3.3.3.3. Giải thuật cho bộ lọc Haar

3.4. Tổ chức dữ liệu cho bộ DNA nguồn

3.5. Đề xuất thuật toán phát hiện sự giống nhau

3.5.1. Mã hóa dữ liệu và tính DNA của văn bản đánh giá

3.5.2. So sánh và đưa ra quyết định

3.5.3. Độ phức tạp của thuật toán phát hiện sự giống nhau

3.6. Kết quả thử nghiệm phương pháp dựa trên DWT

3.6.1. Dữ liệu thử nghiệm

3.6.2. Kết quả thử nghiệm

3.7. Kết luận Chương 3

4. CHƯƠNG 4: PHÁT TRIỂN HỆ THỐNG PHÁT HIỆN SAO CHÉP VĂN BẢN TIẾNG VIỆT

4.1. Mô tả hệ thống

4.1.1. Các đối tượng sử dụng

4.1.2. Mô hình tổng quát

4.2. Xây dựng kho dữ liệu văn bản tiếng Việt

4.2.1. Kiến trúc hệ thống kho dữ liệu

4.2.2. Giải pháp xây dựng kho dữ liệu

4.2.3. Đánh giá về kho dữ liệu

4.3. Triển khai hệ thống phát hiện sao chép văn bản

4.4. Đề xuất hướng phát triển để xử lý dữ liệu lớn

4.4.1. Đề xuất giải pháp xử lý

4.4.2. Đề xuất phương pháp biểu diễn DNA bằng Tensor

4.5. Kết luận Chương 4

DANH MỤC CÁC CÔNG TRÌNH KHOA HỌC ĐÃ CÔNG BỐ

TÀI LIỆU THAM KHẢO

Luận án tiến sĩ kỹ thuật đánh giá mức độ giống nhau của văn bản tiếng việt

Tài liệu có tiêu đề Đánh Giá Mức Độ Giống Nhau Của Văn Bản Tiếng Việt cung cấp một cái nhìn sâu sắc về cách thức đánh giá sự tương đồng giữa các văn bản tiếng Việt. Nội dung chính của tài liệu tập trung vào các phương pháp và công cụ được sử dụng để phân tích và so sánh văn bản, từ đó giúp người đọc hiểu rõ hơn về cách thức mà các văn bản có thể được đánh giá về mặt ngữ nghĩa và cấu trúc.

Một trong những lợi ích lớn nhất mà tài liệu này mang lại là khả năng hỗ trợ các nhà nghiên cứu, sinh viên và những người làm trong lĩnh vực ngôn ngữ học trong việc phát triển kỹ năng phân tích văn bản. Bằng cách nắm vững các phương pháp này, người đọc có thể cải thiện khả năng viết và biên soạn văn bản của mình, đồng thời nâng cao chất lượng công việc nghiên cứu.

Nếu bạn muốn mở rộng kiến thức của mình về các hệ thống công nghệ liên quan, hãy tham khảo tài liệu Xây dựng hệ thống xử lý đa luồng kết hợp với ai cho hệ thống camera giám sát thông minh. Tài liệu này sẽ giúp bạn hiểu rõ hơn về ứng dụng của công nghệ AI trong việc xử lý và phân tích dữ liệu, một khía cạnh quan trọng trong việc phát triển các hệ thống thông minh hiện đại.