Luận Văn Thạc Sĩ: Phân Cụm Kết Quả Tìm Kiếm Web Theo Cách Tiếp Cận Phân Tích Ngữ Nghĩa Tiềm Ẩn ...

83
0
0

Phí lưu trữ

30 Point

Mục lục chi tiết

MỞ ĐẦU

1. CHƯƠNG 1: GIỚI THIỆU TỔNG QUAN

1.1. Động lực

1.2. Phạm vi công việc

1.3. Cấu trúc luận văn

2. CHƯƠNG 2: VẤN ĐỀ TÌM KIẾM WEB VÀ PHÂN CỤM TÀI LIỆU

2.1. Máy tìm kiếm Web

2.2. Cấu trúc bên trong

2.3. Biểu diễn kết quả tìm kiếm

2.4. Khái niệm phân cụm

2.5. Phân cụm tài liệu

2.6. Ứng dụng vào Phân cụm kết quả tìm kiếm Web

2.7. Các bước thực hiện phân cụm

2.8. Mục tiêu phân cụm

2.9. Các vấn đề cần chú ý

2.10. Giải thuật phân cụm

2.10.1. Phương pháp phân cụm phân cấp

2.10.2. Phương pháp phân cụm phân hoạch

2.11. Đánh giá kết quả phân cụm

2.12. Ứng dụng phân cụm

2.13. Một số kĩ thuật phân cụm kết quả tìm kiếm Web hiện nay

2.14. Một số kĩ thuật xử lí tự động tài liệu văn bản

2.14.1. Phân tích từ vựng

2.14.2. Loại bỏ stop-words

3. CHƯƠNG 3: PHÂN TÍCH NGỮ NGHĨA TIỀM ẨN VÀ FISHER KERNEL

3.1. Mô hình không gian vectơ

3.1.1. Trọng số từ

3.1.2. Độ đo tương tự giữa các tài liệu

3.2. Phân tích ngữ nghĩa tiềm ẩn (Latent Semantic Analysis - LSA)

3.2.1. Đặc điểm ngôn ngữ tự nhiên

3.2.2. Mục tiêu LSA

3.2.3. Biểu diễn tập tài liệu dưới dạng bảng co_occurrence

3.2.4. Cơ sở toán học

3.2.5. Chi tiết kĩ thuật SVD

3.3. Xây dựng Fisher Kernel dựa trên LSA

4. CHƯƠNG 4: GIẢI THUẬT PHÂN CỤM KẾT QUẢ TÌM KIẾM WEB THEO CÁCH TIẾP CẬN LSA VÀ FISHER KERNEL

4.1. Phân cụm tài liệu theo cách tiếp cận LSA và Fisher Kernel

4.1.1. Xác định phần tử đại diện nhóm

4.1.2. Giải thuật phân cụm phân hoạch theo LSA và Fisher Kernel (LSA-FK)

4.2. Phân cụm kết quả tìm kiếm Web theo cách tiếp cận LSA và Fisher Kernel

4.2.1. Biểu diễn tập tài liệu dưới dạng bảng co_occurrence

4.2.2. Trích chọn từ đặc trưng

4.2.3. Đánh giá mức độ quan trọng của từ thông qua phương pháp trọng số từ

4.2.4. Khai phá các khái niệm ẩn bên trong tập tài liệu theo phương pháp LSA và tính độ tương tự giữa các tài liệu theo hàm đo độ tương tự Fisher Kernel

4.3. Mô hình thực hiện

4.3.1. Mô hình Carrot2

4.3.2. Lí do chọn ngôn ngữ lập trình Java

5. CHƯƠNG 5: ĐÁNH GIÁ THỰC NGHIỆM

5.1. Các phương pháp đánh giá thực nghiệm

5.2. Ý kiến người sử dụng

5.3. Đánh giá giải thuật LSA-FK

5.3.1. Giá trị k tối ưu

5.3.2. Ngưỡng tương tự

5.3.3. Tính tổng quát câu hỏi truy vấn

TÀI LIỆU THAM KHẢO

Luận văn thạc sĩ vnu uet phân cụm tập kết quả tìm kiếm web theo cách tiếp cận phân tích ngữ nghĩa tiềm ẩn và fisher kernel luận văn ths công nghệ thông tin 1 01 10