Luận Văn Thạc Sĩ Về Ứng Dụng Tập Thô Trong Tìm Kiếm Web

2010

89
1
0

Phí lưu trữ

30 Point

Mục lục chi tiết

MỞ ĐẦU

1. CHƯƠNG 1: GIỚI THIỆU TỔNG QUAN

1.1. Lý do chọn đề tài

1.2. Phạm vi công việc

1.3. Cấu trúc luận văn

2. CHƯƠNG 2: MÁY TÌM KIẾM WEB

2.1. Cấu trúc máy tìm kiếm web

2.2. Biểu diễn kết quả tìm kiếm

2.3. Đánh giá chất lượng tìm kiếm

3. CHƯƠNG 3: PHÂN CỤM TÀI LIỆU VÀ VẤN ĐỀ TÁCH TỪ TIẾNG VIỆT

3.1. Ứng dụng của phân cụm tài liệu trong thu thập và tổ chức thông tin

3.2. Mô hình không gian vector và trình bày văn bản

3.3. Các kỹ thuật tiền xử lý tài liệu

3.4. Bảng trọng số

3.5. Biểu diễn cụm

3.6. Các giải thuật phân cụm

3.6.1. Phương pháp phân cụm phân cấp

3.6.2. Phương pháp phân cụm phân hoạch

3.6.3. Thuật toán phân cụm bán giám sát Seeded - KMeans

3.7. Tiêu chuẩn sự tối ưu

3.8. Gán cứng và gán mềm

3.9. Các bước thực hiện phân cụm

3.10. Đánh giá kết quả phân cụm

3.11. Phân cụm kết quả tìm kiếm web

3.12. Các phương pháp tách từ tiếng Việt

3.12.1. Đặc điểm từ trong tiếng Việt

3.12.2. Phương pháp so khớp cực đại

3.12.3. Phương pháp học cải biến

3.12.4. Mô hình tách từ bằng WFST và mạng Neural

3.12.5. Phương pháp tách từ tiếng Việt dựa trên thống kê từ Internet và thuật giải di truyền

4. CHƯƠNG 4: LÝ THUYẾT TẬP THÔ

4.1. Hệ thông tin

4.2. Quan hệ bất khả phân biệt

4.3. Quan hệ tương đương - Lớp tương đương

4.4. Xấp xỉ tập hợp

4.5. Hàm thuộc thô

4.6. Mô hình tập thô dung sai

4.7. Không gian dung sai các từ chỉ mục

4.8. Nâng cao chất lượng biểu diễn tài liệu

4.9. Mở rộng lược đồ trọng số cho xấp xỉ trên

5. CHƯƠNG 5: ÁP DỤNG LÝ THUYẾT TẬP THÔ VÀO PHÂN CỤM KẾT QUẢ TÌM KIẾM WEB

5.1. Vấn đề phân cụm kết quả tìm kiếm web

5.2. Các thuật toán phân cụm tài liệu dựa trên TRSM

5.2.1. Biểu diễn cụm

5.2.2. Thuật toán phân cụm không phân cấp dựa trên TRSM

5.2.3. Thuật toán phân cụm phân cấp dựa trên TRSM

5.2.4. Thuật toán TRC

5.2.5. Xây dựng ma trận từ - tài liệu

5.2.6. Tạo lớp dung sai

5.2.7. Thuật toán phân cụm Seeded - KMeans cải tiến

6. CHƯƠNG 6: XÂY DỰNG ỨNG DỤNG THỬ NGHIỆM

6.1. Xác định yêu cầu

6.2. Các thành phần của ứng dụng thử nghiệm

6.2.1. Xây dựng các thành phần chức năng

6.2.2. Trình thu thập nội dung web

6.2.3. Bộ tách từ tiếng Việt

6.2.4. Bộ xử lý truy vấn

6.2.5. Biểu diễn kết quả tìm kiếm web

6.3. Triển khai ứng dụng thử nghiệm

Tài liệu tham khảo

Luận văn thạc sĩ vnu uet ứng dụng tập thô vào tìm kiếm web