Luận Văn Thạc Sĩ Về Thuật Toán Đánh Chỉ Mục Ngược Với MapReduce Và Ứng Dụng Trong Đánh Giá Ý ...

Trường đại học

Đại học Thái Nguyên

Chuyên ngành

Khoa học máy tính

Người đăng

Ẩn danh

Thể loại

luận văn

2016

77
0
0

Phí lưu trữ

30 Point

Mục lục chi tiết

LỜI CAM ĐOAN

LỜI CÁM ƠN

MỤC LỤC

DANH SÁCH CÁC TỪ VIẾT TẮT

DANH MỤC CÁC HÌNH VẼ, BẢNG BIỂU

CHƯƠNG MỞ ĐẦU

0.1. Đối tượng và phạm vi nghiên cứu

0.2. Hướng thực hiện đề tài

0.3. Những nội dung nghiên cứu chính

1. CHƯƠNG 1: MÔ HÌNH MapReduce

1.1. Tổng quan về MapReduce

1.2. Sự quan trọng của MapReduce

1.3. Các ý tưởng của MapReduce

1.4. Cấu trúc dữ liệu trong MapReduce

1.5. Mapper và Reducer

1.6. Partitioner và Combiner

1.7. Bộ khung thực thi

1.8. Di chuyển dữ liệu và mã lệnh

1.9. Hệ thống file phân tán. Kiến trúc của HDFS

1.10. Nhiệm vụ của NameNode

1.11. Nhiệm vụ của DataNode

1.12. Nhiệm vụ của Secondary NameNode

2. CHƯƠNG 2: THUẬT TOÁN XỬ LÝ DỮ LIỆU VĂN BẢN VỚI MapReduce

2.1. Thiết kế thuật toán MapReduce cơ bản

2.2. Gộp lớn cục bộ

2.3. Bộ hai và bộ ba

2.4. Tính toán tần số tương đối

2.5. Sắp xếp thứ cấp

2.6. Thuật toán tính chỉ mục ngược để tìm kiếm dữ liệu văn bản

2.7. Thuật toán chỉ mục ngược

2.8. Cài đặt theo cơ bản

2.9. Cài đặt thuật toán cải tiến

2.10. Nén chỉ mục

3. CHƯƠNG 3: THỬ NGHIỆM THUẬT TOÁN ĐÁNH GIÁ Ý KIẾN TRÊN MẠNG XÃ HỘI

3.1. Mã nguồn mở Solr

3.2. Các tính năng chính của Solr

3.3. Mã nguồn mở Nutch

3.4. Các lý do để tự xây dựng một Search Engine

3.5. Các tính năng chính của Nutch

3.6. API biểu đồ Facebook

3.7. Solr trên Hadoop và tìm kiếm thử nghiệm

3.8. Cài đặt cụm máy Hadoop

3.9. Cài đặt Nutch tích hợp với Solr

3.10. Thu thập dữ liệu

3.11. Thực hiện tìm kiếm thử nghiệm trên tập chỉ mục đã thu thập được