Luận Văn Thạc Sĩ Về Hệ Thống Tìm Kiếm Văn Bản

Người đăng

Ẩn danh

Thể loại

luận văn

2022

80
0
0

Phí lưu trữ

30.000 VNĐ

Mục lục chi tiết

LỜI CAM ĐOAN

LỜI CẢM ƠN

MỤC LỤC

DANH MỤC CÁC KÝ HIỆU VÀ CHỮ VIẾT TẮT

DANH SÁCH CÁC BẢNG

DANH SÁCH CÁC HÌNH VẼ

1. CHƯƠNG 1: TỔNG QUAN VÀ ĐỀ TÀI

1.1. Giới thiệu tổng quan và vấn đề nghiên cứu

1.2. Khảo sát hệ thống tìm kiếm văn bản

1.3. Mục tiêu đề tài

1.4. Đối tượng và phạm vi nghiên cứu

1.4.1. Đối tượng nghiên cứu

1.4.2. Phạm vi nghiên cứu

1.5. Phương pháp nghiên cứu

1.5.1. Giả thuyết nghiên cứu

1.5.2. Phương pháp nghiên cứu

1.6. Ý nghĩa khoa học và thực tiễn của đề tài

1.6.1. Ý nghĩa khoa học

1.6.2. Ý nghĩa thực tiễn

1.7. Nội dung thực hiện

2. CHƯƠNG 2: CƠ SỞ LÝ THUYẾT

2.1. Vấn đề truy tìm thông tin

2.1.1. Cấu trúc của một hệ thống truy tìm thông tin

2.1.2. Các phương pháp truy hồi thông tin

2.1.3. Đánh giá một hệ thống tìm kiếm thông tin

2.2. Các thành phần của ontology

2.2.1. Phân loại ontology

2.2.2. Vai trò của Ontology

2.2.3. Các ứng dụng dựa trên Ontology

2.2.4. Các hướng tiếp cận xây dựng ontology

2.3. Mô hình Không gian Vector (VSM)

2.3.1. Mô hình không gian Vector

3. CHƯƠNG 3: MÔ HÌNH VÀ GIẢI PHÁP

3.1. Giới thiệu hệ thống Tic-Office

3.2. Mô hình ontology cho ngữ nghĩa của câu truy vấn

3.3. Công cụ hỗ trợ xử lý tài liệu văn bản

3.3.1. Phương pháp nhận dạng văn bản

3.3.2. Phương pháp rút trích nội dung thực thể

3.3.3. Mô hình Conditional Random Field (CRFs)

3.4. Xây dựng mô hình VSM trong tra cứu tài liệu có sử dụng ngữ nghĩa cho câu truy vấn

3.4.1. Số hóa văn bản theo mô hình không gian vector

3.4.2. Ma trận biểu diễn tập văn bản

3.4.3. Kiến trúc mô hình tìm kiếm tài liệu VSM

4. CHƯƠNG 4: CÀI ĐẶT, THỬ NGHIỆM, ĐÁNH GIÁ

4.1. Xây dựng mô hình dữ liệu ontology

4.2. Module trích xuất nội dung của tài liệu sử dụng Tesseract OCR

4.3. Module rút trích đặc trưng của tài liệu

4.4. Module API kết nối đến hệ thống Tic-Office

4.5. Cài đặt phân hệ tìm kiếm văn bản

4.6. Kết quả thử nghiệm

5. CHƯƠNG 5: KẾT LUẬN VÀ HƯỚNG PHÁT TRIỂN

5.1. Kết quả đạt được của đề tài

5.2. Những hạn chế của đề tài

5.3. Hướng phát triển

TÀI LIỆU THAM KHẢO

Xây dựng chức năng tra cứu thông tin văn bản dựa trên web ngữ nghĩa của hệ thống tic office

Bạn đang xem trước tài liệu:

Xây dựng chức năng tra cứu thông tin văn bản dựa trên web ngữ nghĩa của hệ thống tic office