Luận văn thạc sĩ: Khai thác cụm từ tiếng Việt từ tập văn bản

Trường đại học

Vietnam National University

Chuyên ngành

Information Technology

Người đăng

Ẩn danh

Thể loại

Thesis

2010

81
0
0

Phí lưu trữ

30 Point

Mục lục chi tiết

1. Introduction

1.1. Overview Name Entity recognition(NER)

1.2. NER Approach

1.2.1. Rule based approach

1.2.2. Machine learning Approach

1.3. Thesis contribution

1.4. Thesis structure

2. Related Work

2.1. Overview our problem

2.2. Building NER corpus research

2.3. Researches about building corpus Process

2.4. Overview annotate tools

2.5. Summary

3. Corpus building process

3.1. Objective

4. Online Annotation Framework

4.1. Online annotation interface

4.2. Automate file distribution for annotator

4.3. Automate save and manage files

4.4. Explain unusual entity

4.5. Inter annotatetor agreements

4.6. Offline corpus evaluation

4.7. Named entity recognition system

6. Conclusion And Future work

6.1. Create corpus bigger and more quality

6.2. Improve online annotation framework

6.3. Building NER system base statistical

Name Entity guideline

A.1. Entity and Entity Name

A.2. Instance of entity

A.3. List of Entities

A.4. Entities recognize rules

Luận văn thạc sĩ vnu uet extraction of vietnamese collocation from text corpora