Luận văn thạc sĩ: Cải tiến phương pháp trọng số từ cho phân loại văn bản

Chuyên ngành

Computer Science

Người đăng

Ẩn danh

Thể loại

Thesis

2014

52
0
0

Phí lưu trữ

30 Point

Mục lục chi tiết

ORIGINALITY STATEMENT

ABSTRACT

ACKNOWLEDGEMENTS

1. CHƯƠNG 1: Introduction

1.1. Motivation

1.2. Structure of this Thesis

2. CHƯƠNG 2: Overview of Text Categorization

2.1. Introduction

2.2. Text Representation

2.3. Text Categorization tasks

2.3.1. Single-label and Multi-label Text Categorization

2.3.2. Flat and Hierarchical Text Categorization

2.3.3. Applications of Text Categorization

3. CHƯƠNG 3: Term Weighting Schemes

3.1. Previous Term Weighting Schemes

3.1.1. Unsupervised Term Weighting Schemes

3.1.2. Supervised Term Weighting Schemes

3.2. Our New Term Weighting Scheme

3.2.1. Term Weighting Methods

3.2.2. Machine Learning Algorithm

4. CHƯƠNG 4: Experiments

4.1. Reuters News Corpus

4.2. Results and Discussion

4.2.1. Results on the 20 Newsgroups corpus

4.2.2. Results on the Reuters News corpus

5. CHƯƠNG 5: Conclusion

List of Figures

List of Tables

List of Abbreviations

Luận văn thạc sĩ vnu uet an improved term weighting scheme for text categorization m a thesis information technology 60 48 01