Luận văn thạc sĩ: Tăng hiệu quả phân lớp với phương pháp trích chọn thuộc tính

2012

74
0
0

Phí lưu trữ

30 Point

Mục lục chi tiết

MỞ ĐẦU

1. CHƯƠNG 1: TỔNG QUAN VỀ KHAI PHÁ DỮ LIỆU VÀ TRÍCH CHỌN THUỘC TÍNH

1.1. Giới thiệu khai phá dữ liệu và trích chọn thuộc tính

1.2. Lựa chọn thuộc tính và bài toán phân lớp

1.3. Phương pháp lựa chọn thuộc tính

1.4. Các mô hình lựa chọn thuộc tính

1.4.1. Một số thuật toán lựa chọn thuộc tính

1.4.1.1. Tìm kiếm toàn bộ
1.4.1.2. Tìm kiếm theo kinh nghiệm

1.4.2. Phương pháp trọng số thuộc tính

1.4.3. Phương pháp lai

1.4.4. Phương pháp lớn dần

2. CHƯƠNG 2: THUẬT TOÁN RANDOM FOREST VÀ GIẢI THUẬT DI TRUYỀN

2.1. Giới thiệu thuật toán Random Forest

2.1.1. Phương pháp Bootstrap và Bagging

2.1.1.1. Phương pháp Bootstrap
2.1.1.2. Phương pháp Bagging

2.1.2. Thuật toán Random Forest

2.1.3. Một số đặc điểm của RF

2.1.4. Thuộc tính quan trọng

2.2. Giải thuật di truyền

2.2.1. Nội dung giải thuật di truyền

3. CHƯƠNG 3: PHƯƠNG PHÁP ĐỀ XUẤT

3.1. Cơ sở lí luận của phương pháp đề xuất

3.2. Kiến trúc hệ thống đề xuất

3.3. Nội dung phương pháp đề xuất

3.4. Hoạt động của hệ thống đề xuất

3.5. Sơ đồ khối phương pháp đề xuất

4. CHƯƠNG 4: THỰC NGHIỆM VÀ ĐÁNH GIÁ

4.1. Môi trường thực nghiệm

4.2. Mô tả chương trình

4.3. Kết quả thực nghiệm

4.3.1. Bộ dữ liệu ung thư dạ dày (Stomach)

4.3.1.1. Mô tả bộ dữ liệu Stomach
4.3.1.2. Kết quả và phân tích thực nghiệm trên bộ dữ liệu Stomach

4.3.2. Bộ dữ liệu ung thư ruột kết Colon Tumor

4.3.2.1. Mô tả dữ liệu
4.3.2.2. Kết quả thực nghiệm với bộ dữ liệu Colon Tumor

TÀI LIỆU THAM KHẢO