Nghiên cứu phương pháp phân lớp dữ liệu nấm (mushroom) bằng công cụ Weka

2020

85
0
0

Phí lưu trữ

30 Point

Mục lục chi tiết

LỜI CẢM ƠN

LỜI CAM ĐOAN

MỤC LỤC

DANH SÁNH BẢNG

DANH SÁCH HÌNH VẼ

DANH SÁCH TỪ VIẾT TẮT

1. CHƯƠNG 1: TỔNG QUAN VỀ KHAI PHÁ DỮ LIỆU VÀ PHÁT HIỆN TRI THỨC

1.1. Giới thiệu tổng quan

1.2. Khái niệm khai phá dữ liệu

1.3. Nhiệm vụ của khai phá dữ liệu

1.4. Một số ứng dụng khai phá dữ liệu

1.5. Bước phát triển của việc tổ chức và khai thác các CSDL

1.6. Quá trình phát hiện tri thức

1.7. Một số kỹ thuật khai phá dữ liệu cơ bản

1.7.1. Khai phá dữ liệu dự đoán

1.7.2. Khai phá dữ liệu mô tả

1.7.3. Khai phá luật kết hợp

1.8. Một số so sánh giữa khai phá dữ liệu và các phương pháp cơ bản khác

1.8.1. So sánh với phương pháp hệ chuyên gia (Expert Systems)

1.8.2. So sánh với phương pháp thống kê (Statistics)

1.8.3. So sánh với phương pháp học máy (Machine Learning)

1.8.4. So sánh với phương pháp học sâu (Deep Learning)

1.9. Tổng kết chương

2. CHƯƠNG 2: MỘT SỐ PHƯƠNG PHÁP VÀ KỸ THUẬT PHÂN LỚP DỮ LIỆU

2.1. Tổng quan về phân lớp dữ liệu

2.2. Phân lớp dữ liệu bằng cây quyết định

2.2.1. Độ lợi thông tin

2.2.2. Tỉ số độ lợi

2.2.3. Chỉ số Gini

2.2.4. Tỉa cây quyết định

2.3. Phân lớp dữ liệu Bayesian

2.3.1. Phân lớp Naïve Bayes

2.4. Phân lớp dữ liệu sử dụng máy hỗ trợ vector (SVM)

2.4.1. Phân lớp đa lớp với SVM

2.5. Phân lớp dữ liệu với Random Forest (rừng ngẫu nhiên)

2.6. Một số phương pháp phân lớp dữ liệu khác

2.6.1. Thuật toán phân lớp k-NN

2.7. Đánh giá mô hình phân lớp dữ liệu

2.8. Tổng kết chương

3. CHƯƠNG 3: ỨNG DỤNG PHÂN LỚP DỮ LIỆU MUSHROOM VỚI CÔNG CỤ WEKA VÀ MỘT SỐ THUẬT TOÁN CƠ BẢN

3.1. Giới thiệu bài toán phân lớp dữ liệu Mushroom

3.1.1. Giới thiệu về bài toán phân lớp dữ liệu Mushroom

3.1.2. Thu thập, tiền xử lý và mã hóa dữ liệu

3.1.3. Mô tả sơ lược về dữ liệu

3.2. Giới thiệu về công cụ Weka, cấu hình và ứng dụng phân lớp Mushroom

3.2.1. Môi trường Explorer

3.2.2. Khuôn dạng của tập dữ liệu

3.2.3. Tiền xử lý dữ liệu

3.2.4. Phân tích chức năng phân lớp (Classify)

3.2.5. Mô tả chức năng phân lớp (Classify)

3.3. Áp dụng các phương pháp phân lớp trên tập dữ liệu Mushroom

3.3.1. Thực hiện phân lớp bằng thuật toán Naive Bayes

3.3.2. Thực hiện phân lớp bằng thuật toán k-Nearest neighbor

3.3.3. Thực hiện phân lớp bằng thuật toán Support Vector Machines

3.4. Đánh giá mô hình phân lớp dữ liệu Mushroom

3.4.1. Đánh giá mô hình bằng phương pháp Hold-out

3.4.2. Đánh giá mô hình bằng phương pháp k-fold Cross validation

3.5. Kết luận thực nghiệm phần lớp dữ liệu Mushroom

3.6. Tổng kết chương

KẾT LUẬN VÀ HƯỚNG PHÁT TRIỂN

TÀI LIỆU THAM KHẢO

Luận văn thạc sĩ hay nghiên cứu một số phương pháp phân lớp dữ liệu và ứng dụng trong phân lớp nấm mushroom với công cụ weka