Luận văn thạc sĩ về phương pháp phân lớp và ứng dụng trong dữ liệu protein SUMO hóa

2019

82
0
0

Phí lưu trữ

30.000 VNĐ

Mục lục chi tiết

LỜI CAM ĐOAN

1. CHƯƠNG 1: TỔNG QUAN KHAI PHÁ DỮ LIỆU VÀ PHÁT HIỆN TRI THỨC

1.1. Giới thiệu chung

1.2. Khái niệm khai phá dữ liệu

1.3. Các bước của quá trình phát hiện tri thức

1.4. Tổng quan các kỹ thuật khai phá dữ liệu cơ bản

1.4.1. Khai phá dữ liệu dự đoán

1.4.2. Khai phá dữ liệu mô tả

1.4.3. Luật kết hợp

1.4.4. Phân tích, so sánh với các phương pháp cơ bản khác

1.4.4.1. So sánh với phương pháp hệ chuyên gia (Expert Systems)
1.4.4.2. So sánh với phương pháp thống kê (Statistics)
1.4.4.3. So sánh với phương pháp học máy (Machine Learning)
1.4.4.4. So sánh với phương pháp học sâu (Deep Learning)

2. CHƯƠNG 2: CÁC PHƯƠNG PHÁP VÀ KỸ THUẬT PHÂN LỚP DỮ LIỆU

2.1. Tổng quan về phân lớp dữ liệu

2.2. Phân lớp dữ liệu bằng cây quyết định

2.2.1. Cây quyết định quy nạp

2.2.2. Cây cắt tỉa

2.2.3. Trích luật phân lớp từ các cây quyết định

2.2.4. Cải tiến cây quyết định quy nạp cơ bản

2.2.5. Khả năng mở rộng và cây quyết định quy nạp

2.3. Phân lớp dữ liệu Bayesian

2.3.1. Phân lớp Bayesian ngây thơ

2.3.2. Các mạng belief Bayesian

2.3.3. Huấn luyện các mạng belief Bayesian

2.4. Phân lớp dữ liệu với Random Forest (rừng ngẫu nhiên)

2.5. Phân lớp dữ liệu sử dụng máy hỗ trợ vector

2.5.1. SVM cho bài toán phân lớp tuyến tính

2.5.2. SVM cho phân lớp phi tuyến

2.6. Một số phương pháp phân lớp dữ liệu khác

2.6.1. Các classifier k-láng giềng gần nhất

2.6.2. Lập luận dựa trên tình huống

2.7. Vấn đề đánh giá độ chính xác của phương pháp phân lớp dữ liệu

2.7.1. Đánh giá độ chính xác classifier

2.7.2. Gia tăng độ chính xác classifier

2.7.3. Độ chính xác có đủ để đánh giá một classifier hay không?

3. CHƯƠNG 3: KẾT QUẢ THỬ NGHIỆM

3.1. Giới thiệu bài toán phân lớp dữ liệu protein SUMO hóa (SUMOylation)

3.1.1. Giới thiệu về protein SUMO hóa (SUMOylation)

3.1.2. Thu thập và tiền xử lý dữ liệu

3.1.3. Trích chọn đặc trưng và mã hóa dữ liệu

3.2. Giới thiệu về phân lớp dữ liệu sử dụng công cụ Weka

3.2.1. Thuật toán Hồi quy logistic (Logistic Regression)

3.2.2. Thuật toán Naive Bayes

3.2.3. Thuật toán Cây quyết định (Decision Tree)

3.2.4. Thuật toán k-Nearest Neighbors

3.2.5. Thuật toán Máy hỗ trợ Vector (Support Vector Machines)

3.3. Kết quả phân lớp dữ liệu vị trí protein SUMOylation

TÀI LIỆU THAM KHẢO

Luận văn thạc sĩ hay nghiên cứu một số phương pháp phân lớp và ứng dụng trong phân lớp dữ liệu protein sumo hóa

Bạn đang xem trước tài liệu:

Luận văn thạc sĩ hay nghiên cứu một số phương pháp phân lớp và ứng dụng trong phân lớp dữ liệu protein sumo hóa

Tài liệu "Nghiên cứu phương pháp phân lớp dữ liệu protein SUMO hóa" cung cấp cái nhìn sâu sắc về các phương pháp phân lớp dữ liệu trong lĩnh vực sinh học phân tử, đặc biệt là trong việc phân tích protein SUMO hóa. Nghiên cứu này không chỉ giúp người đọc hiểu rõ hơn về các kỹ thuật phân lớp mà còn chỉ ra tầm quan trọng của việc áp dụng các phương pháp này trong việc phát hiện và phân tích các protein có liên quan đến nhiều bệnh lý.

Để mở rộng kiến thức của bạn về các phương pháp khai thác dữ liệu, bạn có thể tham khảo tài liệu Luận văn thạc sĩ khai phá phụ thuộc hàm xấp xỉ sử dụng phủ tối thiểu và lớp tương đương, nơi trình bày các kỹ thuật khai thác dữ liệu khác nhau. Ngoài ra, tài liệu Luận văn một số thuật toán phân cụm trong khai phá dữ liệu sẽ giúp bạn hiểu rõ hơn về các thuật toán phân cụm, một phần quan trọng trong phân tích dữ liệu. Cuối cùng, bạn cũng có thể tìm hiểu thêm về Khai phá dữ liệu trong SQL Server 2012, nơi cung cấp các ứng dụng thực tiễn của khai thác dữ liệu trong môi trường cơ sở dữ liệu. Những tài liệu này sẽ giúp bạn mở rộng kiến thức và hiểu biết về lĩnh vực khai thác dữ liệu một cách toàn diện hơn.