Chuyên đề thực tập: Kỹ thuật phân nhóm dữ liệu theo WOE trong bài toán phân loại sử dụng mô hình Logistic và thuật toán học máy

Trường đại học

Đại học Kinh tế Quốc dân

Chuyên ngành

Toán Tài chính

Người đăng

Ẩn danh

2022

0
1
0

Phí lưu trữ

30.000 VNĐ

Mục lục chi tiết

LỜI CẢM ƠN

LỜI MỞ ĐẦU

1.1. Lý do lựa chọn đề tài

1.2. Mục tiêu nghiên cứu

1.3. Phương pháp nghiên cứu

1.4. Phạm vi và dữ liệu

1.5. Dự kiến kết quả

1. CHƯƠNG 1: CƠ SỞ LÝ THUYẾT VÀ TỔNG QUAN NGHIÊN CỨU

1.1. Cơ sở lý thuyết về bài toán phân loại

1.2. Các phương pháp sử dụng trong bài toán phân loại

1.2.1. Phương pháp mô hình Logistic

1.2.2. Phương pháp Goldberger (196⁄‡)

1.2.3. Phương pháp Berkson (1953)

1.2.4. Ưu nhược điểm của mô hình Logistic

1.2.5. Phương pháp học máy

1.2.5.1. Một số thuật toán học máy

1.3. Kỹ thuật phân nhóm theo WOE

1.3.1. Giới thiệu về kỹ thuật WOE

1.3.2. Phương pháp phân nhóm theo kỹ thuật WOE

1.3.3. Ưu nhược điểm của kỹ thuật WOE

1.3.4. Mô hình Logistic kết hợp kỹ thuật WOE

1.4. Đặc điểm mô hình

1.5. Đánh giá mô hình

1.5.1. Mục đích của việc đánh giá mô hình

1.5.2. Các chỉ tiêu đánh giá mô hình

1.5.3. Công thức tính điểm từ kết quả mô hình

2. CHƯƠNG 2: THỰC TRẠNG MỘT SỐ LĨNH VỰC KINH TẾ XÃ HỘI

2.1. Tổng quan quy trình xây dựng thẻ điểm ngân hàng

2.2. Sự cần thiết của thẻ điểm ngân hàng

2.3. Quy trình xây dựng thẻ điểm cơ bản của Ngân hàng

2.4. Lập kế hoạch xây dựng mô hình

2.5. Xem xét dữ liệu và thông số dự án

2.6. Tạo lập cơ sở dữ liệu

2.7. Phát triển mô hình

2.8. Hậu kiểm mô hình

2.9. Sự cần thiết của bài toán dự báo trong y học

2.10. Sự cần thiết của bài toán dự báo khả năng rời bỏ của khách hàng

3. CHƯƠNG 3: XÂY DỰNG MÔ HÌNH LOGISTIC GIẢI QUYẾT MỘT SỐ BÀI TOÁN PHÂN LOẠI

3.1. Xây dựng mô hình Logistic với bài toán chấm điểm khách hàng

3.2. Xây dựng mô hình Logistic với dữ liệu phân nhóm WOE

3.2.1. Phân tích thống kê mô tả và kết quả nhóm dữ liệu WOE

3.2.2. Phân tích kết quả hồi quy

3.2.3. Kiểm định mô hình

3.3. Xây dựng mô hình Logistic với dữ liệu gốc

3.4. Xây dựng mô hình Logistic với bài toán dự báo ung thư

3.4.1. Mô tả dữ liệu

3.4.2. Xây dựng mô hình Logistic với dữ liệu phân nhóm WOE

3.4.3. Phân tích thống kê mô tả và kết quả nhóm dữ liệu WOE

3.4.4. Phân tích tương quan

3.4.5. Phân tích kết quả hồi quy

3.4.6. Kiểm định mô hình

3.4.7. Xây dựng mô hình Logistic với tập dữ liệu gốc

3.5. Xây dựng mô hình Logistic với bài toán dự báo khả năng rời bỏ của khách hàng

3.5.1. Mô tả dữ liệu

3.5.2. Xây dựng mô hình Logistic với tập dữ liệu phân nhóm WOE

3.5.3. Phân tích thống kê mô tả và kết quả nhóm dữ liệu WOE

3.5.4. Phân tích tương quan

3.5.5. Phân tích kết quả hồi quy

3.5.6. Kiểm định mô hình

3.5.7. Xây dựng mô hình Logistic với tập dữ liệu gốc

3.5.8. So sánh kết quả dự báo từ mô hình Logistic để giải quyết ba bài toán phân loại

4. CHƯƠNG 4: SỬ DỤNG THUẬT TOÁN HỌC MÁY GIẢI QUYẾT MỘT SỐ BÀI TOÁN PHÂN LOẠI

4.1. Kết quả dự báo từ thuật toán học máy với dữ liệu phân nhóm WOE

4.2. Kết quả dự báo từ thuật toán học máy với dữ liệu gốc

4.3. So sánh kết quả dự báo giữa phương pháp mô hình Logistic và phương pháp học máy

5. CHƯƠNG 5: KẾT LUẬN VÀ KHUYẾN NGHỊ

5.1. Kết luận chung về đề tài

5.2. Những hạn chế của đề tài

5.3. Chính sách khuyến nghị

DANH MỤC TÀI LIỆU THAM KHẢO

DANH MỤC TỪ VIẾT TẮT

DANH MỤC BẢNG

DANH MỤC HÌNH VẼ

Chuyên đề thực tập hiệu quả của kỹ thuật phân nhóm dữ liệu theo woe weight of evidence trong bài toán phân loại sử dụng mô hình logistic và thuật toán học máy

Bạn đang xem trước tài liệu:

Chuyên đề thực tập hiệu quả của kỹ thuật phân nhóm dữ liệu theo woe weight of evidence trong bài toán phân loại sử dụng mô hình logistic và thuật toán học máy

Hướng dẫn thực tập hiệu quả: Phân nhóm dữ liệu bằng WOE trong bài toán phân loại với Logistic và Machine Learning là tài liệu chuyên sâu hướng dẫn cách áp dụng phương pháp Weight of Evidence (WOE) để phân nhóm dữ liệu trong các bài toán phân loại, kết hợp với Logistic Regression và Machine Learning. Tài liệu này không chỉ giải thích chi tiết về lý thuyết mà còn cung cấp các bước thực hành cụ thể, giúp người đọc nắm vững kỹ thuật và ứng dụng hiệu quả trong thực tế. Đặc biệt, nó nhấn mạnh vai trò của WOE trong việc cải thiện độ chính xác của mô hình và giảm thiểu rủi ro trong dự đoán.

Để mở rộng kiến thức về các phương pháp phân tích dữ liệu, bạn có thể tham khảo thêm Luận văn thạc sĩ khoa học máy tính phân lớp dữ liệu chuỗi thời gian dựa vào mạng nơron tích chập CNN, tài liệu này sẽ giúp bạn hiểu sâu hơn về cách xử lý dữ liệu chuỗi thời gian. Ngoài ra, Luận văn Advanced Data Mining Techniques cung cấp các kỹ thuật khai thác dữ liệu nâng cao, phù hợp để bổ trợ kiến thức về Machine Learning. Cuối cùng, Luận văn thạc sĩ khoa học máy tính khai phá cụm hướng thời gian trên dữ liệu giáo dục sẽ giúp bạn khám phá thêm về ứng dụng phân cụm dữ liệu trong lĩnh vực giáo dục.