Cải Tiến Thuật Toán Phân Lớp Cho Dữ Liệu Không Cân Bằng Và Ứng Dụng Trong Dự Đoán Đồng Tác Giả

Trường đại học

Đại Học Bách Khoa Hà Nội

Chuyên ngành

Hệ Thống Thông Tin

Người đăng

Ẩn danh

Thể loại

Luận Án Tiến Sĩ

2024

123
0
0

Phí lưu trữ

30.000 VNĐ

Mục lục chi tiết

LỜI CAM ĐOAN

1. CHƯƠNG 1: TỔNG QUAN VỀ VẤN ĐỀ NGHIÊN CỨU

1.1. Bài toán phân lớp với dữ liệu không cân bằng. Một số thuật toán liên quan

1.2. Thuật toán SVM

1.3. Thuật toán Weighted-SVM

1.4. Fuzzy SVM-CIL

1.5. Thuật toán AdaBoost. Thuật toán CNN

1.6. Phương pháp Cây quyết định

1.7. K-nearest neighbors và Tomek link

1.8. Bài toán dự đoán đồng tác giả

1.9. Mô hình hóa bài toán

1.10. Phương pháp phân lớp cho bài toán dự đoán đồng tác giả

1.11. Phương pháp thực nghiệm và đánh giá. Tập dữ liệu thử nghiệm

1.12. Môi trường và kịch bản thử nghiệm

1.13. Kết luận Chương 1

2. CHƯƠNG 2: CẢI TIẾN THUẬT TOÁN ADABOOST CHO DỮ LIỆU KHÔNG CÂN BẰNG

2.1. Đề xuất thuật toán Im. Phân tích thuật toán AdaBoost

2.2. Phương pháp khởi tạo trọng số cho AdaBoost thích nghi với mức độ không cân bằng

2.3. Phương pháp tính trọng số tin cậy của bộ phân lớp thành viên nhạy cảm với nhãn dương

2.4. Mô tả thuật toán Im.AdaBoost kết hợp với WSVM

2.5. Thử nghiệm trên các bộ dữ liệu UCI

2.6. Thử nghiệm cho bài toán dự đoán đồng tác giả

2.7. Kết luận Chương 2

3. CHƯƠNG 3: ĐỀ XUẤT THUẬT TOÁN ĐIỀU CHỈNH THÍCH NGHI TRỌNG SỐ MỜ DỰA TRÊN FUZZY SVM-CIL

3.1. Đề xuất thuật toán trọng số mờ thích nghi. Xây dựng hàm thuộc mờ giàu ngữ nghĩa cho Fuzzy SVM.

3.2. Phương pháp điều chỉnh trọng số mờ cho các mẫu nhạy cảm

3.3. Thuật toán phân lớp với trọng số mờ thích nghi. Thử nghiệm trên các bộ dữ liệu UCI

3.4. Thử nghiệm cho bài toán dự đoán đồng tác giả

3.5. Thử nghiệm so sánh các thuật toán đã đề xuất

3.6. Kết luận Chương 3

DANH MỤC CÁC CÔNG TRÌNH ĐÃ CÔNG BỐ

TÀI LIỆU THAM KHẢO

Cải tiến thuật toán phân lớp cho dữ liệu không cân bằng và ứng dụng trong dự đoán đồng tác giả

Bạn đang xem trước tài liệu:

Cải tiến thuật toán phân lớp cho dữ liệu không cân bằng và ứng dụng trong dự đoán đồng tác giả

Tóm tắt bài viết "Cải tiến Thuật Toán Phân Lớp cho Dữ Liệu Không Cân Bằng & Ứng Dụng Dự Đoán Đồng Tác Giả" tập trung vào việc giải quyết vấn đề phân lớp dữ liệu khi các lớp không có số lượng mẫu tương đương nhau (dữ liệu không cân bằng). Bài viết này có thể trình bày các cải tiến thuật toán để tăng độ chính xác của việc dự đoán, đặc biệt trong bối cảnh dự đoán đồng tác giả, nơi mà số lượng các bài báo có nhiều tác giả thường ít hơn so với các bài báo chỉ có một tác giả. Việc cải thiện khả năng phân lớp trong trường hợp dữ liệu không cân bằng có ý nghĩa quan trọng trong nhiều lĩnh vực, từ y tế (dự đoán bệnh hiếm gặp) đến tài chính (phát hiện gian lận).

Nếu bạn quan tâm đến việc khai phá dữ liệu và ứng dụng của nó trong việc phân tích thông tin từ mạng xã hội, bạn có thể tham khảo thêm Luận văn khai phá quan điểm dữ liệu twitter để hiểu rõ hơn về cách các kỹ thuật khai phá dữ liệu được áp dụng để phân tích quan điểm từ dữ liệu Twitter. Tài liệu này sẽ cung cấp cho bạn một góc nhìn khác về ứng dụng của khai phá dữ liệu trong một lĩnh vực cụ thể.