Phát hiện website lừa đảo dựa trên mô hình phân lớp Random Forest

Trường đại học

Đại học Kinh tế Huế

Chuyên ngành

Tin học kinh tế

Người đăng

Ẩn danh

2019

60
0
0

Phí lưu trữ

30.000 VNĐ

Mục lục chi tiết

LỜI CẢM ƠN

1. CHƯƠNG I: CƠ SỞ LÝ THUYẾT

1.1. Tổng quan về khai phá dữ liệu

1.2. Nhu cầu phát hiện tri thức từ dữ liệu

1.3. Khai phá dữ liệu

1.3.1. Khai phá luật kết hợp

1.3.2. Thuật toán Apriori

1.3.3. Thuật toán FP-Growth

1.3.4. Ứng dụng Khai phá luật kết hợp

1.4. Phân cụm

1.4.1. Phân cụm phẳng

1.4.2. Phân cụm phân cấp

1.5. Phân lớp

1.5.1. Mô hình phân lớp Naïve Bayes

1.5.2. Mô hình phân lớp K-NN

1.5.3. Mô hình phân lớp Support Vector Machines

1.5.4. Mô hình phân lớp Mạng Nơ-ron nhân tạo

1.6. Phát biểu bài toán nghiên cứu

1.7. Lý thuyết về mô hình phân lớp Random Forest

1.7.1. Giới thiệu chung

1.7.2. Cây quyết định

1.7.3. Nguyên tắc hoạt động

1.7.4. Các công trình liên quan

2. CHƯƠNG II: XÂY DỰNG MÔ HÌNH PHÂN LỚP VÀ ỨNG DỤNG DỰ ĐOÁN WEBSITE LỪA ĐẢO

2.1. Mô tả bộ dữ liệu

2.1.1. Giới thiệu và mô tả dữ liệu

2.1.2. Thông tin thuộc tính

2.2. Xây dựng mô hình

2.3. Phương pháp đánh giá mô hình

2.3.1. Tổng quan về Receiver Operating Characteristic

2.3.2. Xây dựng ROC để đánh giá

2.4. Xây dựng ứng dụng dự đoán website lừa đảo

3. CHƯƠNG III: THÍ NGHIỆM VÀ KẾT QUẢ

3.1. Thiết lập thí nghiệm

3.1.1. Phân lớp với các bộ phân lớp cơ bản

3.1.2. Phân lớp với mô hình Random Forest

3.2. Thiết lập mô hình đánh giá

3.3. Thiết lập ứng dụng dự đoán website lừa đảo

3.3.1. Chuẩn bị bộ dữ liệu Unlabel

3.3.2. Tạo ứng dụng sử dụng Java Swing

3.4. Kết quả thí nghiệm

3.4.1. Kết quả đạt được

3.4.2. Hạn chế của đề tài

3.4.3. Hướng phát triển của đề tài

DANH MỤC TÀI LIỆU THAM KHẢO

Tài liệu "Phát hiện website lừa đảo bằng mô hình Random Forest" cung cấp cái nhìn sâu sắc về cách sử dụng mô hình học máy Random Forest để phát hiện các trang web lừa đảo. Bài viết nêu bật các phương pháp phân tích dữ liệu và cách mà mô hình này có thể giúp cải thiện độ chính xác trong việc nhận diện các trang web không đáng tin cậy. Độc giả sẽ tìm thấy những lợi ích rõ ràng từ việc áp dụng công nghệ này, bao gồm việc bảo vệ người dùng khỏi các rủi ro trực tuyến và nâng cao nhận thức về an toàn thông tin.

Nếu bạn muốn mở rộng kiến thức của mình về các kỹ thuật khai phá dữ liệu, hãy tham khảo thêm tài liệu Luận văn thạc sĩ nghiên cứu một số kỹ thuật khai phá dữ liệu cho bài toán dự đoán rủi ro tín dụng, nơi bạn có thể tìm hiểu về các ứng dụng khác của khai phá dữ liệu trong lĩnh vực tài chính. Ngoài ra, tài liệu Luận văn thạc sĩ công nghệ thông tin nghiên cứu và áp dụng kỹ thuật khai phá dữ liệu trên bộ dữ liệu sinh viên đại học phục vụ công tác cố vấn học tập sẽ giúp bạn khám phá cách khai phá dữ liệu có thể được áp dụng trong giáo dục. Cuối cùng, bạn cũng có thể tìm hiểu về Luận văn thạc sĩ áp dụng kĩ thuật khai phá dữ liệu cho phân lớp các ca kiểm thử phần mềm, một tài liệu liên quan đến việc sử dụng khai phá dữ liệu trong lĩnh vực phát triển phần mềm. Những tài liệu này sẽ giúp bạn có cái nhìn toàn diện hơn về ứng dụng của khai phá dữ liệu trong nhiều lĩnh vực khác nhau.