Dự Báo Thuê Bao Rời Bỏ Nhà Mạng Dựa Vào Học Máy

Luận văn thạc sĩ nghiên cứu máy tính dự báo thuê bao rời bỏ nhà mạng dựa vào học máy, đánh giá hiện trạng, phân tích vấn đề, đề xuất biện pháp hoàn thiện trong lĩnh vực .

Trường đại học

Trường Đại Học Bách Khoa - ĐHQG TP. Hồ Chí Minh

Chuyên ngành

Khoa Học Máy Tính

Người đăng

Ẩn danh

Thể loại

Luận Văn Thạc Sĩ

2018

Phí lưu trữ

30 Point

Mục lục chi tiết

LỜI CẢM ƠN

LỜI CAM ĐOAN

1. CHƯƠNG 1: GIỚI THIỆU TONG QUAN VE DE TÀI

1.1. Động cơ nghiên cứu

1.2. Ý nghĩa thực tiễn

1.3. Ý nghĩa khoa học

1.4. Mục tiêu nghiên cứu

1.5. Giới hạn của đề tài

1.6. Những kết quả đạt được của luận văn

1.7. Bố cục luận văn

2. CHƯƠNG 2: CƠ SỞ LÝ THUYẾT

2.1. Khai phá dữ liệu, học máy và các kỹ thuật phân tích dự báo

2.1.1. Khái niệm Khai phá dữ liệu và học máy

2.1.2. Những nhóm bài toán của Khai phá dữ liệu

2.1.3. Một số kỹ thuật dự báo sử dụng học máy

2.1.4. Các phương pháp lựa chọn đặc trưng (Feature Selection)

2.2. Mô hình trong bài toán lựa chọn thuộc tính

2.2.1. Các mô hình trong lựa chọn thuộc tính

2.2.2. Đánh giá hai mô hình Filter và Wrapper

2.2.3. Các giải thuật lựa chọn thuộc tính

2.3. Khung thức dự báo thuê bao rời bỏ nhà mạng

2.4. Giới thiệu công cụ WEKA

2.5. Kết luận

3. CHƯƠNG 3: CÁC CÔNG TRÌNH LIÊN QUAN

3.1. Mạng Noron hỗn hợp (Hybrid Neural Networks)

3.2. Mô hình 1 quy luật

3.3. Máy Vector hỗ trợ (Support Vector Machine) kết hợp

3.4. Phương pháp bình phương tối thiểu riêng phần (Partial Least Square)

3.5. Mô hình rừng ngẫu nhiên cân bằng cải tiến (IBRE)

3.6. Kết luận

4. CHƯƠNG 4: PHƯƠNG PHÁP TIẾP CẬN

4.1. Sơ đồ tổng quát của hệ thống Mạng Noron + Cây quyết định

4.2. Sơ đồ tổng quát của hệ thống Mạng Noron + Mạng Noron

4.3. Giải thích sơ đồ trình tự của hệ thống

4.4. Quy trình tổng quát của hệ thống

5. CHƯƠNG 5: HIỆN THỰC VÀ THỰC NGHIỆM

5.1. Môi trường thực nghiệm

5.2. Bộ dữ liệu thực nghiệm

5.3. Các bước xây dựng và thực nghiệm mô hình dự báo thuê bao rời mạng hỗn hợp ANN + Decision Tree

5.3.1. Tiền xử lý, chuẩn hóa và rút trích đặc trưng của tập dữ liệu

5.3.2. Tạo mô hình Mạng Nơron và thực nghiệm mô hình Mạng Noron đầu tiên

5.3.3. Tạo mô hình Decision Tree để dự báo dựa vào kết quả của mô hình ANN đầu tiên và thực nghiệm kết quả mô hình Hybrid

5.4. Đánh giá mô hình - Hoàn thành kết quả thực nghiệm

5.5. So sánh mô hình hỗn hợp ANN + Decision Tree với mô hình ANN + ANN trước đây

5.6. Kết luận chương

6. CHƯƠNG 6: KẾT LUẬN VÀ HƯỚNG PHÁT TRIỂN

6.1. Những kết quả đạt được của luận văn

6.2. Hướng phát triển

TÀI LIỆU THAM KHẢO

PHỤ LỤC A

Tóm tắt

I. Tổng Quan Về Dự Báo Thuê Bao Rời Bỏ Nhà Mạng

Trong bối cảnh cạnh tranh khốc liệt của ngành viễn thông, việc dự báo thuê bao rời bỏ nhà mạng trở thành một nhiệm vụ quan trọng. Các nhà mạng cần hiểu rõ nguyên nhân và hành vi của khách hàng để giữ chân họ. Việc áp dụng học máy vào dự báo này không chỉ giúp tăng cường khả năng phân tích mà còn tối ưu hóa các chiến lược giữ chân khách hàng.

1.1. Ý Nghĩa Của Dự Báo Thuê Bao Rời Bỏ

Dự báo thuê bao rời bỏ giúp các nhà mạng nhận diện sớm khách hàng có nguy cơ rời bỏ, từ đó có thể triển khai các biện pháp giữ chân hiệu quả.

1.2. Các Yếu Tố Ảnh Hưởng Đến Khách Hàng Rời Mạng

Nhiều yếu tố như chất lượng dịch vụ, giá cả và khuyến mãi có thể ảnh hưởng đến quyết định của khách hàng trong việc rời bỏ nhà mạng.

II. Thách Thức Trong Dự Báo Thuê Bao Rời Bỏ Nhà Mạng

Dự báo thuê bao rời bỏ không phải là một nhiệm vụ đơn giản. Các nhà mạng phải đối mặt với nhiều thách thức như dữ liệu không đầy đủ, sự biến động của thị trường và hành vi khách hàng khó đoán. Những thách thức này đòi hỏi các phương pháp phân tích mạnh mẽ và chính xác.

2.1. Dữ Liệu Không Đầy Đủ

Việc thiếu hụt dữ liệu có thể dẫn đến những dự đoán không chính xác, ảnh hưởng đến quyết định của nhà mạng.

2.2. Biến Động Thị Trường

Thị trường viễn thông luôn thay đổi, điều này làm cho việc dự đoán hành vi khách hàng trở nên khó khăn hơn.

III. Phương Pháp Dự Báo Thuê Bao Rời Bỏ Dựa Vào Học Máy

Học máy cung cấp nhiều phương pháp hữu ích để dự báo thuê bao rời bỏ. Các mô hình như mạng nơron và cây quyết định đã được chứng minh là hiệu quả trong việc phân tích dữ liệu và dự đoán hành vi khách hàng.

3.1. Mô Hình Mạng Nơron Nhân Tạo

Mạng nơron nhân tạo có khả năng học hỏi từ dữ liệu lớn và phát hiện các mẫu phức tạp trong hành vi khách hàng.

3.2. Cây Quyết Định Trong Dự Báo

Cây quyết định giúp phân loại khách hàng dựa trên các thuộc tính cụ thể, từ đó đưa ra dự đoán chính xác hơn.

IV. Ứng Dụng Thực Tiễn Của Dự Báo Thuê Bao Rời Bỏ

Việc áp dụng các mô hình dự báo vào thực tiễn đã mang lại nhiều lợi ích cho các nhà mạng. Các chiến lược giữ chân khách hàng được tối ưu hóa, giúp tăng cường sự hài lòng và trung thành của khách hàng.

4.1. Chiến Lược Giữ Chân Khách Hàng

Các nhà mạng có thể triển khai các chương trình khuyến mãi và dịch vụ tốt hơn dựa trên dự đoán từ mô hình học máy.

4.2. Kết Quả Nghiên Cứu Thực Tế

Nghiên cứu cho thấy rằng việc áp dụng học máy vào dự báo đã giúp cải thiện đáng kể tỷ lệ giữ chân khách hàng.

V. Kết Luận Về Dự Báo Thuê Bao Rời Bỏ Nhà Mạng

Dự báo thuê bao rời bỏ nhà mạng dựa vào học máy là một lĩnh vực đầy tiềm năng. Các nhà mạng cần tiếp tục đầu tư vào công nghệ và nghiên cứu để cải thiện khả năng dự đoán và giữ chân khách hàng.

5.1. Tương Lai Của Dự Báo Thuê Bao

Với sự phát triển của công nghệ, dự báo thuê bao sẽ ngày càng chính xác hơn, giúp các nhà mạng tối ưu hóa chiến lược kinh doanh.

5.2. Khuyến Nghị Đối Với Các Nhà Mạng

Các nhà mạng nên áp dụng các mô hình học máy mới nhất và thường xuyên cập nhật dữ liệu để duy trì tính chính xác trong dự báo.

28/05/2025

Bạn đang xem trước tài liệu:

Luận văn thạc sĩ khoa học máy tính dự báo thuê bao rời bỏ nhà mạng dựa vào học máy

Tải đầy đủ

Nội dung chính

Tổng quan nghiên cứu

Trong bối cảnh ngành viễn thông phát triển mạnh mẽ và bão hòa về số lượng thuê bao, việc duy trì khách hàng trở thành thách thức lớn đối với các nhà mạng. Theo báo cáo của ngành, tỷ lệ thuê bao rời bỏ nhà mạng (churn rate) có xu hướng gia tăng, gây ảnh hưởng trực tiếp đến doanh thu và uy tín của doanh nghiệp. Bài toán dự báo thuê bao rời bỏ nhà mạng nhằm giúp các doanh nghiệp viễn thông phát hiện sớm những khách hàng có nguy cơ rời đi, từ đó xây dựng các chiến lược giữ chân hiệu quả. Mục tiêu nghiên cứu của luận văn là phát triển mô hình dự báo thuê bao rời bỏ dựa trên các kỹ thuật học máy, cụ thể là kết hợp Mạng Nơron nhân tạo (Artificial Neural Network - ANN) và Cây quyết định (Decision Tree), nhằm cải thiện độ chính xác và thời gian thực thi so với các mô hình truyền thống. Nghiên cứu được thực hiện trên bộ dữ liệu chuẩn của UCI, với phạm vi thời gian từ đầu năm 2018 đến giữa năm 2018 tại Việt Nam, tập trung vào các thuê bao di động. Ý nghĩa của nghiên cứu được thể hiện qua việc nâng cao hiệu quả quản lý khách hàng, giảm thiểu tỷ lệ rời mạng và tăng cường khả năng cạnh tranh của các nhà mạng trên thị trường.

Cơ sở lý thuyết và phương pháp nghiên cứu

Khung lý thuyết áp dụng

Luận văn dựa trên hai lý thuyết chính trong lĩnh vực khai phá dữ liệu và học máy:

Mạng Nơron nhân tạo (ANN): Mô hình mô phỏng hoạt động của các tế bào thần kinh trong não người, có khả năng học từ dữ liệu huấn luyện và khái quát hóa cho dữ liệu mới. Mạng Perceptron nhiều lớp (Multilayer Perceptron - MLP) được sử dụng với thuật toán lan truyền ngược sai số (Backpropagation) để tối ưu trọng số, giúp mô hình học chính xác các mẫu phức tạp. Hàm kích hoạt sigmoid được áp dụng để chuẩn hóa đầu ra trong khoảng [0,1].
Cây quyết định (Decision Tree): Mô hình phân lớp dữ liệu dựa trên cấu trúc cây, trong đó mỗi nút biểu diễn một thuộc tính, các nhánh là giá trị thuộc tính và lá là nhãn phân lớp. Thuật toán C4.5 được sử dụng với tiêu chuẩn đánh giá Gain Ratio để lựa chọn thuộc tính phân chia tốt nhất, đồng thời áp dụng kỹ thuật cắt tỉa cây để tránh hiện tượng quá khớp.

Các khái niệm chính bao gồm: lựa chọn thuộc tính (Feature Selection), thu giảm tập huấn luyện (Data Reduction), phân lớp dữ liệu (Classification), và kỹ thuật kết hợp mô hình (Hybrid Modeling).

Phương pháp nghiên cứu

Nguồn dữ liệu chính là bộ dữ liệu chuẩn từ UCI Repository, bao gồm các thông tin về hành vi sử dụng dịch vụ của khách hàng thuê bao di động. Cỡ mẫu khoảng vài nghìn bản ghi, được tiền xử lý, chuẩn hóa và lựa chọn thuộc tính bằng các thuật toán Sequential Forward Selection (SFS) và WrapperSubsetEval trên công cụ WEKA.

Phương pháp phân tích gồm:

Xây dựng mô hình hỗn hợp ANN + Decision Tree: ANN thực hiện nhiệm vụ thu giảm tập huấn luyện, Decision Tree đảm nhận phân lớp dự báo.
So sánh với mô hình hỗn hợp ANN + ANN, trong đó hai mạng nơron phối hợp để xử lý toàn bộ quá trình.
Đánh giá hiệu suất dựa trên các chỉ số như độ chính xác phân lớp, thời gian thực thi, và ma trận nhầm lẫn (Confusion Matrix).
Timeline nghiên cứu từ tháng 2/2018 đến tháng 6/2018, bao gồm các bước thu thập dữ liệu, tiền xử lý, xây dựng mô hình, thực nghiệm và đánh giá kết quả.

Kết quả nghiên cứu và thảo luận

Những phát hiện chính

Hiệu quả mô hình hỗn hợp ANN + Decision Tree: Mô hình này đạt độ chính xác phân lớp trên 90%, cao hơn khoảng 5% so với mô hình ANN đơn lẻ. Thời gian thực thi giảm khoảng 30% so với mô hình hỗn hợp ANN + ANN, cho thấy sự cải thiện rõ rệt về hiệu suất xử lý.
So sánh với mô hình ANN + ANN: Mặc dù mô hình ANN + ANN cũng đạt độ chính xác cao (khoảng 88-90%), nhưng thời gian thực thi lâu hơn đáng kể, do việc huấn luyện hai mạng nơron phức tạp và tốn kém tài nguyên tính toán.
Tác động của lựa chọn thuộc tính: Việc áp dụng kỹ thuật lựa chọn thuộc tính giúp giảm số chiều dữ liệu từ khoảng 50 xuống còn 20 thuộc tính quan trọng, làm tăng tốc độ huấn luyện và giảm thiểu nhiễu, đồng thời duy trì hoặc cải thiện độ chính xác dự báo.
Ma trận nhầm lẫn (Confusion Matrix): Mô hình hỗn hợp ANN + Decision Tree có tỷ lệ dự báo đúng khách hàng rời mạng đạt trên 92%, trong khi mô hình ANN + ANN đạt khoảng 89%, thể hiện sự ưu việt trong việc phát hiện chính xác khách hàng có nguy cơ rời bỏ.

Thảo luận kết quả

Nguyên nhân chính của sự cải thiện hiệu suất là do mô hình kết hợp ANN + Decision Tree tận dụng ưu điểm của từng kỹ thuật: ANN giảm chiều dữ liệu và trích xuất đặc trưng hiệu quả, Decision Tree phân lớp nhanh và dễ hiểu. Kết quả phù hợp với các nghiên cứu gần đây trong lĩnh vực khai phá dữ liệu và học máy ứng dụng cho bài toán churn prediction. Việc giảm thời gian thực thi giúp mô hình có thể áp dụng trong môi trường thực tế với dữ liệu lớn và yêu cầu xử lý nhanh. Biểu đồ so sánh độ chính xác và thời gian thực thi giữa các mô hình sẽ minh họa rõ nét sự khác biệt này. Kết quả cũng cho thấy tầm quan trọng của bước lựa chọn thuộc tính trong việc nâng cao hiệu quả mô hình.

Đề xuất và khuyến nghị

Triển khai mô hình hỗn hợp ANN + Decision Tree trong hệ thống CRM: Các nhà mạng nên tích hợp mô hình này vào hệ thống quản lý quan hệ khách hàng để dự báo sớm và chủ động giữ chân thuê bao, mục tiêu giảm tỷ lệ rời mạng xuống dưới 5% trong vòng 12 tháng tới.
Tăng cường thu thập và làm sạch dữ liệu: Đảm bảo dữ liệu đầu vào đầy đủ, chính xác và được cập nhật liên tục để mô hình dự báo luôn phản ánh đúng thực trạng khách hàng, giúp nâng cao độ chính xác dự báo.
Đào tạo nhân sự và nâng cao năng lực phân tích dữ liệu: Tổ chức các khóa đào tạo về khai phá dữ liệu và học máy cho đội ngũ phân tích để vận hành và tối ưu mô hình hiệu quả, dự kiến hoàn thành trong 6 tháng.
Phát triển hệ thống cảnh báo tự động: Kết hợp mô hình dự báo với hệ thống cảnh báo tự động để gửi thông báo kịp thời cho bộ phận chăm sóc khách hàng, giúp thực hiện các chương trình giữ chân đúng lúc.

Đối tượng nên tham khảo luận văn

Các nhà quản lý doanh nghiệp viễn thông: Giúp hiểu rõ về các kỹ thuật dự báo khách hàng rời mạng, từ đó xây dựng chiến lược kinh doanh và giữ chân khách hàng hiệu quả.
Chuyên viên phân tích dữ liệu và khoa học dữ liệu: Cung cấp kiến thức chuyên sâu về ứng dụng mạng nơron và cây quyết định trong khai phá dữ liệu thực tế, hỗ trợ phát triển các mô hình dự báo.
Giảng viên và sinh viên ngành công nghệ thông tin, khoa học máy tính: Là tài liệu tham khảo quý giá về phương pháp nghiên cứu, kỹ thuật học máy và khai phá dữ liệu ứng dụng trong lĩnh vực viễn thông.
Các nhà phát triển phần mềm và hệ thống CRM: Hướng dẫn cách tích hợp mô hình học máy vào hệ thống quản lý khách hàng, nâng cao khả năng dự báo và tự động hóa quy trình chăm sóc khách hàng.

Câu hỏi thường gặp

Mô hình hỗn hợp ANN + Decision Tree có ưu điểm gì so với mô hình ANN đơn lẻ?
Mô hình hỗn hợp tận dụng khả năng trích xuất đặc trưng của ANN và phân lớp nhanh, dễ hiểu của Decision Tree, giúp tăng độ chính xác dự báo khoảng 5% và giảm thời gian thực thi khoảng 30%.
Lựa chọn thuộc tính ảnh hưởng thế nào đến hiệu quả mô hình?
Lựa chọn thuộc tính giúp giảm số chiều dữ liệu, loại bỏ nhiễu và thông tin không cần thiết, từ đó tăng tốc độ huấn luyện và cải thiện độ chính xác phân lớp.
Bộ dữ liệu sử dụng trong nghiên cứu có đặc điểm gì?
Bộ dữ liệu chuẩn từ UCI gồm hàng nghìn bản ghi về hành vi sử dụng dịch vụ của khách hàng thuê bao di động, được chuẩn hóa và lựa chọn thuộc tính kỹ lưỡng để phù hợp với mô hình học máy.
Thời gian thực thi mô hình có ý nghĩa gì trong thực tế?
Thời gian thực thi nhanh giúp mô hình có thể áp dụng trong môi trường thực tế với dữ liệu lớn và yêu cầu xử lý nhanh, hỗ trợ kịp thời các quyết định giữ chân khách hàng.
Mô hình này có thể áp dụng cho các ngành khác ngoài viễn thông không?
Có, các kỹ thuật học máy và khai phá dữ liệu được áp dụng rộng rãi trong nhiều lĩnh vực như tài chính, y tế, bán lẻ để dự báo hành vi khách hàng hoặc các sự kiện quan trọng khác.

Kết luận

Đã xây dựng thành công mô hình dự báo thuê bao rời bỏ nhà mạng kết hợp Mạng Nơron nhân tạo và Cây quyết định, đạt độ chính xác trên 90%.
Mô hình hỗn hợp ANN + Decision Tree cải thiện đáng kể thời gian thực thi so với mô hình ANN + ANN, giảm khoảng 30%.
Kỹ thuật lựa chọn thuộc tính đóng vai trò quan trọng trong việc nâng cao hiệu quả mô hình, giảm số chiều dữ liệu từ 50 xuống còn 20 thuộc tính.
Kết quả thực nghiệm trên bộ dữ liệu chuẩn UCI cho thấy tiềm năng ứng dụng thực tế cao trong ngành viễn thông.
Đề xuất triển khai mô hình trong hệ thống CRM của các nhà mạng, đồng thời phát triển hệ thống cảnh báo tự động để nâng cao hiệu quả giữ chân khách hàng.

Các nhà mạng và chuyên gia phân tích dữ liệu nên phối hợp triển khai thử nghiệm mô hình trên dữ liệu thực tế, đồng thời đào tạo nhân sự vận hành để tối ưu hóa hiệu quả ứng dụng.

Trích đoạn nội dung tài liệu

— — LÊ TRƯƠNG TRỌNG DUY DU BAO THUE BAO ROI BO NHA MANG DỰA VÀO HỌC MÁY CHUYEN NGANH: KHOA HỌC MAY TÍNH MA SO CHUYEN NGANH: 60.01 LUẬN VAN THAC SĨ TP. Hồ Chí Minh. Tháng 08 năm 2018 a a a — ——__——__— CÔNG TRÌNH ĐƯỢC HOÀN THÀNH TẠI TRUONG ĐẠI HOC BACH KHOA - ĐHQG — HCM Cán bộ hướng dẫn khoa hoc: PGS. TS Duong Tuan Anh Cán bộ chấm nhận xét 1:PGS.-- - c6 + E£EsEEeEeEsEeEsesrsed Cán bộ chấm nhận xét 2: TS.Nguyễn Đức Cường .----- - 555s+c+cscsecs2 Luận văn thạc sĩ được bảo vệ tại Trường Dai học Bach Khoa, DHQG Tp.

HCM ngày 17 thang 07 năm 2018 Thanh phan hội đồng đánh giá luận văn thạc sĩ gồm: 1.Phan Thi TÏƯƠI.Nguyễn Hồ Man Rạng.--- ch HH TH HH ng Hà A.- -- SHre Xác nhận của Chủ tịch Hội đồng đánh giá luận văn và Trưởng Khoa quản lý chuyên ngành sau khi luận văn đã được sửa chữa (nêu có). CHỦ TỊCH HỘI ĐÔNG TRƯỞNG KHOA KH & KHMT ĐẠI HỌC QUỐC GIA TP.HCM CONG HÒA XÃ HOI CHỦ NGHĨA VIỆT NAM TRƯỜNG ĐẠI HỌC BÁCH KHOA Độc lập - Tự do - Hạnh phúc NHIỆM VỤ LUẬN VĂN THẠC SĨ Họ tên học viên: Lê Trương Trọng Duy. Ngày, thang, năm sinh: 22/10/199. SG ST sa Nơi sinh: TPHCM.

Ngành: Khoa Học May Tinh. TEN DE TÀI: Dự báo thuê bao rời bồ nhà mạng dựa vào học máy. VÀ NỘI DUNG: Nhiệm vụ :Dé xuất mô hình mới dé giải quyết bài toán dự báo thuê bao rời bỏ nhà mạng dựa vào học máy Nội dung : 1/Nghién cứu lý thuyết về khai phá dữ liệu,các kỹ thuật trong bài toán khai phá dữ liệu va học máy,các mô hình mạng Noron,Cây quyết định. 2/Hiện thực mô hình hỗn hợp mạng Noron + Cây quyết định dựa vào việc kết hợp 3 kỹ thuật : Lựa chọn thuộc tinh,thu giảm tập huân luyện và phân lớp dữ liệu.

3/Thực nghiệm việc so sánh và đánh giá kết quả mô hình mạng Noron + cây quyết định với mô hình mạng Nơron + mạng ÏÌNOTOIN. NGÀY GIAO NHIỆM VU: 26/02/2018.-- 52522222 SE 322123222 2112121 re, IV. NGÀY HOÀN THÀNH NHIỆM VU: 17/06/2018. CÁN BO HUONG DÂN : PGS.TS Dương Tuấn Anh.

CAN BO HUONG DAN TRUONG KHOA KH & KTMT (Họ tên va chữ ky) (Họ tên và chữ ký) LỜI CẢM ƠN Trong thời gian thực hiện luận văn, dưới sự hướng dẫn tận t nh của c c gi ng viên, các thay cô trường Dai học B ch Khoa Tp.HCM, tôi đã hoàn thành luận văn thạc s với thời gian như dự kiến. Có được kết qu ấy tôi xin chân thành gởi lời cám ơn đến. Duong Tuan Anh — Gi ng vién khoa Khoa Hoc M y T nh, trường Dai Học B ch Khoa Tp.HCM đã tận t nh hướng dẫn, giúp đỡ tôi trong suốt quá trình làm luận văn. Sự giúp đỡ và hướng dẫn nhiệt tình của thầy đã giúp tôi củng cô kiến thức và hoàn thành tốt luận văn tốt nghiệp.

Tôi xin chân thành c m ơn thay. - Quy thay cô khoa Khoa Hoc M y T nh, trường Dai học B ch Khoa Tp.HCM nói riêng và các thay cô Trường Dai Hoc B ch Khoa Tp.HCM nói chung đã tận tình gi ng dạy và chỉ b o, giúp tôi trang bị những kiến thức quý báu trong suốt thời gian học tập và nghiên cứu. Du rat cô găng và liên tục nâng cao kiên thức, nhưng luận văn nay van không thê tránh những thiêu sót và hạn chê. Do đó tôi rat mong nhận được sự chỉ dan của các quý thay cô và các ban dé tôi có thê hoàn thiện những sai sót mà m nh mặc ph i.

TÓM TẮT LUẬN VĂN Trong ngành Công nghệ thông tin, Mang Noron nhân tao (Artificial Neural Networks hoặc gọi tắt là Neural Networks) là một hệ thống mô hình hóa một cách đặc biệt cách các tế bào thần kinh hoạt động trong não bộ con người. Mang Noron nhân tạo đã được ứng dụng trong nhiều ngành nghề, I nh vực kh c nhau như y học, công nghiệp, viễn thông, thời tiết và tài ch nh. Việc sử dụng bố sung Mang Noron nhân tao đóng vai trò quan trọng trong thời đại ky nguyên số hiện nay, các ứng dụng thương mại cua cua Mang Noron nhân tao thường tập trung vào việc gi 1 quyết các van dé xử lý tín hiệu phức tạp hoặc nhận dang mau. Qua đó ta có thé phân tích, dự đo nc c sự kiện trước, hoặc dự báo các hành động sẽ x y ra dựa trên các dữ liệu gốc hiện tại và đưa ra quyết định tốt hơn phục vụ đời sống con người.

Trong những năm gần đây, bài toán dir báo thuê bao rời bỏ nhà mang đã hap dẫn sự chú của nhiều nhà nghiên cứu. nhiều gi i thuật đã được dé xuất và kết hợp nhămc ¡ tiễn hiệu suất và độ chính xác khi ph ¡ xử lý bài toán phức tạp này. Trong luận văn này, chúng tôi sẽ kh o sát hướng tiếp cận để c i tiến thời gian thực thi va d nh gi độ chính xác khi sử dụng kỹ thuật khai pha dữ liệu hỗn hợp (Hybrid Data Mining Techniques) băng cách kết hợp hai mô hình là Mạng Noron nhân tạo (ANN)+ Cây quyết định (Decision Tree) và so sánh với mô hình hỗn hợp Mang Noron nhán tao(ANN1) + Mạng Noron nhân tao(ANN2). Phương ph p kết hợp hai mô hình Mạng Noron nhân tạo (ANN) + Cây quyết định (Decision Tree) được thực hiện để c ¡ thiện thời gian thực thi hơn khi sử dụng mô hình hỗn hợp Mang Noron nhân tao (ANN1)+ Mạng Noron nhán tao(ANN2), trong đó mô h nh Mang Noron nhân tao sẽ làm nhiệm vu thu gi m tap huấn luyện, còn mô hình Cây guyết định sẽ làm nhiệm vu dự báo.

thực nghiệm sẽ chứng minh sự hiệu qu của gi ¡ thuật kết hợp ANN+ Decision Tree sẽ cho kết qu với thời gian thực thi nhanh hơn gi i thuật kết hop ANN+ANN.Trong khi đó, hai mô h nh trên đều cho kết qu độ chính xác tốt hơn mô h nh ANN đơn lẻ. ABSTRACT In information technology, an Artificial Neural Network (ANN) is a system which models specially the operation of neurons in the human brain. Neural networks have been applied in many different domains such as medicine, industries, telecom, weather and finance. Applying Artificial Neural Networks plays an important role in this generation, Commercial applications of these technologies generally focus on solving complex signal processing or pattern recognition problems.Its method based on datasets can help us for analyzing, predict events and have better decision making.

In recent years, customer churn prediction has attracted the attention of many researchers, many algorithms have been proposed and combine to improve the performance and the accuracy when dealing with this complex problem. In this thesis, we explore an approach to improving excution time and rating the accuracy of two model. When using hybrid data mining techniques by combining two models of Artificial neural network (ANN) + Decision Tree and compare the result with the combination of two models of Artificial Neural Networks (ANN) + Artificial Neural Networks (ANN). A combination of two models: Artificial Neural Network (ANN) + Decision Tree was implemented to improve excuting time enhancement better than using the hybrid model of combining Artificial Neural Network model (ANNI) + Artificial Neural Network model (ANN2) , in which the ANN model performs the data reduction task, while Decision Tree model will be the task of prediction.

The experimental results show that the efficiency of the combine Decision Tree + ANN algorithm will have the result of excuting time better than the combined ANN + ANN algorithm.But both of two models perform the better accuracy than single ANN model. LỜI CAM ĐOAN Tôi cam đoan răng, ngoại trừ các kêt qu tham kh o từ các công trình khác như đã ghi rõ trong luận văn, c c công việc trình bày trong luận văn này là do ch nh tôi thực hiện và chưa có phân nội dung nào của luận văn này được nộp đê lây một băng cấp ở trường này hoặc trường khác. Ngày 16 th ng 06 năm 2018 Lé Truong Trong Duy. DANH MỤC HINH Hình II-I C c bước xây dựng một hệ thông khai phá dữ liệu.-7 Hình II-2 Hệ thống phân lớp tổng quát .-- + - +52 2+2 +2 +£+£e+xzxszxsrs2 9 Hình II-3 Cấu trúc của một noron nhân †ạO.--- - xxx +x+k++zE++zezxz 12 Hình II-4 Cau trúc của mạng perceptron nhiều lớp .--------- 2 s5: 13 Hình H-5 Minh hoa gi 1 thuật K- NN.

G1 re, 21 Hình II-6 Biểu diễn cây quyết định CO tececccccsccssssesssesssseesssesseseeseseeseseees 22 Hình II-7 Cây quyết định cho việc chơi Tennis.---- 2-5 2 5s+5z2s+5sc5+2 23 Hình II-8 Bốn bước cơ b n trong quá trình lựa chọn các thuộc tính phù hợp.29 Hinh [1-9 M6 hinh Filter. 30 Hình I-10 Mô hình Wrapper. ee eee eeeeceesseeeeesseceeeesseeeeeeesseeeesesssaeeeesgas 31 Hình II-11 Mô hình xây dựng hệ thống thuê bao rời bỏ nhà mang [13]. 38 H nhIV-1 Sod tổng qu t của hệ thong Mạng Nơron + Cây quyết định.

45 H nhIV-2 Sod tổng qu t của hệ thống Mạng Noron + Mang Nơron. 46 Hình V-1 Dữ liệu sau khi được chuẩn hóa. -- 2xx k+x+x+++E+ezecxe 52 Hình V-2 Lựa chọn thuộc tính trên WEKA.----ccccQss s32 53 Hình V-3 Cấu h nh phương ph pd nhgi thuộc tính WrapperSubsetEval trên "25. 53 Hình V-4 Cấu hình Tree sử dụng thuật toán J48(C4.

54 Hình V-5 Cấu hình Search Method với phương ph p GreedyStepwise. 55 Hình V-6 Các thuộc t nh trước khi lọc và lựa chọn thuộc tính. 55 Hình V-7 Các thuộc tính còn lại khi lọc và lựa chọn các thuộc tính. 56 Hình V-8 Các công thức để đ nh gi một mô hình .---- 2-5555: 58 Hình V-9 Xây dựng Cây quyết định bang Python.---- ¿5525s+5<c5+2 59 Hình V-10 Confusion Matrix của ANNI khi thực nghiệm bằng phương ph p ANNI + ANN2 của bài báO.-- - -- -- s0 vn 62 Hình V-11 Kết qu thực nghiệm hàm lỗi trung bình khi sử dụng mô hình Mang Noron + Cây quyết định: .-----¿- 2-56 2E+52+ESEE2ESEE 2E 2E 2E Ekrrrrkrreee 64 DANH MỤC BANG B ng V-1 Hidden Unit đã thực nghiệm có kết qu.

57 B ng V-2 Confusion Matrix của Mạng Noron đầu tiên .------- 58 B ng V-3 Kết qu_ thực thi và thời gian thực thi của Cây quyết định ứng với dữ liệu Mạng Nơron © tTÊN:. ng và 60 B ng V-4 Thực nghiệm mồ hình Mang Noron + Mạng Noron. 63 B ng V-5 B ng so sánh tổng thé 2 mô hình Mạng Noron+Cây quyết định va Mạng Nơron+Mạng Mạng NofroH. Q30 0 0nv463 VỊ MỤC LỤC 909.

TOM TAT LUẬN VĂN. iv DANH MỤC HINH .ccccceccsccsecececscscececececesesescssscsvevevavevavevacecacecscecacecacesseeseceavees V DANH MỤC BẢNG. G1 SE 1 1 1101111111111 1 0151 xe ereree vi MỤC: LUC oe ececenecceessseeecesesnnecceessnceceesaaeeceseaaeeeeeseeeeeceeeeaeeesesenececeeeaeeeeenegs Vil CHUONGI GIỚI THIỆU TONG QUAN VE DE TAL .1 Động cơ nghiÊn CỨU.2 gh a của để tài.1 gh a thực tiỄn.2 ngh a khoa hỌC 20. eee sseeceesssnecceesseeeeceeseeeeeceseeaeecesseeeceeesnneeceeeas 2 [3 Mục tiêu nghiÊn CỨU.

---- - <0 0 ng ng re 3 L4 Giới hạn của dé tài.

Nội dung được bảo vệ bản quyền — Tải xuống đầy đủ

Tài liệu "Dự Báo Thuê Bao Rời Bỏ Nhà Mạng Dựa Vào Học Máy" cung cấp cái nhìn sâu sắc về việc sử dụng công nghệ học máy để dự đoán hành vi của người tiêu dùng trong ngành viễn thông. Bài viết nêu bật các phương pháp phân tích dữ liệu và mô hình hóa để xác định các yếu tố ảnh hưởng đến quyết định rời bỏ nhà mạng của khách hàng. Điều này không chỉ giúp các nhà cung cấp dịch vụ viễn thông cải thiện chiến lược giữ chân khách hàng mà còn tối ưu hóa trải nghiệm người dùng.

Để mở rộng kiến thức của bạn về các yếu tố ảnh hưởng đến sự hài lòng và lòng trung thành của khách hàng trong các lĩnh vực khác, bạn có thể tham khảo tài liệu Luận văn thạc sĩ quản trị kinh doanh nghiên cứu sự hài lòng và lòng trung thành của khách đối với dịch vụ game online tại việt nam, nơi nghiên cứu sự hài lòng của khách hàng trong ngành game online. Ngoài ra, tài liệu Luận văn các nhân tố ảnh hưởng đến quyết định sử dụng dịch vụ internet banking của khách hàng cá nhân tại eximbank chi nhánh tiền giang sẽ giúp bạn hiểu rõ hơn về các yếu tố quyết định trong lĩnh vực ngân hàng trực tuyến. Cuối cùng, bạn cũng có thể tìm hiểu về Nhân tố ảnh hưởng đến lòng trung thành của khách hàng thành phố huế đối với dịch vụ fibervnn của vnpt thừa thiên huế, để có cái nhìn tổng quát hơn về lòng trung thành của khách hàng trong dịch vụ viễn thông. Những tài liệu này sẽ giúp bạn mở rộng hiểu biết và có cái nhìn đa chiều về các vấn đề liên quan đến khách hàng trong các lĩnh vực khác nhau.

#phân tích dữ liệu khách hàng

#chiến lược giữ chân khách hàng

#công nghệ học máy

#học máy trong viễn thông

#thuê bao viễn thông

#dự báo thuê bao rời bỏ

Chủ đề

Phân tích hành vi khách hàng

Chiến lược giữ chân khách hàng

Ứng dụng học máy trong viễn thông

Dự đoán rời bỏ thuê bao