Ứng dụng AI dự đoán thuê bao rời mạng dịch vụ internet VNPT

Luận văn thạc sĩ về ứng dụng AI trong dự đoán thuê bao rời mạng dịch vụ internet VNPT. Nghiên cứu chuyên sâu về công nghệ thông tin và phân tích dữ liệu.

Trường đại học

Đại Học Quốc Gia TP HCM - Trường Đại Học Công Nghệ Thông Tin

Chuyên ngành

Công Nghệ Thông Tin

Người đăng

Ẩn danh

Thể loại

Luận văn thạc sĩ

2024

105

Phí lưu trữ

35 Point

Mục lục chi tiết

LỜI CAM ĐOAN

LỜI CẢM ƠN

1. CHƯƠNG 1: Ly do chgn dé tai Internet tại Việt Nam

1.1. Mục tiêu của nghiên CỨU

1.2. Đối tượng nghiên cứu

1.3. Pham vi của nghiên cứu

1.4. So sánh với các nghiên cứu liên quan

1.5. Cấu trúc luận VAN

2. CHƯƠNG 2: Các bước quá trình chăm sóc khách hàng của VNPT

2.1. Tìm hiểu thông tin

2.2. Ký kết hợp đồng

2.3. Lắp đặt dịch vụ

2.4. Bảo tri, sỬa ChẴỮa

2.5. Thanh lý hợp đồng

2.6. Tổng quan về AI và Ứng dụng

2.7. Khái niệm về AI

2.8. Quy trình phân tích dữ liệU

2.9. Một số khái niệm khác trong quy trình phân tích máy học

2.10. Bài toán dự đoán thuê bao rời mạng

3. CHƯƠNG 3: Tổng quan bai toán dự đoán thuê bao rời mạng

3.1. Các mô hình máy học được sử dụng

3.1.1. Thuật toán K láng giềng gần - KNN

3.1.2. Mô hình Naive Bayes

3.1.3. Hồi quy Logistic

3.1.4. Mô hình SVM

3.1.5. Mô hình cây quyết định - DT

3.1.6. Mô hình rừng ngẫu nhiên

3.1.7. Phương pháp tang CƯỜng

3.1.8. Các mô hình học sâu được sử dụng

3.1.8.1. Mạng nơ-ron nhân tạo

3.1.8.2. Mạng nơ ron tích chập

3.2. Hiện trạng bài toán về dự đoán thuê bao rời mạng dịch vụ viễn thông

3.3. Mô hình dự đoán thuê bao rời mạng sử dụng các thuật toán phân tích hồi quy, cây quyết định và mạng nơ-ron nhân tạo

3.4. Dự đoán khách hàng rời bỏ trong ngành Viễn thông sử dụng thuật toán bộ phân loại rừng ngẫu nhiên

3.5. Mô hình dự đoán khách hàng rời mạng trong ngành Viễn thông sử dụng kỹ thuật kết hợp XGBoost và Smote-enn để cải thiện độ chính xác của dự đoán khách hàng rời bỏ trong ngành viễn thông

3.6. Các mô hình CCP trên nhiều bộ dữ liệu khác nhau

4. CHƯƠNG 4: Chỉ tiết kết quả thực nghiệm

4.1. Môi trường thực nghiệm và các bộ dữ liệu

4.2. Tổng quan quy trình tiến hành thực nghiệm

4.3. Tiền xử lý dữ liỆU

4.3.1. Làm sạch dữ liỆU

4.4. Phân tích dữ liệu khám phá

4.4.1. Các trường hợp thuê bao có khả năng cao rời bỏ

4.4.2. Kết quả mô hình KNN

4.4.3. Kết quả mô hình Naive Bayes

4.4.4. Kết quả mô hình hồi quy Logistic

4.4.5. Kết quả mô hình SVM

4.4.6. Kết quả mô hình rừng ngẫu nhiên

4.4.7. Kết quả mô hình cây quyết định

4.4.8. Kết quả mô hình dự đoán Adaboost

4.4.9. Kết quả mô hình Gradient Boost

4.4.10. Kết quả mô hình XGBoost

4.4.11. Kết quả model mạng nơ-ron nhân tạo

4.4.12. Kết quả mô hình mạng neural tích chập

4.4.13. So sánh kết quả các mô hình dự đoán về độ chính xác

4.5. Khả năng dự đoán tỉ lệ thuê bao rời mạng

4.5.1. Thời gian huấn luyện

5. CHƯƠNG 5: KẾT LUẬN VÀ HƯỚNG PHÁT TRIỂN

TÀI LIỆU THAM KHẢO

Tóm tắt

I. Tổng Quan Về Dự Đoán Churn VNPT Bằng AI 55 ký tự

Công nghệ AI đang được tích hợp rộng rãi, hỗ trợ dự đoán, quản lý, đặc biệt trong quản lý thuê bao và chất lượng dịch vụ internet. Thị trường internet phát triển đặt ra thách thức cho các ISP: chuyển từ thu hút khách hàng mới sang giữ chân khách hàng hiện tại. Nhiều yếu tố tác động đến việc thuê bao tiếp tục hay rời mạng. Việc hiểu hành vi khách hàng, khuyến khích chi tiêu và dự đoán, ngăn chặn churn là rất quan trọng. Các nhà điều hành cần tương tác với người tiêu dùng và giữ chân họ bằng dịch vụ cạnh tranh, sáng tạo. Giá cả, dịch vụ tiện ích cộng thêm và hậu mãi tác động lớn đến churn rate. Churn có thể là tự nguyện hoặc do hóa đơn chưa thanh toán. Mục tiêu của luận văn là phân tích, thiết kế và triển khai PM sử dụng AI để đánh giá xác suất rời mạng của thuê bao internet VNPT TP. Hồ Chí Minh. Dựa trên thử nghiệm, tác giả chọn lọc, phân tích PM khác nhau để tìm ra mô hình phù hợp, giúp tìm ra thuê bao có khả năng rời mạng.

1.1. Tầm quan trọng của AI trong dự đoán churn

Việc áp dụng AI vào Customer Churn Prediction (CCP) trong ngành viễn thông mang lại kết quả kinh doanh tốt hơn và tạo ra sự đổi mới, tiến bộ. AI giúp phân tích dữ liệu phức tạp và dự đoán khả năng rời mạng chính xác hơn, hỗ trợ các ISP chủ động can thiệp để giữ chân khách hàng. VNPT cần nghiên cứu và dự đoán hành vi rời mạng để duy trì doanh thu và thị phần. Việc sử dụng AI còn đưa lại các giá trị thực tiễn cho công ty. Kết quả nghiên cứu có thể được ứng dụng vào hoạt động kinh doanh giúp VNPT tối ưu chiến lược bán hàng và CSKH, tăng hiệu quả kinh doanh và duy trì sự cạnh tranh.

1.2. Mục tiêu và đối tượng nghiên cứu về dự đoán churn

Đề tài nghiên cứu lược khảo kỹ thuật và đánh giá mô hình ML trong dự báo. So sánh sai số khi thay đổi thuộc tính dữ liệu và so sánh tác động của số lượng biến tới hiệu suất trong quy trình thử nghiệm. Nghiên cứu cũng đưa ra nhằm lựa chọn mô hình dự báo phù hợp để CCP dịch vụ internet VNPT. Đối tượng nghiên cứu là các mô hình máy học được áp dụng trong nghiên cứu dự báo như: KNN, Naiver Bayes, hồi quy Logistic, rừng ngẫu nhiên, cây quyết định, phương pháp tăng cường, ANN, CNN. Nghiên cứu còn sử dụng bộ dữ liệu danh sách chi tiết các thuê bao sử dụng internet VNPT TP. Hồ Chí Minh trong thời gian 6 năm, từ 2017 đến 2023 trên toàn TP. Hồ Chí Minh.

II. Vấn Đề Thuê Bao Rời Mạng VNPT Thách Thức Lớn 59 ký tự

Internet tại Việt Nam xuất hiện từ 1997, thay đổi thói quen, kinh tế, xã hội và tạo phương thức tìm kiếm tri thức mới. Việt Nam là nước mạnh về Viễn thông - Internet với công nghệ hiện đại và mức phổ cập cao. Số lượng người dùng và ISP gia tăng, tạo cạnh tranh mạnh mẽ. Thị trường internet bão hòa, người dùng mới ít, khách hàng chuyển dịch giữa các ISP. Để giữ vững thị phần, việc hiểu và dự đoán đúng nhu cầu là yếu tố quan trọng. Tận dụng nghiên cứu mới, sử dụng AI và dữ liệu phát sinh để phân tích mẫu dữ liệu phức tạp và dự đoán khả năng rời mạng, hỗ trợ can thiệp kịp thời. Các ISP đối mặt áp lực hỗ trợ khách hàng khắt khe, không chỉ internet mà còn dịch vụ giải trí. Khó khăn của dịch vụ ba trong một là cung cấp trải nghiệm chất lượng cao khi sử dụng dịch vụ hoặc yêu cầu trợ giúp. VNPT TP. Hồ Chí Minh là ISP lớn, có lượng thuê bao rời bỏ. Việc nghiên cứu và dự đoán hành vi rời mạng là cần thiết.

2.1. Các Yếu Tố Ảnh Hưởng Churn VNPT

Nghiên cứu tập trung phân tích yếu tố ảnh hưởng tỉ lệ rời mạng của khách hàng sử dụng Internet của VNPT. Đặc biệt sử dụng mô hình máy học dự báo khả năng thuê bao rời bỏ dịch vụ. Nghiên cứu gồm: Thu thập dữ liệu về hành vi rời mạng thực tế tại VNPT liên tục trong nhiều năm. Tiền xử lý dữ liệu: phân tích, đánh giá, xử lý để loại bỏ giá trị ngoại lai, điền dữ liệu thiếu, chuyển đổi, tạo bộ dữ liệu trung gian, chuẩn hóa dữ liệu. Xây dựng và cài đặt PM: sử dụng thuật toán và PM như KNN, Naive Bayes, rừng ngẫu nhiên, Adaboost, Gradient Boost, XGBoost, hồi quy Logistic, cây quyết định, ANN, mạng neural tích chập. Nghiên cứu còn Đánh giá hiệu suất và so sánh độ lỗi của PM.

2.2. So sánh nghiên cứu churn prediction với các nghiên cứu khác

Luận văn cung cấp tổng quan chi tiết và so sánh kỹ thuật học máy truyền thống và hiện đại trong bài toán dự đoán khách hàng rời bỏ. Đây là tài liệu tham khảo giá trị. Luận văn áp dụng và điều chỉnh thuật toán khác nhau để tối ưu hóa bài toán dự đoán rời mạng, bao gồm tinh chỉnh siêu tham số và kỹ thuật như lựa chọn đặc trưng, điền thiếu dữ liệu. Qua việc so sánh mô hình, luận văn xác định mô hình như Gradient Boosting và XGBoost đạt hiệu suất cao nhờ khả năng xử lý dữ liệu phức tạp. Luận văn có thể đóng góp vào việc điều chỉnh các mô hình hiện có cho bài toán dự đoán khách hàng rời bỏ. Luận văn mô tả chi tiết quy trình tiền xử lý (thu thập, làm sạch, chọn lọc, tạo đặc trưng), nâng cao chất lượng dữ liệu. Nghiên cứu xử lý bộ dữ liệu trong thực tế, đóng góp vào việc tiền xử lý các vấn đề phổ biến. Bộ dữ liệu có tính bảo mật nên không thể công bố rộng rãi.

III. Phương Pháp AI Dự Đoán Churn VNPT Chi Tiết 54 ký tự

Trong mô hình vòng đời sản phẩm, người dùng trải qua các bước: Tìm hiểu thông tin -> Lựa chọn dịch vụ -> Lắp đặt dịch vụ -> Bảo trì, sửa chữa -> Tái ký hợp đồng, gia hạn -> Thanh lý hợp đồng. Các bước được mô tả chi tiết: Tìm hiểu thông tin: Người dùng tìm thông tin về sản phẩm qua môi trường mạng online (web, Facebook, Tiktok, ...) hoặc các kênh trực tiếp như cửa hàng, người quen, đại lý. Sau khi tìm hiểu, xác định ISP tin dùng, người dùng tiếp xúc ISP để chọn sản phẩm.

3.1. Quy Trình Chăm Sóc Khách Hàng VNPT

Sau khi kí kết hợp đồng với người dùng, ISP cần lắp đặt dịch vụ cho người dùng tại nhà hoặc địa điểm đăng ký. Lắp đặt bao gồm kéo đường dây, cài đặt thiết bị và hướng dẫn sử dụng. Trong quá trình sử dụng, dịch vụ có thể gặp sự cố, ISP cần bảo trì, sửa chữa nhanh chóng để đảm bảo trải nghiệm người dùng. Khi hết hạn hợp đồng, người dùng có thể tái ký hợp đồng để tiếp tục sử dụng dịch vụ, hoặc thanh lý hợp đồng nếu không còn nhu cầu.

3.2.Tổng Quan Về AI và Ứng Dụng Trong Viễn Thông

AI (trí tuệ nhân tạo) là ngành khoa học máy tính liên quan đến việc thiết kế và xây dựng các hệ thống thông minh, có khả năng tự động hóa các tác vụ đòi hỏi trí thông minh của con người. Trong viễn thông, AI được ứng dụng rộng rãi trong nhiều lĩnh vực như: Dự đoán nhu cầu của khách hàng, Tối ưu hóa mạng lưới, Phát hiện gian lận, Cá nhân hóa dịch vụ, Chăm sóc khách hàng tự động. AI giúp các nhà mạng nâng cao hiệu quả hoạt động, cải thiện trải nghiệm khách hàng và tạo ra các dịch vụ mới.

3.3. Quy Trình Phân Tích Dữ Liệu Trong Dự Đoán Churn VNPT

Phân tích dữ liệu là quá trình thu thập, xử lý và phân tích dữ liệu để tìm ra các thông tin hữu ích. Trong dự đoán churn VNPT, quy trình phân tích dữ liệu thường bao gồm các bước sau: Thu thập dữ liệu: Thu thập dữ liệu về khách hàng, dịch vụ và mạng lưới. Tiền xử lý dữ liệu: Làm sạch dữ liệu, loại bỏ các giá trị ngoại lai và chuyển đổi dữ liệu về dạng phù hợp để phân tích. Phân tích dữ liệu: Sử dụng các kỹ thuật phân tích dữ liệu để tìm ra các yếu tố ảnh hưởng đến tỷ lệ rời mạng. Xây dựng mô hình dự đoán: Xây dựng mô hình dự đoán khả năng khách hàng rời mạng dựa trên các yếu tố đã được xác định. Đánh giá mô hình: Đánh giá hiệu quả của mô hình dự đoán và điều chỉnh mô hình nếu cần thiết. Triển khai mô hình: Triển khai mô hình dự đoán để hỗ trợ các quyết định kinh doanh.

IV. Nghiên Cứu Thực Nghiệm Kết Quả AI Dự Đoán Churn 57 ký tự

Phần này trình bày chi tiết về môi trường thực nghiệm, các bộ dữ liệu sử dụng, tổng quan quy trình thực nghiệm, tiền xử lý dữ liệu (làm sạch, phân tích khám phá), các trường hợp thuê bao có khả năng cao rời bỏ, và kết quả của các mô hình như KNN, Naive Bayes, hồi quy Logistic, SVM, rừng ngẫu nhiên, cây quyết định, Adaboost, Gradient Boost, XGBoost, mạng nơ-ron nhân tạo, và mạng neural tích chập. So sánh kết quả các mô hình dự đoán về độ chính xác, khả năng dự đoán tỉ lệ thuê bao rời mạng và thời gian huấn luyện.

4.1. Môi trường thực nghiệm và bộ dữ liệu sử dụng

Môi trường thực nghiệm bao gồm phần cứng (CPU, GPU, RAM) và phần mềm (hệ điều hành, ngôn ngữ lập trình, thư viện). Bộ dữ liệu sử dụng là dữ liệu thực tế từ VNPT TP. Hồ Chí Minh, bao gồm thông tin về thuê bao, dịch vụ, và mạng lưới. Dữ liệu được thu thập trong khoảng thời gian từ 2017 đến 2023.

4.2. Chi Tiết Kết Quả Của Các Mô Hình Dự Đoán

Kết quả của mỗi mô hình dự đoán được trình bày chi tiết, bao gồm các thông số đánh giá như độ chính xác (accuracy), độ bao phủ (recall), độ chính xác (precision), F1-score, và AUC. Ma trận nhầm lẫn (confusion matrix) cũng được sử dụng để đánh giá hiệu quả của mô hình trong việc phân loại đúng và sai. Ngoài ra, thời gian huấn luyện của mỗi mô hình cũng được ghi lại để so sánh hiệu suất tính toán.

4.3. So sánh các mô hình về khả năng dự đoán churn

Các mô hình khác nhau có những ưu điểm và nhược điểm riêng. Ví dụ, các mô hình dựa trên cây quyết định như rừng ngẫu nhiên và XGBoost thường cho kết quả tốt với dữ liệu phi tuyến tính và nhiều thuộc tính, trong khi các mô hình tuyến tính như hồi quy Logistic có thể đơn giản hơn nhưng lại hiệu quả trong một số trường hợp nhất định. Mạng nơ-ron nhân tạo có khả năng học các mối quan hệ phức tạp trong dữ liệu, nhưng lại đòi hỏi nhiều tài nguyên tính toán hơn.

V. Kết Luận Ứng Dụng và Hướng Phát Triển AI Churn 54 ký tự

Nghiên cứu đã trình bày chi tiết về việc ứng dụng AI trong dự đoán thuê bao rời mạng VNPT, từ cơ sở lý thuyết, phương pháp thực hiện đến kết quả thực nghiệm. Kết quả cho thấy các mô hình AI có tiềm năng lớn trong việc giúp VNPT giảm thiểu churn rate và nâng cao hiệu quả kinh doanh. Tuy nhiên, cần tiếp tục nghiên cứu và phát triển để hoàn thiện các mô hình và quy trình ứng dụng.

5.1. Tóm Tắt Kết Quả Chính và Ưu Điểm Của Nghiên Cứu

Nghiên cứu đã xác định được các yếu tố quan trọng ảnh hưởng đến tỷ lệ rời mạng của thuê bao VNPT, đồng thời đánh giá hiệu quả của nhiều mô hình AI trong việc dự đoán churn. Kết quả cho thấy các mô hình như XGBoost và Gradient Boosting cho độ chính xác cao, phù hợp với bài toán này.

5.2. Hướng Phát Triển và Ứng Dụng Thực Tế

Trong tương lai, có thể nghiên cứu thêm về các kỹ thuật tiền xử lý dữ liệu tiên tiến hơn, cũng như thử nghiệm với các mô hình học sâu phức tạp hơn. Bên cạnh đó, việc tích hợp kết quả dự đoán churn vào các hệ thống quản lý khách hàng (CRM) để triển khai các chiến dịch giữ chân khách hàng hiệu quả cũng là một hướng đi tiềm năng. Các kết quả nghiên cứu có thể giúp VNPT đưa ra các quyết định kinh doanh sáng suốt hơn, từ đó tăng cường lợi thế cạnh tranh trên thị trường.

26/04/2025

Bạn đang xem trước tài liệu:

Luận văn thạc sĩ công nghệ thông tin ứng dụng ai dự đoán thuê bao rời mạng dịch vụ internet vnpt

Tải đầy đủ

Nội dung chính

Tổng quan nghiên cứu

Trong bối cảnh thị trường internet tại Việt Nam đã đạt đến mức bão hòa với tỷ lệ thuê bao cao và sự cạnh tranh gay gắt giữa các nhà cung cấp dịch vụ internet (ISP), việc giữ chân khách hàng trở thành thách thức lớn đối với các doanh nghiệp viễn thông. Theo ước tính, VNPT TP. Hồ Chí Minh quản lý hơn 660.000 thuê bao internet trong giai đoạn 2017-2023, với tỷ lệ thuê bao rời mạng có xu hướng gia tăng do nhiều yếu tố như chất lượng dịch vụ, giá cước và sự cạnh tranh từ các ISP khác. Nghiên cứu này nhằm phân tích, thiết kế và triển khai các mô hình dự đoán thuê bao rời mạng sử dụng trí tuệ nhân tạo (AI) và các thuật toán máy học, từ đó hỗ trợ VNPT trong việc phát hiện sớm khách hàng có nguy cơ rời bỏ dịch vụ.

Mục tiêu cụ thể của luận văn là đánh giá hiệu quả của các mô hình máy học như KNN, Naive Bayes, hồi quy Logistic, rừng ngẫu nhiên, cây quyết định, Adaboost, Gradient Boost, XGBoost, mạng nơ-ron nhân tạo (ANN) và mạng nơ-ron tích chập (CNN) trong dự đoán hành vi rời mạng của thuê bao internet VNPT tại TP. Hồ Chí Minh. Phạm vi nghiên cứu bao gồm dữ liệu thuê bao internet của VNPT thu thập trong 6 năm từ 2017 đến 2023, với hơn 664.000 bản ghi và 17 thuộc tính liên quan đến hành vi sử dụng dịch vụ. Ý nghĩa nghiên cứu thể hiện qua việc cung cấp công cụ dự báo chính xác, giúp VNPT tối ưu hóa chiến lược chăm sóc khách hàng, giảm tỷ lệ rời mạng và duy trì thị phần trong bối cảnh cạnh tranh ngày càng khốc liệt.

Cơ sở lý thuyết và phương pháp nghiên cứu

Khung lý thuyết áp dụng

Luận văn dựa trên các lý thuyết và mô hình máy học hiện đại trong lĩnh vực dự đoán hành vi khách hàng, bao gồm:

Máy học (Machine Learning - ML): Tập trung vào việc xây dựng các thuật toán cho phép máy tính học từ dữ liệu và cải thiện hiệu suất dự đoán mà không cần lập trình cứng nhắc. Các thuật toán được áp dụng gồm KNN, Naive Bayes, hồi quy Logistic, SVM, cây quyết định, rừng ngẫu nhiên và các phương pháp tăng cường như Adaboost, Gradient Boost và XGBoost.
Học sâu (Deep Learning - DL): Sử dụng mạng nơ-ron nhân tạo nhiều lớp để trích xuất đặc trưng phức tạp từ dữ liệu lớn. Mạng nơ-ron nhân tạo (ANN) và mạng nơ-ron tích chập (CNN) được áp dụng nhằm nâng cao khả năng dự đoán chính xác trong bài toán phân loại thuê bao rời mạng.

Các khái niệm chính bao gồm: dự đoán thuê bao rời mạng (Customer Churn Prediction - CCP), siêu tham số mô hình, ma trận nhầm lẫn, độ chính xác (Accuracy), độ nhạy (Recall), điểm F1 (F1-score), và các kỹ thuật tiền xử lý dữ liệu như làm sạch, loại bỏ ngoại lệ, xử lý dữ liệu thiếu và trích chọn đặc trưng.

Phương pháp nghiên cứu

Nguồn dữ liệu chính là bảng danh sách chi tiết các thuê bao internet của VNPT TP. Hồ Chí Minh, thu thập trong 6 năm (2017-2023), gồm 664.329 bản ghi với 17 thuộc tính như thời gian sử dụng, tốc độ đường truyền, mức cước, số lần không phát sinh lưu lượng, khu vực lắp đặt, số lần tạm dừng dịch vụ, điểm tín nhiệm, số lần gia hạn dịch vụ, v.v. Dữ liệu được thu thập từ các hoạt động bán hàng, bàn giao dịch vụ và chăm sóc khách hàng của VNPT.

Phương pháp phân tích bao gồm:

Tiền xử lý dữ liệu: Loại bỏ dữ liệu ngoại lai, xử lý dữ liệu thiếu, chuẩn hóa và tạo biến mới nhằm nâng cao chất lượng dữ liệu đầu vào cho mô hình.
Xây dựng mô hình: Áp dụng các thuật toán máy học và học sâu đã nêu để huấn luyện trên bộ dữ liệu huấn luyện (chiếm khoảng 70%), kiểm định (15%) và thử nghiệm (15%). Quá trình huấn luyện bao gồm tinh chỉnh siêu tham số nhằm tối ưu hiệu suất mô hình.
Đánh giá mô hình: Sử dụng các chỉ số như độ chính xác, độ nhạy, điểm F1, ma trận nhầm lẫn và thời gian huấn luyện để so sánh hiệu quả các mô hình.
Timeline nghiên cứu: Nghiên cứu được thực hiện trong khoảng thời gian từ 2017 đến 2024, với giai đoạn thu thập và xử lý dữ liệu kéo dài 6 năm, tiếp theo là xây dựng và đánh giá mô hình trong năm 2023-2024.

Kết quả nghiên cứu và thảo luận

Những phát hiện chính

Hiệu suất mô hình Gradient Boost và XGBoost vượt trội: Mô hình XGBoost đạt độ chính xác lên đến khoảng 92%, cao hơn 5-7% so với các mô hình truyền thống như KNN và Naive Bayes. Thời gian huấn luyện của XGBoost cũng được tối ưu, nhanh hơn so với các mô hình học sâu phức tạp.
Mạng nơ-ron nhân tạo (ANN) và mạng nơ-ron tích chập (CNN) cho kết quả khả quan: ANN đạt độ chính xác khoảng 89%, trong khi CNN đạt khoảng 90%, thể hiện khả năng trích xuất đặc trưng phức tạp từ dữ liệu lớn. Tuy nhiên, thời gian huấn luyện của các mô hình này dài hơn đáng kể so với các mô hình cây quyết định.
Ảnh hưởng của các đặc trưng đến dự đoán: Các thuộc tính như số tháng sử dụng dịch vụ, số lần tạm dừng dịch vụ, điểm tín nhiệm và số lần gia hạn dịch vụ có mức độ quan trọng cao trong việc dự đoán thuê bao rời mạng, chiếm tỷ trọng trên 70% trong tổng ảnh hưởng các biến.
Tỷ lệ thuê bao rời mạng cao tập trung ở các khu vực có mức độ cạnh tranh lớn và dịch vụ chưa đồng đều: Phân tích dữ liệu cho thấy các khu vực có tỷ lệ rời mạng trên 15%, cao hơn mức trung bình toàn TP. Hồ Chí Minh khoảng 5%.

Thảo luận kết quả

Nguyên nhân chính của sự khác biệt hiệu suất giữa các mô hình là do khả năng xử lý dữ liệu phức tạp và trích xuất đặc trưng của các thuật toán. Mô hình XGBoost và Gradient Boosting tận dụng kỹ thuật tăng cường giúp cải thiện độ chính xác dự đoán bằng cách tập trung vào các lỗi của mô hình trước đó. Mạng nơ-ron nhân tạo và CNN phù hợp với dữ liệu lớn và phức tạp, tuy nhiên đòi hỏi tài nguyên tính toán cao và thời gian huấn luyện dài.

So sánh với các nghiên cứu trong ngành viễn thông, kết quả này phù hợp với xu hướng ứng dụng AI hiện đại trong dự đoán hành vi khách hàng, đồng thời khẳng định tính khả thi và hiệu quả của việc áp dụng các mô hình máy học và học sâu trong thực tế. Việc trình bày dữ liệu qua biểu đồ tầm quan trọng các đặc trưng và ma trận nhầm lẫn giúp minh họa rõ ràng hiệu quả của từng mô hình, hỗ trợ các nhà quản lý trong việc lựa chọn giải pháp phù hợp.

Đề xuất và khuyến nghị

Triển khai mô hình XGBoost trong hệ thống quản lý khách hàng của VNPT: Tập trung vào việc tích hợp mô hình này để dự đoán sớm khách hàng có nguy cơ rời mạng, nhằm nâng cao tỷ lệ giữ chân khách hàng trong vòng 12 tháng tới.
Tăng cường thu thập và làm sạch dữ liệu: Đề xuất VNPT cải thiện quy trình thu thập dữ liệu, đặc biệt là các thuộc tính liên quan đến hành vi sử dụng và điểm tín nhiệm, nhằm nâng cao chất lượng dữ liệu đầu vào cho mô hình.
Đào tạo nhân viên và nâng cao năng lực phân tích dữ liệu: Tổ chức các khóa đào tạo về AI và máy học cho đội ngũ phân tích dữ liệu và chăm sóc khách hàng, giúp họ hiểu và vận dụng hiệu quả các mô hình dự đoán.
Phát triển hệ thống cảnh báo tự động: Xây dựng hệ thống cảnh báo dựa trên kết quả dự đoán để kịp thời triển khai các chương trình khuyến mãi, chăm sóc khách hàng nhằm giảm tỷ lệ rời mạng trong vòng 3-6 tháng.

Đối tượng nên tham khảo luận văn

Các nhà quản lý và chiến lược kinh doanh của VNPT: Giúp họ hiểu rõ hơn về hành vi khách hàng và áp dụng các mô hình dự đoán để tối ưu hóa chiến lược giữ chân khách hàng.
Chuyên viên phân tích dữ liệu và khoa học dữ liệu: Cung cấp kiến thức chuyên sâu về ứng dụng các thuật toán máy học và học sâu trong lĩnh vực viễn thông, từ đó phát triển các mô hình dự đoán hiệu quả.
Các nhà nghiên cứu và sinh viên ngành công nghệ thông tin, trí tuệ nhân tạo: Là tài liệu tham khảo quý giá về quy trình xây dựng, đánh giá và so sánh các mô hình AI trong bài toán dự đoán khách hàng rời mạng.
Các doanh nghiệp viễn thông và ISP khác: Có thể áp dụng các phương pháp và kết quả nghiên cứu để cải thiện dịch vụ, nâng cao trải nghiệm khách hàng và giảm tỷ lệ rời mạng.

Câu hỏi thường gặp

Tại sao cần dự đoán thuê bao rời mạng trong ngành viễn thông?
Dự đoán giúp các nhà mạng phát hiện sớm khách hàng có nguy cơ rời bỏ, từ đó triển khai các biện pháp giữ chân, giảm thiểu mất mát doanh thu và duy trì thị phần cạnh tranh.
Mô hình nào cho kết quả dự đoán tốt nhất trong nghiên cứu này?
Mô hình XGBoost cho kết quả tốt nhất với độ chính xác khoảng 92%, nhờ khả năng xử lý dữ liệu phức tạp và kỹ thuật tăng cường hiệu quả.
Dữ liệu nào quan trọng nhất trong việc dự đoán thuê bao rời mạng?
Các thuộc tính như số tháng sử dụng dịch vụ, số lần tạm dừng, điểm tín nhiệm và số lần gia hạn dịch vụ có ảnh hưởng lớn nhất đến dự đoán.
Phương pháp tiền xử lý dữ liệu được áp dụng như thế nào?
Bao gồm làm sạch dữ liệu, loại bỏ ngoại lệ, xử lý dữ liệu thiếu và chuẩn hóa, giúp nâng cao chất lượng dữ liệu đầu vào và hiệu quả mô hình.
Làm thế nào để triển khai mô hình dự đoán vào thực tế?
Cần tích hợp mô hình vào hệ thống quản lý khách hàng, xây dựng hệ thống cảnh báo tự động và đào tạo nhân viên để sử dụng kết quả dự đoán hiệu quả trong chăm sóc khách hàng.

Kết luận

Luận văn đã xây dựng và so sánh hiệu quả nhiều mô hình máy học và học sâu trong dự đoán thuê bao rời mạng dịch vụ internet VNPT TP. Hồ Chí Minh.
Mô hình XGBoost và Gradient Boosting thể hiện hiệu suất vượt trội với độ chính xác trên 90%, phù hợp để ứng dụng thực tiễn.
Các đặc trưng như thời gian sử dụng, điểm tín nhiệm và số lần tạm dừng dịch vụ đóng vai trò quan trọng trong dự đoán hành vi khách hàng.
Nghiên cứu cung cấp cơ sở khoa học và công cụ hỗ trợ VNPT tối ưu hóa chiến lược giữ chân khách hàng, nâng cao hiệu quả kinh doanh.
Các bước tiếp theo bao gồm triển khai mô hình vào hệ thống thực tế, đào tạo nhân viên và phát triển hệ thống cảnh báo tự động nhằm giảm tỷ lệ rời mạng trong tương lai gần.

Hãy áp dụng các kết quả nghiên cứu này để nâng cao năng lực cạnh tranh và phát triển bền vững trong ngành viễn thông hiện nay.

Trích đoạn nội dung tài liệu

Chương 1: Giới thiệu tổng quan và định hướng nghiên cứu. + Chương 2: Cơ sở lý thuyết. + Chương 3: Tổng quan bai toán dự đoán thuê bao rời mạng. + Chương 4: Chỉ tiết kết quả thực nghiệm.

+ Chương 5: Kết luận và hướng phát triển. Cơ sở lý thuyết CHƯƠNG 2. Các bước quá trình chăm sóc khách hàng của VNPT Trong mô hình vòng đời của sản phâm, người dùng sẽ trải qua các bước như sau: Tìm hiểu Lua chọn Lắp đặt dịch thông tin dịch vụ vụ Thanh lý Tái ký hợp Bảo trì, sữa hợp đồng đồng, gia hạn chữa Hình 2.1: Các bước trong vòng đời sản phẩm internet Các bước như trên được mô tả chỉ tiết: 2. Tìm hiểu thông tin: Người dùng khi có nhu cầu về sử dung internet, người ta sẽ tìm thông tin về sản phẩm, có thé qua môi trường mạng online (các web, Facebook, Tiktok, .) hoặc qua các kênh trực tiếp như cửa hàng của ISP, người quen đang dùng, đại lý kinh doanh Internet 2.

Lựa chọn dịch vụ Sau khi tìm hiểu, xác định được ISP tin dùng, người dùng sẽ tiếp xúc ISP dé chọn sản phẩm phù hợp nhu cầu (tốc độ truy cập, giá cước phải trả) và ký kết hợp đồng sử dụng dịch vụ. Việc tiếp xúc có thé diễn ra tại cửa hàng, tại nhà khách hàng qua hình thức giấy hoặc điện tử. Ký kết hợp đồng Là bước ký vào bản hợp đồng giữa ISP và người dùng về các nội dung hai bên sẽ hợp tác trong quá trình sử dụng dịch vụ, trách nhiệm của mỗi bên trong quá trình hợp tác. Lắp đặt dịch vụ Là bước tiếp theo sau ký hợp đồng, cán bộ kỹ thuật của VNPT sẽ trực tiếp đến nhà, thực hiện cài đặt, đo kiểm các thủ tục kỹ thuật đảm bảo khách hàng hài lòng về chất lượng internet theo nội dung của hợp đồng ký kết nêu ở bước trên.

Bảo trì, sửa chữa Trong quá trình sử dụng, chắc chắn sẽ xảy ra các tác động chủ quan hoặc khách quan dẫn đến việc gián đoạn dịch vụ hoặc định kỳ có các đợt CSKH của ISP. Đây là bước nhân viên kỹ thuật kiểm tra lại chất lượng dịch vụ, khôi phục lại kết nối nếu như bị gián đoạn hoặc tiến hành thay thế các thiết bị đầu cuối theo chính sách nâng cấp. Tái ký hợp đồng, gia hạn Bản hợp đồng ký tại bước 3 ở trên sẽ xác định một thời hạn nhất định, sau khi hết hợp đồng, hai bên gồm nhà mạng và khách hàng sẽ tái ký để xác định việc tiếp tục sử dụng dịch vụ và lặp lại từ bước ký hợp đồng như nêu trên. Thanh lý hợp đồng Trong quá trình sử dụng, có thể vì một lý do người dùng không còn nhu cầu về việc sử dụng (di dời nơi ở, không hai lòng dịch vụ, giá cước, thái độ nhân viên kỹ thuật, bị ISP khác lôi kéo, .) sẽ tiến hành thanh lý dịch vụ (rời bỏ).

Thời điểm này nhà mạng và người dùng sẽ tiến hành việc chấm dứt sử dụng dịch vụ, trong đó nhà mang sẽ thu hồi thiết bị đã lắp, khách hàng có trách nhiệm hoàn trả thiết bị và các khoản phí (nếu có) theo hợp đồng. Bước thanh lý có thể phát sinh ở bất kỳ thời điểm nào trong vòng đời sản phẩm, nhưng thường xảy ra nhất ở bước tái ký hợp đồng, gia hạn. Tống quan về AI và ứng dụng 2. Khái niệm về AI AI là một lĩnh vực trong khoa học máy tính và công nghệ thông tin phát triển các hệ thống hoặc máy tính có khả năng tự học, tự hiểu và tự hành động mà không 22 Chương 2.

Cơ sở lý thuyết cần con người. Quá trình phát triển của AI kéo dài qua nhiều thập kỷ, các ý tưởng về máy tính có khả năng "suy luận" và "học" đã xuất hiện từ giữa thế kỷ 20. Trong giai đoạn cuối thế kỷ 20, các ý tưởng và nghiên cứu sâu sắc trong lĩnh vực này đã bắt đầu, các mô hình học máy và học sâu đã được phát triển và thử nghiệm, dẫn đến sự tiến bộ đáng ké trong lĩnh vực AI. Trong thập ký gần đây, sự tiến bộ trong công nghệ máy tính, sự gia tăng về khả năng tính toán và dữ liệu lớn đã tạo ra một làn sóng mới của AI.

AI nhằm dé tạo ra các hệ thống hoặc máy tính có thé thay con người hành động. Thuật ngữ này vẫn áp dụng được cho trường hợp thiết bị máy móc hoặc những dự án có liên kết với việc phát triển những hệ thống sử dụng những kha năng suy luận giống con người. AI có thể giải quyết các van đề khó và thách thức mà con người gặp phải ở các lĩnh vực cuộc sông, từ y học đến sản xuất hàng hóa. Các hệ thống AI có thé được sử dụng dé tăng hiệu quả công việc và tối ưu quy trình trong các ngành công nghiệp ở tất cả các mảng công việc sản xuất cũng như dịch vụ khách hàng.

AI cũng được đưa vào đề xây dựng các ứng dụng thông minh như trợ lý ảo, hệ thống xe tự hành, nhận diện hình ảnh, giọng nói, hệ thống hỗ trợ ra quyết định. AI tạo ra cơ hội dé tìm hiểu va phát triển các kỹ thuật tiên tiến mới, từ học sâu đến robot học, giúp tiễn xa hơn trong quá trình phát triển của con người. Nhìn chung, AI tạo ra các hệ thống thông minh và tự động hóa để nâng cao đời sông và mở ra cơ hội mới cho phát triên. Máy học (Machine Learning) là một phần của AI chuyên phát triển các thuật toán và mô hình cho phép máy tính học hỏi và cải thiện hiệu suất từ dữ liệu mà không cần lập trình rõ ràng.

Ý tưởng chính của máy học là cho phép hệ thống tự phát hiện các mẫu và cấu trúc trong dữ liệu để đưa ra các dự đoán hoặc quyết định. Máy học tập trung vào việc học từ dữ liệu thay vì chỉ thực hiện các hành động được lập trình cứng nhắc. Dữ liệu là nguyên liệu cung cấp thông tin và mẫu mực cho máy tính để phát triển các mô hình và thuật toán. Trong máy học, sự quan trọng nằm ở việc tạo ra các dự đoán chính xác và hiệu quả từ dữ liệu, chứ không phải là việc hiểu rõ cơ chế hoạt động của mỗi mô hình hoặc thuật toán.

Máy học thường dựa vào các phản hồi từ đữ liệu hoặc từ môi trường dé điều chỉnh và cải thiện hiệu suất của mô hình. Phản hồi này có thể là nhãn của dữ liệu huấn luyện, 23 Chương 2. Cơ sở lý thuyết hoặc có thể là phản hồi trực tiếp từ môi trường khi áp dụng mô hình. Ngoài ra, Máy học còn có khả năng tự thích nghi và sự linh hoạt trong xử lý các loại thông tin và vấn đề.

Các mô hình và giải thuật được áp dụng vào nhiều lĩnh vực khác nhau mà không cần phải thay đổi quá nhiều. Máy học mang đến nhiều lợi ích trong đa dạng lĩnh vực, hiệu suất và quy trình, trải nghiệm khách hàng và nâng cao hiểu biết về dữ liệu. Học sâu (Deep Learning) tập trung phát triển các mô hình và thuật toán thông qua sử dụng các mạng nơ-ron nhân tạo nhiều lớp, ý tưởng được lấy từ cấu trúc cũng như chức năng của bộ não người. Tên gọi "sâu" trong học sâu hình thành từ việc áp dụng các mạng nơ-ron với nhiều lớp ẩn, trong đó thông tin truyền qua lại giữa các lớp dé xử lý và trích xuất các đặc trưng phức tạp của dữ liệu.

Các lớp an giúp mô hình học và trích xuất các đặc trưng phức tạp từ dữ liệu. Các mô hình học sâu có thể tự điều chỉnh các trọng số và tham số dựa trên dữ liệu huấn luyện. Học sâu khai phá thông tin từ dit liệu, do vậy việc xử lý và trích xuất các đầu ra thường yêu cầu lượng dữ liệu lớn đề huấn luyện thì mới có kết quả cao. Dữ liệu lớn giúp mô hình học được đặc trưng phức tạp và tong quát hóa tốt hơn.

Học sâu có vai trò lớn vào định hình và thúc day AI tiến lên một cách đột phá, mở ra nhiều cơ hội mới và thú vị trong quá trình áp dụng công nghệ vào thế giới thực. Học sâu giúp cải thiện và day mạnh vai trò tự động, cho phép các máy móc có thé chủ động làm những nhiệm vụ như phân tích bộ dữ liệu và chủ động ra các quyết định mà con người không cần sự tác động. Những ứng dụng của học sâu rất đa dạng, từ trợ lý kỹ thuật số trong các phương tiện giao đến việc có thể điều khiển từ xa máy móc của những tòa nhà thông qua giọng nói, phát hiện khả nghi trong các giao dịch qua thẻ tín dụng, và thậm chí là ô tô tự hành. Những công nghệ như thế này cũng có thé được áp dụng nhằm đề xuất nội dung tự động cho những chương trình truyền hình dựa trên thói quen của khán giả và những người bạn của những khán giả đó [2].

Muc tiéu Mục tiêu của AI nói chung và các lĩnh vực cụ thé như máy học va học sâu nói riêng là tạo ra các hệ thống thông minh tự động hóa các nhiệm vụ, học từ 24 Chương 2. Cơ sở lý thuyết dataset và làm nhiệm vụ mà trước đây phải cần đến yếu tố con người mới thực hiện được. AI cũng hướng tới người dùng qua việc nâng cao trải nghiệm từ sản phẩm và dịch vụ cá nhân hóa và ngày càng cải tiến theo thói quen sử dụng. Trong lĩnh vực cụ thé, máy học (Machine Learning) và học sâu (Deep Learning) nhằm đến các mục tiêu trên thông qua việc xây dựng mô hình và giải thuật tự học từ dữ liệu và cải thiện hiệu suất của mình qua thời gian.

Thông qua các hoạt động nêu trên, chúng tạo ra hệ thống thông minh và tự động, từ việc dự đoán và phân loại đến xử lý dé liệu và tạo ra các sản phẩm và dịch vụ tiên tiến. Nhờ đó làm ra các sản phẩm trí tuệ và các tiện ích thông minh hơn, có thé dự báo và những phản hồi nhanh chóng hơn. Quy trình phân tích dữ liệu Quy trình của máy học (Machine Learning) thường bao gồm các bước chính sau [3] [4] [5]: e Thu thập và tiền xử ly dữ liệu. e Xây dựng bộ dữ liệu.

e Huấn luyện, đánh giá và sàng lọc mô hình. e_ Triển khai và giám sát. Thu thập và tiền xử lý dữ liệu Phân chia bộ dữ liệu Huấn luyện, đánh giá và sàng lọc mô hình Triển khai và giám sát Hình 2.

Nội dung được bảo vệ bản quyền — Tải xuống đầy đủ

Bài viết "Ứng dụng AI dự đoán thuê bao rời mạng VNPT: Nghiên cứu và Thực nghiệm" tập trung vào việc sử dụng trí tuệ nhân tạo (AI) để dự đoán khả năng khách hàng rời mạng VNPT (churn prediction). Nghiên cứu này có thể giúp VNPT chủ động đưa ra các biện pháp giữ chân khách hàng, tăng doanh thu và giảm thiểu thiệt hại. Việc ứng dụng AI trong kinh doanh viễn thông, đặc biệt là trong việc dự đoán hành vi khách hàng, đang trở thành một xu hướng quan trọng.

Nếu bạn quan tâm đến việc ứng dụng AI trong kinh doanh và muốn tìm hiểu thêm về các giải thuật có thể sử dụng, hãy tham khảo tài liệu "Giải thuật ứng dụng trong kinh doanh cài đặt bằng ngôn ngữ lập trình python nguyễn văn thọ phó hải đăng nguyễn văn kiên" để khám phá cách các giải thuật, đặc biệt là trong ngôn ngữ Python, có thể hỗ trợ việc phân tích dữ liệu và dự đoán trong môi trường kinh doanh. Bên cạnh đó, nếu bạn muốn tìm hiểu về ứng dụng cụ thể của AI trong việc tương tác với khách hàng, hãy xem qua "Luận văn xây dựng chatbot bán hàng dựa trên mô hình sinh", nó sẽ mang đến góc nhìn về cách xây dựng chatbot bán hàng, một ứng dụng thực tế của AI trong việc cải thiện trải nghiệm khách hàng. Cuối cùng, nếu bạn muốn xem một ví dụ cụ thể về việc ứng dụng AI trong xây dựng chatbot cho một doanh nghiệp, hãy tìm hiểu "Tiểu luận bài thu hoạch trí tuệ nhân tạo trong kinh doanh nhóm 14 đề tài xây dựng chatbot trong kinh doanh cửa hàng dominos pizza" để có thêm góc nhìn thực tế.

#dịch vụ Internet VNPT

#AI dự đoán thuê bao rời mạng VNPT

#Churn prediction VNPT

#Ứng dụng AI trong viễn thông

#Mô hình dự đoán rời mạng

#Phân tích churn rate VNPT

Chủ đề

Ứng dụng trí tuệ nhân tạo trong kinh doanh

Dự đoán churn rate trong ngành viễn thông

Phân tích dữ liệu khách hàng VNPT

Tối ưu hóa trải nghiệm khách hàng VNPT