Tổng quan nghiên cứu

Trong bối cảnh thị trường ngân hàng ngày càng cạnh tranh gay gắt, việc giữ chân khách hàng trở thành một thách thức lớn đối với các tổ chức tài chính. Theo ước tính, chi phí thu hút khách hàng mới cao gấp nhiều lần so với chi phí duy trì khách hàng hiện tại, do đó việc dự đoán khả năng rời bỏ của khách hàng (churn) đóng vai trò quan trọng trong chiến lược phát triển bền vững của ngân hàng. Luận văn tập trung nghiên cứu ứng dụng các kỹ thuật khai phá dữ liệu nhằm xây dựng mô hình dự đoán khả năng rời bỏ của khách hàng trong một số lĩnh vực ngân hàng, đặc biệt là trên nền tảng MyVIB của Ngân hàng Quốc tế Việt Nam (VIB) trong năm 2019.

Mục tiêu cụ thể của nghiên cứu là xây dựng mô hình dự đoán khách hàng có khả năng rời bỏ dịch vụ ngân hàng dựa trên dữ liệu giao dịch và hoạt động của khách hàng, từ đó hỗ trợ ngân hàng trong việc phát triển các chiến lược giữ chân khách hàng hiệu quả. Phạm vi nghiên cứu tập trung vào dữ liệu của 78.112 khách hàng sử dụng ứng dụng MyVIB trong năm 2019, với tổng số 85.455 kỳ sử dụng và 17.641 lần rời bỏ được ghi nhận. Ý nghĩa của nghiên cứu được thể hiện qua việc cải thiện tỷ lệ giữ chân khách hàng, giảm thiểu tổn thất doanh thu và nâng cao trải nghiệm khách hàng thông qua các chiến lược cá nhân hóa dựa trên dự báo chính xác.

Cơ sở lý thuyết và phương pháp nghiên cứu

Khung lý thuyết áp dụng

Luận văn dựa trên hai lý thuyết chính trong lĩnh vực khai phá dữ liệu và học máy:

  1. Khai phá dữ liệu (Data Mining): Quá trình khám phá các mẫu, quy luật từ dữ liệu lớn nhằm hỗ trợ ra quyết định. Quy trình khai phá dữ liệu gồm 6 bước: thu thập, trích chọn, tiền xử lý, chuyển đổi, khai phá và đánh giá kết quả. Các kỹ thuật khai phá dữ liệu chính bao gồm phân loại, phân cụm, dự báo và luật kết hợp.

  2. Mô hình học máy dựa trên cây quyết định: Cây quyết định là mô hình phân lớp dựa trên chuỗi các luật dạng "if-then" giúp phân loại khách hàng theo khả năng rời bỏ. Mô hình rừng cây ngẫu nhiên (Random Forest) và phương pháp tăng cường Gradient Boosting được sử dụng để cải thiện độ chính xác và giảm hiện tượng quá khớp (overfitting).

Các khái niệm chuyên ngành quan trọng bao gồm: churn (khách hàng rời bỏ), feature engineering (lựa chọn đặc trưng), AUC (diện tích dưới đường cong ROC), và các thuật toán học máy như Decision Tree, Random Forest, Gradient Boosting.

Phương pháp nghiên cứu

Nguồn dữ liệu chính là bộ dữ liệu giao dịch và hoạt động của khách hàng trên nền tảng MyVIB năm 2019, bao gồm 6 tập con với thông tin về cá nhân, giao dịch Ebank, hoạt động trên ứng dụng, tài khoản tiền gửi, khoản vay và thẻ ngân hàng. Cỡ mẫu nghiên cứu là 78.112 khách hàng với 85.455 kỳ sử dụng.

Phương pháp phân tích bao gồm:

  • Tiền xử lý dữ liệu: Làm sạch, xử lý dữ liệu thiếu, rút gọn và chuyển đổi dữ liệu sang định dạng phù hợp cho mô hình học máy.
  • Phân tích khám phá dữ liệu (EDA): Khảo sát các đặc trưng ảnh hưởng đến churn như giới tính, kênh đăng ký, phương thức xác thực, tuổi khách hàng, số lượng giao dịch và số tiền giao dịch.
  • Xây dựng mô hình dự đoán: Sử dụng các thuật toán cây quyết định, rừng cây ngẫu nhiên và Gradient Boosting trên môi trường lập trình Python với Google Colaboratory.
  • Đánh giá mô hình: Sử dụng các chỉ số như độ chính xác, AUC để so sánh hiệu quả các mô hình.

Timeline nghiên cứu kéo dài trong năm 2022, bắt đầu từ thu thập và xử lý dữ liệu, xây dựng mô hình, đến đánh giá và đề xuất giải pháp.

Kết quả nghiên cứu và thảo luận

Những phát hiện chính

  1. Định nghĩa khách hàng rời bỏ: Khách hàng được xem là rời bỏ nếu không có giao dịch hoặc hoạt động trên MyVIB trong vòng 60 ngày. Tỷ lệ khách hàng rời bỏ trong năm 2019 là 13,18%, với tỷ lệ quay lại là 41,6%, cho thấy ngưỡng 60 ngày là phù hợp để xác định churn.

  2. Ảnh hưởng của đặc trưng cá nhân:

    • Tỷ lệ rời bỏ giữa nam và nữ gần tương đương, nữ nhỉnh hơn một chút (13,35% so với 13,12%).
    • Khách hàng mở tài khoản qua chi nhánh có tỷ lệ rời bỏ cao nhất (13,57%), tiếp theo là kênh MyVIB (12,28%) và thấp nhất là kênh Auto-Job (8,69%).
    • Khách hàng là nhân viên VIB có tỷ lệ rời bỏ thấp hơn 7,42 lần so với khách hàng không phải nhân viên (1,81% so với 13,43%).
    • Phương thức xác thực SMART_OTP có tỷ lệ rời bỏ thấp nhất (10,40%), trong khi HARD_TOKEN và SMS có tỷ lệ rời bỏ cao hơn (32,43% và 28,16%).
  3. Phân tích giao dịch và hoạt động:

    • Khách hàng rời bỏ có xu hướng giao dịch với số tiền trung bình thấp hơn khách hàng hoạt động.
    • Giao dịch nội bộ VIB có tỷ lệ rời bỏ thấp, trong khi các giao dịch bên ngoài VIB có tỷ lệ rời bỏ cao nhất.
    • Thời gian giao dịch chủ yếu tập trung vào giờ hành chính và ngày làm việc trong tuần, phù hợp với thói quen sử dụng dịch vụ ngân hàng.
  4. Hiệu quả mô hình dự đoán:

    • Mô hình rừng cây ngẫu nhiên và Gradient Boosting cho kết quả dự đoán tốt hơn so với cây quyết định đơn lẻ.
    • Độ chính xác mô hình đạt khoảng 85-90% với AUC trên 0,9, cho thấy khả năng phân biệt khách hàng rời bỏ và không rời bỏ rất cao.

Thảo luận kết quả

Nguyên nhân tỷ lệ rời bỏ cao ở nhóm khách hàng mở tài khoản qua chi nhánh có thể do thiếu sự tương tác kỹ thuật số và trải nghiệm cá nhân hóa kém. Tỷ lệ rời bỏ thấp ở nhân viên VIB phản ánh sự trung thành và hiểu biết sâu sắc về dịch vụ ngân hàng. Phương thức xác thực SMART_OTP được đánh giá là tiện lợi và an toàn, góp phần giảm churn.

So sánh với các nghiên cứu trước đây, kết quả phù hợp với xu hướng sử dụng mô hình học máy trong dự đoán churn, đồng thời nhấn mạnh tầm quan trọng của việc lựa chọn đặc trưng phù hợp và xử lý dữ liệu kỹ lưỡng. Việc trình bày dữ liệu qua biểu đồ phân phối tuổi, biểu đồ thanh số lượng giao dịch theo loại và thời gian giúp trực quan hóa các yếu tố ảnh hưởng, hỗ trợ việc ra quyết định chiến lược.

Đề xuất và khuyến nghị

  1. Tăng cường sử dụng phương thức xác thực SMART_OTP: Khuyến khích khách hàng chuyển sang sử dụng phương thức này nhằm giảm tỷ lệ rời bỏ, dự kiến thực hiện trong 6 tháng tới, do phòng công nghệ và chăm sóc khách hàng phối hợp triển khai.

  2. Phát triển các chương trình chăm sóc khách hàng theo nhóm tuổi: Tập trung vào nhóm khách hàng lớn tuổi (trên 40 tuổi) với các chương trình đào tạo, hỗ trợ sử dụng MyVIB, nhằm giảm churn trong vòng 12 tháng, do phòng marketing và phát triển sản phẩm thực hiện.

  3. Khuyến khích giao dịch nội bộ VIB: Tăng cường ưu đãi và tiện ích cho các giao dịch nội bộ để giữ chân khách hàng trung thành, triển khai trong 9 tháng, do phòng kinh doanh và phát triển dịch vụ đảm nhiệm.

  4. Xây dựng hệ thống cảnh báo sớm dựa trên mô hình dự đoán: Áp dụng mô hình dự đoán để phát hiện khách hàng có nguy cơ rời bỏ cao, từ đó chủ động tiếp cận và giữ chân, thực hiện trong 12 tháng, do phòng phân tích dữ liệu và chăm sóc khách hàng phối hợp.

Đối tượng nên tham khảo luận văn

  1. Các nhà quản lý ngân hàng: Giúp hiểu rõ về hành vi khách hàng và áp dụng mô hình dự đoán để tối ưu chiến lược giữ chân khách hàng, nâng cao hiệu quả kinh doanh.

  2. Chuyên gia phân tích dữ liệu và khoa học dữ liệu: Cung cấp phương pháp và kỹ thuật khai phá dữ liệu, học máy ứng dụng thực tiễn trong lĩnh vực tài chính ngân hàng.

  3. Nhà phát triển sản phẩm ngân hàng số: Hỗ trợ thiết kế các tính năng và trải nghiệm người dùng dựa trên phân tích hành vi khách hàng, giảm tỷ lệ churn.

  4. Sinh viên và nghiên cứu sinh ngành công nghệ thông tin, khoa học máy tính: Là tài liệu tham khảo về ứng dụng kỹ thuật khai phá dữ liệu và học máy trong thực tế, đặc biệt trong lĩnh vực ngân hàng.

Câu hỏi thường gặp

  1. Khách hàng rời bỏ được định nghĩa như thế nào trong nghiên cứu này?
    Khách hàng được xem là rời bỏ nếu không có giao dịch hoặc hoạt động trên ứng dụng MyVIB trong vòng 60 ngày liên tiếp, dựa trên phân tích tỷ lệ quay lại và rời bỏ trong năm 2019.

  2. Tại sao lại chọn kỹ thuật cây quyết định và rừng cây ngẫu nhiên để xây dựng mô hình?
    Cây quyết định dễ hiểu, giải thích được các quy tắc phân loại, trong khi rừng cây ngẫu nhiên giúp cải thiện độ chính xác và giảm hiện tượng quá khớp, phù hợp với dữ liệu phức tạp và đa dạng.

  3. Dữ liệu được xử lý như thế nào trước khi xây dựng mô hình?
    Dữ liệu được làm sạch, xử lý giá trị thiếu, rút gọn chiều dữ liệu, chuyển đổi định dạng và lựa chọn đặc trưng quan trọng nhằm đảm bảo chất lượng và hiệu quả của mô hình.

  4. Mô hình dự đoán có thể áp dụng cho các ngân hàng khác không?
    Mô hình có thể được điều chỉnh và áp dụng cho các ngân hàng khác nếu có dữ liệu tương tự về giao dịch và hoạt động khách hàng, tuy nhiên cần hiệu chỉnh đặc trưng và tham số phù hợp với từng tổ chức.

  5. Làm thế nào để ngân hàng sử dụng kết quả mô hình để giảm tỷ lệ rời bỏ?
    Ngân hàng có thể sử dụng mô hình để phát hiện sớm khách hàng có nguy cơ rời bỏ, từ đó triển khai các chương trình chăm sóc, ưu đãi cá nhân hóa và cải thiện trải nghiệm dịch vụ nhằm giữ chân khách hàng.

Kết luận

  • Đã xây dựng thành công mô hình dự đoán khả năng rời bỏ của khách hàng trên nền tảng MyVIB với độ chính xác cao và AUC trên 0,9.
  • Xác định các đặc trưng quan trọng ảnh hưởng đến churn như phương thức xác thực, kênh đăng ký, tuổi khách hàng và hành vi giao dịch.
  • Đề xuất các giải pháp cụ thể nhằm giảm tỷ lệ rời bỏ, tập trung vào cải thiện trải nghiệm khách hàng và tăng cường tương tác kỹ thuật số.
  • Mô hình và phương pháp nghiên cứu có thể mở rộng ứng dụng cho các ngân hàng khác trong việc quản lý khách hàng và phát triển dịch vụ.
  • Các bước tiếp theo bao gồm triển khai hệ thống cảnh báo sớm dựa trên mô hình, đánh giá hiệu quả thực tế và điều chỉnh chiến lược giữ chân khách hàng.

Khuyến khích các tổ chức tài chính và nhà nghiên cứu tiếp cận và ứng dụng các kỹ thuật khai phá dữ liệu hiện đại để nâng cao năng lực cạnh tranh và phát triển bền vững.