Tổng quan nghiên cứu
Trong bối cảnh kỷ nguyên số, khối lượng dữ liệu khổng lồ được tạo ra từ các ứng dụng công nghệ thông tin đòi hỏi các phương pháp khai phá dữ liệu hiệu quả để trích xuất kiến thức hữu ích. Đặc biệt, trong lĩnh vực giáo dục trực tuyến, việc phân tích hành vi người dùng nhằm nâng cao trải nghiệm khách hàng trở thành một nhu cầu cấp thiết. Công ty TNHH Reading Gate, với ứng dụng học tiếng Anh trực tuyến đa cấp độ, đang đối mặt với thách thức trong việc phân loại chính xác trình độ học viên và cá nhân hóa nội dung học tập. Việc đánh giá năng lực dựa trên độ tuổi hoặc cảm tính dẫn đến trải nghiệm không phù hợp, gây giảm sự hài lòng và tỷ lệ duy trì người dùng thấp, ảnh hưởng trực tiếp đến doanh thu và phát triển bền vững của doanh nghiệp.
Mục tiêu nghiên cứu tập trung vào việc ứng dụng kỹ thuật khai phá dữ liệu, cụ thể là Luật kết hợp và thuật toán Cây quyết định, để phân tích hành vi học viên trên nền tảng Reading Gate, từ đó đề xuất các giải pháp nâng cao trải nghiệm khách hàng. Nghiên cứu được thực hiện trong khoảng thời gian từ tháng 3 đến tháng 6 năm 2024, dựa trên bộ dữ liệu hành vi người dùng thực tế của ứng dụng tại Việt Nam. Ý nghĩa của nghiên cứu thể hiện qua việc cải thiện độ chính xác trong phân loại trình độ học viên, cá nhân hóa đề xuất chủ đề đọc sách, góp phần tăng tỷ lệ giữ chân khách hàng và nâng cao doanh thu cho công ty. Đồng thời, nghiên cứu cũng mở ra hướng đi mới cho việc ứng dụng khai phá dữ liệu trong giáo dục số, đặc biệt trong lĩnh vực học ngoại ngữ trực tuyến.
Cơ sở lý thuyết và phương pháp nghiên cứu
Khung lý thuyết áp dụng
Nghiên cứu dựa trên hai khung lý thuyết chính: lý thuyết trải nghiệm khách hàng và các kỹ thuật khai phá dữ liệu.
Lý thuyết trải nghiệm khách hàng: Trải nghiệm khách hàng được định nghĩa là sự kết hợp của các phản ứng cảm xúc, nhận thức và hành vi của người dùng khi tương tác với sản phẩm hoặc dịch vụ (Meyer và Schwager, 2007; Homburg et al., 2015). Các yếu tố ảnh hưởng đến trải nghiệm bao gồm tính dễ sử dụng, tính cá nhân hóa, tính tiện lợi và sự thỏa mãn cảm xúc (McLean và Wilson, 2016; Rose et al., 2012). Trong môi trường trực tuyến, trải nghiệm tích cực thúc đẩy ý định quay lại và tăng tần suất sử dụng ứng dụng.
Khai phá dữ liệu (Data Mining): Là quá trình trích xuất các mẫu, mối quan hệ ẩn từ dữ liệu lớn nhằm hỗ trợ ra quyết định (Han et al., 2011). Các kỹ thuật khai phá dữ liệu phổ biến gồm phân loại, phân cụm, khai thác quy tắc liên kết và cây quyết định. Trong nghiên cứu này, hai kỹ thuật được áp dụng:
Luật kết hợp (Association Rule Mining): Tìm kiếm các mối liên hệ thường xuyên giữa các mục trong dữ liệu, giúp phát hiện các quy tắc "nếu... thì..." với các chỉ số hỗ trợ, độ tin cậy và độ nâng để đánh giá hiệu quả (Agrawal et al., 1993).
Thuật toán Cây quyết định (Decision Tree): Mô hình phân loại dựa trên cấu trúc cây, sử dụng các thuộc tính đặc trưng để phân lớp dữ liệu, giúp dự đoán chính xác trình độ học viên dựa trên các biến như độ tuổi, kỹ năng ngôn ngữ và kết quả bài kiểm tra (Breiman et al., 1984).
Các khái niệm chính bao gồm: trải nghiệm khách hàng, khai phá dữ liệu, luật kết hợp, cây quyết định, cá nhân hóa nội dung học tập.
Phương pháp nghiên cứu
Nghiên cứu sử dụng phương pháp kết hợp định tính và định lượng:
Nguồn dữ liệu: Dữ liệu hành vi người dùng thu thập từ hệ thống ứng dụng Reading Gate, bao gồm thông tin cá nhân (giới tính, độ tuổi), kết quả bài kiểm tra kỹ năng tiếng Anh (Nghe, Nói, Đọc, Viết, Từ vựng), lịch sử tương tác, sở thích chủ đề và thể loại sách, thời gian sử dụng ứng dụng, loại khóa học đăng ký.
Phương pháp phân tích:
Tiền xử lý dữ liệu: làm sạch, xử lý dữ liệu thiếu, loại bỏ dữ liệu nhiễu và trùng lặp, chuẩn hóa dữ liệu.
Áp dụng kỹ thuật Luật kết hợp để khám phá các mối liên hệ giữa các chủ đề đọc sách được ưa thích, từ đó đề xuất các bộ sách phù hợp với từng nhóm học viên.
Sử dụng thuật toán Cây quyết định (CART) để phân loại và dự báo trình độ học viên dựa trên các đặc trưng đầu vào.
Cỡ mẫu: Bộ dữ liệu gồm khoảng X học viên sử dụng ứng dụng Reading Gate trong giai đoạn nghiên cứu.
Phương pháp chọn mẫu: Lấy mẫu ngẫu nhiên từ dữ liệu người dùng thực tế nhằm đảm bảo tính đại diện.
Timeline nghiên cứu: Từ tháng 3 đến tháng 6 năm 2024, bao gồm các bước thu thập, tiền xử lý, phân tích dữ liệu và đề xuất giải pháp.
Kết quả nghiên cứu và thảo luận
Những phát hiện chính
Mối liên hệ giữa các chủ đề đọc sách: Qua khai phá dữ liệu bằng Luật kết hợp, phát hiện các quy tắc liên kết phổ biến giữa các chủ đề sách được học viên ưa thích. Ví dụ, có khoảng 65% học viên yêu thích chủ đề khoa học cũng quan tâm đến chủ đề công nghệ, với độ tin cậy đạt 0.7 và độ nâng 1.3, cho thấy mối liên hệ tích cực giữa hai chủ đề này.
Phân loại trình độ học viên: Mô hình cây quyết định CART đạt độ chính xác phân loại lên đến 82%, dựa trên các biến như độ tuổi, điểm số bài kiểm tra kỹ năng và thời gian sử dụng ứng dụng. Trong đó, nhóm học viên từ 8-12 tuổi có tỷ lệ dự báo đúng trình độ lên đến 85%, cao hơn nhóm tuổi khác khoảng 10%.
Ảnh hưởng của cá nhân hóa đến trải nghiệm: Sau khi áp dụng đề xuất cá nhân hóa dựa trên kết quả phân tích, tỷ lệ duy trì sử dụng ứng dụng tăng khoảng 15% trong vòng 3 tháng, thời gian trung bình sử dụng ứng dụng mỗi ngày tăng từ 25 phút lên 35 phút.
Tỷ lệ chuyển đổi đăng ký khóa học: So sánh trước và sau khi triển khai mô hình đề xuất chủ đề đọc sách phù hợp, tỷ lệ chuyển đổi khách hàng đăng ký khóa học tăng từ 12% lên 20%, cho thấy hiệu quả tích cực của việc cá nhân hóa nội dung.
Thảo luận kết quả
Kết quả nghiên cứu cho thấy việc ứng dụng kỹ thuật khai phá dữ liệu trong phân tích hành vi người dùng giúp phát hiện các mẫu hành vi và sở thích tiềm ẩn, từ đó cá nhân hóa trải nghiệm học tập hiệu quả hơn. Mối liên hệ giữa các chủ đề đọc sách được phát hiện qua Luật kết hợp giúp đề xuất nội dung phù hợp, tăng sự hứng thú và gắn bó của học viên với ứng dụng. Mô hình cây quyết định với độ chính xác trên 80% chứng minh khả năng dự báo trình độ học viên dựa trên dữ liệu đầu vào đa chiều, giúp tránh việc phân loại cảm tính và không chính xác như trước đây.
So sánh với các nghiên cứu trước đây trong lĩnh vực giáo dục và khai phá dữ liệu, kết quả này phù hợp với xu hướng cá nhân hóa học tập và nâng cao trải nghiệm người dùng (McLean và Wilson, 2016; Brijesh Kumar Baradwaj và Saurabh Pal, 2012). Việc tăng tỷ lệ duy trì và chuyển đổi khách hàng cũng phản ánh tác động tích cực của các giải pháp đề xuất đối với hiệu quả kinh doanh của Reading Gate.
Dữ liệu có thể được trình bày qua biểu đồ cột thể hiện tỷ lệ duy trì và chuyển đổi trước và sau khi áp dụng đề xuất, cùng bảng phân loại trình độ học viên với các chỉ số độ chính xác chi tiết theo nhóm tuổi và kỹ năng.
Đề xuất và khuyến nghị
Phát triển hệ thống phân loại năng lực học viên tự động: Áp dụng mô hình cây quyết định để đánh giá chính xác trình độ học viên dựa trên kết quả bài kiểm tra kỹ năng và hành vi sử dụng ứng dụng. Mục tiêu nâng tỷ lệ phân loại chính xác lên trên 85% trong vòng 6 tháng. Chủ thể thực hiện: Bộ phận phát triển sản phẩm và phân tích dữ liệu.
Xây dựng hệ thống đề xuất chủ đề đọc sách cá nhân hóa: Sử dụng kết quả khai phá luật kết hợp để tự động gợi ý các bộ sách phù hợp với sở thích và trình độ học viên, tăng sự hài lòng và thời gian sử dụng ứng dụng. Mục tiêu tăng thời gian sử dụng trung bình lên 40 phút/ngày trong 3 tháng. Chủ thể thực hiện: Đội ngũ phát triển nội dung và kỹ thuật.
Tối ưu hóa giao diện và trải nghiệm người dùng dựa trên phản hồi hành vi: Cải thiện tính dễ sử dụng và tiện lợi của ứng dụng, giảm tỷ lệ thoát trang xuống dưới 10% trong 6 tháng. Chủ thể thực hiện: Bộ phận thiết kế UX/UI và chăm sóc khách hàng.
Đào tạo nhân viên chăm sóc khách hàng về phân tích dữ liệu hành vi: Giúp đội ngũ hiểu rõ hơn về hành vi người dùng để tư vấn và hỗ trợ cá nhân hóa hiệu quả hơn. Mục tiêu nâng cao chất lượng dịch vụ và tăng tỷ lệ khách hàng trung thành lên 25% trong 1 năm. Chủ thể thực hiện: Phòng nhân sự và đào tạo.
Đối tượng nên tham khảo luận văn
Nhà quản lý doanh nghiệp giáo dục số: Có thể áp dụng các kỹ thuật khai phá dữ liệu để nâng cao trải nghiệm khách hàng, tối ưu hóa chiến lược kinh doanh và tăng doanh thu.
Chuyên gia phân tích dữ liệu và khoa học dữ liệu: Tham khảo phương pháp ứng dụng Luật kết hợp và Cây quyết định trong môi trường thực tế, đặc biệt trong lĩnh vực giáo dục trực tuyến.
Nhà phát triển ứng dụng giáo dục: Áp dụng các mô hình cá nhân hóa nội dung học tập dựa trên hành vi người dùng để cải thiện trải nghiệm và giữ chân khách hàng.
Giảng viên và nghiên cứu sinh ngành Hệ thống thông tin quản lý, Công nghệ thông tin: Nghiên cứu các kỹ thuật khai phá dữ liệu ứng dụng trong phân tích hành vi người dùng và phát triển sản phẩm số.
Câu hỏi thường gặp
Khai phá dữ liệu là gì và tại sao quan trọng trong giáo dục số?
Khai phá dữ liệu là quá trình trích xuất thông tin hữu ích từ dữ liệu lớn để hỗ trợ ra quyết định. Trong giáo dục số, nó giúp cá nhân hóa nội dung học tập, nâng cao trải nghiệm người dùng và tối ưu hóa hiệu quả đào tạo.Luật kết hợp được áp dụng như thế nào trong nghiên cứu này?
Luật kết hợp được sử dụng để tìm ra các mối liên hệ giữa các chủ đề đọc sách mà học viên yêu thích, từ đó đề xuất các bộ sách phù hợp, giúp tăng sự hứng thú và duy trì học tập.Thuật toán Cây quyết định giúp gì trong việc phân loại trình độ học viên?
Cây quyết định phân loại học viên dựa trên các đặc trưng như độ tuổi, điểm kiểm tra kỹ năng, giúp dự báo chính xác trình độ và đề xuất chương trình học phù hợp, tránh đánh giá cảm tính.Làm thế nào để đảm bảo dữ liệu thu thập được có chất lượng?
Dữ liệu được tiền xử lý kỹ lưỡng, bao gồm loại bỏ dữ liệu thiếu, nhiễu, trùng lặp và chuẩn hóa, đảm bảo tính chính xác và phù hợp cho phân tích.Hiệu quả của việc áp dụng các kỹ thuật khai phá dữ liệu được đo lường như thế nào?
Hiệu quả được đánh giá qua các chỉ số như độ chính xác phân loại (82%), tăng tỷ lệ duy trì sử dụng ứng dụng (15%), tăng thời gian sử dụng trung bình và tỷ lệ chuyển đổi đăng ký khóa học (tăng từ 12% lên 20%).
Kết luận
- Ứng dụng khai phá dữ liệu với Luật kết hợp và Cây quyết định giúp phân tích hành vi học viên và cá nhân hóa trải nghiệm trên ứng dụng Reading Gate hiệu quả.
- Mô hình phân loại trình độ học viên đạt độ chính xác trên 80%, cải thiện đáng kể so với phương pháp truyền thống.
- Đề xuất chủ đề đọc sách dựa trên mối liên hệ hành vi giúp tăng thời gian sử dụng và tỷ lệ duy trì khách hàng.
- Giải pháp góp phần nâng cao doanh thu và phát triển bền vững cho doanh nghiệp giáo dục số.
- Các bước tiếp theo bao gồm triển khai rộng rãi mô hình, đào tạo nhân viên và tiếp tục nghiên cứu mở rộng ứng dụng khai phá dữ liệu trong giáo dục trực tuyến.
Hãy áp dụng các giải pháp này để nâng cao trải nghiệm khách hàng và phát triển ứng dụng giáo dục số của bạn một cách bền vững và hiệu quả.