I. Giới thiệu tổng quan
Nghiên cứu ứng dụng khai phá dữ liệu vào quản lý giáo dục đào tạo ngày càng trở nên cần thiết cho các nhà quản lý giáo dục. Việc áp dụng các kỹ thuật khai phá dữ liệu giúp nâng cao chất lượng quản lý và hoạch định chiến lược giáo dục. Gần đây, nhiều công trình nghiên cứu đã chỉ ra lợi ích của việc ứng dụng khoa học máy tính trong lĩnh vực này. Đặc biệt, mô hình mô hình chủ đề hƣớng thời gian đã được phát triển để đáp ứng nhu cầu phân tích dữ liệu thay đổi theo thời gian. Nghiên cứu của Lê Thanh Minh sử dụng khai phá luật kết hợp để đánh giá hiệu quả đào tạo, trong khi Phan Đình Thế Huân áp dụng khai phá dữ liệu để dự đoán kết quả học tập của sinh viên. Những nghiên cứu này cho thấy tầm quan trọng của việc áp dụng các mô hình phân tích dữ liệu trong giáo dục.
II. Nền tảng lý thuyết
Mô hình chủ đề ẩn (LDA) là một trong những mô hình quan trọng trong phân tích dữ liệu. Nó cho phép xác định xác suất phân phối các chủ đề ẩn trong tài liệu. Mô hình này được xây dựng dựa trên ý tưởng rằng mỗi tài liệu có thể được coi là sự pha trộn của nhiều chủ đề. Phương pháp phân tích này giúp cải thiện khả năng phân tích dữ liệu và cung cấp thông tin chi tiết về các chủ đề trong tài liệu. Mô hình chủ đề hƣớng thời gian (DTM) mở rộng LDA để xác định sự tiến triển của các chủ đề theo thời gian. Điều này giúp các nhà nghiên cứu hiểu rõ hơn về cách mà các chủ đề thay đổi theo từng học kỳ, từ đó đưa ra các quyết định chính xác hơn trong việc quản lý giáo dục.
III. Phương pháp phân tích cụm
Phân tích cụm là một bước quan trọng trong khai phá dữ liệu. Đề tài này áp dụng mô hình DTM để phân tích dữ liệu học tập của sinh viên. Quá trình này bao gồm việc phân tích các cụm sinh viên và các môn học, từ đó xác định các yếu tố ảnh hưởng đến kết quả học tập. Việc phân tích cụm theo sinh viên giúp phát hiện nhanh chóng những sinh viên có kết quả học tập không tốt và những môn học cần cải thiện. Kết quả từ mô hình DTM cho thấy khả năng phân tích tốt hơn so với các mô hình khác như LDA và K-Means, minh chứng cho giá trị thực tiễn của mô hình này trong việc hỗ trợ quản lý giáo dục.
IV. Kết quả thực nghiệm và đánh giá
Kết quả thực nghiệm cho thấy mô hình DTM đạt được độ chính xác cao trong việc phân tích dữ liệu học tập. Giá trị độ đo perplexity của mô hình này thường tốt hơn khi đánh giá trên dữ liệu của 6 học kỳ. Điều này chứng tỏ rằng mô hình DTM không chỉ có khả năng khai phá dữ liệu mà còn có thể cung cấp thông tin hữu ích cho các nhà quản lý giáo dục. Sự khác biệt trong kết quả giữa các mô hình cho thấy rằng việc lựa chọn mô hình phù hợp là rất quan trọng trong phân tích dữ liệu giáo dục. Những kết quả này có thể giúp cải thiện chất lượng đào tạo và hỗ trợ kịp thời cho sinh viên gặp khó khăn trong học tập.
V. Hướng phát triển
Đề tài mở ra hướng phát triển mới trong việc áp dụng các mô hình khoa học máy tính vào khai phá dữ liệu giáo dục. Việc sử dụng mô hình DTM có thể được mở rộng sang các lĩnh vực khác như phân tích hành vi người dùng trong hệ thống học trực tuyến. Sự phát triển của công nghệ thông tin và hệ thống thông tin sẽ tạo điều kiện thuận lợi cho việc thu thập và phân tích dữ liệu lớn. Từ đó, các nhà nghiên cứu có thể phát triển các mô hình mạnh mẽ hơn để hỗ trợ quản lý giáo dục. Việc nghiên cứu sâu hơn về các yếu tố ảnh hưởng đến kết quả học tập cũng sẽ giúp nâng cao chất lượng đào tạo trong tương lai.