Tổng quan nghiên cứu

Trong bối cảnh công nghệ thông tin ngày càng phát triển và được ứng dụng rộng rãi trong nhiều lĩnh vực, công tác quản lý tuyển sinh tại các cơ sở giáo dục đại học cũng không nằm ngoài xu hướng này. Tại Học viện Công nghệ Bưu chính Viễn thông, mỗi năm có hàng ngàn thí sinh tham gia xét tuyển, tuy nhiên công tác quản lý tuyển sinh hiện vẫn dựa chủ yếu trên các file Excel, gây khó khăn trong việc tổng hợp, thống kê và dự báo số liệu tuyển sinh. Việc xây dựng một hệ thống quản lý và dự báo tuyển sinh nhằm giảm thiểu sai sót, nâng cao hiệu quả quản lý và hỗ trợ công tác tư vấn tuyển sinh là rất cần thiết.

Mục tiêu nghiên cứu của luận văn là phát triển một hệ thống tích hợp chức năng quản lý hồ sơ thí sinh và dự báo số lượng tuyển sinh theo từng ngành, vùng miền và đối tượng ưu tiên, dựa trên dữ liệu tuyển sinh từ năm 2016 đến 2021 tại Học viện. Hệ thống này không chỉ giúp cán bộ quản lý dễ dàng truy xuất, cập nhật thông tin mà còn cung cấp các dự báo chính xác để phục vụ công tác chuẩn bị cơ sở vật chất và nhân lực cho các kỳ tuyển sinh tiếp theo. Nghiên cứu tập trung vào việc áp dụng thuật toán dự báo chuỗi thời gian Facebook Prophet, một mô hình dự báo phi tuyến tính có khả năng xử lý tốt các xu hướng và tính thời vụ trong dữ liệu.

Phạm vi nghiên cứu bao gồm quy trình tuyển sinh đại học tại Học viện Công nghệ Bưu chính Viễn thông, dữ liệu tuyển sinh trong giai đoạn 2016-2021, và việc xây dựng hệ thống phần mềm quản lý và dự báo. Ý nghĩa của nghiên cứu được thể hiện qua việc nâng cao độ chính xác trong quản lý và dự báo tuyển sinh, góp phần tối ưu hóa nguồn lực và chiến lược phát triển đào tạo của Học viện.

Cơ sở lý thuyết và phương pháp nghiên cứu

Khung lý thuyết áp dụng

Luận văn dựa trên hai lý thuyết và mô hình chính:

  1. Lý thuyết dự báo chuỗi thời gian (Time Series Forecasting): Đây là phương pháp dự báo dựa trên dữ liệu lịch sử, giả định rằng các quy luật trong quá khứ sẽ lặp lại trong tương lai. Chuỗi thời gian được phân tích thành các thành phần xu hướng, tính mùa vụ và nhiễu ngẫu nhiên.

  2. Mô hình phân rã chuỗi thời gian theo mô hình cộng (Additive Model): Chuỗi thời gian được phân tách thành các thành phần xu hướng (g(t)), tính mùa vụ (s(t)), ảnh hưởng ngày lễ (h(t)) và sai số ngẫu nhiên (εt), theo phương trình: [ y(t) = g(t) + s(t) + h(t) + \varepsilon_t ] Thuật toán Facebook Prophet được áp dụng dựa trên mô hình này, với ưu điểm xử lý tốt các xu hướng phi tuyến tính và tính thời vụ, đồng thời dễ dàng điều chỉnh và mở rộng.

Các khái niệm chuyên ngành quan trọng bao gồm:

  • Dự báo chuỗi thời gian (Time Series Forecasting)
  • Thuật toán Prophet
  • Mô hình Logistic Growth và Linear Growth
  • Phân rã chuỗi thời gian (Decomposition)
  • Sai số tuyệt đối trung bình (MAE), Tỉ lệ phần trăm sai số tuyệt đối (MAPE)

Phương pháp nghiên cứu

Luận văn sử dụng phương pháp nghiên cứu kết hợp giữa lý thuyết và thực nghiệm ứng dụng:

  • Nguồn dữ liệu: Thu thập dữ liệu tuyển sinh của Học viện Công nghệ Bưu chính Viễn thông từ năm 2016 đến 2021, bao gồm thông tin thí sinh đăng ký, trúng tuyển và nhập học. Dữ liệu được chuẩn hóa và tiền xử lý để đồng nhất định dạng, phục vụ cho việc nhập liệu và phân tích.

  • Phương pháp phân tích: Áp dụng thuật toán Facebook Prophet để dự báo số lượng hồ sơ trúng tuyển và sinh viên nhập học theo từng ngành, vùng miền và đối tượng ưu tiên. Các mô hình Logistic Growth và Linear Growth được thử nghiệm để lựa chọn mô hình phù hợp nhất dựa trên các chỉ số đánh giá như MAE, MAPE và RMSE.

  • Timeline nghiên cứu:

    • Thu thập và tiền xử lý dữ liệu: 3 tháng
    • Nghiên cứu và áp dụng thuật toán Prophet: 2 tháng
    • Thiết kế và phát triển hệ thống quản lý: 3 tháng
    • Thử nghiệm và đánh giá kết quả: 2 tháng

Phương pháp chọn mẫu là sử dụng toàn bộ dữ liệu tuyển sinh có sẵn trong giai đoạn nghiên cứu nhằm đảm bảo tính đại diện và độ tin cậy của kết quả dự báo.

Kết quả nghiên cứu và thảo luận

Những phát hiện chính

  1. Dữ liệu tuyển sinh có biến động theo năm: Tổng số sinh viên trúng tuyển qua các năm có sự biến đổi lớn, đặc biệt năm 2020 giảm mạnh do thay đổi chính sách tuyển sinh của Bộ Giáo dục và Đào tạo. Ví dụ, tổng số sinh viên trúng tuyển năm 2019 là khoảng 1.000, giảm xuống còn khoảng 700 năm 2020.

  2. Ngành Công nghệ Đa phương tiện có xu hướng ổn định: Số lượng sinh viên trúng tuyển ngành này duy trì ổn định, dao động quanh mức 100-190 sinh viên mỗi năm, không chịu ảnh hưởng lớn bởi biến động chung của toàn trường.

  3. Mô hình Prophet với Linear Growth phù hợp nhất: Do dữ liệu không có tính chu kỳ rõ ràng và không bị ảnh hưởng bởi ngày lễ, mô hình Linear Growth của Prophet cho kết quả dự báo chính xác hơn Logistic Growth. Sai số MAE và MAPE trên tập kiểm tra lần lượt đạt khoảng 5% và 7%, cho thấy độ tin cậy cao.

  4. Hệ thống quản lý và dự báo giúp giảm thiểu sai sót: Việc tích hợp chức năng nhập liệu, tìm kiếm, cập nhật và dự báo trong một hệ thống web đã giúp cán bộ quản lý tiết kiệm thời gian, giảm thiểu sai sót do thao tác thủ công trên nhiều file Excel.

Thảo luận kết quả

Nguyên nhân biến động dữ liệu tuyển sinh chủ yếu do thay đổi chính sách tuyển sinh và hình thức xét tuyển đa dạng (xét tuyển thẳng, xét tuyển dựa vào kết quả thi THPT, xét tuyển kết hợp, xét tuyển dựa vào kỳ thi đánh giá năng lực). So với các nghiên cứu dự báo chuỗi thời gian khác, việc áp dụng thuật toán Prophet cho dữ liệu tuyển sinh là phù hợp do tính linh hoạt và khả năng xử lý dữ liệu thiếu hoặc không đều.

Kết quả dự báo có thể được trình bày qua các biểu đồ đường thể hiện xu hướng số lượng thí sinh trúng tuyển và nhập học theo từng ngành qua các năm, kèm theo các khoảng dự báo trên và dưới (yhat_lower, yhat_upper) để minh họa độ tin cậy. Bảng so sánh sai số dự báo giữa các mô hình cũng giúp minh chứng hiệu quả của mô hình Prophet.

Việc xây dựng hệ thống quản lý dựa trên mô hình ba lớp (giao diện người dùng, xử lý nghiệp vụ, truy cập dữ liệu) cùng các công nghệ Java, ReactJs, MySQL và Streamlit đã tạo ra một nền tảng ổn định, dễ bảo trì và mở rộng trong tương lai.

Đề xuất và khuyến nghị

  1. Triển khai hệ thống quản lý và dự báo tuyển sinh toàn diện: Cán bộ quản lý cần áp dụng hệ thống để nhập liệu, thống kê và dự báo số liệu tuyển sinh theo từng ngành và vùng miền, nhằm nâng cao hiệu quả công tác quản lý. Thời gian thực hiện: trong vòng 6 tháng tới.

  2. Tăng cường đào tạo cán bộ sử dụng hệ thống: Tổ chức các khóa đào tạo kỹ năng sử dụng phần mềm cho cán bộ quản lý tuyển sinh để đảm bảo khai thác tối đa các tính năng của hệ thống. Mục tiêu giảm thiểu sai sót nhập liệu xuống dưới 2%. Thời gian: 3 tháng.

  3. Cập nhật và mở rộng dữ liệu dự báo: Thu thập dữ liệu tuyển sinh hàng năm và cập nhật vào hệ thống để cải thiện độ chính xác dự báo, đồng thời mở rộng dự báo sang các chỉ tiêu khác như tỷ lệ nhập học, tỷ lệ tốt nghiệp. Thời gian: liên tục hàng năm.

  4. Phát triển thêm các mô hình dự báo nâng cao: Nghiên cứu áp dụng các mô hình học máy khác như LSTM, ARIMA kết hợp với Prophet để so sánh và nâng cao độ chính xác dự báo. Chủ thể thực hiện: bộ phận nghiên cứu và phát triển của Học viện. Thời gian: 12 tháng.

Đối tượng nên tham khảo luận văn

  1. Cán bộ quản lý tuyển sinh tại các trường đại học: Hệ thống và phương pháp dự báo giúp họ nâng cao hiệu quả quản lý, giảm thiểu sai sót và có cơ sở dữ liệu chính xác để ra quyết định.

  2. Nhà nghiên cứu và phát triển phần mềm giáo dục: Tham khảo mô hình phát triển hệ thống ba lớp, công nghệ sử dụng và thuật toán dự báo để ứng dụng trong các dự án tương tự.

  3. Chuyên gia phân tích dữ liệu và dự báo: Nghiên cứu cách áp dụng thuật toán Prophet trong lĩnh vực giáo dục, đặc biệt với dữ liệu chuỗi thời gian có tính đặc thù.

  4. Các cơ quan quản lý giáo dục và hoạch định chính sách: Sử dụng kết quả dự báo để xây dựng các chiến lược tuyển sinh, phân bổ nguồn lực đào tạo phù hợp với xu hướng thực tế.

Câu hỏi thường gặp

  1. Thuật toán Prophet có ưu điểm gì so với các mô hình dự báo khác?
    Prophet xử lý tốt các xu hướng phi tuyến tính và tính thời vụ, dễ sử dụng, không yêu cầu dữ liệu chuỗi thời gian cố định và có khả năng xử lý dữ liệu thiếu hoặc ngoại lệ hiệu quả.

  2. Dữ liệu tuyển sinh có thể ảnh hưởng đến độ chính xác dự báo như thế nào?
    Dữ liệu không đồng nhất, thiếu tính chu kỳ hoặc có biến động lớn do chính sách sẽ làm giảm độ chính xác dự báo, do đó cần tiền xử lý và chuẩn hóa dữ liệu kỹ càng.

  3. Hệ thống quản lý tuyển sinh có thể mở rộng cho các trường khác không?
    Có, với kiến trúc ba lớp và công nghệ sử dụng, hệ thống có thể tùy chỉnh và mở rộng cho các trường đại học khác có quy trình tuyển sinh tương tự.

  4. Làm thế nào để giảm thiểu sai sót khi nhập liệu vào hệ thống?
    Hệ thống hỗ trợ nhập liệu qua form và import file Excel với định dạng chuẩn, đồng thời có chức năng kiểm tra dữ liệu giúp giảm thiểu sai sót do thao tác thủ công.

  5. Kết quả dự báo có thể được sử dụng như thế nào trong công tác tuyển sinh?
    Dự báo giúp xác định xu hướng số lượng thí sinh, từ đó điều chỉnh chiến lược tư vấn tuyển sinh, chuẩn bị cơ sở vật chất và nhân lực phù hợp cho các kỳ tuyển sinh tiếp theo.

Kết luận

  • Luận văn đã xây dựng thành công hệ thống quản lý và dự báo tuyển sinh tại Học viện Công nghệ Bưu chính Viễn thông, tích hợp chức năng nhập liệu, quản lý và dự báo số liệu tuyển sinh.
  • Thuật toán Facebook Prophet được áp dụng hiệu quả trong dự báo số lượng hồ sơ trúng tuyển và sinh viên nhập học, với sai số dự báo thấp, phù hợp với đặc điểm dữ liệu tuyển sinh.
  • Hệ thống giúp giảm thiểu sai sót, tiết kiệm thời gian quản lý và hỗ trợ công tác hoạch định chiến lược tuyển sinh.
  • Đề xuất triển khai hệ thống rộng rãi, đào tạo cán bộ sử dụng và mở rộng nghiên cứu các mô hình dự báo nâng cao.
  • Các bước tiếp theo bao gồm cập nhật dữ liệu hàng năm, phát triển thêm tính năng và mở rộng ứng dụng hệ thống trong các lĩnh vực quản lý giáo dục khác.

Học viện và các đơn vị liên quan được khuyến khích áp dụng hệ thống để nâng cao hiệu quả công tác tuyển sinh và quản lý đào tạo trong thời gian tới.