Tổng quan nghiên cứu

Trong bối cảnh chuyển đổi số và sự phát triển mạnh mẽ của Internet, giáo dục trực tuyến ngày càng trở nên phổ biến và quan trọng, đặc biệt trong các trường đại học. Tại Trường Đại học Bách Khoa - ĐHQG TP.HCM, hệ thống học tập trực tuyến e-learning đã được triển khai từ năm 2007, cùng với hệ thống chấm điểm tự động AGS và tiện ích CodeRunner hỗ trợ giảng dạy lập trình. Qua đó, lượng dữ liệu thu thập từ các hệ thống này ngày càng lớn, tạo điều kiện thuận lợi cho việc khai phá dữ liệu giáo dục (Educational Data Mining - EDM) nhằm hiểu rõ hơn về hành vi học tập của người học.

Luận văn tập trung vào việc xác định hành vi học tập thông qua phân tích dữ liệu thu thập từ hệ thống học tập trực tuyến, đặc biệt trong các khóa học lập trình thực hành. Mục tiêu nghiên cứu bao gồm khảo sát ngân hàng câu hỏi lập trình, đánh giá độ khó câu hỏi, thử nghiệm mô hình lớp học đảo ngược (flipped classroom) và phân tích hành vi học tập của sinh viên dựa trên dữ liệu thu thập được. Phạm vi nghiên cứu tập trung vào các môn Kỹ thuật lập trình, Cấu trúc dữ liệu và Giải thuật tại Trường Đại học Bách Khoa trong các học kỳ gần đây, với dữ liệu từ khoảng 600-800 sinh viên.

Ý nghĩa của nghiên cứu thể hiện qua việc cung cấp cho giảng viên cái nhìn sâu sắc về hành vi học tập của người học, từ đó cá nhân hóa phương pháp giảng dạy, nâng cao hiệu quả học tập và thúc đẩy môi trường học tập linh hoạt, đa dạng. Đồng thời, nghiên cứu góp phần làm rõ giá trị của mô hình lớp học đảo ngược trong giảng dạy lập trình thực hành và minh họa cho việc ứng dụng khai phá dữ liệu trong giáo dục đại học.

Cơ sở lý thuyết và phương pháp nghiên cứu

Khung lý thuyết áp dụng

Luận văn dựa trên các lý thuyết và mô hình sau:

  • Phương pháp giảng dạy lớp học đảo ngược (Flipped Classroom): Mô hình này đảo ngược quá trình học truyền thống, trong đó sinh viên tự học kiến thức mới qua tài liệu, video trước lớp và sử dụng thời gian trên lớp để thảo luận, thực hành và giải quyết vấn đề. Mô hình này giúp tăng cường sự tương tác và tự chủ trong học tập.

  • Khai phá dữ liệu giáo dục (Educational Data Mining - EDM): Áp dụng các kỹ thuật khai phá dữ liệu để phân tích hành vi học tập, dự đoán thành tích và hỗ trợ quyết định trong giáo dục. EDM bao gồm các kỹ thuật phân tích học tập, phân tích hành vi, trực quan hóa dữ liệu và dự đoán học tập.

  • Các thuật toán phân tích dữ liệu:

    • K-means clustering: Phân nhóm dữ liệu dựa trên khoảng cách đến tâm cụm, được sử dụng để phân loại độ khó câu hỏi và nhóm người học.
    • OPTICS: Thuật toán phân cụm dựa trên mật độ, giúp phát hiện các điểm ngoại lệ (outliers) trong dữ liệu hành vi học tập.
    • Naive Bayes Classification: Thuật toán phân loại dựa trên định lý Bayes, được dùng để phân loại hành vi học tập của sinh viên.
  • Các khái niệm chính:

    • Độ khó câu hỏi: Được xác định qua các công thức dựa trên điểm trung bình, số sinh viên đạt, số bài nộp đạt và số lần nộp bài.
    • Đánh giá quá trình và đánh giá tổng kết: Đánh giá quá trình nhằm theo dõi và cải thiện học tập, đánh giá tổng kết nhằm đo lường kết quả cuối cùng của học viên.
    • Độ vênh (discrepancy): Độ lệch trung bình tuyệt đối giữa điểm đánh giá quá trình và đánh giá tổng kết, dùng để phát hiện chủ đề học khó.

Phương pháp nghiên cứu

  • Nguồn dữ liệu:
    Dữ liệu thu thập từ hệ thống học tập trực tuyến Moodle và hệ thống chấm điểm tự động AGS của Trường Đại học Bách Khoa - ĐHQG TP.HCM, bao gồm kết quả làm bài của khoảng 600-800 sinh viên trong các môn Kỹ thuật lập trình, Cấu trúc dữ liệu và Giải thuật.

  • Phương pháp phân tích:

    • Xử lý dữ liệu bằng công cụ Pandas và Scikit-learn trong Python.
    • Phân cụm độ khó câu hỏi bằng thuật toán k-means với hai mô hình: mô hình 1 sử dụng điểm trung bình, mô hình 2 sử dụng vectơ đặc trưng gồm bốn công thức độ khó.
    • Phân cụm và loại bỏ nhiễu trong dữ liệu hành vi học tập bằng thuật toán OPTICS.
    • Tính toán độ vênh giữa đánh giá quá trình và đánh giá tổng kết để phát hiện chủ đề khó.
    • Phân loại hành vi học tập sinh viên bằng thuật toán Naive Bayes.
  • Timeline nghiên cứu:
    Nghiên cứu được thực hiện trong học kỳ 2 năm học 2022-2023, với thu thập và phân tích dữ liệu từ các khóa học lập trình thực hành, đồng thời thử nghiệm mô hình lớp học đảo ngược trong giảng dạy.

Kết quả nghiên cứu và thảo luận

Những phát hiện chính

  1. Phân loại độ khó câu hỏi lập trình:

    • Hai mô hình phân cụm k-means được áp dụng cho ngân hàng câu hỏi lập trình, phân loại thành ba mức độ: dễ, trung bình và khó.
    • Điểm Silhouette của mô hình 1 đạt khoảng 0.66 (môn Kỹ thuật lập trình) và 0.61 (môn Cấu trúc dữ liệu & Giải thuật), cho thấy phân cụm hợp lý.
    • Mô hình 2 sử dụng vectơ đặc trưng đa chiều cũng cho kết quả tương tự, với độ giống nhau giữa hai mô hình đạt 78.25% và độ tương tự 100%.
  2. Phát hiện chủ đề học khó dựa trên độ vênh:

    • Độ vênh giữa điểm đánh giá quá trình và đánh giá tổng kết được tính cho từng chủ đề học.
    • Chủ đề 6 (Cây) được xác định là chủ đề khó nhất trong kỳ thi giữa kỳ với nhiều cụm có độ vênh cao (trên ngưỡng 0.8).
    • Trong kỳ thi cuối kỳ, ba chủ đề khó gồm 7 (Cây nâng cao), 8 (Heap - Hash) và 4 (Tìm kiếm).
    • Tỷ lệ nhiễu trong dữ liệu dao động từ 6% đến 17%, với khoảng 43.85% sinh viên được xác định là ngoại lệ ít nhất một lần trong quá trình phân cụm.
  3. Phân tích hành vi học tập sinh viên:

    • Mô hình lớp học đảo ngược được áp dụng trong môn Kỹ thuật lập trình với 786 sinh viên, chia buổi thực hành thành Prelab (tự học trước lớp) và Inlab (thực hành trên lớp).
    • Tỷ lệ sinh viên tham gia làm bài Prelab và Inlab đạt trên 87%, với điểm trung bình Prelab cao hơn Inlab (Prelab 2 đạt 9.63, Inlab 1 thấp nhất 8.1).
    • So sánh các mô hình giảng dạy truyền thống, lớp học đảo ngược và lớp học đảo ngược trong lập trình cho thấy mô hình đảo ngược tăng cường tính tham gia và tự học của sinh viên.

Thảo luận kết quả

Kết quả phân cụm độ khó câu hỏi cho thấy việc sử dụng đa chiều các công thức độ khó giúp đánh giá chính xác hơn so với chỉ dùng điểm trung bình. Việc phát hiện chủ đề khó dựa trên độ vênh giữa đánh giá quá trình và tổng kết cung cấp một công cụ khách quan để giảng viên điều chỉnh nội dung và phương pháp giảng dạy. Tỷ lệ ngoại lệ cao phản ánh sự đa dạng trong hành vi học tập, đòi hỏi các biện pháp hỗ trợ cá nhân hóa.

Mô hình lớp học đảo ngược được chứng minh là phù hợp với giảng dạy lập trình thực hành, giúp sinh viên chủ động tiếp cận kiến thức và tăng cường kỹ năng thực hành. Kết quả điểm số và tỷ lệ tham gia cao minh chứng cho hiệu quả của mô hình này. So sánh với các nghiên cứu khác, kết quả phù hợp với xu hướng toàn cầu về tăng cường tương tác và cá nhân hóa trong giáo dục trực tuyến.

Dữ liệu có thể được trình bày qua các biểu đồ histogram phân bố điểm, biểu đồ phân cụm Silhouette, và biểu đồ phân bố độ vênh để minh họa sự khác biệt giữa các chủ đề và nhóm sinh viên. Các bảng tổng hợp kết quả phân cụm và phân loại hành vi cũng hỗ trợ trực quan cho việc đánh giá.

Đề xuất và khuyến nghị

  1. Triển khai rộng rãi mô hình lớp học đảo ngược:

    • Động từ hành động: Áp dụng, mở rộng.
    • Target metric: Tăng tỷ lệ tham gia và điểm trung bình học tập.
    • Timeline: Triển khai trong các học kỳ tiếp theo.
    • Chủ thể thực hiện: Giảng viên và khoa đào tạo.
  2. Phát triển hệ thống phân tích dữ liệu tự động:

    • Động từ hành động: Xây dựng, tích hợp.
    • Target metric: Tự động phân loại hành vi học tập và phát hiện chủ đề khó.
    • Timeline: 6-12 tháng.
    • Chủ thể thực hiện: Bộ phận công nghệ thông tin và nghiên cứu khoa học.
  3. Cá nhân hóa phương pháp giảng dạy dựa trên nhóm hành vi học tập:

    • Động từ hành động: Phân nhóm, tùy chỉnh.
    • Target metric: Cải thiện hiệu quả học tập từng nhóm sinh viên.
    • Timeline: 1 năm.
    • Chủ thể thực hiện: Giảng viên và cố vấn học tập.
  4. Tăng cường thu thập và phân tích dữ liệu đánh giá quá trình:

    • Động từ hành động: Thu thập, phân tích.
    • Target metric: Giảm độ vênh giữa đánh giá quá trình và tổng kết.
    • Timeline: Liên tục.
    • Chủ thể thực hiện: Giảng viên và bộ phận quản lý đào tạo.

Đối tượng nên tham khảo luận văn

  1. Giảng viên đại học ngành Khoa học Máy tính và Công nghệ Thông tin:

    • Lợi ích: Áp dụng mô hình lớp học đảo ngược và khai thác dữ liệu để nâng cao hiệu quả giảng dạy.
    • Use case: Thiết kế bài giảng, phân tích hành vi học tập sinh viên.
  2. Nhà quản lý giáo dục và cán bộ đào tạo:

    • Lợi ích: Hiểu rõ hành vi học tập và đánh giá chất lượng đào tạo dựa trên dữ liệu thực tế.
    • Use case: Quyết định chính sách đào tạo, cải tiến chương trình học.
  3. Nhà nghiên cứu trong lĩnh vực khai phá dữ liệu giáo dục (EDM):

    • Lợi ích: Tham khảo phương pháp phân tích dữ liệu, thuật toán phân cụm và phân loại trong giáo dục.
    • Use case: Phát triển các mô hình dự đoán và phân tích hành vi học tập.
  4. Sinh viên và người học trực tuyến:

    • Lợi ích: Hiểu rõ hơn về hành vi học tập của bản thân và cách mô hình lớp học đảo ngược hỗ trợ học tập.
    • Use case: Tự điều chỉnh phương pháp học tập, tăng hiệu quả học tập cá nhân.

Câu hỏi thường gặp

  1. Làm thế nào để xác định độ khó của câu hỏi lập trình?
    Độ khó được xác định qua các công thức dựa trên điểm trung bình, số sinh viên đạt, số bài nộp đạt và số lần nộp bài. Việc phân cụm k-means giúp phân loại câu hỏi thành dễ, trung bình và khó dựa trên các chỉ số này.

  2. Mô hình lớp học đảo ngược có ưu điểm gì trong giảng dạy lập trình?
    Mô hình này giúp sinh viên tự học kiến thức cơ bản trước lớp, tăng thời gian thực hành và tương tác trên lớp, từ đó nâng cao kỹ năng lập trình và sự chủ động trong học tập.

  3. Độ vênh giữa đánh giá quá trình và đánh giá tổng kết phản ánh điều gì?
    Độ vênh thể hiện sự khác biệt giữa kết quả học tập trong quá trình và kết quả cuối cùng, giúp phát hiện chủ đề học khó hoặc bất thường trong hành vi học tập để điều chỉnh phương pháp giảng dạy.

  4. Thuật toán OPTICS được sử dụng để làm gì trong nghiên cứu này?
    OPTICS được dùng để phân cụm dữ liệu hành vi học tập và phát hiện các điểm ngoại lệ (người học có hành vi bất thường), giúp loại bỏ nhiễu và tập trung phân tích nhóm người học điển hình.

  5. Làm thế nào để áp dụng kết quả nghiên cứu vào thực tế giảng dạy?
    Giảng viên có thể sử dụng phân tích hành vi học tập để cá nhân hóa phương pháp giảng dạy, điều chỉnh nội dung học liệu cho phù hợp với nhóm sinh viên khác nhau và áp dụng mô hình lớp học đảo ngược để tăng hiệu quả học tập.

Kết luận

  • Luận văn đã triển khai thành công mô hình lớp học đảo ngược trong giảng dạy lập trình thực hành, thu thập và phân tích dữ liệu hành vi học tập từ hệ thống trực tuyến với hơn 700 sinh viên.
  • Hai mô hình phân cụm k-means được áp dụng hiệu quả để phân loại độ khó câu hỏi lập trình, với độ chính xác và độ tương đồng cao.
  • Phương pháp tính độ vênh giữa đánh giá quá trình và tổng kết giúp phát hiện các chủ đề học khó, hỗ trợ quá trình cải tiến nội dung giảng dạy.
  • Thuật toán OPTICS giúp loại bỏ nhiễu và phát hiện các nhóm sinh viên có hành vi học tập đặc biệt, từ đó hỗ trợ cá nhân hóa giảng dạy.
  • Kết quả nghiên cứu mở ra hướng phát triển các công cụ phân tích dữ liệu giáo dục tự động, góp phần nâng cao chất lượng đào tạo và trải nghiệm học tập.

Next steps: Mở rộng áp dụng mô hình và công cụ phân tích cho các môn học khác, phát triển hệ thống hỗ trợ giảng dạy cá nhân hóa dựa trên dữ liệu hành vi học tập.

Call-to-action: Các giảng viên và nhà quản lý giáo dục nên cân nhắc tích hợp mô hình lớp học đảo ngược và khai phá dữ liệu giáo dục để nâng cao hiệu quả đào tạo trong kỷ nguyên số.