I. Tổng quan phân tích kết quả môn Cấu trúc rời rạc Bách Khoa
Bài viết này tiến hành phân tích kết quả kiểm tra môn Cấu trúc rời rạc tại Đại học Bách Khoa TP.HCM, dựa trên một báo cáo nghiên cứu thực hiện bởi sinh viên khoa Khoa học và Kỹ thuật Máy tính HCMUT. Mục tiêu chính của phân tích là khai phá dữ liệu từ các bài thi giữa kỳ và cuối kỳ, nhằm đánh giá chất lượng học tập của sinh viên và xác định các điểm mạnh, điểm yếu trong quá trình tiếp thu kiến thức. Cấu trúc rời rạc (CTRR), mã học phần CO1007, là một môn học nền tảng quan trọng, nhưng cũng là một thách thức lớn đối với nhiều sinh viên. Việc phân tích dữ liệu điểm số không chỉ cung cấp những con số thống kê thú vị mà còn là nền tảng để cải thiện phương pháp giảng dạy và học tập. Dữ liệu được sử dụng bao gồm kết quả chi tiết của 163 sinh viên, được lưu trữ trong file Excel "201_CO1007.xlsx", bao gồm thông tin về câu trả lời, kết quả đúng/sai, mã đề và chương liên quan cho từng câu hỏi. Phương pháp chính được áp dụng là thống kê mô tả, sử dụng ngôn ngữ R – một công cụ mạnh mẽ và miễn phí cho phân tích thống kê và vẽ biểu đồ. Các kỹ thuật này cho phép trực quan hóa dữ liệu phức tạp, từ đó rút ra những kết luận có giá trị về hiệu suất học tập và độ khó của môn học. Báo cáo gốc nhấn mạnh: "Những kết quả mà các em tìm ra sẽ là bước khởi đầu cho việc khai phá nguồn dữ liệu của hệ thống sau này, nhằm đạt tới mục tiêu nâng cao kỹ năng lập trình, kỹ năng giải quyết vấn đề cho người học". Toàn bộ phân tích này sẽ làm rõ bức tranh tổng thể về phổ điểm Cấu trúc rời rạc HCMUT, tỷ lệ qua môn, và các yếu tố ảnh hưởng đến kết quả cuối cùng của sinh viên.
1.1. Mục tiêu khai phá dữ liệu điểm thi Cấu trúc rời rạc
Mục tiêu cốt lõi của bài toán là sử dụng các kỹ thuật thống kê để khai phá dữ liệu từ kết quả thi giữa kỳ và cuối kỳ. Việc này có ý nghĩa quan trọng trong việc đánh giá chính xác năng lực của sinh viên. Báo cáo gốc nêu rõ, việc đánh giá này "góp phần xác định những điểm mạnh, điểm yếu của sinh viên để giáo viên có phương pháp phù hợp trong việc cải thiện kỹ năng của sinh viên". Phân tích không chỉ dừng lại ở việc tính điểm trung bình môn CTRR mà còn đi sâu vào việc phân tích hiệu suất trên từng câu hỏi, từng chương học. Qua đó, những con số có ý nghĩa về dữ liệu thực tế sẽ được tìm ra, làm cơ sở cho việc cải tiến chất lượng dạy và học trong tương lai.
1.2. Mô tả tập dữ liệu và phương pháp thống kê bằng R
Nguồn dữ liệu phân tích là file "201_CO1007.xlsx" chứa kết quả kiểm tra của 163 sinh viên trong niên khóa 2020-2021. Dữ liệu được chia thành các sheet: 'CDR' (chuẩn đầu ra), 'GK' và 'CK' (kết quả giữa kỳ và cuối kỳ), 'GK_0' và 'CK_0' (đáp án, chương liên quan). Để xử lý và trực quan hóa bộ dữ liệu này, ngôn ngữ R được lựa chọn làm công cụ chính. R là một phần mềm mã nguồn mở chuyên dụng cho phân tích thống kê và vẽ biểu đồ, được phát triển bởi Ross Ihaka và Robert Gentleman. Việc sử dụng R cho phép thực hiện các phép tính phức tạp như tính phương sai, độ lệch chuẩn, độ méo, độ nhọn và vẽ các biểu đồ phổ điểm một cách hiệu quả và chính xác, cung cấp một cái nhìn trực quan về kết quả học tập.
II. Thách thức thể hiện qua thống kê điểm thi CTRR Bách Khoa
Dữ liệu thống kê cho thấy Cấu trúc rời rạc là một môn học có độ khó cao, thể hiện rõ qua kết quả kiểm tra của sinh viên. Phân tích trên tập mẫu 157 sinh viên thi giữa kỳ và 163 sinh viên thi cuối kỳ đã vẽ nên một bức tranh đầy thách thức. Cụ thể, điểm trung bình môn CTRR ở kỳ giữa kỳ chỉ đạt 5.89/10, trong khi cuối kỳ là 5.56/10. Con số này cho thấy phần lớn sinh viên chỉ đạt mức điểm trung bình. Đáng chú ý hơn là tỷ lệ qua môn Cấu trúc rời rạc. Ở giữa kỳ, có 41 sinh viên (khoảng 26%) bị điểm dưới 5, con số này ở cuối kỳ là 74 sinh viên (khoảng 45%). Tỷ lệ sinh viên đạt điểm giỏi (từ 9.0 trở lên) là cực kỳ thấp, chỉ có 1 sinh viên ở giữa kỳ và 2 sinh viên ở cuối kỳ. Những số liệu này khẳng định rằng để đạt được điểm cao trong môn học này đòi hỏi sự nỗ lực rất lớn. Biểu đồ phổ điểm Cấu trúc rời rạc HCMUT cho thấy sự tập trung cao ở khoảng điểm 4-6, đặc biệt ở kỳ thi cuối kỳ. Sự phân tán điểm số cũng rất đáng quan tâm, với phương sai ở giữa kỳ là 3.03 và cuối kỳ là 5.88, cho thấy kết quả thi cuối kỳ có sự chênh lệch lớn hơn giữa các sinh viên. Những con số này không chỉ là thước đo kết quả mà còn là tín hiệu cảnh báo về những khó khăn mà sinh viên phải đối mặt khi tiếp cận các chủ đề như logic mệnh đề và tổ hợp hay lý thuyết đồ thị Bách Khoa.
2.1. Phân tích phổ điểm và điểm trung bình môn CTRR
Kết quả thống kê từ báo cáo cho thấy một bức tranh rõ nét về kết quả học tập. Điểm trung bình môn CTRR của kỳ giữa kỳ là 5.89, với điểm cao nhất là 8.8 và thấp nhất là 2.0. Trong khi đó, điểm trung bình cuối kỳ giảm xuống còn 5.56, với điểm cao nhất là 9.21 và thấp nhất là 0.0. Biểu đồ phổ điểm giữa kỳ cho thấy số lượng sinh viên tập trung nhiều nhất ở khoảng điểm 5.0-6.0 (50 sinh viên). Tuy nhiên, ở cuối kỳ, phổ điểm dịch chuyển sang trái, với số lượng sinh viên ở khoảng điểm 4.0-5.0 và 5.0-6.0 là cao nhất, và có tới 74 sinh viên dưới 5 điểm.
2.2. Tỷ lệ qua môn và các ngưỡng điểm quan trọng
Việc phân tích tỷ lệ qua môn Cấu trúc rời rạc là một chỉ số quan trọng để đánh giá độ khó. Dữ liệu cho thấy: Ở giữa kỳ, có 122/157 sinh viên (77.7%) đạt từ 5.0 điểm trở lên. Tuy nhiên, tỷ lệ này giảm mạnh ở cuối kỳ, chỉ còn 89/163 sinh viên (54.6%) đạt từ 5.0 điểm trở lên. Điều này cho thấy đề thi cuối kỳ có thể khó hơn hoặc kiến thức ở giai đoạn sau phức tạp hơn. Số lượng sinh viên đạt điểm khá (từ 7.0 trở lên) cũng giảm từ 59 sinh viên ở giữa kỳ xuống còn 54 sinh viên ở cuối kỳ. Những con số này là cơ sở quan trọng để sinh viên xây dựng chiến lược ôn thi Cấu trúc rời rạc HCMUT hiệu quả hơn.
III. Phương pháp phân tích độ phân tán và hình dạng điểm thi
Để hiểu sâu hơn về dữ liệu điểm số, nghiên cứu đã áp dụng các phương pháp thống kê nâng cao để đo lường độ phân tán và hình dạng của phân phối điểm. Cách tính điểm môn Cấu trúc rời rạc được chuẩn hóa (tổng câu đúng / tổng số câu * 10), tạo ra một thang đo đồng nhất để phân tích. Các chỉ số chính bao gồm phương sai (variance), độ lệch chuẩn (standard deviation), độ méo (skewness) và độ nhọn (kurtosis). Phương sai của điểm giữa kỳ là 3.03, trong khi cuối kỳ tăng lên đáng kể là 5.88. Điều này có nghĩa là mức độ phân tán của điểm số cuối kỳ lớn hơn rất nhiều, kết quả của sinh viên chênh lệch nhau rõ rệt hơn so với giữa kỳ. Độ lệch chuẩn, căn bậc hai của phương sai, cũng xác nhận xu hướng này. Một điểm thú vị là chỉ số độ méo (skewness) của cả hai kỳ thi đều âm (GK: -1.997, CK: -1.992), cho thấy phân phối điểm bị lệch về phía bên phải, tức là có một "đuôi" dài gồm các sinh viên có điểm thấp, trong khi phần lớn điểm số tập trung ở mức trên trung bình. Phân tích tứ phân vị (quartile) cũng cung cấp cái nhìn sâu sắc: ở giữa kỳ, 75% sinh viên có điểm từ 4.8 trở lên, nhưng ở cuối kỳ, con số này giảm xuống còn 4.5. Những phân tích này không chỉ là những con số khô khan mà là bằng chứng định lượng về đặc điểm của thống kê điểm thi CTRR Bách Khoa.
3.1. Đo lường mức độ phân tán bằng phương sai độ lệch chuẩn
Phương sai phản ánh mức độ phân tán của các giá trị quanh giá trị trung bình. Trong kỹ thuật, nó đặc trưng cho sự ổn định. Báo cáo ghi nhận phương sai điểm cuối kỳ (5.88) cao gần gấp đôi giữa kỳ (3.03). Điều này cho thấy sự không đồng đều trong kết quả làm bài cuối kỳ. Một số sinh viên có thể đã nắm vững kiến thức và đạt điểm cao, trong khi một bộ phận lớn khác lại gặp khó khăn và nhận điểm rất thấp, tạo ra một khoảng cách lớn về năng lực. Độ lệch chuẩn tương ứng là 1.74 (GK) và 2.42 (CK), củng cố thêm kết luận này.
3.2. Phân tích hình dạng phân phối điểm qua độ méo và độ nhọn
Độ méo (skewness) và độ nhọn (kurtosis) mô tả hình dạng của biểu đồ phân phối. Độ méo âm cho thấy phần lớn điểm số tập trung ở phía cao hơn giá trị trung bình, nhưng có một số giá trị ngoại lai rất thấp kéo "đuôi" của phân phối về bên trái. Điều này phù hợp với thực tế: có một nhóm sinh viên gặp rất nhiều khó khăn và đạt điểm 0-2, trong khi phần đông tập trung ở mức 4-7 điểm. Độ nhọn (kurtosis) đo lường mức độ tập trung của dữ liệu quanh giá trị trung tâm. Các chỉ số này giúp xác nhận rằng phân phối điểm của môn Cấu trúc rời rạc không phải là phân phối chuẩn (hình chuông), mà có những đặc điểm riêng cần lưu ý.
IV. Cách đánh giá đề thi Toán rời rạc BKU qua từng chương
Một trong những phân tích giá trị nhất của nghiên cứu là đi sâu vào việc đánh giá đề thi Toán rời rạc BKU dựa trên hiệu suất của sinh viên theo từng chương học. Cách tiếp cận này giúp xác định chính xác những mảng kiến thức nào là "khó nhằn" nhất. Kết quả phân tích cho thấy sự phân bổ câu hỏi và tỷ lệ trả lời đúng/sai có sự khác biệt rõ rệt giữa các chương. Ở kỳ giữa kỳ, kiến thức xoay quanh 6 chương đầu, trong đó chương 2 (Logic mệnh đề) và chương 4 (Tổ hợp) có số lượng câu hỏi nhiều nhất. Về hiệu suất, sinh viên làm tốt nhất ở chương 2 với 677 lượt trả lời đúng, nhưng lại gặp khó khăn nhất ở chương 1 (Các khái niệm cơ bản) với chỉ 97 lượt trả lời đúng, cho thấy sự chủ quan với kiến thức nền tảng có thể dẫn đến mất điểm. Ở kỳ cuối kỳ, kiến thức tập trung vào 5 chương sau (từ 7 đến 11). Chương 10, có thể liên quan đến lý thuyết đồ thị Bách Khoa, có số lượt trả lời đúng cao vượt trội (1515 lượt), nhưng đây cũng là chương có số câu hỏi nhiều nhất. Ngược lại, chương 8 là chương có tỷ lệ trả lời đúng thấp, cho thấy đây là một điểm yếu của sinh viên. Phân tích tần suất câu sai theo chương cũng chỉ ra rằng, chương 2 và 4 (giữa kỳ) cùng chương 10 và 11 (cuối kỳ) là những nơi sinh viên mắc lỗi nhiều nhất. Đây là những thông tin vô giá, cung cấp định hướng cho việc biên soạn giáo trình Cấu trúc rời rạc Bách Khoa và chiến lược ôn tập của sinh viên.
4.1. Phân tích tần suất và số lượng câu hỏi theo chương
Đề thi giữa kỳ có tổng cộng 25 câu hỏi, phân bổ trong 6 chương đầu. Trong khi đó, đề thi cuối kỳ có 38 câu hỏi, bao gồm kiến thức của 5 chương sau. Phân tích cho thấy có sự tập trung câu hỏi không đồng đều. Ví dụ, trong một mã đề giữa kỳ, chương 2 và 4 chiếm phần lớn số câu. Tương tự, ở cuối kỳ, chương 10 chiếm tỷ trọng câu hỏi rất lớn. Việc nắm được cấu trúc này giúp sinh viên phân bổ thời gian ôn tập hợp lý, tập trung vào các chương có khả năng xuất hiện nhiều trong đề thi CTRR Bách Khoa các năm.
4.2. Xác định các chương khó dựa trên tỷ lệ trả lời sai
Chương được xem là khó khi có số lượng sinh viên trả lời đúng thấp. Dựa trên dữ liệu, ở giữa kỳ, chương 5 (Quan hệ) là chương khó nhất khi chỉ có 220 lượt trả lời đúng và tỷ lệ sinh viên làm sai cao. Ở cuối kỳ, chương 8 (Đệ quy) cho thấy là một thử thách lớn với chỉ 381 lượt trả lời đúng. Những phát hiện này cung cấp kinh nghiệm học CTRR BKU quý báu: sinh viên cần dành nhiều thời gian và nỗ lực hơn cho các chương này, đồng thời tìm kiếm thêm tài liệu ôn thi CTRR để củng cố kiến thức.
V. Bí quyết ôn thi Cấu trúc rời rạc HCMUT từ dữ liệu thực tế
Từ những phân tích sâu sắc về kết quả kiểm tra, có thể rút ra nhiều kinh nghiệm học CTRR BKU và bí quyết ôn tập hiệu quả. Dữ liệu không chỉ chỉ ra vấn đề mà còn gợi ý giải pháp. Đầu tiên, việc đạt điểm cao ở giữa kỳ không đảm bảo sẽ có kết quả tốt ở cuối kỳ. Phân tích cho thấy chỉ có 9 sinh viên đạt điểm từ 7.0 trở lên ở cả hai kỳ thi. Điều này nhấn mạnh tầm quan trọng của việc duy trì sự tập trung và nỗ lực trong suốt học kỳ, thay vì chỉ học tốt giai đoạn đầu. Thứ hai, việc phân tích hiệu suất theo chương cho thấy sinh viên cần có một chiến lược ôn tập thông minh. Thay vì học dàn trải, cần ưu tiên các chương có tần suất xuất hiện cao trong đề thi như chương 2, 4 (giữa kỳ) và chương 10 (cuối kỳ). Đồng thời, phải đặc biệt chú trọng vào các chương được xác định là "khó" như chương 5 và 8, vì đây là những nơi dễ mất điểm nhất. So sánh kết quả giữa các nhóm lớp (L01 và L02) cũng cho thấy một điểm thú vị: nhóm L02 có điểm trung bình cuối kỳ (5.83) cao hơn nhóm L01 (5.29), cho thấy có thể có sự khác biệt trong phương pháp học tập hoặc tương tác nhóm. Cuối cùng, việc xem xét các đề thi CTRR Bách Khoa các năm và luyện tập giải các dạng bài tập lớn Cấu trúc rời rạc là cực kỳ cần thiết để làm quen với cấu trúc và độ khó của đề thi thật.
5.1. Tầm quan trọng của việc duy trì phong độ học tập
Dữ liệu cho thấy có rất ít sinh viên (9/163) giữ được thành tích tốt (trên 7.0 điểm) ở cả hai kỳ thi. Điều này cho thấy kiến thức của môn học có tính kế thừa và độ khó tăng dần. Lời khuyên rút ra là sinh viên không nên chủ quan sau khi có kết quả tốt ở giữa kỳ. Cần phải liên tục ôn tập và củng cố kiến thức, đặc biệt là các phần nền tảng, để chuẩn bị cho các nội dung phức tạp hơn ở cuối kỳ. Việc này giúp tránh tình trạng "hụt hơi" và đảm bảo kết quả cuối cùng được tốt nhất.
5.2. Xây dựng chiến lược ôn tập dựa trên chương trọng tâm
Một chiến lược ôn thi Cấu trúc rời rạc HCMUT hiệu quả là phân bổ thời gian dựa trên dữ liệu. Sinh viên nên dành nhiều thời gian hơn cho các chương có trọng số câu hỏi lớn trong đề thi. Bên cạnh đó, cần xác định các điểm yếu cá nhân bằng cách tự đánh giá qua các bài tập của những chương khó (như chương 5, 8). Việc thực hành thường xuyên với các dạng bài tập trong những chương này sẽ giúp cải thiện đáng kể kỹ năng và sự tự tin khi đối mặt với kỳ thi thật. Đây chính là cách biến phân tích dữ liệu thành hành động cụ thể.