Nghiên Cứu Thuật Toán Cụm Mờ và Ứng Dụng Vào Phân Loại Sinh Viên

Nghiên cứu các thuật toán cụm mờ và ứng dụng hiệu quả vào phân loại sinh viên, giúp nâng cao chất lượng giáo dục và quản lý dữ liệu.

Trường đại học

Trường Đại Học Công Nghiệp Thành Phố Hồ Chí Minh

Chuyên ngành

Khoa Học Máy Tính

Người đăng

Ẩn danh

Thể loại

Luận Văn Thạc Sĩ

2021

Phí lưu trữ

30 Point

Mục lục chi tiết

LỜI CAM ĐOAN

LỜI CẢM ƠN

TÓM TẮT LUẬN VĂN THẠC SĨ

LỜI CAM ĐOAN

MỤC LỤC

DANH MỤC HÌNH ẢNH

DANH MỤC BẢNG BIỂU

DANH MỤC TỪ VIẾT TẮT

MỞ ĐẦU

0.1. Mục tiêu nghiên cứu

0.2. Đối tượng và phạm vi nghiên cứu

0.3. Cách tiếp cận và phương pháp nghiên cứu

0.4. Ý nghĩa thực tiễn của đề tài

1. CHƯƠNG 1: TỔNG QUAN VỀ LĨNH VỰC NGHIÊN CỨU

1.1. Tổng quan về đề tài

1.2. Tổng quan nghiệp vụ xếp loại sinh viên

1.2.1. Cách tính điểm kết quả học tập học kỳ/năm học/khoá học

1.2.2. Cách quy đổi điểm kết quả học tập học kỳ/năm học/khoá học

1.2.3. Xếp loại tốt nghiệp

1.3. Các hướng tiếp cận

1.4. Khó khăn và thách thức

1.5. Đề xuất hướng giải quyết

1.6. Bố cục luận văn

2. CHƯƠNG 2: CƠ SỞ LÝ THUYẾT

2.1. Tổng quan về khai phá dữ liệu

2.1.1. Giới thiệu khai phá dữ liệu

2.1.2. Quá trình khám phá tri thức

2.1.3. Các giai đoạn của quá trình khai phá dữ liệu

2.1.4. Các phương pháp khai phá dữ liệu

2.1.5. Các hướng tiếp cận cơ bản và kỹ thuật áp dụng

2.1.6. Các thách thức khó khăn trong KPTT và KPDL

2.2. Tổng quan về phân cụm dữ liệu

2.2.1. Các ứng dụng của phân cụm

2.2.2. Những kỹ thuật tiếp cận trong phân cụm dữ liệu

2.3. Kỹ thuật phân cụm dữ liệu mờ

2.3.1. Giới thiệu về phân cụm mờ

2.3.2. Lý thuyết gom cụm (Clustering)

2.3.3. Thuật toán K-Means

2.3.4. Thuật toán FCM (Fuzzy C-Means)

2.3.5. Thuật toán εFCM (ε −Insensitive Fuzzy C-Means)

3. CHƯƠNG 3: ÁP DỤNG KẾT QUẢ NGHIÊN CỨU

3.1. Cách tổ chức thực nghiệm

3.2. Chuẩn bị cài đặt thực nghiệm

3.3. Thực nghiệm với tập dữ liệu và đánh giá kết quả

3.3.1. Thực nghiệm với dữ liệu CĐCQ Dược học khoá 6

3.3.2. Thực nghiệm với dữ liệu CĐCQ Điều dưỡng khoá 6

3.3.3. Thực nghiệm với dữ liệu CĐCQ Kỹ thuật xét nghiệm khoá 6

3.3.4. Thực nghiệm với dữ liệu CĐCQ Phục hồi chức năng khoá 6

3.3.5. Thực nghiệm với dữ liệu CĐCQ Dược học khoá 7

3.3.6. Thực nghiệm với dữ liệu CĐCQ Điều dưỡng khoá 7

3.3.7. Thực nghiệm với dữ liệu CĐCQ Kỹ thuật xét nghiệm khoá 7

3.3.8. Thực nghiệm với dữ liệu CĐCQ Phục hồi chức năng khoá 7

3.3.9. Thực nghiệm với dữ liệu CĐLT Dược học khoá 4

3.3.10. Thực nghiệm với dữ liệu CĐLT Điều dưỡng khoá 4

3.3.11. Thực nghiệm với dữ liệu CĐLT Hộ sinh khoá 4

3.3.12. Thực nghiệm với dữ liệu CĐLT Dược học khoá 5

3.3.13. Thực nghiệm với dữ liệu CĐLT Điều dưỡng khoá 5

3.3.14. Thực nghiệm với dữ liệu CĐLT Hộ sinh khoá 5

3.3.15. Thực nghiệm với dữ liệu TCCQ Y sỹ khoá 6 Campuchia

3.4. Bàn luận thực nghiệm

KẾT LUẬN VÀ KIẾN NGHỊ

DANH MỤC CÔNG TRÌNH ĐÃ CÔNG BỐ CỦA HỌC VIÊN

TÀI LIỆU THAM KHẢO

LÝ LỊCH TRÍCH NGANG CỦA HỌC VIÊN

Tóm tắt

I. Tổng quan về Thuật Toán Cụm Mờ và Phân Loại Sinh Viên

Thuật toán cụm mờ là một trong những phương pháp mạnh mẽ trong lĩnh vực học máy, đặc biệt trong việc phân loại dữ liệu. Trong bối cảnh giáo dục, việc áp dụng thuật toán này giúp đánh giá và phân loại sinh viên một cách chính xác hơn. Bài viết này sẽ đi sâu vào các khái niệm cơ bản về thuật toán cụm mờ và cách thức nó có thể được áp dụng trong việc phân loại sinh viên.

1.1. Khái niệm về Thuật Toán Cụm Mờ

Thuật toán cụm mờ (Fuzzy Clustering) cho phép các đối tượng thuộc về nhiều cụm khác nhau với mức độ khác nhau. Điều này rất hữu ích trong việc phân loại sinh viên, nơi mà một sinh viên có thể có nhiều đặc điểm khác nhau.

1.2. Tại sao cần Phân Loại Sinh Viên

Phân loại sinh viên giúp nhà trường hiểu rõ hơn về năng lực và nhu cầu của từng sinh viên, từ đó đưa ra các phương pháp giảng dạy phù hợp hơn.

II. Vấn đề trong Phân Loại Sinh Viên Hiện Nay

Mặc dù có nhiều phương pháp phân loại, nhưng việc áp dụng các phương pháp truyền thống vẫn gặp nhiều khó khăn. Các tiêu chí đánh giá hiện tại thường dựa trên điểm số cứng, không phản ánh đúng năng lực thực tế của sinh viên.

2.1. Hạn chế của Phương Pháp Truyền Thống

Phương pháp truyền thống thường không xem xét đầy đủ các yếu tố như kỹ năng mềm, thái độ học tập, và kinh nghiệm thực tế của sinh viên.

2.2. Nhu cầu Cần Có Một Công Cụ Đánh Giá Mới

Cần có một công cụ đánh giá mềm dẻo hơn, cho phép sử dụng nhiều tiêu chí khác nhau để phân loại sinh viên một cách chính xác hơn.

III. Phương Pháp Phân Cụm Mờ Trong Phân Loại Sinh Viên

Các thuật toán phân cụm mờ như K-Means, FCM và εFCM đã được áp dụng để phân loại sinh viên. Những phương pháp này cho phép phân tích dữ liệu một cách linh hoạt và chính xác hơn.

3.1. Thuật Toán K Means

K-Means là một trong những thuật toán phân cụm phổ biến nhất, giúp phân chia dữ liệu thành các cụm dựa trên khoảng cách giữa các điểm dữ liệu.

3.2. Thuật Toán Fuzzy C Means FCM

FCM cho phép mỗi điểm dữ liệu thuộc về nhiều cụm với mức độ khác nhau, giúp phản ánh chính xác hơn sự phân bố của sinh viên.

3.3. Thuật Toán εFCM

εFCM là một biến thể của FCM, giúp cải thiện độ chính xác trong việc phân loại dữ liệu có nhiễu.

IV. Ứng Dụng Thực Tiễn của Thuật Toán Cụm Mờ

Việc áp dụng thuật toán cụm mờ trong phân loại sinh viên đã cho thấy nhiều kết quả khả quan. Các trường học có thể sử dụng những kết quả này để cải thiện chất lượng đào tạo.

4.1. Kết Quả Nghiên Cứu Tại Trường Cao Đẳng Y Tế Đồng Tháp

Nghiên cứu tại Trường Cao Đẳng Y Tế Đồng Tháp cho thấy việc áp dụng thuật toán phân cụm mờ giúp phân loại sinh viên một cách hiệu quả hơn.

4.2. Lợi Ích Của Việc Phân Loại Chính Xác

Phân loại chính xác giúp nhà trường đưa ra các chương trình đào tạo phù hợp, từ đó nâng cao chất lượng giáo dục.

V. Kết Luận và Tương Lai của Thuật Toán Cụm Mờ

Thuật toán cụm mờ đang mở ra nhiều cơ hội mới trong việc phân loại sinh viên. Tương lai của nó hứa hẹn sẽ mang lại nhiều cải tiến trong giáo dục.

5.1. Tương Lai Của Phân Loại Sinh Viên

Với sự phát triển của công nghệ, việc áp dụng các thuật toán học máy trong giáo dục sẽ ngày càng trở nên phổ biến.

5.2. Khuyến Nghị Đối Với Các Trường Học

Các trường học nên xem xét áp dụng các thuật toán phân cụm mờ để cải thiện quy trình đánh giá và phân loại sinh viên.

24/07/2025

Bạn đang xem trước tài liệu:

Nghiên cứu một số thuật toán cụm mờ và ứng dụng vào bài toán phân loại sinh viên

Tải đầy đủ

Nội dung chính

Tổng quan nghiên cứu

Việc đánh giá kết quả học tập và phân loại sinh viên là một trong những vấn đề trọng yếu trong quản lý đào tạo giáo dục hiện nay. Theo quy định của Bộ Lao động Thương binh – Xã hội, việc xếp loại học lực và rèn luyện sinh viên dựa trên thang điểm cứng, tuy nhiên, kết quả học tập giữa các sinh viên trong cùng một trường thường có sự khác biệt do yếu tố chủ quan trong đánh giá từng học phần. Nghiên cứu này nhằm mục tiêu phát triển một công cụ phân loại mềm dẻo hơn, sử dụng thuật toán phân cụm mờ để đánh giá kết quả học tập sinh viên một cách khách quan và đa chiều hơn. Phạm vi nghiên cứu tập trung vào dữ liệu kết quả học tập của sinh viên các hệ Cao đẳng chính quy, Cao đẳng liên thông và Trung cấp chính quy quốc tế tại Trường Cao đẳng Y tế Đồng Tháp trong giai đoạn từ năm 2017 đến 2021.

Nghiên cứu đã áp dụng ba thuật toán phân cụm mờ gồm K-Means, Fuzzy C-Means (FCM) và ε-Insensitive Fuzzy C-Means (εFCM) để phân loại sinh viên dựa trên dữ liệu điểm số theo thang điểm 4. Qua đó, so sánh kết quả phân loại với quy chế cứng hiện hành của Bộ nhằm nâng cao chất lượng đánh giá, hỗ trợ nhà trường trong việc giới thiệu sinh viên phù hợp với yêu cầu tuyển dụng của các đơn vị sử dụng lao động. Kết quả nghiên cứu có ý nghĩa quan trọng trong việc số hóa quy trình đào tạo, kiểm định chất lượng và nâng cao hiệu quả quản lý đào tạo tại các cơ sở giáo dục nghề nghiệp.

Cơ sở lý thuyết và phương pháp nghiên cứu

Khung lý thuyết áp dụng

Nghiên cứu dựa trên lý thuyết khai phá dữ liệu (Data Mining) và phân cụm dữ liệu (Clustering), trong đó phân cụm mờ (Fuzzy Clustering) được sử dụng để xử lý các trường hợp dữ liệu có ranh giới không rõ ràng giữa các nhóm.

Khai phá dữ liệu (Data Mining): Là quá trình tìm kiếm các mẫu, mô hình ẩn trong tập dữ liệu lớn nhằm hỗ trợ ra quyết định. Quá trình này bao gồm các bước trích chọn, tiền xử lý, chuyển đổi dữ liệu, khai phá và đánh giá mô hình.
Phân cụm dữ liệu (Clustering): Là kỹ thuật nhóm các đối tượng dữ liệu tương tự vào cùng một cụm sao cho các đối tượng trong cùng cụm có tính đồng nhất cao, khác biệt với các cụm khác.
Phân cụm mờ (Fuzzy Clustering): Cho phép một điểm dữ liệu thuộc về nhiều cụm với các mức độ thành viên khác nhau, phù hợp với các dữ liệu có ranh giới mờ, chồng lấn giữa các nhóm.
Thuật toán K-Means: Phân cụm rõ, phân chia dữ liệu thành k cụm dựa trên khoảng cách Euclide đến tâm cụm.
Thuật toán Fuzzy C-Means (FCM): Phân cụm mờ, tối thiểu hóa hàm mục tiêu với trọng số mờ hóa, cho phép điểm dữ liệu thuộc nhiều cụm.
Thuật toán ε-Insensitive Fuzzy C-Means (εFCM): Mở rộng FCM nhằm giảm ảnh hưởng của nhiễu và ngoại lai bằng cách sử dụng hàm mục tiêu phi nhạy cảm ε.

Phương pháp nghiên cứu

Nguồn dữ liệu: Dữ liệu điểm học tập của sinh viên các ngành Dược học, Điều dưỡng, Kỹ thuật xét nghiệm, Phục hồi chức năng, Hộ sinh và Y sỹ đa khoa quốc tế tại Trường Cao đẳng Y tế Đồng Tháp, được trích xuất từ hệ thống phần mềm quản lý đào tạo trên nền tảng SQL Server 2014.
Cỡ mẫu: Tổng cộng 15 tập dữ liệu với số lượng sinh viên dao động từ 14 đến 289 sinh viên, mỗi tập có từ 15 đến 48 đặc trưng (features).
Phương pháp chọn mẫu: Loại trừ sinh viên bảo lưu, thôi học, bị đình chỉ hoặc không đủ dữ liệu học phần; chỉ chọn sinh viên đã hoàn thành khóa học.
Phương pháp phân tích: Cài đặt và thực nghiệm ba thuật toán phân cụm K-Means, FCM và εFCM trên ngôn ngữ Python sử dụng thư viện sklearn và fuzzy-c-means. Các thuật toán được đánh giá bằng ma trận nhầm lẫn (Confusion Matrix) và trực quan hóa dữ liệu qua các kỹ thuật PCA, t-SNE, ISOMAP.
Timeline nghiên cứu: Thu thập và xử lý dữ liệu từ tháng 12/2020 đến tháng 10/2021, thực hiện cài đặt và đánh giá thuật toán trong cùng khoảng thời gian.

Kết quả nghiên cứu và thảo luận

Những phát hiện chính

Phân loại sinh viên theo thuật toán K-Means: Với dữ liệu Cao đẳng chính quy ngành Dược học khóa 6 (289 sinh viên, 38 features), K-Means phân chia thành 4 nhóm với số lượng sinh viên lần lượt là 131, 127, 19 và 12. Tương tự, với ngành Điều dưỡng khóa 6 (73 sinh viên, 48 features), K-Means phân nhóm 36, 33, 2 và 2 sinh viên.
Phân loại theo thuật toán FCM: Cùng dữ liệu ngành Dược học khóa 6, FCM phân chia số sinh viên vào 4 nhóm gần bằng nhau: 67, 72, 78 và 67 sinh viên. Với ngành Điều dưỡng khóa 6, số sinh viên phân vào 4 nhóm là 18, 16, 20 và 19.
Phân loại theo thuật toán εFCM: Thuật toán này cho kết quả phân bố tương tự FCM, với ngành Dược học khóa 6 là 66, 73, 75 và 75 sinh viên; ngành Điều dưỡng khóa 6 là 19, 18, 2 và 19 sinh viên.
Đánh giá hiệu quả phân loại: Qua ma trận nhầm lẫn, các thuật toán phân cụm mờ (FCM và εFCM) cho kết quả phân loại mềm dẻo hơn, phù hợp với dữ liệu có ranh giới mờ giữa các nhóm sinh viên, trong khi K-Means có xu hướng phân nhóm rõ ràng nhưng ít linh hoạt hơn.

Thảo luận kết quả

Kết quả cho thấy thuật toán phân cụm mờ FCM và εFCM có khả năng phân loại sinh viên dựa trên nhiều tiêu chí điểm số một cách linh hoạt hơn so với phương pháp phân cụm rõ K-Means. Điều này phù hợp với thực tế đánh giá kết quả học tập, khi mà ranh giới giữa các nhóm sinh viên không hoàn toàn rõ ràng do sự đa dạng về năng lực và kết quả học tập từng học phần. Việc sử dụng εFCM giúp giảm thiểu ảnh hưởng của dữ liệu nhiễu và ngoại lai, nâng cao độ chính xác phân loại. So sánh với quy chế cứng của Bộ Lao động Thương binh – Xã hội, các thuật toán phân cụm mờ cung cấp một công cụ đánh giá mềm dẻo, đa chiều, giúp nhà trường có cái nhìn toàn diện hơn về năng lực sinh viên, từ đó hỗ trợ hiệu quả trong việc giới thiệu sinh viên phù hợp với yêu cầu tuyển dụng. Dữ liệu trực quan hóa qua PCA, t-SNE và ISOMAP minh họa rõ sự phân bố các cụm, giúp nhà quản lý dễ dàng nhận diện nhóm sinh viên ưu tú và nhóm cần hỗ trợ thêm.

Đề xuất và khuyến nghị

Áp dụng thuật toán phân cụm mờ trong hệ thống quản lý đào tạo: Nhà trường nên tích hợp các thuật toán FCM và εFCM vào phần mềm quản lý đào tạo để phân loại sinh viên theo nhiều tiêu chí, nâng cao tính khách quan và chính xác trong đánh giá kết quả học tập.
Đào tạo và nâng cao năng lực cho cán bộ quản lý: Tổ chức các khóa đào tạo về khai phá dữ liệu và phân tích thuật toán phân cụm cho cán bộ quản lý đào tạo nhằm nâng cao khả năng vận dụng công nghệ trong quản lý giáo dục.
Cập nhật và làm sạch dữ liệu thường xuyên: Đảm bảo dữ liệu đầu vào được làm sạch, loại bỏ sinh viên bảo lưu, thôi học hoặc dữ liệu thiếu để nâng cao chất lượng phân tích và kết quả phân loại.
Phát triển hệ thống báo cáo trực quan: Xây dựng các báo cáo và biểu đồ trực quan hóa kết quả phân loại sinh viên để hỗ trợ nhà trường và các đơn vị tuyển dụng trong việc ra quyết định tuyển chọn nhân sự phù hợp.
Thời gian thực hiện: Các giải pháp trên nên được triển khai trong vòng 12 tháng, bắt đầu từ việc tích hợp thuật toán vào hệ thống phần mềm quản lý đào tạo, tiếp theo là đào tạo cán bộ và hoàn thiện hệ thống báo cáo.

Đối tượng nên tham khảo luận văn

Nhà quản lý giáo dục và cán bộ đào tạo: Giúp nâng cao hiệu quả quản lý, đánh giá kết quả học tập sinh viên một cách khách quan và đa chiều.
Giảng viên và chuyên gia công nghệ thông tin trong giáo dục: Áp dụng các thuật toán phân cụm mờ để nghiên cứu và phát triển các công cụ hỗ trợ đánh giá và phân loại sinh viên.
Các cơ sở đào tạo nghề và đại học: Tham khảo mô hình phân loại mềm dẻo để cải tiến quy trình đánh giá sinh viên, phù hợp với yêu cầu tuyển dụng và kiểm định chất lượng đào tạo.
Nhà tuyển dụng và doanh nghiệp: Sử dụng kết quả phân loại sinh viên dựa trên thuật toán phân cụm mờ để lựa chọn ứng viên phù hợp với tiêu chí năng lực và kỹ năng thực tế.

Câu hỏi thường gặp

Phân cụm mờ khác gì so với phân cụm rõ?
Phân cụm mờ cho phép một điểm dữ liệu thuộc về nhiều cụm với các mức độ thành viên khác nhau, trong khi phân cụm rõ chỉ cho phép điểm dữ liệu thuộc duy nhất một cụm. Điều này giúp xử lý dữ liệu có ranh giới mờ và chồng lấn hiệu quả hơn.
Tại sao chọn thuật toán εFCM thay vì FCM thông thường?
εFCM cải tiến FCM bằng cách giảm ảnh hưởng của nhiễu và các điểm ngoại lai nhờ hàm mục tiêu phi nhạy cảm ε, giúp phân cụm chính xác hơn trong các tập dữ liệu thực tế có nhiều nhiễu.
Làm thế nào để đánh giá hiệu quả phân loại của các thuật toán?
Hiệu quả được đánh giá bằng ma trận nhầm lẫn (Confusion Matrix) và trực quan hóa dữ liệu qua các kỹ thuật như PCA, t-SNE, ISOMAP để quan sát sự phân bố và tính đồng nhất của các cụm.
Có thể áp dụng mô hình này cho các ngành học khác không?
Có, mô hình phân cụm mờ có thể áp dụng cho nhiều ngành học khác nhau, đặc biệt là những ngành có dữ liệu học tập đa chiều và ranh giới phân loại không rõ ràng.
Làm sao để tích hợp thuật toán phân cụm vào hệ thống quản lý đào tạo hiện tại?
Có thể sử dụng các ngôn ngữ lập trình như Python cùng các thư viện hỗ trợ (sklearn, fuzzy-c-means) để phát triển module phân cụm, sau đó tích hợp vào phần mềm quản lý đào tạo qua API hoặc các công cụ hỗ trợ tích hợp.

Kết luận

Nghiên cứu đã thành công trong việc cài đặt và áp dụng ba thuật toán phân cụm mờ K-Means, FCM và εFCM trên dữ liệu kết quả học tập sinh viên tại Trường Cao đẳng Y tế Đồng Tháp.
Thuật toán phân cụm mờ FCM và εFCM cho kết quả phân loại mềm dẻo, phù hợp với thực tế đánh giá năng lực sinh viên hơn so với phương pháp phân cụm rõ K-Means.
Kết quả phân loại hỗ trợ nhà trường trong việc đánh giá chất lượng đào tạo, kiểm định và giới thiệu sinh viên phù hợp với yêu cầu tuyển dụng.
Đề xuất tích hợp các thuật toán phân cụm mờ vào hệ thống quản lý đào tạo, đồng thời nâng cao năng lực cán bộ quản lý và phát triển hệ thống báo cáo trực quan.
Các bước tiếp theo bao gồm triển khai thực tế các giải pháp đề xuất trong vòng 12 tháng và mở rộng nghiên cứu áp dụng cho các ngành học khác nhằm nâng cao hiệu quả quản lý đào tạo và chất lượng nguồn nhân lực.

Hành động tiếp theo: Nhà trường và các cơ sở đào tạo nên phối hợp với chuyên gia công nghệ thông tin để triển khai tích hợp thuật toán phân cụm mờ vào hệ thống quản lý đào tạo, đồng thời tổ chức đào tạo nâng cao nhận thức và kỹ năng cho cán bộ quản lý giáo dục.

Trích đoạn nội dung tài liệu

CHƯƠNG 1 TỔNG QUAN VỀ LĨNH VỰC NGHIÊN CỨU 1.1 Tổng quan về đề tài Đánh giá kết quả học tập và phân loại sinh viên là một trong những vấn đề quan trọng trong quá trình đào tạo. Hiện nay các quy định của Bộ Lao động Thương Binh – Xã hội [1] về xếp loại học lực và rèn luyện của sinh viên đều dựa theo thang điểm cứng, kết quả học tập của các cơ sở đào tạo, các đối tượng sinh viên khác nhau trong cùng một trường thường có sự khác biệt do chủ quan đánh giá kết quả học tập của từng học phần, từng module. Do đó, nhà trường cần có một công cụ xếp loại phần mềm mềm dẻo hơn, sử dụng nhiều tiêu chí đánh giá và công cụ để so sánh, điều chỉnh kết quả phân loại của các nhóm đối tượng khác nhau một cách khách quan là cần thiết. Ngoài ra, nhu cầu tuyển dụng của các đơn vị tuyển dụng ngày càng khắt khe hơn về kinh nghiệm nghề, kỹ năng và điểm số chuyên môn; do đó, nếu chỉ áp dụng cứng như hiện nay thì cơ hội dành cho những bạn thật sự có năng lực bị hạn chế dẫn đến đánh mất cơ hội.

Đây cũng là mục tiêu kiểm định chất lượng đào tạo, hướng đến nhà trường số hoá quy trình và đánh giá chất lượng kết quả đào tạo một cách rõ ràng, công tâm và nâng cao chất lượng dạy và học, kết hợp vận dụng y đức sau khi sinh viên tốt nghiệp.2 Tổng quan nghiệp vụ xếp loại sinh viên Trường Cao đẳng Y tế Đồng Tháp được thành lập theo quyết định số 1407/QĐ- BGDĐT ngày 09 tháng 04 năm 2011 của Bộ Giáo dục và Đào tạo dựa trên cơ sở Trường Trung cấp Y tế Đồng Tháp. Nhà trường căn cứ theo Thông tư số 09/2017/TT-BLĐTBXH [1] về việc tổ chức thực hiện chương trình đào tạo trình độ trung cấp, cao đẳng theo niên chế hoặc theo phương thức tích luỹ mô-đun hoặc tín chỉ; quy chế kiểm tra, thi, xét công nhận tốt nghiệp. Nhà trường bám sát 38 điều trong Thông tư để xây dựng các tiêu chí riêng cho việc tổ chức thực hiện chương trình đạo tạo trình độ trung cấp, cao đẳng theo phương thức tích lỹ mô-đun hoặc tín chỉ và được áp dụng từ năm 2017 đến nay cho các ngành đang đào tạo. Trong đó có một vấn đề rất quan trọng đó là đánh giá kết quả sinh viên toàn khoá học, bởi vì 6 đánh giá kết quả học tập sinh viên là một trong những yếu tố quan trọng nhất trong giáo dục đại học.

Kết quả đánh giá sẽ ảnh hưởng sâu sắc đến sự nghiệp của sinh viên sau này. Vì vậy, việc đánh giá cần được thực hiện một cách chuyên nghiệp trong đó cần tập trung nhiều vào đánh giá kiến thức thông qua quá trình kiểm tra và thi cử, cung cấp cho nhà trường các thông tin có giá trị về hiệu quả giảng dạy và các hoạt động dịch vụ hỗ trợ người học.1 Cách tính điểm kết quả học tập học kỳ/năm học/khoá học Điểm môn học, mô-đun: bao gồm ĐTB các điểm kiểm tra có trọng số 0,4 và điểm thi kết thúc có trọng số 0,6. ĐTB điểm kiểm tra là trung bình cộng của các điểm kiểm tra thường xuyên, điểm kiểm tra định kỳ theo hệ số của từng loại điểm. Trong đó, điểm kiểm tra thường xuyên tính hệ số 1, điểm kiểm tra định kỳ tính hệ số 2.

Điểm môn học, mô-đun đạt yêu cầu khi có điểm theo thang điểm 10 đạt từ 4,0 trở lên. Điểm trung bình chung học kỳ/năm học/khoá học và điểm trung bình chung tích luỹ được tính theo công thức sau: n a n i i A  i 1 n n i 1 i Trong đó: - A: là điểm trung bình chung học kỳ/năm học/khoá học hoặc điểm trung bình chung tích luỹ. - i: là số thứ tự môn học, mô-đun. - Ai: là điểm của môn học, mô-đun thứ i; - ni: là số tín chỉ của môn học, mô-đun thứ i; - n: tổng số môn học, mô-đun trong học kỳ/năm học/khoá học hoặc số môn học, mô-đun đã tích luỹ.

7 Điểm trung bình chung tích luỹ là ĐTB của các môn học, mô-đun mà người học đã tích luỹ được, tính từ đầu khoá học cho tới thời điểm được xem xét vào lúc kết thúc mỗi học kỳ. Điểm trung bình chung học kỳ/năm học/khoá học, ĐTB chung tích luỹ bao gồm cả điểm môn học, mô-đun được bảo lưu, không bao gồm điểm môn học, mô-đun được miễn trừ và môn học điều kiện. Trường hợp người học được tạm hoãn học môn học, mô-đun thì chưa tính khối lượng học tập của môn học, mô-đun đó trong thời gian tạm hoãn. Điểm trung bình chung học kỳ, năm học, ĐTB chung tích luỹ để xét học bổng, khen thưởng sau mỗi học kỳ, năm học hoặc khoá học được tính theo kết quả điểm thi kết thúc môn học, mô-đun lần thứ nhất; để xét điều chỉnh tiến độ học, buộc thôi học được tính theo kết quả thi kết thúc môn học, mô-đun có điểm cao nhất.

Môn học Giáo dục thể chất, Giáo dục quốc phòng và an ninh là 2 môn điều kiện, kết quả đánh giá 2 môn học này không tính vào ĐTB chung học kỳ, năm học, điểm trung bình chung tích luỹ, xếp loại tốt nghiệp nhưng là một trong các điều kiện để xét hoàn thành khối lượng học tập, xét điều kiện dự thi tốt nghiệp hoặc bảo vệ chuyên đề, khoá luận tốt nghiệp và được ghi vào bảng điểm cấp kèm theo bằng tốt nghiệp.2 Cách quy đổi điểm kết quả học tập học kỳ/năm học/khoá học Quy đổi điểm môn học, mô-đun: được tính theo khoản 1 Điều 15 của Thông tư BLĐTBXH [1] theo thang điểm 10 sau khi làm tròn đến một chữ số thập phân sẽ được chuyển thành điểm chữ, và quy đổi từ điểm chữ qua điểm số theo thang điểm 4 Bảng 1.1 Bảng quy đổi từ điểm chữ qua điểm số Điểm chữ Điểm 10 Loại Điểm 4 A 8,5 – 10 Giỏi 4 B 7,0 – 8,4 Khá 3 C 5,5 – 6,9 Trung bình 2 D 4,0 – 5,4 Trung bình yếu 1 F < 4,0 Không đạt 0 8 1.3 Xếp loại tốt nghiệp Xếp loại tốt nghiệp được xác định theo điểm trung bình chung tích luỹ của toàn khoá học theo thang điểm 4, như sau: Bảng 1.2 Xếp loại tốt nghiệp Loại Diễn giải Loại Xuất sắc Điểm trung bình chung tích luỹ từ 3,60 đến 4,00 Loại Giỏi Điểm trung bình chung tích luỹ từ 3,20 đến 3,59 Loại Khá Điểm trung bình chung tích luỹ từ 2,50 đén 3,19 Loại Trung bình Điểm trung bình chung tích luỹ từ 2,00 đến 2,49 Người học có điểm xếp loại tốt nghiệp đạt từ loại giỏi trở lên sẽ bị giảm đi một mức xếp loại tốt nghiệp nếu thuộc một trong các trường hợp như: có một môn học hoặc một mô-đun trở lên trong khoá học phải thi lại; bị kỷ luật từ mức cảnh cáo trở lên trong thời gian học tập tại trường.3 Các hướng tiếp cận Tìm hiểu về Thông tư số 09/2017/TT-BLĐTBXH về cách xếp loại điểm trung bình chung khoá học của sinh viên và từ phần mềm quản lý đào tạo hiện có tại trường, qua đó tìm hiểu cấu trúc của Cơ sở dữ liệu để có những đánh giá sơ bộ về phần mềm. Từ đó, tác giả tìm hiểu về kết quả học tập của sinh viên theo khoá học có trên phần mềm để có cơ sở tổng hợp những kết quả theo quy định, làm tiền đề cho việc so sánh với kết quả khi sử dụng các thuật toán phân cụm mờ trong đề tài. Trong quá trình tìm hiểu về dữ liệu, tác giả cũng viết một thủ tục với các tham số khác nhau như ngành đào tạo, khoá học để truy xuất dữ liệu từ hệ thống phần mềm quản lý đào tạo hiện có để có cái nhìn tổng quan về dữ liệu của hệ thống với các khoá đã tốt nghiệp ra trường; sau đó, tác giả tiến đến việc làm sạch dữ liệu và mã hoá dữ liệu theo từng ngành đào tạo cụ thể. 9 Tác giả từng bước cài đặt thuật toán K-means, thuật toán FCM (Fuzzy c-means) [2], thuật toán εFCM (ε-Insensitive Fuzzy c-means) để kiểm tra với 15 tập dữ liệu cụ thể khi xuất ra bao gồm hệ cao đẳng chính quy các ngành Dược học, Điều dưỡng, Kỹ thuật xét nghiệm, Phục hồi chức năng, hệ cao đẳng liên thông các ngành Dược học, Điều dưỡng, Hộ sinh và hệ trung cấp Y sỹ chính quy quốc tế Campuchia.

Từ những kết quả thu được, tác giả thực hiện biễu mẫu để so sánh các kết quả cụ thể từ quy chế cứng của Bộ và thông qua các thuật toán phân cụm đã cài đặt.4 Khó khăn và thách thức Hệ thống Quản lý đào tạo hiện có tại trường đang lưu trữ nhiều kết quả điểm của sinh viên, trong đó có cả những sinh viên bỏ học ngang hoặc bảo lưu, và có 2 học phần không được tính vào kết quả học tập toàn của sinh viên như Giáo dục thể chất, giáo dục Quốc phòng – an ninh; vì thế, việc thống kê đánh kết quả để so sánh các hình thức xếp loại sinh viên khác nhau dẫn đến nhiều kết quả không mong muốn. Ngoài khó khăn trên thì hệ thống còn phải lưu trữ nhiều quy chế tính điểm khác nhau theo quy định từ Bộ, qua đó, mỗi quy chế lại có cách lưu trữ và tính điểm khác nhau, dẫn đến việc không đồng nhất trong quá trình đánh giá phân loại của một sinh viên. Để kết xuất dữ liệu từ hệ thống quản lý đào tạo, tác giả phải viết thủ tục truy vấn cơ sở dữ liệu T-SQL để có thể truy xuất được các kết quả mong muốn và phải thực hiện tiền xử lý dữ liệu thô để có tập dữ liệu phù hợp; ngoài ra, do việc cài đặt thuật toán thử nghiệm trên nhiều ngành, khoá học khác nhau cũng dẫn đến việc xử lý dữ liệu cần thận trọng và cần nhiều thời gian.5 Đề xuất hướng giải quyết Tác giả đã xin số liệu từ cơ sở dữ liệu hiện có trên phần mềm Quản lý đào tạo tại trường Cao đẳng Y tế Đồng Tháp với các khoá đã tốt nghiệp có đầy đủ dữ liệu, bao gồm hệ cao đẳng chính quy các ngành Dược học, Điều dưỡng, Kỹ thuật xét nghiệm, Phục hồi chức năng, hệ cao đẳng liên thông các ngành Dược học, Điều dưỡng, Hộ sinh và hệ trung cấp Y sỹ chính quy quốc tế Campuchia. Số dữ liệu được thu thập từ 10 năm 2017 với các khoá học 2017-2020, 2017-2019, 2018-2020, 2018-2021, 2018- 2019.

Qua đó tác giả truy vấn T-SQL trực tiếp trên hệ thống cơ sở dữ liệu phần mềm và kết xuất kết quả ra 15 tập tin excel với định dạng CSV (comma delimited) khác nhau tương ứng với từng ngành, từng khoá học như hướng tiếp cận trên.

Nội dung được bảo vệ bản quyền — Tải xuống đầy đủ

Chủ đề

Ứng dụng học máy trong giáo dục

Khai phá dữ liệu và phân cụm

thuật toán phân cụm mờ