Dự báo khả năng bỏ học của sinh viên trường Đại học Bình Dương qua phân lớp dựa trên luật kết hợp

Trường đại học

Trường Đại học Sư phạm Kỹ thuật Thành phố Hồ Chí Minh

Chuyên ngành

Khoa học máy tính

Người đăng

Ẩn danh

Thể loại

luận văn

2021

137

Phí lưu trữ

35 Point

Mục lục chi tiết

LÝ LỊCH KHOA HỌC

LỜI CẢM ƠN

LỜI CAM ĐOAN

TÓM TẮT

1. CHƯƠNG 1: TỔNG QUAN

1.1. Lý do chọn đề tài

1.2. Mục tiêu của đề tài

1.3. Nhiệm vụ của đề tài

1.4. Đối tượng và phạm vi nghiên cứu

1.4.1. Đối tượng nghiên cứu

1.4.2. Phạm vi nghiên cứu

1.5. Cách tiếp cận và phương pháp nghiên cứu

1.6. Ý nghĩa thực tiễn của đề tài

1.7. Các công trình nghiên cứu gần đây

2. CHƯƠNG 2: CƠ SỞ LÝ THUYẾT

2.1. Các khái niệm cơ bản trong phân lớp

2.2. Phân lớp dựa trên luật kết hợp

2.3. Một số thuật giải phân lớp dựa trên luật kết hợp

2.3.1. Thuật giải CARIM (An Efficient Algorithm for Mining ClassAssociation Rules with Interestingness Measures)

2.3.2. Thuật giải MMAC (Multi-class, multi-label associative classification)

2.3.3. Thuật giải CBA (Classification Based on Associations)

2.3.4. Thuật giải CPAR (Classification based on Predictive Association Rules)

2.3.5. Thuật giải MISFP (Multiple Item Support Frequent Patterns)

2.3.6. Thuật giải FCBA (Fast Classification Based On Association Rules)

2.3.7. Thuật giải CMAR (Classification based on Multiple Association Rules)

2.3.8. Thuật giải MCAR (Multi class Classification based on Association Rule)

2.3.9. Thuật giải CPAR-GR (Predictive association rule based classifier using gain ratio)

2.3.10. Thuật giải WCBA (Weighted Classification Based On Association Rules)

2.4. Một số phương pháp tiền xử lý dữ liệu

2.4.1. Phương pháp lọc (filter method)

2.4.2. Phương pháp bao bọc (wrapper method)

2.4.3. Phương pháp nhúng (embedded method)

2.4.4. Phương pháp làm sạch dữ liệu bằng SPSS

2.4.5. Giới thiệu về phần mềm SPSS 23

2.4.6. Làm sạch dữ liệu bằng phần mềm SPSS

2.4.7. Ứng dụng vào đề tài dự báo khả năng bỏ học của sinh viên

3. CHƯƠNG 3: PHÂN LỚP DỰA TRÊN LUẬT KẾT HỢP

3.1. Mô tả thuật giải CPAR-GR

3.2. Ứng dụng thuật giải vào bài toán dự báo khả năng bỏ học của sinh viên, kết quả thực nghiệm

3.2.1. Mô tả bài toán

3.2.2. Phương pháp thực hiện

3.2.3. Xây dựng và lựa chọn mô hình

3.2.4. Minh họa thuật giải CPAR-GR

3.2.5. Giao diện chương trình demo

3.2.6. Mô tả dữ liệu tập huấn luyện, tập dữ liệu kiểm tra

3.2.7. Kết quả tạo luật từ thuật giải CPAR-GR trên tập huấn luyện

3.2.8. Đánh giá độ chính xác các luật từ thuật giải CPAR-GR trên tập huấn luyện

3.2.9. Sử dụng luật vào dự báo khả năng bỏ học của sinh viên

3.2.10. Kết quả đạt được

3.2.11. Hạn chế của đề tài

3.2.12. Hướng phát triển đề tài

4. CHƯƠNG 4: ỨNG DỤNG THUẬT GIẢI VÀO BÀI TOÁN DỰ BÁO KHẢ NĂNG BỎ HỌC CỦA SINH VIÊN

5. CHƯƠNG 5: KẾT LUẬN

TÀI LIỆU THAM KHẢO

Tóm tắt

I. Tổng quan

Trong bối cảnh giáo dục đại học hiện nay, việc dự báo khả năng bỏ học của sinh viên trở thành một vấn đề cấp thiết. Tình trạng sinh viên bỏ học gia tăng do nhiều nguyên nhân như thiếu kế hoạch học tập, không hiểu rõ tầm quan trọng của việc học. Việc áp dụng công nghệ thông tin, đặc biệt là kỹ thuật phân lớp luật kết hợp, giúp dự đoán khả năng bỏ học và đưa ra giải pháp kịp thời. Mục tiêu của nghiên cứu này là tìm hiểu và ứng dụng thuật giải CPAR-GR để dự báo khả năng bỏ học của sinh viên tại Trường Đại học Bình Dương.

1.1. Lý do chọn đề tài

Môi trường giáo dục đại học hiện nay yêu cầu sinh viên phải tự hoạch định chiến lược học tập. Tuy nhiên, nhiều sinh viên không có kế hoạch rõ ràng, dẫn đến kết quả học tập kém và tình trạng bỏ học gia tăng. Việc ứng dụng công nghệ thông tin trong việc khai thác dữ liệu học tập sẽ giúp cải thiện tình hình này. Nghiên cứu này nhằm mục đích phát triển một hệ thống dự báo khả năng bỏ học của sinh viên, từ đó giúp các đơn vị giáo dục có biện pháp hỗ trợ kịp thời.

II. Cơ sở lý thuyết

Chương này trình bày các khái niệm cơ bản liên quan đến khai phá luật kết hợp và phân lớp. Phân lớp dựa trên luật kết hợp là một kỹ thuật mạnh mẽ trong việc phân tích dữ liệu. Thuật giải CPAR-GR được sử dụng để tìm ra các quy tắc kết hợp và dự đoán khả năng bỏ học của sinh viên. Các khái niệm như tập mục phổ biến và độ tin cậy của luật kết hợp cũng được đề cập. Việc hiểu rõ các thuật toán này là cần thiết để áp dụng vào thực tiễn.

2.1. Khai phá luật kết hợp

Khai phá luật kết hợp là quá trình tìm kiếm các mối quan hệ giữa các biến trong tập dữ liệu. Các quy tắc kết hợp giúp xác định các yếu tố ảnh hưởng đến khả năng bỏ học của sinh viên. Việc áp dụng các thuật toán như CPAR-GR cho phép phân tích sâu hơn về dữ liệu sinh viên, từ đó đưa ra các dự đoán chính xác hơn về khả năng bỏ học.

III. Phân lớp dựa trên luật kết hợp

Chương này tập trung vào việc trình bày chi tiết về thuật giải CPAR-GR. Thuật giải này cho phép tạo ra các luật kết hợp từ dữ liệu sinh viên và phân lớp dựa trên các luật này. Việc áp dụng thuật giải CPAR-GR giúp cải thiện độ chính xác trong việc dự đoán khả năng bỏ học. Các bước thực hiện và kết quả đạt được từ việc áp dụng thuật giải này sẽ được phân tích kỹ lưỡng.

3.1. Ý tưởng thực hiện

Ý tưởng chính của chương này là sử dụng thuật giải CPAR-GR để tạo ra các luật kết hợp từ dữ liệu sinh viên. Các luật này sẽ được sử dụng để phân lớp sinh viên thành các nhóm có khả năng bỏ học cao và thấp. Việc phân tích các yếu tố ảnh hưởng đến khả năng bỏ học sẽ giúp các nhà quản lý giáo dục có cái nhìn rõ hơn về tình hình học tập của sinh viên.

IV. Ứng dụng thuật giải vào bài toán dự báo

Chương này mô tả chi tiết về bài toán dự báo khả năng bỏ học của sinh viên. Các phương pháp thực hiện, cấu trúc dữ liệu đầu vào và đầu ra, cũng như kết quả thực nghiệm sẽ được trình bày. Việc xây dựng chương trình demo dự báo khả năng bỏ học của sinh viên bằng thuật giải CPAR-GR sẽ được thực hiện và đánh giá.

4.1. Mô tả bài toán

Bài toán dự báo khả năng bỏ học của sinh viên được mô tả thông qua việc phân tích dữ liệu học tập của sinh viên. Các yếu tố như điểm số, thời gian học tập và các hoạt động ngoại khóa sẽ được xem xét. Việc sử dụng thuật giải CPAR-GR sẽ giúp xác định các yếu tố chính ảnh hưởng đến khả năng bỏ học và từ đó đưa ra các dự đoán chính xác.

V. Kết luận

Nghiên cứu này đã chỉ ra rằng việc áp dụng kỹ thuật phân lớp luật kết hợp có thể giúp dự báo khả năng bỏ học của sinh viên một cách hiệu quả. Kết quả thực nghiệm cho thấy độ chính xác cao của thuật giải CPAR-GR trong việc phân tích dữ liệu sinh viên. Hướng phát triển trong tương lai có thể bao gồm việc mở rộng mô hình dự báo và áp dụng vào các trường đại học khác.

5.1. Hướng phát triển

Hướng phát triển tiếp theo của nghiên cứu này có thể là mở rộng mô hình dự báo để áp dụng cho các trường đại học khác. Việc tích hợp thêm các yếu tố khác như tâm lý sinh viên và môi trường học tập cũng có thể giúp cải thiện độ chính xác của dự báo. Nghiên cứu này không chỉ có giá trị trong việc dự báo khả năng bỏ học mà còn có thể áp dụng trong nhiều lĩnh vực khác trong giáo dục.

25/01/2025

Bạn đang xem trước tài liệu:

Luận văn thạc sĩ hcmute phân lớp dựa trên luật kết hợp để dự báo khả năng bỏ học của sinh viên trường đại học bình dương

Tải đầy đủ

Nội dung chính

Tổng quan nghiên cứu

Trong bối cảnh giáo dục đại học hiện nay, đặc biệt là các trường đào tạo theo hệ thống tín chỉ, tình trạng sinh viên bỏ học đang trở thành vấn đề đáng báo động. Tại Trường Đại học Bình Dương, tỷ lệ sinh viên bị cảnh báo học vụ và bỏ học có xu hướng tăng, ảnh hưởng trực tiếp đến chất lượng đào tạo và uy tín của nhà trường. Theo số liệu thống kê từ các khóa học chính quy năm 2017 đến 2020, tỷ lệ sinh viên bỏ học dao động khoảng 10-15%, trong khi đó, nhiều sinh viên chưa có kế hoạch học tập rõ ràng, dẫn đến kết quả học tập giảm sút và tinh thần học tập kém.

Mục tiêu nghiên cứu của luận văn là ứng dụng kỹ thuật phân lớp dựa trên luật kết hợp, cụ thể là thuật giải CPAR-GR, để dự báo khả năng bỏ học của sinh viên Trường Đại học Bình Dương. Nghiên cứu tập trung vào dữ liệu học tập của sinh viên từ năm 1 đến năm 4, trong phạm vi thời gian từ năm 2017 đến 2020, nhằm xây dựng mô hình dự báo chính xác và hiệu quả.

Ý nghĩa của nghiên cứu không chỉ giúp nhà trường có cơ sở khoa học để phát hiện sớm sinh viên có nguy cơ bỏ học mà còn hỗ trợ các đơn vị chuyên trách xây dựng các giải pháp can thiệp kịp thời, giảm tỷ lệ bỏ học và nâng cao chất lượng đào tạo. Việc ứng dụng công nghệ thông tin và khai phá dữ liệu trong giáo dục đại học góp phần thúc đẩy chuyển đổi số trong quản lý đào tạo, đồng thời nâng cao hiệu quả công tác tư vấn học tập và hỗ trợ sinh viên.

Cơ sở lý thuyết và phương pháp nghiên cứu

Khung lý thuyết áp dụng

Luận văn dựa trên các lý thuyết và mô hình chính sau:

Khai phá luật kết hợp (Association Rule Mining): Là kỹ thuật tìm kiếm các luật kết hợp trong cơ sở dữ liệu, biểu diễn dưới dạng X ⇒ Y, với X và Y là các tập mục không giao nhau. Luật kết hợp được đánh giá bằng hai chỉ số chính là độ hỗ trợ (support) và độ tin cậy (confidence). Ví dụ, một luật có độ hỗ trợ 0.75 nghĩa là 75% giao dịch chứa cả X và Y, còn độ tin cậy 0.8 nghĩa là 80% giao dịch chứa X cũng chứa Y.
Phân lớp dựa trên luật kết hợp (Classification based on Association Rules): Là quá trình xây dựng mô hình phân lớp dựa trên các luật kết hợp có chứa nhãn lớp ở vế phải. Mục tiêu là tìm ra các luật có độ chính xác cao để phân loại dữ liệu mới.
Thuật giải CPAR-GR (Predictive Association Rule based Classifier using Gain Ratio): Là thuật giải cải tiến của CPAR, kết hợp phương pháp thống kê T-test để lựa chọn thuộc tính quan trọng, giảm kích thước dữ liệu và nâng cao độ chính xác của luật phân lớp. Thuật giải sử dụng độ chính xác Laplace để đánh giá luật và chọn ra các luật tốt nhất phục vụ phân lớp.
Phương pháp tiền xử lý dữ liệu bằng SPSS: Sử dụng phần mềm SPSS để làm sạch dữ liệu, loại bỏ các biến không quan trọng dựa trên phân tích thống kê T-test, giúp giảm thiểu chi phí xử lý và tăng hiệu quả mô hình.

Phương pháp nghiên cứu

Nguồn dữ liệu nghiên cứu là bộ dữ liệu thực tế về quá trình học tập của sinh viên chính quy từ năm 1 đến năm 4 tại Trường Đại học Bình Dương, bao gồm các khóa 2017, 2018, 2019 và 2020. Dữ liệu được mã hóa để bảo mật thông tin cá nhân.

Phương pháp nghiên cứu kết hợp:

Nghiên cứu lý thuyết: Tổng hợp, phân tích các thuật toán phân lớp dựa trên luật kết hợp, đặc biệt là CPAR-GR.
Thu thập và xử lý dữ liệu: Tiền xử lý dữ liệu bằng phần mềm SPSS để làm sạch và lựa chọn thuộc tính quan trọng thông qua phân tích T-test.
Xây dựng mô hình: Áp dụng thuật giải CPAR-GR để khai thác luật kết hợp và xây dựng mô hình phân lớp dự báo khả năng bỏ học.
Thực nghiệm và đánh giá: Chạy thử chương trình demo viết bằng Python, đánh giá độ chính xác của mô hình trên tập dữ liệu huấn luyện và kiểm tra.

Timeline nghiên cứu kéo dài từ tháng 9/2019 đến tháng 4/2021, bao gồm các giai đoạn: thu thập dữ liệu, tiền xử lý, xây dựng mô hình, thực nghiệm và hoàn thiện luận văn.

Kết quả nghiên cứu và thảo luận

Những phát hiện chính

Hiệu quả của phương pháp tiền xử lý dữ liệu bằng SPSS: Qua phân tích T-test, khoảng 30% biến không có tác động đáng kể đến khả năng bỏ học của sinh viên đã được loại bỏ, giúp giảm kích thước dữ liệu và tăng tốc độ xử lý. Ví dụ, các biến như giới tính, quê quán không ảnh hưởng nhiều, trong khi điểm trung bình học kỳ và số tín chỉ tích lũy có ảnh hưởng lớn.
Độ chính xác của mô hình CPAR-GR: Mô hình phân lớp dựa trên luật kết hợp CPAR-GR đạt độ chính xác trung bình trên 85% khi dự báo khả năng bỏ học trên tập kiểm tra, cao hơn khoảng 10% so với các thuật toán phân lớp truyền thống như C4.5 hoặc Naive Bayes.
Luật kết hợp quan trọng được phát hiện: Một số luật có độ tin cậy trên 90% cho thấy sinh viên có điểm trung bình học kỳ dưới 5.0 và số tín chỉ tích lũy thấp có nguy cơ bỏ học cao. Luật này được minh họa trong bảng kết quả tạo luật với độ hỗ trợ 0.15 và độ tin cậy 0.92.
Ứng dụng thực tế của chương trình demo: Giao diện chương trình demo dự báo khả năng bỏ học được xây dựng bằng Python, cho phép nhập dữ liệu sinh viên và dự báo nhanh chóng. Kết quả thực nghiệm cho thấy chương trình có thể hỗ trợ cán bộ quản lý đào tạo trong việc phát hiện sớm sinh viên có nguy cơ bỏ học.

Thảo luận kết quả

Nguyên nhân chính dẫn đến khả năng bỏ học của sinh viên là do thiếu kế hoạch học tập, điểm trung bình thấp và số tín chỉ tích lũy không đạt yêu cầu. Kết quả phân tích thống kê và mô hình phân lớp cho thấy các biến này có ảnh hưởng rõ rệt, phù hợp với thực trạng tại nhiều trường đại học đào tạo theo hệ thống tín chỉ.

So sánh với các nghiên cứu trước đây, mô hình CPAR-GR kết hợp với tiền xử lý dữ liệu bằng SPSS cho kết quả dự báo chính xác hơn, đồng thời giảm thiểu chi phí tính toán. Điều này phù hợp với các nghiên cứu ứng dụng phân lớp dựa trên luật kết hợp trong lĩnh vực giáo dục và y tế, nơi dữ liệu thường có tính phức tạp và mất cân bằng.

Dữ liệu có thể được trình bày qua các biểu đồ phân bố điểm trung bình, số tín chỉ tích lũy và tỷ lệ bỏ học theo từng khóa, giúp trực quan hóa mối quan hệ giữa các biến và khả năng bỏ học. Bảng tổng hợp các luật kết hợp quan trọng cũng hỗ trợ việc đánh giá và lựa chọn các yếu tố ảnh hưởng.

Đề xuất và khuyến nghị

Xây dựng hệ thống cảnh báo sớm: Áp dụng mô hình phân lớp CPAR-GR vào hệ thống quản lý đào tạo để tự động cảnh báo sinh viên có nguy cơ bỏ học, giúp cán bộ tư vấn kịp thời can thiệp. Mục tiêu giảm tỷ lệ bỏ học xuống dưới 10% trong vòng 2 năm tới.
Tăng cường tư vấn học tập: Tổ chức các buổi hướng dẫn lập kế hoạch học tập cho sinh viên, đặc biệt là năm đầu, nhằm nâng cao nhận thức về tầm quan trọng của việc tích lũy tín chỉ và điểm số. Thời gian triển khai trong học kỳ đầu năm học.
Cải tiến chương trình đào tạo: Điều chỉnh nội dung và phương pháp giảng dạy phù hợp với năng lực sinh viên, tăng cường hỗ trợ học tập cho nhóm sinh viên có điểm trung bình thấp. Chủ thể thực hiện là các khoa và phòng đào tạo trong vòng 1 năm.
Đào tạo cán bộ quản lý: Nâng cao năng lực sử dụng công nghệ thông tin và phân tích dữ liệu cho cán bộ quản lý đào tạo để khai thác hiệu quả các công cụ dự báo và hỗ trợ ra quyết định. Thời gian đào tạo định kỳ hàng năm.

Đối tượng nên tham khảo luận văn

Cán bộ quản lý đào tạo đại học: Giúp hiểu rõ về ứng dụng kỹ thuật khai phá dữ liệu trong quản lý sinh viên, từ đó xây dựng các chính sách hỗ trợ phù hợp.
Giảng viên và cố vấn học tập: Sử dụng mô hình dự báo để phát hiện sớm sinh viên có nguy cơ bỏ học, từ đó có biện pháp tư vấn và hỗ trợ kịp thời.
Nhà nghiên cứu trong lĩnh vực khoa học máy tính và giáo dục: Tham khảo phương pháp phân lớp dựa trên luật kết hợp CPAR-GR và kỹ thuật tiền xử lý dữ liệu bằng SPSS để phát triển các nghiên cứu tiếp theo.
Sinh viên ngành khoa học máy tính và công nghệ thông tin: Học hỏi về ứng dụng thực tế của thuật toán khai phá dữ liệu và xây dựng chương trình demo dự báo trong môi trường giáo dục.

Câu hỏi thường gặp

Phân lớp dựa trên luật kết hợp là gì?
Phân lớp dựa trên luật kết hợp là kỹ thuật xây dựng mô hình phân loại dựa trên các luật kết hợp có chứa nhãn lớp, giúp dự đoán nhãn cho dữ liệu mới dựa trên các luật đã tìm được.
Thuật giải CPAR-GR có ưu điểm gì so với các thuật toán khác?
CPAR-GR kết hợp phương pháp thống kê T-test để chọn thuộc tính quan trọng, giảm kích thước dữ liệu và nâng cao độ chính xác của luật phân lớp, đồng thời giảm chi phí tính toán so với các thuật toán truyền thống.
Tại sao cần tiền xử lý dữ liệu bằng SPSS?
Tiền xử lý giúp loại bỏ các biến không quan trọng, làm sạch dữ liệu, giảm nhiễu và tăng hiệu quả mô hình phân lớp, đồng thời giảm thời gian và tài nguyên xử lý.
Mô hình dự báo có thể áp dụng cho các trường đại học khác không?
Có, mô hình có thể được điều chỉnh và áp dụng cho các trường đại học khác có dữ liệu tương tự, giúp dự báo khả năng bỏ học và hỗ trợ quản lý đào tạo.
Chương trình demo dự báo hoạt động như thế nào?
Chương trình cho phép nhập dữ liệu sinh viên, sử dụng thuật giải CPAR-GR để phân tích và dự báo khả năng bỏ học, hỗ trợ cán bộ quản lý đưa ra quyết định kịp thời.

Kết luận

Luận văn đã ứng dụng thành công thuật giải CPAR-GR kết hợp với tiền xử lý dữ liệu bằng SPSS để dự báo khả năng bỏ học của sinh viên Trường Đại học Bình Dương với độ chính xác trên 85%.
Phương pháp tiền xử lý giúp loại bỏ khoảng 30% biến không quan trọng, giảm chi phí tính toán và nâng cao hiệu quả mô hình.
Các luật kết hợp quan trọng được phát hiện giúp nhận diện rõ các yếu tố ảnh hưởng đến khả năng bỏ học như điểm trung bình học kỳ và số tín chỉ tích lũy.
Chương trình demo dự báo được xây dựng bằng Python, có thể ứng dụng thực tế trong quản lý đào tạo và tư vấn học tập.
Đề xuất các giải pháp cảnh báo sớm, tư vấn học tập, cải tiến chương trình đào tạo và đào tạo cán bộ nhằm giảm tỷ lệ bỏ học trong thời gian tới.

Tiếp theo, nghiên cứu sẽ mở rộng phạm vi dữ liệu, áp dụng thêm các thuật toán phân lớp khác và phát triển hệ thống dự báo tích hợp để nâng cao hiệu quả ứng dụng trong thực tế. Đề nghị các đơn vị quản lý đào tạo và nghiên cứu tiếp tục phối hợp triển khai và hoàn thiện mô hình dự báo này.

Bài viết "Dự báo khả năng bỏ học của sinh viên trường Đại học Bình Dương qua phân lớp dựa trên luật kết hợp" của tác giả Thái Thanh Hùng, dưới sự hướng dẫn của TS. Nguyễn Thành Sơn, tập trung vào việc áp dụng các phương pháp phân lớp để dự đoán khả năng bỏ học của sinh viên. Nghiên cứu này không chỉ giúp các nhà quản lý giáo dục nhận diện sớm những sinh viên có nguy cơ bỏ học mà còn cung cấp các giải pháp can thiệp kịp thời, từ đó nâng cao tỷ lệ giữ chân sinh viên và cải thiện chất lượng giáo dục tại trường.

Để mở rộng thêm kiến thức về các yếu tố ảnh hưởng đến sự hài lòng và chất lượng dịch vụ trong giáo dục, bạn có thể tham khảo bài viết Đánh Giá Sự Hài Lòng Của Sinh Viên Về Chất Lượng Dịch Vụ Tại Trường Đại Học Ngoại Thương, nơi nghiên cứu sự hài lòng của sinh viên đối với dịch vụ giáo dục. Bên cạnh đó, bài viết Nghiên cứu tác động của chất lượng dịch vụ đào tạo tới sự hài lòng của sinh viên các trường đại học tại Hà Nội cũng sẽ cung cấp cái nhìn sâu sắc về mối liên hệ giữa chất lượng dịch vụ và sự hài lòng của sinh viên. Cuối cùng, bài viết Quản Lý Chất Lượng Đào Tạo Đại Học Từ Xa Ở Việt Nam Theo Tiêu Chuẩn AAOU sẽ giúp bạn hiểu rõ hơn về các tiêu chuẩn chất lượng trong giáo dục đại học, đặc biệt là trong bối cảnh tự chủ giáo dục hiện nay. Những tài liệu này sẽ giúp bạn mở rộng kiến thức và có cái nhìn toàn diện hơn về các vấn đề liên quan đến giáo dục đại học.

#phân tích dữ liệu giáo dục

#Dự báo bỏ học

#Sinh viên Đại học Bình Dương

#Phân lớp luật kết hợp

#Khả năng bỏ học

#Học sinh đại học

Chủ đề

Giáo dục đại học

Công nghệ trong giáo dục

Phân tích dữ liệu trong giáo dục

Hành vi sinh viên

Dự báo khả năng bỏ học của sinh viên trường Đại học Bình Dương qua phân lớp dựa trên luật kết hợp

LÝ LỊCH KHOA HỌC

LỜI CẢM ƠN

LỜI CAM ĐOAN

TÓM TẮT

1. CHƯƠNG 1: TỔNG QUAN

1.1. Lý do chọn đề tài

1.2. Mục tiêu của đề tài

1.3. Nhiệm vụ của đề tài

1.4. Đối tượng và phạm vi nghiên cứu

1.4.1. Đối tượng nghiên cứu

1.4.2. Phạm vi nghiên cứu

1.5. Cách tiếp cận và phương pháp nghiên cứu

1.6. Ý nghĩa thực tiễn của đề tài

1.7. Các công trình nghiên cứu gần đây

2. CHƯƠNG 2: CƠ SỞ LÝ THUYẾT

2.1. Các khái niệm cơ bản trong phân lớp

2.2. Phân lớp dựa trên luật kết hợp

2.3. Một số thuật giải phân lớp dựa trên luật kết hợp

2.3.1. Thuật giải CARIM (An Efficient Algorithm for Mining ClassAssociation Rules with Interestingness Measures)

2.3.2. Thuật giải MMAC (Multi-class, multi-label associative classification)

2.3.3. Thuật giải CBA (Classification Based on Associations)

2.3.4. Thuật giải CPAR (Classification based on Predictive Association Rules)

2.3.5. Thuật giải MISFP (Multiple Item Support Frequent Patterns)

2.3.6. Thuật giải FCBA (Fast Classification Based On Association Rules)

2.3.7. Thuật giải CMAR (Classification based on Multiple Association Rules)

2.3.8. Thuật giải MCAR (Multi class Classification based on Association Rule)

2.3.9. Thuật giải CPAR-GR (Predictive association rule based classifier using gain ratio)

2.3.10. Thuật giải WCBA (Weighted Classification Based On Association Rules)

2.4. Một số phương pháp tiền xử lý dữ liệu

2.4.1. Phương pháp lọc (filter method)

2.4.2. Phương pháp bao bọc (wrapper method)

2.4.3. Phương pháp nhúng (embedded method)

2.4.4. Phương pháp làm sạch dữ liệu bằng SPSS

2.4.5. Giới thiệu về phần mềm SPSS 23

2.4.6. Làm sạch dữ liệu bằng phần mềm SPSS

2.4.7. Ứng dụng vào đề tài dự báo khả năng bỏ học của sinh viên

3. CHƯƠNG 3: PHÂN LỚP DỰA TRÊN LUẬT KẾT HỢP

3.1. Mô tả thuật giải CPAR-GR

3.2. Ứng dụng thuật giải vào bài toán dự báo khả năng bỏ học của sinh viên, kết quả thực nghiệm

3.2.1. Mô tả bài toán

3.2.2. Phương pháp thực hiện

3.2.3. Xây dựng và lựa chọn mô hình

3.2.4. Minh họa thuật giải CPAR-GR

3.2.5. Giao diện chương trình demo

3.2.6. Mô tả dữ liệu tập huấn luyện, tập dữ liệu kiểm tra

3.2.7. Kết quả tạo luật từ thuật giải CPAR-GR trên tập huấn luyện

3.2.8. Đánh giá độ chính xác các luật từ thuật giải CPAR-GR trên tập huấn luyện

3.2.9. Sử dụng luật vào dự báo khả năng bỏ học của sinh viên

3.2.10. Kết quả đạt được

3.2.11. Hạn chế của đề tài

3.2.12. Hướng phát triển đề tài

4. CHƯƠNG 4: ỨNG DỤNG THUẬT GIẢI VÀO BÀI TOÁN DỰ BÁO KHẢ NĂNG BỎ HỌC CỦA SINH VIÊN

5. CHƯƠNG 5: KẾT LUẬN

TÀI LIỆU THAM KHẢO

I. Tổng quan

1.1. Lý do chọn đề tài

II. Cơ sở lý thuyết

2.1. Khai phá luật kết hợp

III. Phân lớp dựa trên luật kết hợp

3.1. Ý tưởng thực hiện

IV. Ứng dụng thuật giải vào bài toán dự báo

4.1. Mô tả bài toán

V. Kết luận

5.1. Hướng phát triển

TÀI LIỆU LIÊN QUAN

THÔNG TIN CHI TIẾT

Tác giả: Thái Thanh Hùng

Người hướng dẫn: TS. Nguyễn Thành Sơn

Trường học: Trường Đại học Sư phạm Kỹ thuật Thành phố Hồ Chí Minh

Chuyên ngành: Khoa học máy tính

Đề tài: Dự Báo Khả Năng Bỏ Học Của Sinh Viên Đại Học Bình Dương Bằng Phân Lớp Luật Kết Hợp

Loại tài liệu: luận văn

Năm xuất bản: 2021

Địa điểm: Hồ Chí Minh

Tổng quan nghiên cứu

Cơ sở lý thuyết và phương pháp nghiên cứu

Khung lý thuyết áp dụng

Phương pháp nghiên cứu

Kết quả nghiên cứu và thảo luận