Luận văn thạc sĩ ứng dụng khai phá dữ liệu để xây dựng hệ thống tư vấn học tập tại trường đại học công nghiệp hà nội 04

Luận văn thạc sĩ kỹ thuật phân tích ứng dụng khai phá dữ liệu để xây dựng hệ thống tư vấn học tập tại trường đại học công nghiệp hà nội, đánh giá thực trạng, chỉ ra hạn chế, đề

Trường đại học

Đại học Công nghiệp Hà Nội

Chuyên ngành

Công nghệ thông tin

Người đăng

Ẩn danh

Thể loại

luận văn thạc sĩ

2015

Phí lưu trữ

30 Point

Mục lục chi tiết

LỜI CẢM ƠN

LỜI CAM ĐOAN

DANH MỤC CÁC KÝ HIỆU VÀ CHỮ VIẾT TẮT

DANH MỤC CÁC BẢNG

DANH MỤC CÁC HÌNH VẼ, ĐỒ THỊ

1. CHƯƠNG 1: GIỚI THIỆU TỔNG QUAN

1.1. Bài toán ứng dụng KPDL để xây dựng hệ thống tư vấn tại trường ĐHCNHN

1.2. Một số hướng nghiên cứu về khai phá dữ liệu trong lĩnh vực giáo dục hiện nay

1.3. Hướng tiếp cận của luận văn

1.4. Kết luận chương 1

2. CHƯƠNG 2: CÁC KIẾN THỨC CƠ SỞ LIÊN QUAN

2.1. Khai phá dữ liệu

2.2. Khái niệm KPDL

2.3. Những nhóm bài toán của KPDL

2.4. Các bước xây dựng một giải pháp về KPDL

2.5. Ứng dụng KPDL trong giáo dục

2.5.1. Các ứng dụng hướng đến học sinh, sinh viên

3. CHƯƠNG 3: PHƯƠNG PHÁP GIẢI QUYẾT BÀI TOÁN

3.1. Tìm hiểu và thu thập dữ liệu điểm

3.2. Xây dựng mô hình

3.3. Lập trình KPDL với Analysis Services APIs

3.3.1. Đánh giá các mô hình dự báo với Lift Chart

3.3.2. Đánh giá các mô hình dự báo với Classification Matrix

3.4. Kết luận chương 3

4. CHƯƠNG 4: XÂY DỰNG HỆ THỐNG TƯ VẤN HỌC TẬP TẠI TRƯỜNG ĐHCNHN

HƯỚNG PHÁT TRIỂN

TÀI LIỆU THAM KHẢO

Tóm tắt

I. Giới thiệu tổng quan

Trường Đại học Công nghiệp Hà Nội là một cơ sở giáo dục lớn, cung cấp nhiều chương trình đào tạo đa dạng. Việc xây dựng hệ thống tư vấn học tập là cần thiết để hỗ trợ sinh viên trong việc lựa chọn lộ trình học phù hợp. Khai phá dữ liệu (KPDL) được ứng dụng để phân tích thông tin từ điểm số và lộ trình học, nhằm dự đoán kết quả học tập của sinh viên. Điều này không chỉ giúp sinh viên có sự lựa chọn tốt hơn mà còn nâng cao chất lượng đào tạo của nhà trường. Theo đó, việc áp dụng công nghệ thông tin trong quản lý giáo dục là một xu hướng tất yếu, giúp tối ưu hóa quy trình tư vấn và quản lý học tập.

1.1. Bài toán ứng dụng KPDL

Bài toán tư vấn lựa chọn lộ trình học cho sinh viên được chia thành hai bước chính: liệt kê toàn bộ lộ trình học và dự đoán kết quả học tập. Việc này giúp sinh viên có cái nhìn tổng quan về các lựa chọn của mình và đưa ra quyết định dựa trên dữ liệu thực tế. Hệ thống thông tin sẽ hỗ trợ trong việc thu thập và phân tích dữ liệu, từ đó đưa ra các khuyến nghị hợp lý cho sinh viên. Việc sử dụng các mô hình KPDL như cây quyết định, luật kết hợp, và mạng nơ ron nhân tạo sẽ giúp nâng cao độ chính xác trong dự đoán kết quả học tập.

II. Các kiến thức cơ sở liên quan

KPDL là quá trình phân tích và khai thác thông tin từ các khối dữ liệu lớn. Các bước cơ bản trong KPDL bao gồm: lựa chọn dữ liệu, tiền xử lý, và trích xuất mẫu. Việc áp dụng KPDL trong giáo dục giúp phát hiện các mẫu học tập, từ đó đưa ra các quyết định thông minh hơn cho sinh viên. Phân tích dữ liệu không chỉ giúp cải thiện chất lượng giảng dạy mà còn hỗ trợ sinh viên trong việc lựa chọn ngành học và môn học phù hợp. Các kỹ thuật như phân loại, phân cụm, và hồi quy đều có thể được áp dụng để tối ưu hóa quá trình học tập.

2.1. Khái niệm KPDL

KPDL là một lĩnh vực nghiên cứu quan trọng, giúp trích xuất thông tin có giá trị từ dữ liệu lớn. Quá trình này bao gồm nhiều bước như làm sạch dữ liệu, chuyển đổi dữ liệu, và xây dựng mô hình. Việc áp dụng KPDL trong giáo dục không chỉ giúp cải thiện kết quả học tập mà còn tạo ra các mô hình dự đoán chính xác hơn cho sinh viên. Các ứng dụng của KPDL trong giáo dục bao gồm tư vấn chọn ngành học, môn học, và lộ trình học, giúp sinh viên có sự lựa chọn tốt nhất cho tương lai của mình.

III. Phương pháp giải quyết bài toán

Để giải quyết bài toán tư vấn học tập, cần thu thập và xử lý dữ liệu điểm của sinh viên. Việc xây dựng mô hình KPDL sẽ dựa trên các thuật toán như cây quyết định, Naïve Bayes, và mạng nơ ron nhân tạo. Mỗi mô hình sẽ được đánh giá dựa trên độ chính xác và khả năng dự đoán kết quả học tập. Việc lựa chọn mô hình tốt nhất sẽ giúp tối ưu hóa quy trình tư vấn cho sinh viên, từ đó nâng cao chất lượng đào tạo của nhà trường. Hệ thống thông tin quản lý sẽ đóng vai trò quan trọng trong việc thu thập và phân tích dữ liệu, giúp đưa ra các quyết định chính xác hơn.

3.1. Xây dựng mô hình

Quá trình xây dựng mô hình KPDL bao gồm việc xác định mục tiêu, thu thập dữ liệu, và làm sạch dữ liệu. Sau đó, các mô hình sẽ được xây dựng và đánh giá dựa trên các tiêu chí như độ chính xác và khả năng dự đoán. Việc áp dụng các mô hình KPDL sẽ giúp sinh viên có được những khuyến nghị hợp lý về lộ trình học tập, từ đó nâng cao kết quả học tập của họ. Ứng dụng công nghệ thông tin trong việc xây dựng mô hình sẽ giúp tối ưu hóa quy trình và nâng cao hiệu quả tư vấn.

IV. Xây dựng hệ thống tư vấn học tập

Hệ thống tư vấn học tập tại Đại học Công nghiệp Hà Nội sẽ được xây dựng dựa trên các mô hình KPDL đã được đánh giá. Hệ thống này sẽ cung cấp cho sinh viên các thông tin cần thiết để lựa chọn lộ trình học phù hợp. Việc áp dụng công nghệ thông tin trong hệ thống sẽ giúp tối ưu hóa quy trình tư vấn và quản lý học tập. Hệ thống sẽ sử dụng các thuật toán KPDL để phân tích dữ liệu và đưa ra các khuyến nghị cho sinh viên. Điều này không chỉ giúp sinh viên có sự lựa chọn tốt hơn mà còn nâng cao chất lượng đào tạo của nhà trường.

4.1. Hướng phát triển

Hệ thống tư vấn học tập sẽ được phát triển theo hướng tích hợp nhiều công nghệ mới, nhằm nâng cao hiệu quả tư vấn cho sinh viên. Việc áp dụng các công nghệ như trí tuệ nhân tạo và học máy sẽ giúp cải thiện độ chính xác của các dự đoán. Hệ thống cũng sẽ được mở rộng để phục vụ cho nhiều đối tượng sinh viên khác nhau, từ đó đáp ứng nhu cầu học tập đa dạng của sinh viên. Phát triển kỹ năng cho sinh viên thông qua hệ thống tư vấn sẽ là một trong những mục tiêu quan trọng trong tương lai.

25/01/2025

Bạn đang xem trước tài liệu:

Luận văn thạc sĩ ứng dụng khai phá dữ liệu để xây dựng hệ thống tư vấn học tập tại trường đại học công nghiệp hà nội 04

Tải đầy đủ

Nội dung chính

Tổng quan nghiên cứu

Trong bối cảnh giáo dục đại học hiện đại, việc nâng cao chất lượng đào tạo đồng thời mở rộng quy mô tuyển sinh là một thách thức lớn đối với các trường đại học, đặc biệt là các trường đào tạo đa ngành như Trường Đại học Công nghiệp Hà Nội (ĐHCNHN). Với quy mô đào tạo trên 50.000 sinh viên thuộc nhiều ngành nghề khác nhau, từ công nghệ, kỹ thuật đến kinh tế, may mặc, sư phạm và du lịch, nhà trường cần có các giải pháp quản lý và tư vấn học tập hiệu quả nhằm hỗ trợ sinh viên lựa chọn lộ trình học phù hợp, tối ưu hóa kết quả học tập. Từ năm học 2008-2009, ĐHCNHN đã triển khai đào tạo theo hệ thống tín chỉ, tạo điều kiện cho sinh viên tự chủ trong việc lựa chọn môn học và lộ trình học tập. Tuy nhiên, việc tư vấn học tập trong môi trường đào tạo tín chỉ vẫn còn nhiều khó khăn do khối lượng dữ liệu lớn và phức tạp, cũng như sự đa dạng trong lựa chọn lộ trình học.

Luận văn tập trung vào ứng dụng khai phá dữ liệu (KPDL) để xây dựng hệ thống tư vấn học tập tại ĐHCNHN, nhằm dự đoán kết quả học tập cuối khóa của sinh viên dựa trên thông tin cá nhân, điểm tuyển sinh đầu vào và các lộ trình học có thể lựa chọn. Mục tiêu cụ thể là phát triển các mô hình dự báo kết quả học tập bằng các thuật toán KPDL như cây quyết định, Naïve Bayes, mạng nơ ron nhân tạo và luật kết hợp, từ đó lựa chọn mô hình có độ chính xác cao nhất để áp dụng trong hệ thống tư vấn. Nghiên cứu sử dụng dữ liệu điểm của 3402 sinh viên thuộc 21 ngành học, với hơn 233.000 bản ghi điểm học phần, thu thập trong khoảng thời gian nhiều năm gần đây. Ý nghĩa của nghiên cứu thể hiện qua việc hỗ trợ sinh viên lựa chọn lộ trình học tối ưu, góp phần nâng cao chất lượng đào tạo và hiệu quả quản lý giáo dục tại trường.

Cơ sở lý thuyết và phương pháp nghiên cứu

Khung lý thuyết áp dụng

Luận văn dựa trên các lý thuyết và mô hình khai phá dữ liệu (KPDL) trong lĩnh vực giáo dục, tập trung vào các thuật toán phân lớp và dự báo kết quả học tập. Các khái niệm chính bao gồm:

Khai phá dữ liệu (Data Mining): Quá trình phân tích và trích xuất các mẫu dữ liệu có giá trị từ các kho dữ liệu lớn, nhằm tạo ra tri thức hữu ích phục vụ cho việc ra quyết định.
Các thuật toán phân lớp và dự báo: Bao gồm cây quyết định (Decision Tree), phân lớp Naïve Bayes, mạng nơ ron nhân tạo (Neural Network) và luật kết hợp (Association Rules). Đây là các phương pháp phổ biến trong KPDL, phù hợp với bài toán dự đoán kết quả học tập có thuộc tính rời rạc.
Lift Chart và Classification Matrix: Hai công cụ đánh giá hiệu quả mô hình dự báo, trong đó Lift Chart thể hiện trực quan độ chính xác dự báo của mô hình, còn Classification Matrix so sánh kết quả dự báo với dữ liệu thực tế dưới dạng ma trận.

Ngoài ra, luận văn sử dụng nền tảng kỹ thuật của hệ quản trị cơ sở dữ liệu MS SQL Server 2008 và bộ công cụ Business Intelligence Development Studio (BIDS) của Microsoft để triển khai các mô hình KPDL, cùng với ngôn ngữ truy vấn DMX (Data Mining Extensions) và thư viện lập trình ADOMD.NET để xây dựng hệ thống tư vấn học tập.

Phương pháp nghiên cứu

Nguồn dữ liệu nghiên cứu gồm 233.510 bản ghi điểm học phần và thông tin cá nhân của 3402 sinh viên hệ đại học chính quy thuộc 21 ngành học tại ĐHCNHN. Dữ liệu được thu thập từ hệ thống quản lý điểm của nhà trường, bao gồm điểm thi tuyển sinh, điểm học phần từng kỳ, thông tin ngành học, lộ trình học và các thuộc tính nhân khẩu học như giới tính, khu vực, đối tượng tuyển sinh.

Phương pháp phân tích dữ liệu gồm các bước:

Tiền xử lý dữ liệu: Loại bỏ bản ghi thiếu hoặc trùng lặp, chuẩn hóa mã ngành, mã môn học và biểu diễn lộ trình học dưới dạng chuỗi có thứ tự theo học kỳ.
Xây dựng mô hình: Sử dụng bộ công cụ BIDS trên Visual Studio 2008 kết hợp SQL Server 2008 để tạo 4 mô hình KPDL gồm cây quyết định, Naïve Bayes, mạng nơ ron nhân tạo và luật kết hợp. Dữ liệu được chia theo tỷ lệ 85% cho huấn luyện (2892 bản ghi) và 15% cho kiểm thử (510 bản ghi) bằng phương pháp chọn mẫu ngẫu nhiên.
Đánh giá mô hình: Sử dụng Lift Chart và Classification Matrix để so sánh độ chính xác dự báo của các mô hình, từ đó lựa chọn mô hình có hiệu quả cao nhất.
Triển khai hệ thống tư vấn: Áp dụng mô hình tốt nhất (Naïve Bayes) để xây dựng chương trình tư vấn học tập, hỗ trợ sinh viên lựa chọn lộ trình học phù hợp dựa trên các thông tin đầu vào như giới tính, ngành học, lộ trình học, khối thi và điểm thi tuyển sinh.

Quá trình nghiên cứu được thực hiện trong khoảng thời gian từ năm 2014 đến 2015 tại Trường Đại học Công nghiệp Hà Nội.

Kết quả nghiên cứu và thảo luận

Những phát hiện chính

Hiệu quả dự báo của các mô hình KPDL: Mô hình Naïve Bayes đạt độ chính xác dự báo cao nhất với tỷ lệ 80,98%, tiếp theo là mạng nơ ron nhân tạo (78,82%), cây quyết định (78,62%) và cuối cùng là luật kết hợp (75,29%). Kết quả này được xác nhận qua biểu đồ Lift Chart và ma trận Classification Matrix, cho thấy Naïve Bayes vượt trội hơn về khả năng dự đoán kết quả học tập cuối khóa của sinh viên.
Phân tích Lift Chart theo giá trị dự đoán: Khi dự báo kết quả học tập loại "Khá", mô hình Naïve Bayes có điểm xếp hạng cao nhất (0,93), vượt trội so với các mô hình còn lại (Neural Network 0,92; Cây quyết định 0,90; Luật kết hợp 0,86). Điều này chứng tỏ Naïve Bayes có khả năng phân biệt chính xác các trường hợp sinh viên đạt loại "Khá" trong tập dữ liệu kiểm thử.
Sự phụ thuộc của kết quả dự đoán: Thuộc tính kết quả học tập cuối khóa phụ thuộc chủ yếu vào 5 thuộc tính đầu vào gồm giới tính, ngành học, lộ trình học, khối thi và điểm thi tuyển sinh. Các thuộc tính khác như đối tượng dự thi, khu vực, tỉnh/thành phố không ảnh hưởng đáng kể đến kết quả dự báo.
Tính khả thi của hệ thống tư vấn học tập: Hệ thống tư vấn dựa trên mô hình Naïve Bayes có thể cung cấp dự đoán kết quả học tập với xác suất chính xác cao, giúp sinh viên lựa chọn lộ trình học phù hợp nhằm tối ưu hóa kết quả học tập cuối khóa.

Thảo luận kết quả

Nguyên nhân mô hình Naïve Bayes cho kết quả tốt nhất có thể do tính chất độc lập có điều kiện của các thuộc tính đầu vào phù hợp với giả định của thuật toán, đồng thời mô hình này xử lý tốt các dữ liệu rời rạc và có khả năng dự báo chính xác trong môi trường dữ liệu đa dạng như giáo dục đại học. Kết quả này tương đồng với các nghiên cứu trong lĩnh vực khai phá dữ liệu giáo dục, nơi Naïve Bayes thường được đánh giá cao về hiệu quả và tính ổn định.

Việc xác định 5 thuộc tính đầu vào quan trọng giúp giảm thiểu dữ liệu đầu vào cần thiết cho hệ thống tư vấn, từ đó đơn giản hóa quá trình thu thập thông tin và tăng tính ứng dụng thực tế. So với các mô hình khác như cây quyết định hay mạng nơ ron, Naïve Bayes có ưu điểm về tốc độ xử lý và dễ dàng triển khai trong môi trường SQL Server.

Kết quả nghiên cứu cũng cho thấy khai phá dữ liệu là công cụ hữu hiệu để hỗ trợ quản lý giáo dục, đặc biệt trong việc tư vấn học tập theo hệ thống tín chỉ, giúp sinh viên và nhà trường có cơ sở khoa học để ra quyết định về lộ trình học tập. Dữ liệu được trình bày qua các biểu đồ Lift Chart và bảng Classification Matrix giúp trực quan hóa hiệu quả các mô hình, hỗ trợ việc lựa chọn mô hình phù hợp.

Đề xuất và khuyến nghị

Triển khai hệ thống tư vấn học tập dựa trên mô hình Naïve Bayes: Nhà trường nên áp dụng mô hình Naïve Bayes làm nền tảng cho hệ thống tư vấn học tập nhằm hỗ trợ sinh viên lựa chọn lộ trình học phù hợp, nâng cao kết quả học tập cuối khóa. Thời gian triển khai dự kiến trong vòng 6 tháng, do phòng Công nghệ Thông tin chủ trì phối hợp với phòng Đào tạo thực hiện.
Tăng cường thu thập và quản lý dữ liệu học tập: Đề xuất xây dựng hệ thống quản lý dữ liệu điểm và thông tin sinh viên đồng bộ, chính xác và đầy đủ hơn, nhằm đảm bảo chất lượng dữ liệu đầu vào cho các mô hình khai phá dữ liệu. Thời gian thực hiện trong 12 tháng, do phòng Công nghệ Thông tin và các khoa chuyên môn phối hợp.
Đào tạo cán bộ và giảng viên về khai phá dữ liệu và ứng dụng công nghệ thông tin: Tổ chức các khóa đào tạo, tập huấn về khai phá dữ liệu, phân tích dữ liệu và sử dụng hệ thống tư vấn học tập cho cán bộ quản lý, cố vấn học tập và giảng viên. Mục tiêu nâng cao năng lực ứng dụng công nghệ trong quản lý và giảng dạy. Thời gian thực hiện trong 3 tháng, do phòng Đào tạo và phòng Công nghệ Thông tin phối hợp.
Nâng cấp và mở rộng hệ thống tư vấn học tập: Sau khi triển khai thành công hệ thống cơ bản, tiếp tục nghiên cứu mở rộng chức năng tư vấn lựa chọn môn học, ngành học và hỗ trợ phân loại sinh viên theo năng lực học tập. Đồng thời, tích hợp các thuật toán khai phá dữ liệu mới nhằm nâng cao độ chính xác và tính linh hoạt của hệ thống. Kế hoạch thực hiện trong 18 tháng tiếp theo, do phòng Công nghệ Thông tin chủ trì.

Đối tượng nên tham khảo luận văn

Cán bộ quản lý giáo dục đại học: Luận văn cung cấp cơ sở khoa học và công nghệ để xây dựng các hệ thống quản lý và tư vấn học tập hiện đại, giúp nâng cao hiệu quả quản lý đào tạo và hoạch định chính sách giáo dục.
Giảng viên và cố vấn học tập: Hệ thống tư vấn học tập hỗ trợ giảng viên và cố vấn trong việc hướng dẫn sinh viên lựa chọn lộ trình học phù hợp, từ đó nâng cao chất lượng giảng dạy và hỗ trợ sinh viên đạt kết quả tốt.
Nhà nghiên cứu và sinh viên ngành Công nghệ Thông tin, Hệ thống Thông tin: Luận văn trình bày chi tiết về ứng dụng các thuật toán khai phá dữ liệu trong môi trường thực tế, cung cấp tài liệu tham khảo quý giá cho các nghiên cứu và phát triển ứng dụng trong lĩnh vực này.
Các tổ chức giáo dục và đào tạo: Các trường đại học, cao đẳng có thể áp dụng mô hình và phương pháp nghiên cứu để xây dựng hệ thống tư vấn học tập phù hợp với đặc thù của đơn vị mình, góp phần nâng cao chất lượng đào tạo và quản lý.

Câu hỏi thường gặp

Khai phá dữ liệu là gì và tại sao lại quan trọng trong giáo dục?
Khai phá dữ liệu là quá trình phân tích các tập dữ liệu lớn để tìm ra các mẫu, quy luật có giá trị. Trong giáo dục, KPDL giúp dự đoán kết quả học tập, tư vấn lộ trình học, phân loại sinh viên, từ đó nâng cao chất lượng đào tạo và quản lý hiệu quả hơn.
Tại sao mô hình Naïve Bayes được chọn làm mô hình tốt nhất trong nghiên cứu?
Mô hình Naïve Bayes có giả định các thuộc tính đầu vào độc lập có điều kiện, phù hợp với dữ liệu rời rạc trong giáo dục. Nó cho kết quả dự báo chính xác cao (80,98%) và ổn định hơn so với các mô hình khác như cây quyết định hay mạng nơ ron nhân tạo.
Hệ thống tư vấn học tập hoạt động như thế nào?
Hệ thống sử dụng dữ liệu cá nhân, điểm thi tuyển sinh và các lộ trình học có thể lựa chọn để dự đoán kết quả học tập cuối khóa của sinh viên theo từng lộ trình. Từ đó, hệ thống tư vấn lộ trình học tối ưu giúp sinh viên đạt kết quả tốt nhất.
Dữ liệu đầu vào cho hệ thống tư vấn gồm những gì?
Dữ liệu đầu vào gồm các thuộc tính như giới tính, ngành học, lộ trình học, khối thi và điểm thi tuyển sinh. Các thuộc tính này được xác định là có ảnh hưởng lớn đến kết quả học tập cuối khóa.
Làm thế nào để triển khai hệ thống tư vấn học tập tại các trường khác?
Các trường cần thu thập dữ liệu học tập đầy đủ, chuẩn hóa dữ liệu, lựa chọn thuật toán phù hợp (ví dụ Naïve Bayes), xây dựng mô hình dự báo và tích hợp vào hệ thống quản lý đào tạo. Đồng thời, cần đào tạo cán bộ và giảng viên để sử dụng hiệu quả hệ thống.

Kết luận

Luận văn đã ứng dụng thành công các thuật toán khai phá dữ liệu để xây dựng hệ thống tư vấn học tập tại Trường Đại học Công nghiệp Hà Nội, với mô hình Naïve Bayes đạt độ chính xác dự báo cao nhất (80,98%).
Nghiên cứu đã xác định được các thuộc tính quan trọng ảnh hưởng đến kết quả học tập cuối khóa gồm giới tính, ngành học, lộ trình học, khối thi và điểm thi tuyển sinh.
Hệ thống tư vấn học tập giúp sinh viên lựa chọn lộ trình học phù hợp, góp phần nâng cao chất lượng đào tạo và hiệu quả quản lý giáo dục.
Đề xuất triển khai hệ thống tư vấn trong thực tế, đồng thời nâng cấp, mở rộng chức năng và đào tạo cán bộ để phát huy tối đa hiệu quả ứng dụng.
Các bước tiếp theo bao gồm hoàn thiện hệ thống, mở rộng phạm vi áp dụng và nghiên cứu các thuật toán khai phá dữ liệu mới nhằm nâng cao độ chính xác và tính linh hoạt của hệ thống.

Hãy bắt đầu áp dụng khai phá dữ liệu trong quản lý giáo dục để nâng cao chất lượng đào tạo và hỗ trợ sinh viên hiệu quả hơn ngay hôm nay!

Trích đoạn nội dung tài liệu

phần mở đầu, kết luận và 04 chƣơng, cụ thể nhƣ sau: Chƣơng 1: Giới thiệu tổng quan Giới thiệu bài toán ứng dụng KPDL để xây dựng hệ thống tƣ vấn tại trƣờng ĐHCNHN, trình bày một số hƣớng nghiên cứu về KPDL trong giáo dục và hƣớng tiếp cận của luận văn. Chƣơng 2: Các kiến thức cơ sở liên quan Nghiên cứu các cơ sở lý thuyết KPDL, các vấn đề liên quan đến KPDL trong lĩnh vực giáo dục. Tìm hiểu các kỹ thuật khai phá dữ liệu sử dụng trong bài toán phân lớp, dự báo (cây quyết định, phân lớp Naïve Bayes, mạng nơ ron nhân tạo, luật kết hợp) và kỹ thuật KPDL trên hệ quản trị CSDL MS SQL Server. Phƣơng pháp giải quyết bài toán Mô tả ứng dụng, xây dựng bài toán liệt kê lộ trình học cho từng ngành học để tƣ vấn cho sinh viên chọn lộ trình phù hợp với ngành mình đang theo học.

Thu thập và xử lý các dữ liệu liên quan để phát triển hệ thống. Xây dựng 4 mô hình: Cây quyết định, Naïve Bayes, Neural Networks, Luật kết hợp và đƣa ra đánh giá các mô hình tƣơng ứng. Chƣơng 4: Xây dựng hệ thống tƣ vấn học tập tại trƣờng ĐHCNHN Dựa trên những đánh giá về mô hình, lựa chọn mô hình cho kết quả tốt nhất. Xây dựng chƣơng trình thực nghiệm để tƣ vấn cho sinh viên.Giới thiệu tổng quan 1.

Bài toán ứng dụng KPDL để xây dựng hệ thống tƣ vấn tại trƣờng ĐHCNHN Trƣờng Đại học Công nghiệp Hà Nội cung cấp dịch vụ giáo dục - đào tạo nhiều ngành, nhiều trình độ, chất lƣợng cao, đáp ứng nguồn nhân lực cho công nghiệp hóa, hiện đại hóa đất nƣớc và xuất khẩu lao động, tạo cơ hội học tập thuận lợi cho mọi đối tƣợng. Về ngành, nghề đào tạo: Trong những năm qua nhà trƣờng đã xây dựng đƣợc chƣơng trình và triển khai đào tạo 21 chuyên ngành đại học chính quy, 18 chuyên ngành đào tạo cao đẳng chính quy, 14 chuyên ngành Trung cấp chuyên nghiệp và nhiều chƣơng trình đào tạo trình độ khác nhau. Về qui mô đào tạo: Trên 50.000 học sinh, sinh viên. Các lĩnh vực đào tạo: Công nghệ, kỹ thuật, Kinh tế, May, Thời trang, Sƣ phạm, Du lịch Các loại hình đào tạo: Chính qui, Vừa làm vừa học, Liên thông, Liên kết nƣớc ngoài, Nâng bậc thợ, Đào tạo lao động xuất khẩu, Bồi dƣỡng ngắn hạn và dài hạn theo nhu cầu xã hội quan tâm.

Một thực tế đặt ra đối với trƣờng ĐHCNHN là làm sao thu hút đƣợc nhiều sinh viên dựa trên “thƣơng hiệu” của nhà trƣờng, để đáp ứng chỉ tiêu đào tạo. Tuy nhiên, yêu cầu đặt ra về số lƣợng cũng phải kèm theo yêu cầu về chất lƣợng đào tạo. Vấn đề nâng cao chất lƣợng đào tạo là một vấn đề luôn đƣợc nhà trƣờng quan tâm. Nhằm đổi mới giáo dục đại học ở Việt Nam, Bộ Giáo dục và Đào tạo đã yêu cầu chuyển đổi từ việc thực hiện chƣơng trình đào tạo theo hệ thống niên chế thành đào tạo theo hệ thống tín chỉ kiểu Hoa Kỳ, bắt đầu từ năm học 2008-2009 và đòi hỏi phải hoàn tất việc chuyển đổi này trƣớc năm 2012.

Trƣờng Đại học Công nghiệp Hà Nội đã triển khai đào tạo theo học chế tín chỉ bắt đầu từ năm học 2008 – 2009. Đào tạo tín chỉ có ƣu điểm giúp sinh viên có thể tự quản lý quỹ thời gian và tùy theo khả năng của mình để tự quyết định các môn học theo từng kỳ. Vì vậy, việc tƣ vấn học tập, chủ yếu liên quan đến lựa chọn lộ trình học phù hợp nhằm đạt đƣợc kết quả học tập cao nhất cho mỗi sinh viên đƣợc đặc biệt quan tâm. Đó cũng là khó khăn chung không chỉ của sinh viên, mà còn của các cố vấn học tập, giáo viên chủ nhiệm và các tổ chức quản lý trong trƣờng.

Các giảng viên chuyên trách, cố vấn học tập không thể tiếp cận toàn bộ dữ liệu về điểm của sinh viên. Đối với mỗi sinh viên, việc lựa chọn cho mình một lộ trình học phù hợp theo đúng quy trình đào tạo là một việc hết sức khó khăn, đặc biệt là với các sinh viên mới vào trƣờng, khi mà kinh nghiệm học tập ở bậc đại học và hình thức đào tạo tín chỉ còn rất mới mẻ. Xuất phát từ thực tế đó, việc tƣ vấn lựa chọn lộ trình học cho sinh viên theo ngành học đã đăng ký là một việc làm hết sức thiết thực và ý nghĩa. 9 z Bài toán tƣ vấn lựa chọn lộ trình học cho sinh viên gồm hai bƣớc: Bƣớc 1: Liệt kê toàn bộ lộ trình học có thể của một sinh viên theo ngành học mà sinh viên đó đã chọn.

Bƣớc 2: Dự đoán kết quả học tập cuối khóa của sinh viên theo tất cả các lộ trình ở trên. Chọn ra lộ trình với kết quả dự đoán cho ra kết quả học tập tốt nhất để tƣ vấn cho sinh viên. Nếu có nhiều lộ trình có cùng kết quả thì sinh viên có thể tự chọn một trong số các lộ trình học đó sao cho phù hợp nhất với năng lực, sở thích và các điều kiện khác của bản thân. Trên cơ sở những lộ trình học đã liệt kê cho một sinh viên, công đoạn quan trọng nhất chính là dự đoán kết quả học tập toàn khóa của sinh viên tƣơng ứng với các lộ trình học ở trên và tƣ vấn cho sinh viên lộ trình học phù hợp nhất.

Việc dự đoán đƣợc sử dụng kỹ thuật khai phá dữ liệu trên SQL Server với việc áp dụng các mô hình khác nhau nhƣ: cây quyết định, luật kết hợp, mạng Naïve Bayes và mạng nơ ron nhân tạo. Qua đánh giá độ chính xác của các mô hình sẽ lựa chọn mô hình cho kết quả tốt nhất, áp dụng vào hệ thống để tƣ vấn lựa chọn lộ trình học cho sinh viên. Một số hƣớng nghiên cứu về khai phá dữ liệu trong lĩnh vực giáo dục hiện nay Hiện đã có rất nhiều nghiên cứu về ứng dụng KPDL cho giáo dục. Những khai phá dữ liệu trong giáo dục đã nổi bật lên nhƣ là một lĩnh vực nghiên cứu độc lập trong những năm gần đây, mà cao điểm là năm 2008 với sự thành lập hội nghị quốc tế về khai phá dữ liệu giáo dục, và những bài báo về khai phá dữ liệu giáo dục.

Đó là “Applying Data Mining Techniques to e-Learning Problems” của Félix Castrol, Alfredo Vellido1, Àngela Nebotl, và Francisco Mugica3, “Recommendation in Higher Education Using Data Mining Techniques” của César Vialardi, Javier Bravo, Leila Shafti, Álvaro Ortigosa, “Using Association Rules for Course Recommendation” của Narimel Bendakir và Esma A¨ımeur. Các nhà nghiên cứu về việc KPDL trong giáo dục tập trung vào nhiều vấn đề bao gồm việc học của cá nhân từ phần mềm giáo dục, học cộng tác với sự giúp đỡ của máy tính, kiểm nghiệm khả năng thích ứng với máy tính, và nhiều nhân tố đƣợc kết hợp với các sinh viên không có khả năng hoặc thiếu định hƣớng trong quá trình học tập. Mỗi lĩnh vực chính của việc ứng dụng khai phá dữ liệu vào giáo dục là phát triển các mô hình hƣớng đối tƣợng sinh viên. Các mô hình sinh viên thể hiện thông tin về một nét đặc trƣng hay tình trạng của sinh viên, nhƣ kiến thức hiện tại của sinh viên, động cơ thúc đẩy học tập, quan điểm nguyện vọng của sinh viên… Một số bài toán ứng dụng KPDL nhƣ: Tƣ vấn chọn ngành học, Tƣ vấn lựa chọn môn học, Tƣ vấn lựa chọn lộ trình học.

Ở Việt Nam, KPDL cũng đã đƣợc nghiên cứu và ứng dụng trong nhiều tổ chức, doanh nghiệp và đem lại hiệu quả cao trong các lĩnh vực nhƣ giáo dục, y tế, thƣơng mại, 10 z tài chính. Nhiều công trình khoa học đã và đang đƣợc nghiên cứu để áp dụng vào thực tế. Song bên cạnh đó, việc khai thác các thông tin có giá trị ở một số đơn vị chƣa thực sự hiệu quả, việc áp dụng trong thực tế còn hạn chế. Hƣớng tiếp cận của luận văn Luận văn tập trung nghiên cứu lý thuyết KPDL, sử dụng công cụ khai phá dữ liệu BIDS của Microsoft, KPDL điểm thực tế của sinh viên trƣờng ĐHCNHN.

Bên cạnh đó, luận văn sử dụng một số thuật toán điển hình trong khai phá dữ liệu đƣợc hỗ trợ sẵn trong SQL Server nhằm giải quyết bài toán dự báo, dự đoán kết quả học tập của sinh viên. Sau khi đánh giá mô hình dự đoán tốt nhất, tác giả xây dựng chƣơng trình thực nghiệm để hỗ trợ tƣ vấn học tập cho sinh viên năm đầu. Kết luận chƣơng 1 Chƣơng này giới thiệu về bài toán, những yêu cầu đặt ra cần giải quyết đối với bài toán đồng thời trình bày một số hƣớng nghiên cứu về KPDL trong giáo dục hiện nay, hƣớng tiếp cận của luận văn.Các kiến thức cơ sở liên quan 2. Khai phá dữ liệu 2.

Khái niệm KPDL KPDL là quá trình khảo sát và phân tích một khối lƣợng lớn các dữ liệu đƣợc lƣu trữ trong các cơ sở dữ liệu, kho dữ liệu…để từ đó trích xuất ra các thông tin quan trọng, có giá trị tiềm ẩn bên trong. Do nhu cầu nghiệp vụ cần có cách nhìn thông tin trên quy mô toàn đơn vị. Các dữ liệu này đƣợc thu từ nhiều nguồn, đa số là từ các phần mềm nghiệp vụ nhƣ: phần mềm tài chính, kế toán, các hệ thống quản lý tài nguyên doanh nghiệp, các hệ thống quản lý khách hàng hay từ tác công cụ lƣu trữ thông tin trên web… Đây là những khối dữ liệu khổng lồ nhƣng những thông tin mà nó thể hiện ra thì lộn xộn và “nghèo” đối với ngƣời dùng. Kích thƣớc của khối dữ liệu khổng lồ đó cũng tăng với tốc độ rất nhanh chiếm nhiều dung lƣợng lƣu trữ.

KPDL liệu sẽ giúp trích xuất ra các mẫu điển hình có giá trị và biến chúng thành những tri thức hữu ích. Quá trình này gồm một số bƣớc đƣợc thể hiện trong hình sau.1: Các bƣớc xây dựng một hệ thống KPDL Ý nghĩa cụ thể của các bƣớc nhƣ sau: - Lựa chọn dữ liệu liên quan đến bài toán quan tâm. 12 z - Tiền xử lý dữ liệu, làm sạch dữ liệu - Chuyển đổi dữ liệu về dạng phù hợp thuận lợi cho việc khai phá. - KPDL, trích xuất ra các mẫu dữ liệu (mô hình).

- Đánh giá mẫu. - Sử dụng tri thức khai phá đƣợc. Những nhóm bài toán của KPDL KPDL có thể đƣợc dùng để giải quyết hàng trăm bài toán với những mục đích và nhiệm vụ khác nhau.

Nội dung được bảo vệ bản quyền — Tải xuống đầy đủ

Bài luận văn thạc sĩ mang tiêu đề "Ứng dụng khai phá dữ liệu trong xây dựng hệ thống tư vấn học tập tại Đại học Công nghiệp Hà Nội" của tác giả Nguyễn Thị Thanh Hương, dưới sự hướng dẫn của PGS. Nguyễn Hà Nam, tập trung vào việc áp dụng các kỹ thuật khai phá dữ liệu để phát triển một hệ thống tư vấn học tập hiệu quả cho sinh viên. Nghiên cứu này không chỉ giúp cải thiện chất lượng tư vấn học tập mà còn cung cấp những thông tin hữu ích cho việc ra quyết định của sinh viên trong quá trình học tập tại trường.

Bài viết mang lại nhiều lợi ích cho độc giả, đặc biệt là những ai quan tâm đến công nghệ thông tin và giáo dục, giúp họ hiểu rõ hơn về cách khai thác dữ liệu để nâng cao hiệu quả học tập. Để mở rộng thêm kiến thức, bạn có thể tham khảo các tài liệu liên quan như "Các yếu tố ảnh hưởng đến quyết định chọn nơi làm việc của sinh viên công nghệ thông tin tại Đà Nẵng", nơi phân tích các yếu tố tác động đến quyết định nghề nghiệp của sinh viên công nghệ thông tin, hay "Luận văn thạc sĩ về quản lý giáo dục và ứng dụng công nghệ thông tin trong dạy học ở huyện Phong Điền, TP Cần Thơ", nghiên cứu về ứng dụng công nghệ thông tin trong giáo dục. Cuối cùng, bạn cũng có thể tìm hiểu thêm về "Luận văn thạc sĩ về quản lý hoạt động bồi dưỡng đội ngũ giảng viên Trường Cao đẳng Cần Thơ", một nghiên cứu liên quan đến quản lý giáo dục và phát triển đội ngũ giảng viên. Những tài liệu này sẽ giúp bạn có cái nhìn sâu sắc hơn về các ứng dụng của công nghệ thông tin trong giáo dục.

#Luận văn Thạc sĩ

#Phân tích dữ liệu

#Ứng dụng công nghệ

#hỗ trợ sinh viên

#khai phá dữ liệu

#Đại học Công nghiệp Hà Nội

Chủ đề

Công nghệ thông tin trong giáo dục

Khai phá dữ liệu và ứng dụng

Phát triển hệ thống tư vấn học tập

Nâng cao chất lượng giáo dục đại học

Luận văn thạc sĩ ứng dụng khai phá dữ liệu để xây dựng hệ thống tư vấn học tập tại trường đại học công nghiệp hà nội 04

LỜI CẢM ƠN

LỜI CAM ĐOAN

DANH MỤC CÁC KÝ HIỆU VÀ CHỮ VIẾT TẮT

DANH MỤC CÁC BẢNG

DANH MỤC CÁC HÌNH VẼ, ĐỒ THỊ

1. CHƯƠNG 1: GIỚI THIỆU TỔNG QUAN

1.1. Bài toán ứng dụng KPDL để xây dựng hệ thống tư vấn tại trường ĐHCNHN

1.2. Một số hướng nghiên cứu về khai phá dữ liệu trong lĩnh vực giáo dục hiện nay

1.3. Hướng tiếp cận của luận văn

1.4. Kết luận chương 1

2. CHƯƠNG 2: CÁC KIẾN THỨC CƠ SỞ LIÊN QUAN

2.1. Khai phá dữ liệu

2.2. Khái niệm KPDL

2.3. Những nhóm bài toán của KPDL

2.4. Các bước xây dựng một giải pháp về KPDL

2.5. Ứng dụng KPDL trong giáo dục

2.5.1. Các ứng dụng hướng đến học sinh, sinh viên

3. CHƯƠNG 3: PHƯƠNG PHÁP GIẢI QUYẾT BÀI TOÁN

3.1. Tìm hiểu và thu thập dữ liệu điểm

3.2. Xây dựng mô hình

3.3. Lập trình KPDL với Analysis Services APIs

3.3.1. Đánh giá các mô hình dự báo với Lift Chart

3.3.2. Đánh giá các mô hình dự báo với Classification Matrix

3.4. Kết luận chương 3

4. CHƯƠNG 4: XÂY DỰNG HỆ THỐNG TƯ VẤN HỌC TẬP TẠI TRƯỜNG ĐHCNHN

HƯỚNG PHÁT TRIỂN

TÀI LIỆU THAM KHẢO

I. Giới thiệu tổng quan

1.1. Bài toán ứng dụng KPDL

II. Các kiến thức cơ sở liên quan

2.1. Khái niệm KPDL

III. Phương pháp giải quyết bài toán

3.1. Xây dựng mô hình

IV. Xây dựng hệ thống tư vấn học tập

4.1. Hướng phát triển

Tài liệu liên quan

THÔNG TIN CHI TIẾT

Tác giả: Nguyễn Thị Thanh Hương

Người hướng dẫn: PGS. Nguyễn Hà Nam

Trường học: Đại học Công nghiệp Hà Nội

Chuyên ngành: Công nghệ thông tin

Đề tài: Hệ thống tư vấn học tập tại Đại học Công nghiệp Hà Nội bằng khai phá dữ liệu

Loại tài liệu: luận văn thạc sĩ

Năm xuất bản: 2015

Địa điểm: Hà Nội

Tổng quan nghiên cứu

Cơ sở lý thuyết và phương pháp nghiên cứu

Khung lý thuyết áp dụng

Phương pháp nghiên cứu

Kết quả nghiên cứu và thảo luận

Những phát hiện chính

Thảo luận kết quả

Đề xuất và khuyến nghị

Đối tượng nên tham khảo luận văn

Câu hỏi thường gặp

Kết luận

Có thể bạn quan tâm