Tổng quan nghiên cứu
Trong bối cảnh phát triển kinh tế - xã hội hiện nay, việc định hướng nghề nghiệp cho học sinh trung học phổ thông (THPT) trở thành một vấn đề cấp thiết nhằm giúp các em lựa chọn ngành nghề phù hợp với năng lực, sở trường và nhu cầu thị trường lao động. Tại trường THPT Trần Phú, tỉnh Quảng Nam, với tổng số 911 học sinh trong giai đoạn 2017-2021, việc lựa chọn ngành nghề còn nhiều hạn chế do thiếu thông tin và công cụ hỗ trợ hiệu quả. Nhiều học sinh đăng ký ngành nghề theo cảm tính, theo bạn bè hoặc theo xu hướng xã hội mà không dựa trên đánh giá năng lực cá nhân, dẫn đến tình trạng học sinh không hạnh phúc, bỏ học hoặc làm việc trái ngành sau khi tốt nghiệp đại học.
Mục tiêu nghiên cứu của luận văn là xây dựng một hệ thống ứng dụng khai phá dữ liệu nhằm dự báo khả năng thành công và hạnh phúc của học sinh khi chọn ngành nghề dựa trên các thông tin cá nhân, kết quả học tập và sở thích. Phạm vi nghiên cứu tập trung vào dữ liệu tuyển sinh và học tập của học sinh trường THPT Trần Phú trong 5 năm học liên tiếp từ 2016-2017 đến 2020-2021. Nghiên cứu không chỉ có ý nghĩa khoa học trong việc ứng dụng kỹ thuật khai phá dữ liệu vào giáo dục mà còn mang tính thực tiễn cao, giúp nhà trường và học sinh có cơ sở để tư vấn, định hướng nghề nghiệp chính xác, nâng cao chất lượng đào tạo và giảm thiểu tình trạng chọn sai ngành nghề.
Cơ sở lý thuyết và phương pháp nghiên cứu
Khung lý thuyết áp dụng
Luận văn dựa trên các lý thuyết và mô hình sau:
Khai phá dữ liệu (Data Mining): Quá trình trích xuất tri thức hữu ích từ kho dữ liệu lớn, bao gồm các bước làm sạch, tích hợp, lựa chọn, chuyển đổi dữ liệu, khai phá và đánh giá mẫu. Khai phá dữ liệu giúp phát hiện các mẫu, luật kết hợp và mô hình phân lớp nhằm dự báo xu hướng tương lai.
Kỹ thuật phân lớp bằng cây quyết định (Decision Tree): Sử dụng thuật toán C4.5 để xây dựng mô hình phân lớp dựa trên các thuộc tính như điểm trung bình, nhóm sở thích, đặc điểm sở thích. Cây quyết định giúp tạo ra các luật đơn giản, dễ hiểu để dự đoán khả năng hạnh phúc khi học sinh chọn ngành nghề.
Luật kết hợp (Association Rules): Phân tích các mối quan hệ giữa các thuộc tính trong dữ liệu để phát hiện các luật kết hợp phổ biến, hỗ trợ việc dự báo và tư vấn nghề nghiệp.
Các khái niệm chính bao gồm: nhóm sở thích theo mã hóa Holland, điểm trung bình tổ hợp môn, đặc điểm sở thích cá nhân, và kết quả dự báo hạnh phúc khi chọn ngành nghề.
Phương pháp nghiên cứu
Nguồn dữ liệu: Thu thập dữ liệu từ 911 học sinh đã trúng tuyển đại học trong 5 năm (2017-2021) tại trường THPT Trần Phú, bao gồm thông tin cá nhân, kết quả học tập, nhóm sở thích và ngành nghề đã chọn.
Phương pháp thu thập: Sử dụng Google Form tích hợp trên website trường để thu thập thông tin sở thích và kết quả học tập, kết hợp với dữ liệu tuyển sinh từ nhà trường.
Tiền xử lý dữ liệu: Loại bỏ dữ liệu thiếu, trùng lặp, chuyển đổi dữ liệu về dạng phù hợp, phân nhóm sở thích theo phương pháp mật mã Holland, chọn lọc các thuộc tính quan trọng gồm đặc điểm sở thích, nhóm sở thích, điểm trung bình tổ hợp và điểm trung bình năm lớp 12.
Phương pháp phân tích: Áp dụng thuật toán C4.5 xây dựng mô hình cây quyết định và luật kết hợp trên công cụ Business Intelligence Development Studio (BIDS) của Microsoft SQL Server 2008 R2. Dữ liệu được chia thành 70% để huấn luyện và 30% để kiểm thử mô hình.
Timeline nghiên cứu: Thu thập và xử lý dữ liệu trong năm 2022, xây dựng mô hình và kiểm định trong quý cuối năm 2022, triển khai ứng dụng dự báo trên nền web trong đầu năm 2023.
Kết quả nghiên cứu và thảo luận
Những phát hiện chính
Mô hình phân lớp bằng cây quyết định C4.5 cho độ chính xác 67% trên tập kiểm thử gồm 273 mẫu, thể hiện qua confusion matrix với 60 dự đoán đúng nhóm "Không hạnh phúc" và 124 dự đoán đúng nhóm "Hạnh phúc". Mô hình này cho phép dự báo khả năng hạnh phúc khi học sinh chọn ngành nghề dựa trên các thuộc tính đầu vào.
Các thuộc tính ảnh hưởng mạnh nhất đến dự báo gồm đặc điểm sở thích, nhóm sở thích, điểm trung bình năm lớp 12 và điểm trung bình tổ hợp. Trong đó, đặc điểm sở thích có mức độ ảnh hưởng cao nhất, cho thấy vai trò quan trọng của việc hiểu rõ bản thân trong định hướng nghề nghiệp.
So sánh giữa kỹ thuật cây quyết định và luật kết hợp cho thấy giá trị score bằng nhau (0.74), tuy nhiên cây quyết định được lựa chọn do tính trực quan và dễ hiểu trong việc xây dựng các luật dự báo.
Ứng dụng web dự báo khả năng thành công và hạnh phúc khi chọn ngành nghề được xây dựng dựa trên mô hình, giúp học sinh có thể tra cứu và điều chỉnh nguyện vọng phù hợp với năng lực và sở thích cá nhân.
Thảo luận kết quả
Kết quả nghiên cứu cho thấy khai phá dữ liệu là công cụ hiệu quả trong việc hỗ trợ định hướng nghề nghiệp cho học sinh THPT, đặc biệt tại các vùng miền núi như huyện Hiệp Đức, tỉnh Quảng Nam, nơi học sinh ít tiếp cận các nguồn tư vấn nghề nghiệp chính thống. Độ chính xác 67% của mô hình cây quyết định là mức khá cao trong lĩnh vực dự báo nhân sự, đồng thời phù hợp với thực tế khi so sánh với khảo sát mức độ hạnh phúc của học sinh sau khi chọn ngành.
Việc lựa chọn các thuộc tính đầu vào dựa trên nhóm sở thích và điểm học tập phản ánh đúng các yếu tố ảnh hưởng đến sự thành công và hài lòng nghề nghiệp. So với các nghiên cứu trong ngành giáo dục và công nghệ thông tin, kết quả này tương đồng với xu hướng ứng dụng kỹ thuật khai phá dữ liệu để cá nhân hóa tư vấn nghề nghiệp.
Việc xây dựng ứng dụng dự báo trên nền web tạo điều kiện thuận lợi cho học sinh và nhà trường trong việc ra quyết định, đồng thời góp phần nâng cao hiệu quả công tác tư vấn hướng nghiệp. Dữ liệu có thể được trình bày qua biểu đồ Lift chart và confusion matrix để minh họa độ chính xác và hiệu quả của mô hình, giúp người dùng dễ dàng đánh giá và tin tưởng vào kết quả dự báo.
Đề xuất và khuyến nghị
Triển khai rộng rãi hệ thống dự báo định hướng nghề nghiệp tại các trường THPT trong tỉnh Quảng Nam nhằm nâng cao khả năng lựa chọn ngành nghề phù hợp cho học sinh, dự kiến trong vòng 1-2 năm tới, do Sở Giáo dục và Đào tạo phối hợp với các trường thực hiện.
Tổ chức các buổi tập huấn cho giáo viên và cán bộ tư vấn hướng nghiệp về sử dụng công cụ khai phá dữ liệu và ứng dụng web dự báo, giúp nâng cao năng lực tư vấn chính xác và hiệu quả, thực hiện trong 6 tháng đầu năm học.
Cập nhật và mở rộng cơ sở dữ liệu định kỳ hàng năm, thu thập thêm thông tin về kết quả học tập, sở thích và tình hình việc làm của học sinh sau tốt nghiệp để cải tiến mô hình dự báo, do nhà trường và các phòng ban liên quan chịu trách nhiệm.
Phát triển thêm các tính năng hỗ trợ cá nhân hóa tư vấn nghề nghiệp dựa trên dữ liệu tâm lý, hoàn cảnh gia đình và thị trường lao động, nhằm tăng tính chính xác và phù hợp của dự báo, nghiên cứu và triển khai trong 2 năm tiếp theo.
Đối tượng nên tham khảo luận văn
Giáo viên và cán bộ tư vấn hướng nghiệp tại các trường THPT: Nghiên cứu cung cấp công cụ và phương pháp hỗ trợ tư vấn nghề nghiệp dựa trên dữ liệu thực tế, giúp nâng cao hiệu quả công tác hướng nghiệp.
Nhà quản lý giáo dục và Sở Giáo dục và Đào tạo: Có thể áp dụng kết quả nghiên cứu để xây dựng chính sách, chương trình đào tạo và định hướng nghề nghiệp phù hợp với đặc điểm học sinh địa phương.
Sinh viên và nghiên cứu sinh ngành Hệ thống thông tin, Công nghệ thông tin: Tham khảo phương pháp khai phá dữ liệu, thuật toán cây quyết định và luật kết hợp trong ứng dụng thực tiễn giáo dục.
Phụ huynh và học sinh THPT: Hiểu rõ hơn về tầm quan trọng của việc lựa chọn ngành nghề dựa trên sở thích và năng lực cá nhân, đồng thời sử dụng ứng dụng dự báo để đưa ra quyết định chính xác.
Câu hỏi thường gặp
Khai phá dữ liệu là gì và tại sao lại quan trọng trong định hướng nghề nghiệp?
Khai phá dữ liệu là quá trình trích xuất tri thức hữu ích từ kho dữ liệu lớn để dự báo xu hướng và hành vi tương lai. Trong định hướng nghề nghiệp, nó giúp phân tích thông tin học sinh để dự báo khả năng thành công và hạnh phúc khi chọn ngành nghề, từ đó hỗ trợ quyết định chính xác hơn.Thuật toán cây quyết định C4.5 hoạt động như thế nào trong nghiên cứu này?
Thuật toán C4.5 xây dựng mô hình phân lớp dựa trên các thuộc tính như điểm học tập và sở thích, tạo ra các luật đơn giản để dự đoán kết quả hạnh phúc khi học sinh chọn ngành nghề. Mô hình này có độ chính xác khoảng 67% trên tập kiểm thử.Dữ liệu nghiên cứu được thu thập và xử lý như thế nào?
Dữ liệu gồm 911 học sinh từ năm 2017 đến 2021, thu thập qua Google Form và hệ thống quản lý nhà trường. Dữ liệu được làm sạch, loại bỏ thiếu sót, phân nhóm sở thích theo mật mã Holland và chọn lọc các thuộc tính quan trọng để xây dựng mô hình.Ứng dụng web dự báo nghề nghiệp có lợi ích gì cho học sinh?
Ứng dụng giúp học sinh tra cứu khả năng thành công và hạnh phúc khi chọn ngành nghề dựa trên thông tin cá nhân và học tập, từ đó điều chỉnh nguyện vọng phù hợp, giảm thiểu rủi ro chọn sai ngành và tăng cơ hội phát triển nghề nghiệp bền vững.Mô hình có thể áp dụng cho các trường khác ngoài THPT Trần Phú không?
Có thể áp dụng rộng rãi cho các trường THPT khác trong tỉnh Quảng Nam hoặc khu vực tương tự, với điều kiện thu thập dữ liệu đầy đủ và điều chỉnh mô hình phù hợp đặc điểm từng địa phương.
Kết luận
- Luận văn đã xây dựng thành công mô hình khai phá dữ liệu bằng thuật toán cây quyết định C4.5 và luật kết hợp, dự báo khả năng hạnh phúc khi học sinh chọn ngành nghề với độ chính xác 67%.
- Các thuộc tính quan trọng ảnh hưởng đến dự báo gồm đặc điểm sở thích, nhóm sở thích, điểm trung bình tổ hợp và điểm trung bình năm lớp 12.
- Ứng dụng web dự báo nghề nghiệp được phát triển giúp học sinh và nhà trường có công cụ hỗ trợ tư vấn chính xác, tiện lợi.
- Kết quả nghiên cứu có ý nghĩa khoa học và thực tiễn, góp phần nâng cao hiệu quả công tác định hướng nghề nghiệp tại các trường THPT vùng miền núi.
- Đề xuất triển khai mở rộng hệ thống, cập nhật dữ liệu định kỳ và đào tạo cán bộ tư vấn để phát huy tối đa hiệu quả ứng dụng trong tương lai.
Hãy áp dụng kết quả nghiên cứu này để nâng cao chất lượng tư vấn hướng nghiệp, giúp học sinh có những lựa chọn ngành nghề phù hợp, góp phần phát triển nguồn nhân lực chất lượng cao cho đất nước.