Đề tài tối ưu hóa trải nghiệm học tập của sinh viênbằng cách sử dụng big data

Tài liệu Tối ưu hóa trải nghiệm học tập sinh viên bằng big data tổng hợp lý thuyết và thực hành, phục vụ học tập ngành tại Việt Nam

Chuyên ngành

Tin học đại cương

Người đăng

Ẩn danh

Thể loại

Tiểu luận

2023

45
0
0

Phí lưu trữ

30 Point

Tóm tắt

I. Big Data giáo dục Tối ưu hóa trải nghiệm học tập sinh viên

Trong bối cảnh cách mạng công nghiệp 4.0, Big Data nổi lên như một công cụ đột phá, có khả năng biến đổi sâu sắc ngành giáo dục. Đề tài tối ưu hóa trải nghiệm học tập của sinh viên bằng cách sử dụng big data không còn là một ý tưởng tương lai mà đã trở thành một hướng đi chiến lược được nhiều cơ sở giáo dục đại học theo đuổi. Về cơ bản, Big Data trong giáo dục là việc thu thập, xử lý và phân tích các tập dữ liệu khổng lồ, đa dạng và phức tạp được tạo ra trong quá trình học tập và giảng dạy. Những dữ liệu này, theo định nghĩa của Gartner, được đặc trưng bởi mô hình 7Vs: Volume (Số lượng), Velocity (Tốc độ), Variety (Đa dạng), Veracity (Độ tin cậy), Value (Giá trị), Variability (Sự biến đổi) và Visualisation (Trực quan hóa). Nguồn dữ liệu bao gồm kết quả học tập từ hệ thống quản lý học tập (LMS), lịch sử tương tác trên các nền tảng trực tuyến, thông tin tuyển sinh và cả dữ liệu hành vi người học. Việc áp dụng Big Data cho phép các nhà giáo dục chuyển từ phương pháp tiếp cận đồng loạt sang một mô hình giáo dục được cá nhân hóa sâu sắc, đáp ứng chính xác nhu cầu và năng lực của từng cá nhân. Thay vì chỉ dựa vào các bài kiểm tra định kỳ, các nhà quản lý có thể sử dụng phân tích học thuật (learning analytics) để theo dõi tiến độ học tập theo thời gian thực, xác định sớm các sinh viên có nguy cơ tụt hậu và can thiệp kịp thời. Đây chính là sức mạnh của khoa học dữ liệu cho giáo dục: biến dữ liệu thô thành những hiểu biết sâu sắc, phục vụ mục tiêu cuối cùng là nâng cao chất lượng đào tạo và mang lại trải nghiệm học tập ý nghĩa, hiệu quả nhất cho sinh viên.

1.1. Hiểu đúng về phân tích dữ liệu lớn giáo dục và mô hình 7Vs

Big Data không chỉ đơn thuần là dữ liệu lớn về mặt dung lượng. Theo nhà phân tích Doug Laney (2001), nó được định nghĩa ban đầu bởi 3Vs: Volume (Số lượng), Velocity (Tốc độ) và Variety (Đa dạng). Tuy nhiên, trong bối cảnh giáo dục hiện đại, mô hình đã được mở rộng thành 7Vs để phản ánh đầy đủ tính phức tạp của nó. Phân tích dữ liệu lớn giáo dục là quá trình ứng dụng các kỹ thuật thống kê và máy học để khai thác thông tin giá trị từ dữ liệu học tập. Dữ liệu này có thể là dữ liệu có cấu trúc (bảng điểm, thông tin nhân khẩu học), bán cấu trúc (dữ liệu từ LMS) hoặc phi cấu trúc (thảo luận trên diễn đàn, video bài giảng). Việc hiểu rõ 7 thuộc tính này giúp các cơ sở giáo dục xây dựng chiến lược thu thập và xử lý dữ liệu hiệu quả, đảm bảo tính chính xác và giá trị của thông tin đầu ra.

1.2. Tầm quan trọng của Big Data giúp cải thiện chất lượng giảng dạy

Big Data cung cấp cho giảng viên một lăng kính chi tiết để nhìn nhận hiệu quả của phương pháp giảng dạy. Bằng cách phân tích dữ liệu về mức độ tương tác của sinh viên với tài liệu học tập, thời gian hoàn thành bài tập, hay các câu hỏi thường gặp, giảng viên có thể xác định được phần kiến thức nào khó hiểu và cần điều chỉnh cách truyền đạt. Điều này giúp cải thiện chất lượng giảng dạy một cách liên tục, dựa trên bằng chứng cụ thể thay vì cảm tính. Hơn nữa, dữ liệu còn giúp nhận diện các phong cách học tập khác nhau trong lớp, từ đó giảng viên có thể đa dạng hóa nội dung và hoạt động để thu hút mọi sinh viên, góp phần tối ưu hóa tài nguyên giáo dục và nâng cao kết quả học tập chung.

II. Thách thức giáo dục và nhu cầu cá nhân hóa lộ trình học tập

Hệ thống giáo dục truyền thống thường đối mặt với thách thức cố hữu của phương pháp "một kích cỡ cho tất cả". Trong một lớp học đông sinh viên, việc đáp ứng nhu cầu học tập riêng biệt của từng cá nhân là gần như không thể. Hậu quả là nhiều sinh viên không theo kịp chương trình, cảm thấy chán nản và dẫn đến nguy cơ bỏ học. Đây là một trong những vấn đề cấp thiết mà tối ưu hóa trải nghiệm học tập của sinh viên bằng cách sử dụng big data hướng đến giải quyết. Thiếu các công cụ đo lường sự tương tác của sinh viên một cách hiệu quả khiến giảng viên khó nhận biết sớm các dấu hiệu cảnh báo. Các bài kiểm tra giữa kỳ và cuối kỳ chỉ cung cấp một cái nhìn tổng quan tại một thời điểm nhất định, không phản ánh được toàn bộ quá trình nỗ lực hay những khó khăn tiềm ẩn. Sự thiếu hụt dữ liệu chi tiết này làm cản trở việc cung cấp sự hỗ trợ sinh viên thông minh và kịp thời. Nhu cầu cá nhân hóa lộ trình học tập trở nên bức thiết hơn bao giờ hết. Mỗi sinh viên có một nền tảng kiến thức, tốc độ tiếp thu và mục tiêu nghề nghiệp khác nhau. Một lộ trình học tập linh hoạt, được điều chỉnh dựa trên dữ liệu thực tế sẽ giúp tối đa hóa tiềm năng của họ, duy trì động lực và giảm thiểu rủi ro học tập. Big Data chính là chìa khóa để hiện thực hóa mô hình giáo dục lấy người học làm trung tâm, nơi mỗi sinh viên được trao quyền để đi trên con đường học vấn phù hợp nhất với bản thân.

2.1. Hạn chế của phương pháp dạy học đồng loạt hiện nay

Phương pháp giảng dạy đồng loạt giả định rằng tất cả sinh viên trong một lớp có cùng tốc độ học và cùng mối quan tâm. Điều này tạo ra một khoảng cách lớn giữa những sinh viên tiếp thu nhanh và những người cần thêm thời gian. Những sinh viên giỏi có thể cảm thấy nhàm chán, trong khi những sinh viên yếu hơn dần bị bỏ lại phía sau. Hạn chế này không chỉ ảnh hưởng đến kết quả học tập mà còn làm giảm sự hứng thú và động lực của người học. Việc thiếu các cơ chế phản hồi cá nhân hóa khiến sinh viên không biết mình đang mạnh hay yếu ở điểm nào để cải thiện.

2.2. Bài toán nan giải Làm sao để giảm tỷ lệ sinh viên bỏ học

Tỷ lệ sinh viên bỏ học cao là một tổn thất lớn cho cả cá nhân, gia đình và xã hội. Nguyên nhân có thể đến từ nhiều yếu tố: khó khăn trong học tập, áp lực tài chính, thiếu định hướng nghề nghiệp, hoặc cảm giác lạc lõng. Các phương pháp can thiệp truyền thống thường mang tính phản ứng, tức là chỉ hành động khi vấn đề đã trở nên nghiêm trọng. Big Data mở ra một hướng tiếp cận chủ động hơn. Bằng cách phân tích các yếu tố nguy cơ, hệ thống có thể giúp giảm tỷ lệ sinh viên bỏ học thông qua việc xác định sớm và cung cấp các biện pháp hỗ trợ phù hợp trước khi sinh viên đi đến quyết định cuối cùng.

III. Phương pháp phân tích học thuật để tối ưu hóa trải nghiệm học

Phân tích học thuật (Learning Analytics) là một lĩnh vực cốt lõi trong việc tối ưu hóa trải nghiệm học tập của sinh viên bằng cách sử dụng big data. Đây là quá trình đo lường, thu thập, phân tích và báo cáo dữ liệu về người học và bối cảnh của họ, nhằm mục đích thấu hiểu và tối ưu hóa việc học cũng như môi trường học tập. Thay vì chỉ nhìn vào điểm số cuối kỳ, learning analytics tập trung vào toàn bộ quá trình. Dữ liệu được thu thập từ nhiều nguồn, đặc biệt là từ các hệ thống quản lý học tập (LMS) như Moodle hay Canvas. Mỗi cú nhấp chuột, mỗi video được xem, mỗi bài đăng trên diễn đàn, hay thời gian dành cho một bài tập đều là những điểm dữ liệu quý giá. Những dữ liệu hành vi người học này được tổng hợp để tạo ra một bức tranh toàn cảnh về mô hình học tập của sinh viên. Ví dụ, hệ thống có thể phát hiện một sinh viên thường xuyên truy cập tài liệu vào đêm khuya, hoặc một sinh viên khác chưa bao giờ tham gia vào các hoạt động thảo luận nhóm. Những thông tin này giúp giảng viên và cố vấn học tập có những can thiệp mang tính cá nhân. Việc áp dụng khoa học dữ liệu cho giáo dục cho phép các trường đại học không chỉ phân tích những gì đã xảy ra mà còn dự đoán những gì có thể xảy ra, tạo điều kiện cho một môi trường giáo dục chủ động và hỗ trợ.

3.1. Khai thác dữ liệu hành vi người học từ hệ thống LMS

Hệ thống LMS là một mỏ vàng dữ liệu. Nó ghi lại mọi tương tác của sinh viên với khóa học: số lần đăng nhập, thời gian dành cho mỗi học phần, tần suất xem lại bài giảng, kết quả các bài kiểm tra nhanh, và mức độ tham gia diễn đàn. Bằng cách khai thác dữ liệu hành vi người học, các nhà phân tích có thể xác định các mẫu hành vi liên quan đến thành công hoặc thất bại trong học tập. Ví dụ, nghiên cứu có thể chỉ ra rằng những sinh viên thường xuyên xem lại video bài giảng có xu hướng đạt điểm cao hơn. Thông tin này có thể được sử dụng để khuyến khích các hành vi học tập tích cực.

3.2. Đo lường sự tương tác của sinh viên với tài liệu học tập

Việc đo lường sự tương tác của sinh viên vượt ra ngoài việc điểm danh. Các công cụ phân tích hiện đại có thể theo dõi cách sinh viên tương tác với tài liệu kỹ thuật số: họ đánh dấu những đoạn nào, họ dành bao nhiêu thời gian cho một trang sách điện tử, họ có bỏ qua các video hướng dẫn hay không. Dữ liệu này cung cấp phản hồi vô giá cho người thiết kế khóa học để tối ưu hóa tài nguyên giáo dục. Nếu đa số sinh viên bỏ qua một chương cụ thể, có thể nội dung đó không liên quan hoặc được trình bày quá phức tạp, cần được cải tiến.

IV. Bí quyết xây dựng mô hình dự đoán kết quả học tập hiệu quả

Một trong những ứng dụng mạnh mẽ nhất của Big Data trong giáo dục là khả năng dự đoán. Việc xây dựng mô hình dự đoán kết quả học tập cho phép các cơ sở giáo dục chuyển từ việc giải quyết vấn đề sang phòng ngừa vấn đề. Bằng cách sử dụng các thuật toán máy học và trí tuệ nhân tạo trong giáo dục, hệ thống có thể phân tích dữ liệu lịch sử (điểm đầu vào, kết quả các môn học trước, hành vi trên LMS) để xác định xác suất một sinh viên sẽ gặp khó khăn trong một môn học cụ thể. Đây là một bước tiến vượt bậc trong việc tối ưu hóa trải nghiệm học tập của sinh viên bằng cách sử dụng big data. Khi một sinh viên được hệ thống gắn cờ là có nguy cơ cao, cố vấn học tập hoặc giảng viên có thể chủ động tiếp cận để cung cấp sự hỗ trợ cần thiết, chẳng hạn như các buổi phụ đạo, tài liệu bổ sung, hoặc tư vấn về phương pháp học. Mô hình này không chỉ giúp giảm tỷ lệ sinh viên bỏ học mà còn thúc đẩy một văn hóa quan tâm, chăm sóc trong môi trường học đường. Ngoài ra, các mô hình này còn có thể gợi ý các môn học tự chọn phù hợp với năng lực và sở thích của sinh viên, giúp họ xây dựng một lộ trình học tập cá nhân hóa tối ưu, phục vụ cho mục tiêu nghề nghiệp tương lai. Việc cung cấp hỗ trợ sinh viên thông minh và kịp thời dựa trên dự đoán chính là tương lai của quản lý đào tạo hiện đại.

4.1. Vai trò của trí tuệ nhân tạo trong giáo dục và hệ thống gợi ý

Trí tuệ nhân tạo trong giáo dục (AI in Education) đóng vai trò là bộ não xử lý khối Big Data thu thập được. Các thuật toán AI có thể nhận diện các mẫu phức tạp trong dữ liệu mà con người khó có thể nhìn thấy. Dựa trên phân tích này, hệ thống có thể đưa ra các gợi ý thông minh, ví dụ như đề xuất các bài đọc thêm cho sinh viên tỏ ra yêu thích một chủ đề, hoặc giới thiệu các khóa học kỹ năng mềm cho những sinh viên sắp tốt nghiệp. Các hệ thống này hoạt động tương tự như cơ chế gợi ý sản phẩm của Amazon hay phim của Netflix, nhưng được áp dụng vào bối cảnh học thuật.

4.2. Cách cung cấp hệ thống hỗ trợ sinh viên thông minh 24 7

Một hệ thống hỗ trợ sinh viên thông minh có thể hoạt động dưới dạng chatbot hoặc trợ lý ảo. Được tích hợp AI và truy cập vào cơ sở dữ liệu lớn của trường, các công cụ này có thể trả lời ngay lập tức các câu hỏi phổ biến của sinh viên về lịch học, thủ tục đăng ký, hay chính sách học vụ, giải phóng thời gian cho nhân viên tư vấn để tập trung vào các vấn đề phức tạp hơn. Hơn nữa, chúng có thể gửi các nhắc nhở tự động về hạn nộp bài, lịch thi, hoặc các sự kiện quan trọng, giúp sinh viên quản lý thời gian hiệu quả và giảm bớt căng thẳng.

V. Ứng dụng Edtech và Big Data để nâng cao chất lượng đào tạo

Sự kết hợp giữa Edtech và Big Data đang tạo ra một cuộc cách mạng trong phương pháp tiếp cận giáo dục. Các ứng dụng thực tiễn cho thấy rõ hiệu quả của việc tối ưu hóa trải nghiệm học tập của sinh viên bằng cách sử dụng big data. Nhiều trường đại học hàng đầu trên thế giới đã triển khai các nền tảng learning analytics để theo dõi và cải thiện hiệu suất sinh viên. Ví dụ, Đại học Purdue với dự án Signals, đã sử dụng mô hình dự đoán để cảnh báo sớm cho sinh viên về nguy cơ rớt môn, kết quả là tỷ lệ duy trì sinh viên đã tăng lên đáng kể. Tại Việt Nam, một số trường cũng bắt đầu ứng dụng phân tích dữ liệu lớn giáo dục để tối ưu hóa công tác tuyển sinh, phân bổ tài nguyên và quản lý chất lượng đào tạo. Các nền tảng học tập thích ứng (adaptive learning platforms) là một minh chứng điển hình. Những nền tảng này sử dụng thuật toán để điều chỉnh độ khó của câu hỏi và nội dung bài học theo thời gian thực, dựa trên câu trả lời của từng sinh viên. Điều này đảm bảo mỗi người học luôn được thử thách ở mức độ phù hợp, không quá dễ gây nhàm chán và cũng không quá khó gây nản chí. Kết quả là sự tương tác và mức độ tiếp thu kiến thức được cải thiện rõ rệt, góp phần hiện thực hóa mục tiêu cá nhân hóa lộ trình học tập trên quy mô lớn. Việc áp dụng thành công các công nghệ này không chỉ giúp sinh viên học tốt hơn mà còn cung cấp cho ban giám hiệu những dữ liệu quý giá để đưa ra các quyết định chiến lược về phát triển chương trình và đầu tư.

5.1. Case study Tối ưu hóa tài nguyên giáo dục tại các đại học

Big Data giúp các nhà quản lý đưa ra quyết định dựa trên dữ liệu về việc tối ưu hóa tài nguyên giáo dục. Bằng cách phân tích dữ liệu đăng ký môn học qua các năm, trường có thể dự đoán nhu cầu và mở số lượng lớp học phù hợp, tránh tình trạng lớp quá đông hoặc quá vắng. Tương tự, dữ liệu từ hệ thống thư viện số có thể cho biết tài liệu nào được sử dụng nhiều nhất, từ đó định hướng cho việc mua sắm tài nguyên mới, đảm bảo ngân sách được chi tiêu hiệu quả và đáp ứng đúng nhu cầu thực tế của sinh viên và giảng viên.

5.2. Kết quả thực tiễn trong việc nâng cao tỷ lệ sinh viên tốt nghiệp

Các chương trình can thiệp sớm dựa trên phân tích dữ liệu đã chứng minh hiệu quả trong việc cải thiện tỷ lệ tốt nghiệp. Khi một sinh viên được xác định có nguy cơ, hệ thống sẽ tự động kích hoạt một chuỗi các hành động hỗ trợ: gửi email từ cố vấn học tập, mời tham gia các nhóm học tập, hoặc cung cấp các khóa học bổ trợ kỹ năng. Cách tiếp cận chủ động này giúp giải quyết các vấn đề từ gốc rễ, giữ cho sinh viên duy trì được động lực và đi đúng hướng trên con đường học vấn của mình, trực tiếp góp phần vào việc giảm tỷ lệ sinh viên bỏ học.

VI. Tương lai của Big Data Cách mạng hóa giáo dục đại học Việt Nam

Tương lai của giáo dục đại học gắn liền với dữ liệu. Quá trình tối ưu hóa trải nghiệm học tập của sinh viên bằng cách sử dụng big data sẽ tiếp tục phát triển mạnh mẽ, định hình lại mọi khía cạnh của việc dạy và học. Xu hướng sắp tới sẽ là sự tích hợp sâu hơn của trí tuệ nhân tạo trong giáo dục, tạo ra các hệ sinh thái học tập thông minh và hoàn toàn cá nhân hóa. Các trợ lý học tập ảo sẽ không chỉ trả lời câu hỏi mà còn có thể đóng vai trò như một người gia sư riêng, thấu hiểu điểm mạnh, điểm yếu và phong cách học của từng sinh viên để đưa ra những gợi ý phù hợp. Tuy nhiên, hành trình này cũng đối mặt với không ít thách thức. Các vấn đề về bảo mật dữ liệu và đạo đức trong việc sử dụng thông tin cá nhân của sinh viên cần được đặt lên hàng đầu. Cần có những quy định rõ ràng và minh bạch về việc ai có quyền truy cập dữ liệu và dữ liệu được sử dụng cho mục đích gì. Hơn nữa, việc triển khai thành công đòi hỏi một sự đầu tư lớn vào hạ tầng công nghệ và đào tạo nhân lực có khả năng thực hiện phân tích học thuật. Vượt qua những rào cản này, tiềm năng của Big Data là vô hạn. Nó hứa hẹn xây dựng một nền giáo dục đại học linh hoạt, hiệu quả và công bằng hơn, nơi mỗi sinh viên đều có cơ hội để phát huy hết tiềm năng của mình.

6.1. Xu hướng phát triển của learning analytics và trí tuệ nhân tạo

Trong tương lai, learning analytics sẽ không chỉ dừng lại ở việc dự đoán kết quả mà sẽ tiến tới phân tích cảm xúc và mức độ gắn kết của sinh viên thông qua phân tích văn bản hoặc nhận diện hình ảnh. AI sẽ giúp tạo ra các nội dung học tập động, tự điều chỉnh để phù hợp với từng cá nhân. Sự phát triển của Edtech và Big Data sẽ tạo ra một vòng lặp cải tiến liên tục: dữ liệu giúp AI thông minh hơn, và AI thông minh hơn sẽ tạo ra trải nghiệm học tập tốt hơn, từ đó lại tạo ra nhiều dữ liệu giá trị hơn.

6.2. Thách thức về bảo mật và đạo đức trong phân tích dữ liệu

Việc thu thập một lượng lớn dữ liệu về sinh viên làm dấy lên những lo ngại về quyền riêng tư. Ai sở hữu dữ liệu này? Dữ liệu có thể bị sử dụng để phân biệt đối xử với sinh viên hay không? Các cơ sở giáo dục phải xây dựng các chính sách quản trị dữ liệu chặt chẽ, đảm bảo tính ẩn danh và chỉ sử dụng dữ liệu cho các mục đích cải thiện giáo dục đã được công bố. Sự minh bạch và tin tưởng là yếu tố then chốt để sinh viên và các bên liên quan chấp nhận việc ứng dụng công nghệ này.

20/09/2025

Trích đoạn nội dung tài liệu

CHƯƠNG 1: TỔNG QUAN – CƠ SỞ LÍ LUẬN 1. Một số khái niệm liên quan 1. B Khái niệm Big Data ig Data là một khái niệm liên quan đến việc thu thập, xử lý và lưu trữ một lượng dữ liệu khổng lồ do người dùng tạo ra. Nói một cách đơn giản, Big Data (dữ liệu lớn) là các tập dữ liệu lớn hơn, phức tạp hơn, đặc biệt là từ các nguồn dữ liệu mới.

Những bộ dữ liệu này đồ sộ đến mức các phần mềm xử lý dữ liệu truyền thống không thể quản lý chúng. Big Data có thể bao gồm nhiều loại dữ liệu khác nhau như các tập dữ liệu có cấu trúc, không cấu trúc và cả những dữ liệu bán cấu trúc (Hình 1) (Oracle). úc có các thuộc tính của ữ liệu không nhưng thể chứa không trong đủ để xem Dữ liệu có cấu trúc là dữ liệu nóđược cũngtổkhông chức có theo mômột định hình dữ dạng nhất định, thường nào đượci hoặc lưu trữloại trongkhác các bảng hoặc liên quan tệp Excel. Hình 1: Khái niệm các kiểu cấu trúc dữ liệu 1 ĐỀ TÀI: BIG DATA Thiên Ân & Quốc Vinh Big Data không xuất hiện lần đầu tiên vào năm 2008 với bài xã luận của Chris Anderson.

Nó cũng không phải là phát minh của gã khổng lồ Google vào năm 1998. Nó cũng chẳng phải là một đứa con tinh thần khác của Steve Jobs, người đã cùng hai người khác thành lập Apple vào năm 1976. Tuy nhiên thuật ngữ này đã xuất hiện ngay từ những ngày đầu tiên của cuộc cách mạng Công nghiệp lần thứ 3 vào những năm thập niên 50. Tại thời điểm này, các nhà địa lý đã bắt đầu sử dụng các phương pháp định lượng để đo lường chính xác hơn, việc sử dụng máy tính để xử lý dữ liệu và việc sử dụng các mô hình toán học để mô tả các hiện tượng địa lý (Barnes 2013).

Ngày nay nhân loại đã ứng dụng công cụ Big Data để: xác định xu hướng kinh doanh, chất lượng nghiên cứu, ngăn chặn bệnh dịch, liên kết các trích dẫn luật pháp, phòng chống tội phạm, xác định tình trạng giao thông trong thời gian thực. Vào năm 2001, nhà phân tích hàng đầu Doug Laney của tập đoàn META (một tổ chức nghiên cứu hàng đầu trong lĩnh vực công nghệ thông tin, hiện đã sáp nhập vào Gartner) đã phát biểu về những thách thức và cơ hội đối diện với sự gia tăng về dữ liệu, và ông đã sử dụng một phương pháp mô tả tinh tế bằng ba khía cạnh quan trọng, được gọi là "3Vs" bao gồm: Số lượng lưu trữ (Volume), Tốc độ xử lý dữ liệu (Velocity) và cuối cùng là Các loại hình dữ liệu (Variety) (Hình 2). c độ xử lý dữ liệu (Velocity) Thời gian thực, hàng loạt, xử lý luồng Dữ liệu có cấu trúc, không cấu Dữ liệu trúc, dữ liệu Terabytes, hàng bán cấu trúc loạt các bản ghi Các loại hình dữ liệu (Variety) lượng lưu trữ (Volume) 2 ĐỀ TÀI: BIG DATA Thiên Ân & Quốc Vinh Hình 2: Mô hình 3Vs của Big Data Đến năm 2012, Gartner bổ sung ngoài 3 tính chất trên thì Big Data còn phải “cần đến các dạng xử lý mới để giúp đỡ việc đưa ra quyết định, khám phá sâu vào sự vật/sự việc và tối ưu hóa các quy trình làm việc”. Năm 2014, Gartner đã đưa ra một khái niệm mới : “5Vs” về Big Data.

Khái niệm “5Vs” của Gartner có thể được hiểu như sau:  “Volume” – “Số lượng dữ liệu”: là lượng dữ liệu được tạo ra từ nhiều nguồn khác nhau như các giao dịch kinh doanh, các bài đăng trên mạng xã hội, cảm biến,… “Volume” còn được biết đến là một trong những yếu tố quan trọng nhất của Big Data, thường được đo bằng terabyte (TB), petabyte (PB), exabyte (EB), zettabyte (ZB) hoặc yottabyte (YB).(SHARMA 11 JUNE, 2020)  “Velocity” – “Tốc độ xử lý dữ liệu”: "Velocity" trong Big Data nói lên tốc độ mà dữ liệu được tạo ra và xử lý. Với sự phát triển không ngừng của công nghệ, dữ liệu ngày càng được tạo ra và thu thập với tốc độ chóng mặt, đôi khi ngay lập tức, gần như theo thời gian hiện hành (real-time). Điều này đặc biệt quan trọng trong các lĩnh vực như Internet, Tài chính - Ngân hàng, Hàng không, Quân sự, Y tế - Sức khỏe, nơi mà việc xử lý dữ liệu theo thời gian thực là rất cần thiết. Công nghệ xử lý Big Data hiện đại cho phép chúng ta xử lý dữ liệu ngay lập tức, trước khi chúng được lưu trữ vào cơ sở dữ liệu.

Điều này khác biệt so với cách tiếp cận truyền thống, thuật ngữ chỉ tính chất chuyển động liên tục của dòng dữ liệu (Streaming Data) rất lớn cần xử lý, khác với cách truyền thống ta thu nhận và xử lý dữ liệu theo lô (Batch). (Marr 2014)  “Variety” - “Đa dạng chủng loại”: Hình thức lưu trữ đã ngày một đa dạng hơn, nếu trước kia ta thường nhắc đến dữ liệu có cấu trúc thì ngày nay hơn 80% dữ liệu hiện nay là dạng không có cấu trúc (unstructured data), bao gồm các tài liệu, blog, hình ảnh, video, audio,.Công nghệ Big Data hiện đại 3 ĐỀ TÀI: BIG DATA Thiên Ân & Quốc Vinh cho phép chúng ta liên kết và phân tích nhiều loại dữ liệu khác nhau với nhau. Ví dụ, chúng ta có thể phân tích các bình luận hoặc bài đăng từ một nhóm người dùng cụ thể trên Facebook kết hợp với thông tin video được chia sẻ từ YouTube hoặc Twitter.  “Value” – “Giá trị thông tin”: là tính chất quan trọng nhất của công nghệ Big Data.

Để ứng dụng Big Data hiệu quả, cơ sở ứng dụng phải xác định được những thông tin hữu ích cho vấn đề, bài toán hoặc mô hình hoạt động của mình. Chỉ khi có được “Giá trị của thông tin” thì mới nên bắt tay vào Big Data. Dữ liệu là nguồn chứa hầu hết mọi thông tin của con người, nhưng chúng chỉ có giá trị khi được phân tích (xử lý). Xử lý dữ liệu lớn là một vấn đề khó, và cần có những phương pháp và công cụ thích hợp để làm việc này.

 “Veracity” – “Độ chính xác của dữ liệu”: là một trong những tính chất phức tạp nhất của Big Data. Với sự phát triển mạnh mẽ của mạng và truyền thông xã hội, cùng với sự gia tăng tương tác và chia sẻ thông tin qua điện thoại thông minh, việc xác định độ tin cậy và chính xác của dữ liệu ngày càng trở nên khó khăn. Đặc biệt, công đoạn phân tích và loại bỏ dữ liệu gây nhiễu, không chính xác có vai trò đặc biệt quan trọng. Chỉ có công nghệ Big Data mới có khả năng đáp ứng được yêu cầu này.

Hiện nay thế giới đã được tiếp cận đến đến mô hình 7V’s của dữ liệu lớn, một khái niệm mới được Gartner đưa ra năm 2014 (Khan, Uddin et al. Chúng ta sẽ có cái nhìn đầy đủ về các tính chất quan trọng của dữ liệu lớn theo mô hình này (Hình 3). Theo mô hình này, dữ liệu lớn có năm tính chất trến và được bổ sung thêm hai tính chất là:  “Variability” – “Sự thay đổi liên tục”: sự linh động về ý nghĩa của dữ liệu, đòi hỏi phải có chương trình phức tạp để hiểu được ngữ cảnh và giải mã ý nghĩa chính xác. 4 ĐỀ TÀI: BIG DATA Thiên Ân & Quốc Vinh  “Visualisation” – “Cách thức trình bày”: là việc biểu diễn thông tin và dữ liệu dưới dạng đồ họa, giúp nhìn thấy và hiểu rõ hơn về xu hướng, ngoại lệ và mô hình trong dữ liệu.

Volume (Số lượng) Variety Velocity (Chủng (Tốc độ xử loại) lý) DỮ LIỆU LỚN (BIG DATA) Value Veracity (Độ chính (Giá trị) xác) Variability Visualisation (Tính linh (Trình bày hoạt) dữ liệu) Hình 3: Mô hình 7Vs của Big Data 1. Tối ưu hóa trải nghiệm học tập của sinh viên bằng cách sủ dụng Big Data N gày nay Big Data được ứng dụng trong giáo dục đại học bao gồm hai loại dữ liệu chính: dữ liệu hành chính và dữ liệu quá trình học tập. Dữ liệu hành chính, bao gồm thông tin về nhân khẩu học, nền tảng học 5 ĐỀ TÀI: BIG DATA Thiên Ân & Quốc Vinh vấn và hồ sơ học tập của sinh viên, ngày càng được số hóa và chuẩn hóa. Hệ thống thông tin học sinh (SIS) được sử dụng rộng rãi để lưu trữ và sắp xếp thông tin này.

Big Data giúp phân tích dữ liệu từ SIS để hiểu rõ hơn về hành vi và nhu cầu của sinh viên, từ đó nâng cao trải nghiệm học tập của sinh viên… Big Data còn có khả năng cá nhân hóa giáo dục trực tuyến bằng cách phân tích thông tin về lịch sử học, các môn học yêu thích, thời gian học… của học viên để cá nhân hóa bài giảng giúp cải thiện kết quả học tập (nongbichvan 2018). TT Loại dữ liệu Mô tả 1 Dữ liệu tuyển sinh và Số lượng hồ sơ đăng ký, số lượng nhập học, nhập học điểm trúng tuyển học bạ… 2 Dữ liệu người học Bao gồm: tên, tuồi, trường cấp 3 đã theo học, thành tích học tập trong quá khứ, thông tin liên lạc… 3 Dữ liệu về đội ngũ Số lượng giảng viên, nhân viên, hồ sơ đội ngũ… 4 Dữ liệu tài chính Thu nhập, chi tiêu, ngân sách, thuế, lợi nhuận… 5 Dữ liệu cựu người học Địa chỉ, thông tin liên hệ hiện tại, vị trí công việc, nơi làm việc… 6 Kế hoạch giảng dạy, học Dữ liệu về danh sách các môn học mở trong tập và nghiên cứu từng học kỳ, phân công giảng viên, số lượng sinh viên đăng ký, danh sách phân bổ đề tài… 7 Cơ sở vật chất Số phòng học, phòng thí nghiệm, trang thiết bị, phần mềm, thư viện, kí túc xá… Bảng 1: Dữ liệu quá trình học tập có cấu trúc Ví dụ, thông qua việc phân tích dữ liệu về hiệu suất học tập, các nhà giáo dục có thể nhận ra được những khó khăn mà sinh viên đang gặp phải và đưa ra các biện pháp hỗ trợ kịp thời. Ngoài ra, Big Data cũng cho phép các nhà giáo 6 ĐỀ TÀI: BIG DATA Thiên Ân & Quốc Vinh dục theo dõi sự tiến bộ của sinh viên theo thời gian và điều chỉnh phương pháp giảng dạy của mình để phù hợp với nhu cầu của sinh viên. Cuối cùng, thông qua việc sử dụng công cụ trực quan hóa dữ liệu, các nhà giáo dục có thể trình bày dữ liệu một cách rõ ràng và dễ hiểu, giúp sinh viên có cái nhìn tổng quan về quá trình học tập của mình (Marr 2015).

Tầm quan trọng của Big Data trong giáo dục T rong giáo dục đại học, dữ liệu lớn có vai trò quan trọng trong việc cải thiện chất lượng và hiệu quả của quá trình học tập, giảng dạy, nghiên cứu và quản lý.

Nội dung được bảo vệ bản quyền — Tải xuống đầy đủ