## Tổng quan nghiên cứu

Trong bối cảnh phát triển mạnh mẽ của công nghệ thông tin và giáo dục điện tử, trắc nghiệm trực tuyến (Internet Based Testing - iBT) đã trở thành phương thức đánh giá năng lực học tập phổ biến trên thế giới và tại Việt Nam. Ước tính hiện nay, các kỳ thi tiêu chuẩn hóa trên thế giới như TOEFL, GRE, SAT thu hút hàng triệu thí sinh tham gia mỗi năm, minh chứng cho sự phát triển vượt bậc của hình thức trắc nghiệm khách quan. Tại Việt Nam, mặc dù khoa học đo lường trong giáo dục còn khá lạc hậu, nhưng các hệ thống trắc nghiệm trực tuyến đã bắt đầu được triển khai tại một số cơ sở đào tạo lớn như Viện Công nghệ Thông tin – Đại học Quốc gia Hà Nội với gần 60 nghìn lượt sát hạch qua phần mềm CMTest.

Vấn đề nghiên cứu tập trung vào việc ứng dụng lý thuyết trắc nghiệm, đặc biệt là lý thuyết ứng đáp câu hỏi (Item Response Theory - IRT), nhằm nâng cao chất lượng ngân hàng câu hỏi và độ chính xác trong đánh giá năng lực thí sinh qua các bài thi trắc nghiệm trực tuyến. Mục tiêu cụ thể của nghiên cứu là xây dựng quy trình xây dựng ngân hàng câu hỏi trắc nghiệm phù hợp với các môn học chuyên ngành Công nghệ Thông tin, đồng thời phát triển và thử nghiệm hệ thống trắc nghiệm trực tuyến ứng dụng lý thuyết IRT tại Viện Công nghệ Thông tin – Đại học Quốc gia Hà Nội.

Phạm vi nghiên cứu bao gồm phân tích lý thuyết trắc nghiệm cổ điển (Classical Test Theory - CTT) và lý thuyết ứng đáp câu hỏi (IRT), xây dựng ngân hàng câu hỏi theo đặc tả IMS QTI, và ứng dụng thực tiễn trên hệ thống trắc nghiệm trực tuyến với mẫu 315 thí sinh. Ý nghĩa nghiên cứu được thể hiện qua việc nâng cao độ tin cậy, độ phân biệt và tính khách quan của các bài thi, góp phần cải tiến phương pháp đánh giá trong giáo dục đại học và đào tạo chuyên môn.

## Cơ sở lý thuyết và phương pháp nghiên cứu

### Khung lý thuyết áp dụng

- **Lý thuyết trắc nghiệm cổ điển (Classical Test Theory - CTT):** Mô hình cơ bản đánh giá điểm bài thi dựa trên điểm thực và sai số, tập trung vào các tham số như độ khó, độ phân biệt và độ tin cậy của câu hỏi. CTT có ưu điểm đơn giản, dễ áp dụng với mẫu nhỏ nhưng hạn chế lớn là các tham số câu hỏi phụ thuộc vào mẫu thí sinh thử nghiệm.

- **Lý thuyết ứng đáp câu hỏi (Item Response Theory - IRT):** Phát triển sau CTT, IRT mô hình hóa mối quan hệ giữa năng lực thí sinh và xác suất trả lời đúng câu hỏi thông qua các tham số độ khó (b), độ phân biệt (a), và độ phỏng đoán (c). IRT khắc phục nhược điểm của CTT bằng cách ước lượng tham số câu hỏi độc lập với mẫu thí sinh và năng lực thí sinh không phụ thuộc vào bộ câu hỏi.

- **Đặc tả IMS QTI (Question & Test Interoperability):** Chuẩn kỹ thuật cho phép tương tác và chia sẻ câu hỏi, bài trắc nghiệm giữa các hệ thống trắc nghiệm trực tuyến, giúp xây dựng ngân hàng câu hỏi linh hoạt và mở rộng.

- **Khái niệm chính:** Năng lực (ability θ), đường cong đặc trưng câu hỏi (Item Characteristic Curve - ICC), độ khó, độ phân biệt, độ phỏng đoán, độ tin cậy, ngân hàng câu hỏi, trắc nghiệm trực tuyến.

### Phương pháp nghiên cứu

- **Nguồn dữ liệu:** Kết quả làm bài thi trắc nghiệm môn Tin học Văn phòng của 315 thí sinh hệ đào tạo Kỹ thuật viên tại Trung tâm Tin học PT – Viện Công nghệ Thông tin – Đại học Quốc gia Hà Nội.

- **Phương pháp phân tích:** Sử dụng thuật toán ước lượng hợp lý cực đại (Maximum Likelihood Estimation) và phương pháp Gradient Descent để ước lượng đồng thời các tham số câu hỏi và năng lực thí sinh theo mô hình IRT 2 và 3 tham số. Phân tích độ khó, độ phân biệt, độ phỏng đoán của câu hỏi, đánh giá độ tin cậy và độ giá trị của bài trắc nghiệm.

- **Timeline nghiên cứu:** Nghiên cứu được thực hiện trong khoảng thời gian từ năm 2022 đến 2024, bao gồm giai đoạn xây dựng ngân hàng câu hỏi, phát triển phần mềm trắc nghiệm trực tuyến, thu thập và phân tích dữ liệu thử nghiệm, và hoàn thiện luận văn.

## Kết quả nghiên cứu và thảo luận

### Những phát hiện chính

- **Phân tích tham số câu hỏi:** Qua ước lượng tham số cho 40 câu hỏi, độ khó trung bình nằm trong khoảng từ -2.5 đến 2.0, độ phân biệt dao động từ 0.3 đến 1.8, và độ phỏng đoán trung bình khoảng 0.2, cho thấy sự đa dạng về mức độ khó và khả năng phân biệt của các câu hỏi.

- **Đánh giá năng lực thí sinh:** Năng lực ước lượng của 315 thí sinh phân bố chủ yếu trong khoảng [-2, 2], với độ chính xác ước lượng cao hơn ở các mức năng lực trung bình, phù hợp với đặc điểm đường cong đặc trưng của câu hỏi.

- **Độ tin cậy bài trắc nghiệm:** Giá trị Cronbach's α đạt 0.87, cho thấy bài trắc nghiệm có độ tin cậy cao, đảm bảo tính ổn định và chính xác trong đánh giá.

- **So sánh với CTT:** IRT cho phép ước lượng tham số câu hỏi không phụ thuộc vào mẫu thí sinh, đồng thời năng lực thí sinh được đánh giá độc lập với bộ câu hỏi, khắc phục hạn chế lớn của CTT.

### Thảo luận kết quả

Kết quả nghiên cứu khẳng định tính ưu việt của lý thuyết ứng đáp câu hỏi (IRT) trong việc nâng cao chất lượng đánh giá trắc nghiệm trực tuyến. Việc ước lượng đồng thời tham số câu hỏi và năng lực thí sinh giúp phát hiện các câu hỏi kém chất lượng để loại bỏ hoặc chỉnh sửa, từ đó nâng cao độ tin cậy và độ giá trị của bài thi. So với phương pháp truyền thống dựa trên điểm thô, IRT cung cấp một thang đo năng lực chính xác và khách quan hơn.

Dữ liệu có thể được trình bày qua biểu đồ đường cong đặc trưng của từng câu hỏi, biểu đồ phân bố năng lực thí sinh, và bảng thống kê tham số câu hỏi để minh họa rõ ràng sự phân bố và hiệu quả của các câu hỏi trong ngân hàng. So sánh với các nghiên cứu quốc tế, kết quả phù hợp với xu hướng ứng dụng IRT trong các hệ thống trắc nghiệm tiêu chuẩn hóa trên thế giới.

## Đề xuất và khuyến nghị

- **Xây dựng và duy trì ngân hàng câu hỏi chất lượng:** Áp dụng quy trình xây dựng ngân hàng câu hỏi theo đặc tả IMS QTI, đảm bảo đa dạng về độ khó, độ phân biệt và độ phỏng đoán, cập nhật thường xuyên dựa trên kết quả phân tích IRT. Chủ thể thực hiện: các giáo viên, chuyên gia trắc nghiệm; Thời gian: liên tục.

- **Triển khai hệ thống trắc nghiệm trực tuyến ứng dụng IRT:** Phát triển phần mềm hỗ trợ sinh đề thi ngẫu nhiên, chấm điểm tự động và ước lượng năng lực thí sinh chính xác. Chủ thể thực hiện: Viện Công nghệ Thông tin và các đơn vị đào tạo; Thời gian: 1-2 năm.

- **Đào tạo chuyên sâu về lý thuyết trắc nghiệm và IRT:** Tổ chức các khóa đào tạo, hội thảo nâng cao năng lực cho cán bộ giáo dục và phát triển phần mềm nhằm nâng cao nhận thức và kỹ năng ứng dụng IRT. Chủ thể thực hiện: Bộ Giáo dục và Đào tạo, các trường đại học; Thời gian: hàng năm.

- **Nâng cao hạ tầng công nghệ và bảo mật:** Đầu tư nâng cấp hạ tầng mạng, đảm bảo an toàn, bảo mật dữ liệu trong quá trình tổ chức thi trực tuyến, giảm thiểu sự cố kỹ thuật. Chủ thể thực hiện: các cơ sở đào tạo, nhà cung cấp dịch vụ CNTT; Thời gian: 1 năm.

## Đối tượng nên tham khảo luận văn

- **Giáo viên và cán bộ khảo thí:** Hỗ trợ xây dựng ngân hàng câu hỏi chất lượng, áp dụng các phương pháp đánh giá hiện đại, nâng cao hiệu quả giảng dạy và kiểm tra.

- **Nhà phát triển phần mềm giáo dục:** Cung cấp cơ sở lý thuyết và thuật toán ước lượng tham số câu hỏi, năng lực thí sinh để phát triển các hệ thống trắc nghiệm trực tuyến chính xác và hiệu quả.

- **Nhà quản lý giáo dục và đào tạo:** Giúp hoạch định chính sách, đầu tư công nghệ và tổ chức các kỳ thi tiêu chuẩn hóa phù hợp với xu hướng hiện đại.

- **Nghiên cứu sinh và học viên cao học:** Là tài liệu tham khảo chuyên sâu về lý thuyết trắc nghiệm, ứng dụng IRT và quy trình xây dựng ngân hàng câu hỏi trong lĩnh vực Công nghệ Thông tin và giáo dục.

## Câu hỏi thường gặp

1. **Lý thuyết ứng đáp câu hỏi (IRT) là gì?**  
IRT là lý thuyết mô hình hóa mối quan hệ giữa năng lực thí sinh và xác suất trả lời đúng câu hỏi, giúp ước lượng chính xác tham số câu hỏi và năng lực thí sinh.

2. **Ưu điểm của IRT so với lý thuyết trắc nghiệm cổ điển (CTT)?**  
IRT không phụ thuộc vào mẫu thí sinh thử nghiệm, năng lực thí sinh được đánh giá độc lập với bộ câu hỏi, nâng cao tính khách quan và độ chính xác.

3. **Ngân hàng câu hỏi được xây dựng như thế nào?**  
Ngân hàng câu hỏi được xây dựng theo quy trình chuẩn, bao gồm xác định năng lực đo, viết câu hỏi, đánh giá và hiệu chỉnh dựa trên phân tích tham số câu hỏi.

4. **Trắc nghiệm trực tuyến có những ưu điểm gì?**  
Dễ dàng tổ chức thi trên diện rộng, chấm điểm tự động, giảm chi phí, tăng tính khách quan và hỗ trợ đào tạo từ xa hiệu quả.

5. **Làm thế nào để đảm bảo an toàn và bảo mật trong trắc nghiệm trực tuyến?**  
Cần đầu tư hạ tầng mạng ổn định, mã hóa dữ liệu, kiểm soát truy cập và có phương án xử lý sự cố kỹ thuật kịp thời.

## Kết luận

- Luận văn đã trình bày chi tiết lý thuyết trắc nghiệm cổ điển và lý thuyết ứng đáp câu hỏi, làm rõ ưu nhược điểm và ứng dụng thực tiễn của từng lý thuyết.  
- Đã xây dựng quy trình xây dựng ngân hàng câu hỏi trắc nghiệm theo đặc tả IMS QTI, phù hợp với đào tạo chuyên ngành Công nghệ Thông tin.  
- Thử nghiệm ứng dụng lý thuyết IRT trên hệ thống trắc nghiệm trực tuyến của Viện Công nghệ Thông tin với mẫu 315 thí sinh cho kết quả khả quan về độ tin cậy và độ chính xác đánh giá năng lực.  
- Đề xuất các giải pháp nâng cao chất lượng trắc nghiệm trực tuyến, bao gồm phát triển phần mềm, đào tạo nhân lực và nâng cấp hạ tầng công nghệ.  
- Khuyến khích các cơ sở đào tạo và nhà quản lý giáo dục áp dụng rộng rãi lý thuyết IRT để nâng cao hiệu quả đánh giá và đào tạo.

Triển khai mở rộng hệ thống trắc nghiệm trực tuyến ứng dụng IRT, đào tạo chuyên sâu cho cán bộ giáo dục, và nghiên cứu phát triển các mô hình ứng dụng mới trong lĩnh vực đo lường giáo dục.