I. Giới thiệu đề tài
Hệ thống hỏi đáp hỗ trợ học vụ trong thạc sĩ khoa học máy tính đã trở thành một công cụ quan trọng trong việc giải quyết các thắc mắc của sinh viên về quy định học vụ. Hệ thống này không chỉ giúp sinh viên tiết kiệm thời gian mà còn nâng cao hiệu quả trong việc tìm kiếm thông tin. Việc ứng dụng công nghệ thông tin vào giáo dục, đặc biệt là trong việc xây dựng hệ thống hỏi đáp, đang dần trở thành xu hướng tất yếu. Mô hình ngôn ngữ lớn, như GPT và các phiên bản khác, đã mở ra nhiều cơ hội cho việc phát triển các hệ thống này. Các mô hình này có khả năng xử lý ngôn ngữ tự nhiên, giúp cải thiện độ chính xác của câu trả lời. Theo nghiên cứu, việc kết hợp các mô hình ngôn ngữ lớn với phương pháp Retrieval Augmented Generation (RAG) đã cho thấy hiệu quả trong việc cải thiện chất lượng câu trả lời, đặc biệt trong môi trường học tập.
1.1 Mục tiêu của đề tài
Mục tiêu chính của đề tài là phát triển một hệ thống hỏi đáp có khả năng cung cấp thông tin chính xác và nhanh chóng cho sinh viên. Hệ thống sẽ được xây dựng dựa trên mô hình ngôn ngữ lớn, với các phương pháp cải tiến như Hybrid Search và Multiquery để nâng cao hiệu suất tìm kiếm thông tin. Việc nghiên cứu và áp dụng các kỹ thuật mới trong lĩnh vực công nghệ giáo dục sẽ giúp tạo ra một nền tảng vững chắc cho việc phát triển hệ thống hỏi đáp hiệu quả. Hệ thống này không chỉ giải đáp các câu hỏi thường gặp mà còn hỗ trợ sinh viên trong việc nắm bắt thông tin liên quan đến quy định học vụ, từ đó nâng cao trải nghiệm học tập.
II. Công trình nghiên cứu liên quan
Chương này tổng hợp các công trình nghiên cứu liên quan đến hệ thống hỏi đáp và mô hình ngôn ngữ lớn. Các nghiên cứu trước đây đã chỉ ra rằng việc áp dụng công nghệ thông tin vào giáo dục có thể mang lại nhiều lợi ích, bao gồm tăng cường khả năng tiếp cận thông tin và cải thiện chất lượng học tập. Một số mô hình như RAG đã được nghiên cứu và ứng dụng thành công trong nhiều lĩnh vực, từ y tế đến giáo dục. Tuy nhiên, vẫn còn nhiều thách thức trong việc triển khai các mô hình này trong môi trường học thuật, đặc biệt là trong việc xử lý các thông tin không chính xác hoặc không đầy đủ. Việc cải thiện các mô hình này thông qua các phương pháp như phân loại câu hỏi và xếp hạng sẽ là những hướng nghiên cứu quan trọng trong tương lai.
2.1 Hệ thống hỏi đáp
Hệ thống hỏi đáp có thể được phân loại thành hai loại chính: nguồn thông tin mở và nguồn thông tin đóng. Hệ thống mở có khả năng trả lời câu hỏi trên nhiều chủ đề khác nhau, trong khi hệ thống đóng chỉ có thể cung cấp câu trả lời dựa trên một nguồn thông tin cụ thể. Trong môi trường học tập, hệ thống hỏi đáp thường được xây dựng dựa trên các quy định nội bộ của trường, nhằm giải đáp các thắc mắc của sinh viên về quy chế học vụ. Việc áp dụng các mô hình ngôn ngữ lớn vào các hệ thống này sẽ giúp cải thiện đáng kể độ chính xác và hiệu quả trong việc cung cấp thông tin cho sinh viên.
III. Mô hình đề xuất
Mô hình đề xuất trong luận văn này tập trung vào việc cải thiện hệ thống hỏi đáp thông qua việc kết hợp các kỹ thuật như Hybrid Search, Multiquery, và Parent Child Document. Các kỹ thuật này sẽ giúp tối ưu hóa quá trình truy xuất thông tin và nâng cao độ chính xác của câu trả lời. Việc áp dụng mô hình Rerank sẽ cho phép hệ thống sắp xếp các kết quả truy xuất theo mức độ liên quan, từ đó cung cấp cho người dùng các câu trả lời chính xác nhất. Mô hình này không chỉ áp dụng cho lĩnh vực giáo dục mà còn có thể mở rộng ra nhiều lĩnh vực khác, tạo ra một nền tảng vững chắc cho việc phát triển các hệ thống hỏi đáp trong tương lai.
3.1 Kết quả đạt được
Kết quả của mô hình đề xuất cho thấy sự cải thiện rõ rệt trong việc trả lời các câu hỏi liên quan đến quy định học vụ. Các thử nghiệm cho thấy độ chính xác của câu trả lời đã tăng lên đáng kể so với các mô hình trước đó. Hệ thống có khả năng xử lý một lượng lớn thông tin và cung cấp câu trả lời nhanh chóng và chính xác. Điều này không chỉ giúp sinh viên tiết kiệm thời gian trong việc tìm kiếm thông tin mà còn nâng cao trải nghiệm học tập của họ. Hệ thống này hứa hẹn sẽ là một công cụ hữu ích trong việc hỗ trợ sinh viên trong quá trình học tập tại Trường Đại học Bách Khoa - ĐHQG TP.HCM.