I. Giới thiệu về hệ thống chatbot tư vấn tuyển sinh đại học
Hệ thống chatbot được xây dựng nhằm hỗ trợ tư vấn tuyển sinh đại học, đặc biệt là tại Trường Đại học Công Nghệ Thông Tin. Chatbot AI này giúp giải đáp các thắc mắc liên quan đến tuyển sinh, cung cấp thông tin nhanh chóng và chính xác. Khóa luận khoa học máy tính này tập trung vào việc xây dựng chatbot với các tính năng như tư vấn tự động, theo dõi hội thoại, và xử lý ngôn ngữ tiếng Việt không dấu. Hệ thống tư vấn này không chỉ giúp giảm tải công việc cho nhân viên mà còn cải thiện trải nghiệm người dùng.
1.1. Mục tiêu của khóa luận
Mục tiêu chính của khóa luận là xây dựng hệ thống chatbot hỗ trợ tư vấn tuyển sinh đại học. Cụ thể, hệ thống cần giải quyết các bài toán như phân loại ý định, thêm dấu tiếng Việt, và theo dõi hội thoại. Hệ thống AI này cũng cần tích hợp được vào các nền tảng web và mạng xã hội, đồng thời đảm bảo tính tự nhiên trong giao tiếp.
1.2. Đối tượng và phạm vi nghiên cứu
Đối tượng nghiên cứu là các tin nhắn tư vấn tuyển sinh và cơ sở dữ liệu tuyển sinh của trường. Phạm vi nghiên cứu bao gồm xây dựng chatbot với khả năng phân loại ý định và thêm dấu tiếng Việt, tập trung vào các câu hỏi và câu trả lời liên quan đến tuyển sinh đại học.
II. Cơ sở lý thuyết và công trình liên quan
Chatbot là một ứng dụng AI giúp con người tương tác với máy tính bằng ngôn ngữ tự nhiên. Hệ thống chatbot hiện đại thường sử dụng các mô hình học sâu như LSTM, BiLSTM, và Transformer. Khóa luận này kế thừa các nghiên cứu trước về chatbot AI, đặc biệt là các phương pháp phân loại ý định và xử lý ngôn ngữ tiếng Việt. Các công trình liên quan bao gồm nghiên cứu về chatbot dựa trên khuôn mẫu và chatbot dựa trên AI, trong đó Transformer được đánh giá cao về độ chính xác và hiệu suất.
2.1. Phân loại ý định trong chatbot
Phân loại ý định là bài toán quan trọng trong xây dựng chatbot. Việc xác định chính xác ý định người dùng giúp chatbot đưa ra câu trả lời phù hợp. Khóa luận sử dụng mô hình PhoBERT để phân loại ý định, đạt độ chính xác cao (97.69%).
2.2. Thêm dấu tiếng Việt
Bài toán thêm dấu tiếng Việt giúp chatbot hiểu được các câu hỏi không dấu. Khóa luận thử nghiệm các mô hình như LSTM, BiLSTM, và Transformer, trong đó BiLSTM cho kết quả ổn định nhất với tỉ lệ lỗi thấp (0.93%).
III. Phương pháp và kết quả thực nghiệm
Hệ thống chatbot được xây dựng dựa trên các phương pháp học sâu, bao gồm phân loại ý định và thêm dấu tiếng Việt. Khóa luận sử dụng bộ dữ liệu gồm 4511 mẫu câu hỏi và câu trả lời liên quan đến tuyển sinh đại học. Kết quả thực nghiệm cho thấy mô hình PhoBERT đạt hiệu suất cao nhất trong phân loại ý định, trong khi BiLSTM là lựa chọn tối ưu cho bài toán thêm dấu.
3.1. Xây dựng bộ dữ liệu
Bộ dữ liệu gồm 229 câu hỏi mẫu và 4511 mẫu câu hỏi mở rộng, được thu thập từ cơ sở dữ liệu tuyển sinh của trường. Các câu hỏi được chú thích và phân loại để phù hợp với tư vấn tuyển sinh.
3.2. Đánh giá hệ thống
Hệ thống được đánh giá dựa trên độ chính xác và thời gian xử lý. PhoBERT đạt F1-score 97.68%, trong khi BiLSTM cho tỉ lệ lỗi thấp nhất (0.93%) trong bài toán thêm dấu. Hệ thống cũng được tích hợp vào một trang web để người dùng tương tác trực tiếp.
IV. Kết luận và hướng phát triển
Khóa luận đã thành công trong việc xây dựng hệ thống chatbot hỗ trợ tư vấn tuyển sinh đại học. Hệ thống có khả năng phân loại ý định, thêm dấu tiếng Việt, và theo dõi hội thoại. Tuy nhiên, vẫn còn một số hạn chế như khả năng xử lý các câu hỏi phức tạp ngoài phạm vi hiểu biết. Hướng phát triển trong tương lai bao gồm cải thiện độ chính xác và mở rộng phạm vi ứng dụng của hệ thống chatbot.
4.1. Đóng góp của khóa luận
Khóa luận đóng góp vào việc xây dựng chatbot với các tính năng tiên tiến như phân loại ý định và thêm dấu tiếng Việt, đồng thời tích hợp thành công vào các nền tảng web.
4.2. Hướng phát triển
Hướng phát triển bao gồm cải thiện khả năng xử lý ngôn ngữ tự nhiên, mở rộng phạm vi ứng dụng, và tích hợp thêm các tính năng như gợi ý câu hỏi và chuyển tiếp cho chuyên viên.