Nghiên Cứu Xây Dựng Chatbot Tự Động Áp Dụng Kỹ Thuật Học Máy Cho Ứng Dụng Tin Nhắn Văn Bản

Nghiên cứu xây dựng chatbot tự động sử dụng kỹ thuật học máy cho ứng dụng tin nhắn văn bản, nâng cao trải nghiệm người dùng và hiệu quả giao tiếp.

Trường đại học

Công nghệ Thông tin và Truyền thông

Chuyên ngành

Khoa học máy tính

Người đăng

Ẩn danh

Thể loại

luận văn thạc sĩ

2022

Phí lưu trữ

30 Point

Mục lục chi tiết

LỜI CẢM ƠN

TÓM TẮT NỘI DUNG LUẬN VĂN

1. CHƯƠNG 1: TỔNG QUAN VỀ CHATBOT

1.1. Khái niệm Chatbot

1.2. Các thành phần của Chatbot

1.3. Một số phân loại khác về Chatbot

1.3.1. Chatbot dựa trên luật (Rules Based Chatbot)

1.3.2. Chatbot dựa trên trí tuệ nhân tạo và học máy (AI and Machine learning)

1.3.3. Chatbot phạm vi đóng (Close – domain)

1.3.4. Chatbot phạm vi mở (Open – domain)

1.4. Một số nền tảng công nghệ xây dựng Chatbot

1.5. Một số ứng dụng của Chatbot

2. CHƯƠNG 2: CƠ SỞ LÝ THUYẾT

2.1. Cơ bản về Deep learning

2.2. Mạng nơ-ron hồi quy RNN (Recurrent Neural Network)

2.3. Mô hình Transformer. Tầng chú ý đa đầu. Kết nối phần dư và Lớp chuẩn hóa

2.4. Ưu điểm của mô hình Transformer so với mô hình RNN

2.5. Mô hình DIET

2.6. Pipeline và các compoments

3. CHƯƠNG 3: XÂY DỰNG CÔNG CỤ HỎI ĐÁP THÔNG TIN TƯ VẤN TUYỂN SINH ĐẠI HỌC

3.1. Giới thiệu bài toán

3.2. Sơ đồ quy trình hoạt động của Chatbot Tư vấn tuyển sinh Đại học Nội vụ HN

3.3. Xây dựng dữ liệu Chatbot

3.3.1. Xây dựng ý định (intent)

3.3.2. Xây dựng câu trả lời cho Chatbot

3.3.3. Đào tạo cho chatbot

3.4. Cài đặt chương trình

3.4.1. Kịch bản hỏi về phương thức tuyển sinh

3.4.2. Kịch bản không hiểu câu hỏi của người dùng

3.4.3. Kịch bản người dùng hỏi theo stories được xây dựng sẵn

3.5. Thử nghiệm và đánh giá chương trình

KẾT LUẬN VÀ HƯỚNG PHÁT TRIỂN

TÀI LIỆU THAM KHẢO

Tóm tắt

I. Tổng Quan Về Xây Dựng Chatbot Tự Động Hiện Nay

Chatbot tự động đang trở thành một phần không thể thiếu trong các ứng dụng tin nhắn. Với sự phát triển của kỹ thuật học máy, việc xây dựng chatbot đã trở nên dễ dàng hơn bao giờ hết. Chatbot không chỉ giúp tiết kiệm thời gian mà còn nâng cao trải nghiệm người dùng. Nghiên cứu cho thấy rằng việc áp dụng trí tuệ nhân tạo vào chatbot có thể cải thiện đáng kể khả năng tương tác và phản hồi của chúng.

1.1. Khái Niệm Về Chatbot Tự Động

Chatbot tự động là phần mềm sử dụng kỹ thuật học máy để mô phỏng cuộc hội thoại với người dùng. Chúng có khả năng hiểu và phản hồi các câu hỏi một cách tự động, giúp tiết kiệm thời gian cho cả người dùng và doanh nghiệp.

1.2. Lợi Ích Của Việc Sử Dụng Chatbot Trong Ứng Dụng Tin Nhắn

Việc sử dụng chatbot trong ứng dụng tin nhắn mang lại nhiều lợi ích như giảm thiểu chi phí nhân sự, tăng cường khả năng phục vụ khách hàng 24/7 và cải thiện trải nghiệm người dùng thông qua phản hồi nhanh chóng và chính xác.

II. Những Thách Thức Khi Xây Dựng Chatbot Tự Động

Mặc dù việc xây dựng chatbot tự động mang lại nhiều lợi ích, nhưng cũng tồn tại không ít thách thức. Các vấn đề như hiểu ngôn ngữ tự nhiên, xử lý ngữ cảnh và khả năng học hỏi từ dữ liệu là những yếu tố quan trọng cần được chú ý. Nghiên cứu cho thấy rằng xử lý ngôn ngữ tự nhiên (NLP) là một trong những thách thức lớn nhất trong việc phát triển chatbot.

2.1. Khó Khăn Trong Việc Hiểu Ngôn Ngữ Tự Nhiên

Một trong những thách thức lớn nhất là khả năng hiểu ngôn ngữ tự nhiên của chatbot. Nhiều khi, chatbot không thể hiểu được ý định của người dùng do ngữ cảnh hoặc cách diễn đạt khác nhau.

2.2. Vấn Đề Về Dữ Liệu Huấn Luyện

Dữ liệu huấn luyện là yếu tố quyết định đến hiệu quả của chatbot. Việc thu thập và xử lý dữ liệu chất lượng cao là rất cần thiết để đảm bảo chatbot có thể học hỏi và cải thiện khả năng phản hồi.

III. Phương Pháp Xây Dựng Chatbot Tự Động Hiệu Quả

Để xây dựng một chatbot tự động hiệu quả, cần áp dụng các phương pháp và công nghệ tiên tiến. Việc sử dụng Rasa và các mô hình học sâu như Transformer có thể giúp tối ưu hóa quy trình phát triển chatbot. Các phương pháp này không chỉ giúp cải thiện khả năng hiểu ngôn ngữ mà còn nâng cao độ chính xác trong phản hồi.

3.1. Sử Dụng Rasa Để Xây Dựng Chatbot

Rasa là một framework mạnh mẽ cho phép xây dựng chatbot với khả năng hiểu ngôn ngữ tự nhiên tốt. Nó cung cấp các công cụ để quản lý hội thoại và xử lý dữ liệu một cách hiệu quả.

3.2. Ứng Dụng Mô Hình Transformer Trong Chatbot

Mô hình Transformer đã chứng minh được hiệu quả trong việc xử lý ngôn ngữ tự nhiên. Việc áp dụng mô hình này giúp chatbot có khả năng hiểu và phản hồi chính xác hơn với các câu hỏi phức tạp.

IV. Ứng Dụng Thực Tiễn Của Chatbot Trong Tư Vấn Tuyển Sinh

Chatbot đã được áp dụng thành công trong nhiều lĩnh vực, đặc biệt là trong tư vấn tuyển sinh. Việc sử dụng chatbot giúp giải đáp nhanh chóng các thắc mắc của học sinh về thông tin tuyển sinh, ngành học và phương thức xét tuyển. Nghiên cứu cho thấy rằng chatbot có thể cải thiện đáng kể hiệu quả tư vấn tuyển sinh.

4.1. Chatbot Hỗ Trợ Tư Vấn Tuyển Sinh Đại Học

Chatbot có thể cung cấp thông tin chi tiết về các ngành học, học phí và phương thức xét tuyển, giúp học sinh dễ dàng tiếp cận thông tin cần thiết.

4.2. Kết Quả Nghiên Cứu Về Hiệu Quả Của Chatbot

Nghiên cứu cho thấy rằng việc sử dụng chatbot trong tư vấn tuyển sinh đã giúp giảm thiểu thời gian chờ đợi và nâng cao sự hài lòng của học sinh đối với dịch vụ tư vấn.

V. Kết Luận Và Tương Lai Của Chatbot Tự Động

Chatbot tự động đang ngày càng trở nên phổ biến và có tiềm năng phát triển mạnh mẽ trong tương lai. Với sự tiến bộ của kỹ thuật học máy và xử lý ngôn ngữ tự nhiên, chatbot sẽ ngày càng thông minh hơn và có khả năng phục vụ người dùng tốt hơn. Tương lai của chatbot hứa hẹn sẽ mang lại nhiều giá trị cho các doanh nghiệp và người dùng.

5.1. Xu Hướng Phát Triển Chatbot Trong Tương Lai

Xu hướng phát triển chatbot sẽ tập trung vào việc cải thiện khả năng hiểu ngôn ngữ tự nhiên và tích hợp nhiều tính năng thông minh hơn, giúp nâng cao trải nghiệm người dùng.

5.2. Tác Động Của Chatbot Đến Các Ngành Nghề

Chatbot sẽ tiếp tục có tác động lớn đến nhiều ngành nghề, từ giáo dục đến dịch vụ khách hàng, giúp tối ưu hóa quy trình làm việc và nâng cao hiệu quả kinh doanh.

16/07/2025

Bạn đang xem trước tài liệu:

Nghiên cứu xây dựng chatbot trả lời tự động áp dụng kỹ thuật học máy cho ứng dụng tin nhắn văn bản

Tải đầy đủ

Nội dung chính

Tổng quan nghiên cứu

Trong bối cảnh phát triển mạnh mẽ của khoa học công nghệ, đặc biệt là trí tuệ nhân tạo (AI) và học máy (Machine Learning), Chatbot đã trở thành một công cụ quan trọng trong nhiều lĩnh vực như chăm sóc khách hàng, giáo dục, y tế, và thương mại điện tử. Theo báo cáo của ngành, thị trường Chatbot toàn cầu dự kiến đạt khoảng 1,25 tỷ đô la vào năm 2025 với tốc độ tăng trưởng gộp hàng năm trên 24%. Ở Việt Nam, Chatbot đã được ứng dụng trong nhiều lĩnh vực nhưng vẫn còn hạn chế trong giáo dục, đặc biệt là tư vấn tuyển sinh đại học.

Đại dịch Covid-19 đã làm gián đoạn công tác tư vấn tuyển sinh truyền thống, gây khó khăn cho học sinh trong việc lựa chọn phương thức xét tuyển phù hợp. Việc tư vấn trực tiếp bị hạn chế do dịch bệnh, dẫn đến nhu cầu cấp thiết về một giải pháp tự động, hoạt động 24/7 để hỗ trợ học sinh và phụ huynh. Trước thực trạng này, luận văn tập trung nghiên cứu xây dựng Chatbot trả lời tự động áp dụng kỹ thuật học máy, nhằm hỗ trợ tư vấn tuyển sinh tại Trường Đại học Nội vụ Hà Nội.

Mục tiêu cụ thể của nghiên cứu là phát triển một hệ thống Chatbot miền đóng, sử dụng mô hình học sâu Transformer và DIET, tích hợp trên nền tảng mã nguồn mở Rasa, có khả năng hiểu và trả lời chính xác các câu hỏi liên quan đến tuyển sinh đại học. Phạm vi nghiên cứu bao gồm thu thập dữ liệu thực tế từ phòng tuyển sinh, xây dựng bộ dữ liệu huấn luyện, thiết kế và triển khai Chatbot trên nền tảng Messenger của Fanpage trường. Nghiên cứu có ý nghĩa thiết thực trong việc nâng cao hiệu quả tư vấn tuyển sinh, giảm tải công việc cho nhân viên và cung cấp thông tin kịp thời, chính xác cho người dùng.

Cơ sở lý thuyết và phương pháp nghiên cứu

Khung lý thuyết áp dụng

Luận văn dựa trên các lý thuyết và mô hình học máy hiện đại trong xử lý ngôn ngữ tự nhiên (NLP) và học sâu (Deep Learning). Hai mô hình chính được áp dụng là:

Mô hình Transformer: Được giới thiệu năm 2017, Transformer sử dụng cơ chế tự chú ý đa đầu (Multi-Head Attention) và mã hóa vị trí (Positional Encoding) để xử lý dữ liệu tuần tự song song, khắc phục nhược điểm vanishing gradient của mạng nơ-ron hồi quy (RNN). Mô hình này cho phép xử lý câu có độ dài lớn với tốc độ nhanh và độ chính xác cao, được chứng minh qua các bộ dữ liệu dịch máy tiêu chuẩn với điểm BLEU đạt 28.4 và 41.0 trên các tập EN-DE và EN-FR.
Mô hình DIET (Dual Intent and Entity Transformer): Là mô hình đa tác vụ, đồng thời thực hiện phân loại ý định (intent classification) và trích xuất thực thể (entity extraction) dựa trên kiến trúc Transformer. DIET sử dụng lớp CRF để gán nhãn chuỗi và tối ưu hóa tổn thất entropy chéo sigmoid nhằm tăng khả năng tổng quát hóa. Các siêu tham số như số lớp Transformer, kích thước embedding, số epoch được điều chỉnh phù hợp với dữ liệu huấn luyện.

Ngoài ra, luận văn sử dụng nền tảng Rasa Framework – một mã nguồn mở hỗ trợ xây dựng Chatbot với các thành phần chính: NLU (Natural Language Understanding), Dialogue Management (quản lý hội thoại) và NLG (Natural Language Generation). Rasa cho phép tùy chỉnh pipeline xử lý ngôn ngữ, tích hợp API, học tương tác và triển khai đa nền tảng.

Các khái niệm chính bao gồm: ý định người dùng (intent), thực thể (entity), chính sách hội thoại (policy), slot (bộ nhớ lưu trữ thông tin), và stories (kịch bản hội thoại).

Phương pháp nghiên cứu

Nghiên cứu sử dụng phương pháp thu thập và xử lý dữ liệu thực tế từ phòng tuyển sinh Trường Đại học Nội vụ Hà Nội, bao gồm hơn 1.570 câu hỏi mẫu thuộc 31 intent khác nhau, được gán nhãn và chuẩn hóa. Dữ liệu được xây dựng dựa trên các cuộc hội thoại thực tế và các tài liệu tuyển sinh chính thức của nhà trường.

Phương pháp phân tích chính là huấn luyện mô hình học sâu trên nền tảng Rasa với pipeline bao gồm tokenization, featurization (sử dụng supervised embeddings phù hợp với tiếng Việt), DIETClassifier và ResponseSelector. Cỡ mẫu huấn luyện là toàn bộ bộ dữ liệu 1.570 câu hỏi, được chia thành tập huấn luyện và kiểm thử theo tỷ lệ phù hợp.

Quá trình nghiên cứu được thực hiện trong khoảng thời gian từ đầu năm 2022 đến tháng 9/2022, với các bước chính: tổng hợp dữ liệu, thiết kế mô hình, huấn luyện và đánh giá hiệu suất, triển khai Chatbot trên nền tảng Messenger. Phương pháp đánh giá bao gồm đo độ chính xác phân loại intent, ma trận nhầm lẫn (confusion matrix) và mức độ tin cậy dự đoán (confidence score).

Kết quả nghiên cứu và thảo luận

Những phát hiện chính

Hiệu quả phân loại ý định người dùng: Mô hình DIETClassifier trên Rasa đạt độ chính xác trên 95% trong việc phân loại 31 intent với 1.570 câu hỏi mẫu. Mức độ tin cậy dự đoán ý định trung bình đạt 98%, thể hiện qua biểu đồ confidence score.
Khả năng trích xuất thực thể chính xác: Chatbot có thể nhận diện và trích xuất chính xác các thực thể như tên ngành học, phương thức xét tuyển, thời gian đăng ký với tỷ lệ thành công trên 90%, giúp trả lời câu hỏi chi tiết và phù hợp.
Độ tin cậy trong quản lý hội thoại: Sử dụng chính sách kết hợp Rule-based, Memorization và TED policy, Chatbot xử lý linh hoạt các kịch bản hội thoại phức tạp, giảm thiểu lỗi dự đoán hành động sai xuống dưới 5%, được thể hiện qua ma trận nhầm lẫn.
Tính ứng dụng thực tiễn cao: Chatbot được tích hợp thành công trên nền tảng Messenger của Fanpage Trường Đại học Nội vụ Hà Nội, hoạt động ổn định 24/7, hỗ trợ tư vấn tuyển sinh với hơn 500 lượt tương tác trong tháng đầu tiên triển khai.

Thảo luận kết quả

Kết quả cho thấy mô hình Transformer và DIET phù hợp với bài toán Chatbot miền đóng trong lĩnh vực tư vấn tuyển sinh, nhờ khả năng xử lý ngôn ngữ tự nhiên tiếng Việt đa dạng và phức tạp. Việc sử dụng Rasa framework giúp tối ưu hóa quá trình phát triển, dễ dàng tùy chỉnh và tích hợp với hệ thống hiện có.

So với các nghiên cứu trước đây sử dụng RNN hoặc Rule-based Chatbot, mô hình này vượt trội về độ chính xác và khả năng mở rộng. Các biểu đồ ma trận nhầm lẫn và confidence score minh họa rõ ràng hiệu quả phân loại và trích xuất thực thể, đồng thời giảm thiểu các trường hợp Chatbot không hiểu ý người dùng.

Tuy nhiên, một số hạn chế còn tồn tại như khả năng xử lý các câu hỏi phức tạp chưa cao, cần bổ sung thêm dữ liệu huấn luyện và cải tiến thuật toán học tương tác để nâng cao trải nghiệm người dùng. Ngoài ra, việc mở rộng phạm vi miền mở vẫn là thách thức lớn trong tương lai.

Đề xuất và khuyến nghị

Mở rộng bộ dữ liệu huấn luyện: Thu thập thêm các câu hỏi thực tế từ người dùng, đặc biệt các câu hỏi phức tạp và đa dạng hơn, nhằm nâng cao độ chính xác và khả năng hiểu ngôn ngữ tự nhiên của Chatbot. Thời gian thực hiện: 6 tháng; Chủ thể: Phòng CNTT và phòng tuyển sinh.
Tăng cường học tương tác (Interactive Learning): Áp dụng chế độ học tương tác của Rasa để người quản trị có thể trực tiếp chỉnh sửa, bổ sung câu trả lời khi Chatbot mắc lỗi, giúp cải thiện liên tục hiệu suất. Thời gian: 3 tháng; Chủ thể: Đội ngũ phát triển Chatbot.
Tích hợp thêm các kênh giao tiếp: Mở rộng tích hợp Chatbot trên các nền tảng khác như Zalo, Telegram để tăng khả năng tiếp cận người dùng, đặc biệt là học sinh vùng sâu vùng xa. Thời gian: 4 tháng; Chủ thể: Phòng CNTT.
Phát triển tính năng phân tích dữ liệu người dùng: Xây dựng hệ thống báo cáo, phân tích hành vi người dùng để hỗ trợ phòng tuyển sinh điều chỉnh chiến lược tư vấn, nâng cao hiệu quả tuyển sinh. Thời gian: 6 tháng; Chủ thể: Phòng phân tích dữ liệu và phòng tuyển sinh.

Đối tượng nên tham khảo luận văn

Các nhà nghiên cứu và sinh viên ngành Khoa học máy tính, AI và NLP: Luận văn cung cấp kiến thức chuyên sâu về mô hình Transformer, DIET và ứng dụng thực tiễn trong xây dựng Chatbot, giúp mở rộng hiểu biết và phát triển các đề tài nghiên cứu liên quan.
Các doanh nghiệp và tổ chức giáo dục: Đặc biệt các phòng tuyển sinh đại học, cao đẳng có nhu cầu tự động hóa tư vấn, giảm tải nhân lực và nâng cao chất lượng dịch vụ khách hàng.
Nhà phát triển phần mềm và kỹ sư AI: Tài liệu chi tiết về Rasa framework, pipeline xử lý ngôn ngữ tự nhiên và kỹ thuật huấn luyện mô hình giúp họ dễ dàng áp dụng và tùy chỉnh Chatbot cho các ứng dụng thực tế.
Các nhà quản lý công nghệ thông tin trong lĩnh vực giáo dục: Có thể tham khảo để xây dựng chiến lược ứng dụng AI trong tư vấn tuyển sinh, nâng cao hiệu quả vận hành và cải thiện trải nghiệm người dùng.

Câu hỏi thường gặp

Chatbot miền đóng là gì và tại sao chọn loại này?
Chatbot miền đóng tập trung trả lời các câu hỏi trong phạm vi lĩnh vực cụ thể, giúp tăng độ chính xác và hiệu quả. Trong nghiên cứu, loại này phù hợp với bài toán tư vấn tuyển sinh vì dữ liệu và câu hỏi có phạm vi rõ ràng, dễ huấn luyện.
Tại sao không sử dụng RNN mà chọn Transformer?
Transformer khắc phục nhược điểm vanishing gradient của RNN, xử lý song song dữ liệu, tăng tốc độ huấn luyện và cải thiện độ chính xác, đặc biệt với câu hỏi dài và phức tạp trong ngôn ngữ tự nhiên.
Rasa framework có ưu điểm gì so với các nền tảng khác?
Rasa là mã nguồn mở, dễ tùy chỉnh, hỗ trợ học tương tác, tích hợp API linh hoạt và có cộng đồng lớn. Điều này giúp phát triển Chatbot phù hợp với ngôn ngữ và yêu cầu riêng của từng tổ chức.
Làm thế nào để Chatbot xử lý các câu hỏi chưa được huấn luyện?
Rasa hỗ trợ học tương tác, cho phép người quản trị bổ sung câu trả lời khi Chatbot không hiểu, đồng thời sử dụng chính sách TED để dự đoán hành động dựa trên ngữ cảnh hội thoại.
Chatbot có thể áp dụng cho các lĩnh vực khác ngoài giáo dục không?
Có, Chatbot có thể ứng dụng trong chăm sóc khách hàng, y tế, bán lẻ, du lịch, tài chính… với các mô hình và dữ liệu huấn luyện phù hợp từng lĩnh vực.

Kết luận

Luận văn đã nghiên cứu và xây dựng thành công Chatbot trả lời tự động áp dụng kỹ thuật học máy, sử dụng mô hình Transformer và DIET trên nền tảng Rasa, phục vụ tư vấn tuyển sinh tại Trường Đại học Nội vụ Hà Nội.
Mô hình đạt độ chính xác phân loại intent trên 95%, trích xuất thực thể trên 90%, hoạt động ổn định trên nền tảng Messenger với hơn 500 lượt tương tác trong tháng đầu.
Giải pháp giúp giảm tải công việc cho nhân viên tuyển sinh, cung cấp thông tin nhanh chóng, chính xác và hỗ trợ người dùng 24/7 trong bối cảnh dịch bệnh.
Đề xuất mở rộng dữ liệu, tăng cường học tương tác và tích hợp đa kênh nhằm nâng cao hiệu quả và phạm vi ứng dụng trong tương lai.
Khuyến khích các nhà nghiên cứu, doanh nghiệp và tổ chức giáo dục tham khảo và phát triển thêm các ứng dụng Chatbot dựa trên nền tảng mã nguồn mở và mô hình học sâu hiện đại.

Triển khai mở rộng Chatbot tại các trường đại học khác, đồng thời phát triển thêm các tính năng nâng cao dựa trên phản hồi người dùng và dữ liệu thực tế. Để biết thêm chi tiết và hỗ trợ triển khai, vui lòng liên hệ phòng CNTT của Trường Đại học Nội vụ Hà Nội.

Trích đoạn nội dung tài liệu

Chương 1: Giới thiệu tổng quan về hệ thống Chatbot : Chương này sẽ giới thiệu những kiến thức tổng quan về hệ thống Chatbot, các thành phần của Chatbot và phân biệt các loại Chatbot. Chương 2: Cơ sở lý thuyết: Tìm hiểu về Deep learning, mạng nơ ron hồi quy RNN, mô hình học sâu Transformer, DIET và Rasa Framework. Chương 3: Trình bày về quá trình xây dựng Chatbot trả lời thông tin về tuyển sinh đại học, thực nghiệm và đánh giá các kết quả. 2 TỔNG QUAN VỀ CHATBOT 1.1 Khái niệm Chatbot Chatbot là một phần mềm trí tuệ nhân tạo(AI) giả lập cuộc hội thoại của con người bằng văn bản hoặc giọng nói, giúp trả lời tự động tin nhắn của con người thông qua các ứng dụng tin nhắn trên website hoặc trên điện thoại di động.

Chatbot thường trao đổi với người dùng qua hình thức văn bản hoặc âm thanh. Do được thiết kế để mô phỏng cách trò chuyện với con người, các hệ thống Chatbot thường phải điều chỉnh và thử nghiệm liên tục. Chatbot thường được sử dụng trong các hệ thống hội thoại cho các mục đích khác nhau bao gồm dịch vụ khách hàng, định tuyến yêu cầu hoặc để thu thập thông tin. Mặc dù một số ứng dụng Chatbot sử dụng các phương pháp phân loại từ (word- classification), xử lý ngôn ngữ tự nhiên (NLP) và trí tuệ nhân tạo (AI), một số ứng dụng khác chỉ cần quét các từ khóa chung và tạo phản hồi bằng các cụm từ phổ biến thu được từ thư viện hoặc cơ sở dữ liệu liên quan.

Ngày nay, hầu hết các Chatbot được truy cập trực tuyến thông qua cửa sổ popup của các trang web hoặc thông qua các trợ lý ảo như Google Assistant, Amazon Alexa hoặc các ứng dụng nhắn tin như Facebook Messenger, Telegram, WeChat, Zalo… Chatbot chia thành 2 loại [1] miền mở (open domain) và miền đóng (close domain). Ứng dụng chatbot mền mở là mô hình trả lời tự động trên không giới hạn lĩnh vực, cho phép người dùng có thể tham gia trò chuyện với một chủ đề bất kỳ, không nhất thiết phải có một mục tiêu rõ ràng hay một ý định cụ thể nào. Ứng dụng chatbot miền đóng thường tập trung vào trả lời các câu hỏi đối thoại liên quan đến một lĩnh vực cụ thể, ví dụ như: y tế, giáo dục, du lịch, mua sắm… Trong luận văn này tôi sẽ tập trung vào xây dựng Chatbot thuộc loại miền đóng, cụ thể là bài toán hỗ trợ người dùng hiểu rõ về chương trình tuyển sinh của Trường Đại học Nội vụ Hà Nội.2 Các thành phần của Chatbot Bước đầu tiên trong việc thiết kế bất kỳ hệ thống nào là chia nó thành các bộ phận cấu thành theo một tiêu chuẩn để có thể tuân theo cách tiếp cận phát triển mô đun. Trong hình dưới giới thiệu một kiến trúc chung của Chatbot.

3 Hình 1-1: Kiến trúc chung của chatbot Ứng dụng chatbot được xây dựng từ 3 thành phần chính [2]: thành phần hiểu ngôn ngữ tự nhiên (NLU), thành phần quản lý hội thoại (DM) và thành phần sinh ngôn ngữ (NLG). Mỗi thành phần có một tác vụ riêng biệt: - NLU: Là quá trình xử lý để hiểu ngôn ngữ tự nhiên, thành phần giúp Chatbot hiểu được ý định người dùng (intent) và trích xuất các thực thể (entity) trong câu. Khi người dùng nhập câu hỏi “Học phí ngành luật là bao nhiêu?” Chatbot sẽ cần xử lý, bởi vì Chatbot không hiểu được ngôn ngữ của con người do đó NLU sẽ chuyển nó thành dữ liệu có cấu trúc, từ đó có thể phân tích câu hỏi trên với ý định là “hỏi học phí”, thực thể sản phẩm “ngành luật” - DM: Quản lý hội thoại có nhiệm vụ xác định được hành động (action) tiếp theo dựa vào trạng thái hành động trước đó hoặc ngữ cảnh của hội thoại. Các ngữ cảnh của hội thoại sẽ được học qua kịch bản xây dựng sẵn (story).

Xử lý truy xuất dữ liệu từ hệ thống khác thông qua các API/Data sources cũng sẽ được thực hiện trong thành phần này. - NLG: Là thành phần bao gồm nhiều mẫu câu trả lời đã được định nghĩa trước và phụ thuộc vào hành động được dự đoán ở DM kết hợp với chính sách (policy) của hệ thống để đưa ra câu trả lời cho người dùng. Ví dụ ở câu hỏi “Học phí ngành luật là bao nhiêu?” ta sẽ định nghĩa trước mẫu câu “Chào bạn, học phí hiện tại ngành{ma_nganh} là {gia_hoc_phi} nhé”, và ở thành phần DM hệ thống sẽ lấy được thông tin mã ngành thông qua NLU và gọi đến API của hệ thống khác để lấy thông tin học phí, từ đó kết quả NLG trả về sẽ là “Chào bạn, học phí hiện tại ngành luật là 387.3 Một số phân loại khác về Chatbot 1.1 Chatbot dựa trên luật (Rules Based Chatbot) Rule-based Chatbot [2] (Chatbot dạng menu/button) là Chatbot dựa theo luật được đề ra sẵn, người dùng không được phép tùy ý phản hồi mà phải lựa chọn các phản hồi do lập trình viên đã tạo ra, là một dạng Chatbot trở nên nổi tiếng sau khi Facebook cho ra mắt nền tảng Messenger cho phép cá nhân hoặc doanh nghiệp tạo ra bot hỗ trợ khách hàng tự động. Xây dựng Chatbot theo Rule- based là việc định nghĩa các luật hoặc đưa ra các mẫu có trước mà Chatbot muốn hướng đến, để thao tác với Chatbot ứng dụng sẽ sử dụng cả nút bấm, thanh menu hoặc hệ thống điều hướng để người dùng lựa chọn.

Giống với việc gọi điện đến tổng đài hỗ trợ khách hàng ta cần chọn ngôn ngữ, chọn phòng ban phụ trách sau đó mới được chuyển hướng đến hỗ trợ viên thích hợp, Rule-based Chatbot cũng hoạt động như vậy chỉ khác là sẽ hiển thị các nút bấm hoặc menu trên cửa sổ chat. Hình 1-2: Chatbot hỗ trợ nút bấm để thao tác của Pizza Hut Hình phía trên là ví dụ của Chatbot dạng menu/button, đây là ảnh của Chatbot hệ thống cửa hàng Pizza Hut trên ứng dụng Messenger Facebook, người dùng có thể sử dụng để đặt hàng, theo dõi đơn hàng hoặc liên hệ hỗ trợ thông qua điều hướng menu. Ví dụ nếu người dùng ấn nút “Customer support” cuộc trò 5 chuyện sẽ được chuyển hướng đến hỗ trợ viên trực tiếp. Lợi thế của Rule-based Chatbot so với các loại Chatbot khác là hiển thị được tất cả các lựa chọn, giúp người dùng đưa ra quyết định chính xác mà không cần suy nghĩ sẽ hỏi như thế nào và câu hỏi đó Chatbot có hiểu được không.

Rule-based Chatbot được sử dụng khi người dùng muốn thực hiện một hành động cụ thể, ví dụ đặt vé máy bay, đặt vé xem phim. Rule-based Chatbot cũng sẽ dễ dàng cập nhật hơn, thay vì việc phải huấn luyện lại Chatbot mỗi khi có dữ liệu mới, ta chỉ cần thêm nút hoặc menu và câu phản hồi cho chủ đề mới đó, Chatbot cũng không cần phải training. Chatbot cũng sẽ không gặp trường hợp không hiểu ý định của khách hàng, với việc thiết kế thêm nút chọn “Liên hệ trực tiếp” sẽ dẫn khách hàng đến nhân viên hỗ trợ trong trường hợp không tìm thấy lựa chọn phù hợp ở giao diện chat. Một số nền tảng giúp xây dựng Rule-based Chatbot như Manychat, Chatfuel, Botsify… Bên cạnh những ưu điểm nêu trên, Rule-based Chatbot cũng gặp phải hạn chế, một trong những hạn chế là không thể trả lời câu hỏi khách hàng mà Chatbot không được định nghĩa trước.

Khách hàng cần đi qua nhiều bước mới đến được câu trả lời phù hợp, do vậy trong vài trường hợp sẽ ảnh hưởng đến trải nghiệm người dùng. Chatbot dựa trên trí tuệ nhân tạo và học máy (AI and Machine learning) Khác với Rule-based Chatbot, AI-based Chatbot không sử dụng các menu/button để điều hướng người dùng, thay vào đó sử dụng trí tuệ nhân tạo AI để xử lý tin nhắn và phản hồi đến người dùng. Khoảng 5 năm trở lại đây, trí tuệ nhân tạo phát triển mạnh mẽ, Chatbot cũng được trang bị thêm công nghệ trí tuệ nhân tạo và công nghệ học máy giúp Chatbot có khả năng tự học từ những cuộc trò chuyện thực tế với người dùng để trở nên thông minh hơn theo thời gian. Công nghệ xử lý ngôn ngữ tự nhiên NLP giúp Chatbot AI hiểu ý định trong câu nói của người dùng và đưa ra những phản hồi chính xác.

Người dùng không phải nhập những câu rập khuôn máy móc để giao tiếp với Chatbot mà hoàn toàn có thể diễn tả ý định theo cách của riêng mình. Nhờ xác định các từ khóa, các biến trong câu nói của người dùng mà Chatbot thông minh hiểu và đối đáp linh hoạt 6 với người dùng. Bên cạnh đó, Chatbot AI có khả năng tích hợp nhiều tính năng tiện ích bổ sung, nhằm giải quyết đa dạng các bài toán của doanh nghiệp. Chatbot không những có thể tư vấn, cung cấp thông tin về các sản phẩm dịch vụ của doanh nghiệp, mà Chatbot còn có thể thực hiện nhiều tác vụ như thu thập thông tin khách hàng, đặt hàng, đặt lịch hẹn.

Chatbot phạm vi đóng (Close – domain) Phạm vi của Chatbot chỉ giải quyết một số vấn đề trong phạm vi nhất định. Ví dụ: Khách hàng mua ô tô, tư vấn khách hàng mua bảo hiểm nhân thọ, dự báo thời tiết… Chatbot này phổ biến, dữ liệu huấn luyện trong phạm vi nhỏ nên dễ huấn luyện, độ chính xác cao. Chatbot phạm vi mở (Open – domain) Chatbot phạm vi mở là mục tiêu của trí tuệ nhân tạo. Một Chatbot biết mọi thứ và có thể trả lời mọi vấn đề.

Rất nhiều Chatbot thông minh được tạo ra. Tuy nhiên trả lời mọi vấn đề và vượt qua được Turing test thì vẫn chưa thể đạt tới. Một số nền tảng công nghệ xây dựng Chatbot Chatbot đã không còn khái niệm xa lạ với người dùng Internet nói chung và các doanh nghiệp nói riêng. Hiện nay nhiều nền tảng xây dựng Chatbot được ra đời, hỗ trợ người dùng giao diện trực quan và khả năng đưa ra câu trả lời phù hợp với câu hỏi của người dùng một cách chính xác như Chatfuel, FPT.AI Conversation, Harafunnel…Hoặc doanh nghiệp có thể tự xây dựng hệ thống Chatbot dựa trên các framework nổi tiếng như Rasa, Dialogflow…Sau đây là một số nền tảng Chatbot nổi tiếng trên thế giới mà bất kỳ cá nhân hoặc doanh nghiệp nào cũng có thể tiếp cận: a.

Một số nền tảng trả phí - FPT.AI Conversation [11]: là nền tảng trí tuệ nhân tạo được Bộ Thông tin và Truyền thông trao Giải thưởng Sản phẩm công nghệ số Made in Vietnam năm 2020.AI Conversation cung cấp nền tảng tạo và quản lý Chatbot với giao diện người dùng. Được trang bị Machine Learning và NLP, Chatbot của FPT.AI có thể hiểu được ý định và yêu cầu của khách hàng.

Nội dung được bảo vệ bản quyền — Tải xuống đầy đủ

Tài liệu "Xây Dựng Chatbot Tự Động Sử Dụng Kỹ Thuật Học Máy Cho Ứng Dụng Tin Nhắn" cung cấp cái nhìn sâu sắc về cách xây dựng một chatbot tự động hiệu quả bằng cách áp dụng các kỹ thuật học máy tiên tiến. Tài liệu này không chỉ giải thích các khái niệm cơ bản mà còn đi sâu vào các phương pháp cụ thể để tối ưu hóa trải nghiệm người dùng thông qua giao tiếp tự động. Độc giả sẽ tìm thấy những lợi ích rõ ràng từ việc triển khai chatbot, bao gồm khả năng tiết kiệm thời gian, nâng cao sự hài lòng của khách hàng và cải thiện quy trình làm việc.

Để mở rộng kiến thức về lĩnh vực này, bạn có thể tham khảo thêm các tài liệu liên quan như Luận văn thạc sĩ phát triển chatbot trên nền tảng transformers ứng dụng trong tìm kiếm tra cứu thông tin về trường đại học công nghệ đông á, nơi bạn sẽ tìm thấy các ứng dụng thực tiễn của chatbot trong lĩnh vực giáo dục. Ngoài ra, tài liệu Luận văn thạc sĩ khoa học máy tính kết hợp học sâu và mô hình ngôn ngữ để nhận dạng giọng nói tiếng việt cũng sẽ giúp bạn hiểu rõ hơn về cách mà công nghệ học máy có thể được áp dụng để cải thiện khả năng tương tác của chatbot. Cuối cùng, bạn có thể tìm hiểu thêm về Luận văn thạc sĩ khoa học máy tính ứng dụng học sâu vào xây dựng mô hình rút trích thông tin, một lĩnh vực liên quan giúp nâng cao khả năng xử lý thông tin của chatbot. Những tài liệu này sẽ cung cấp cho bạn cái nhìn toàn diện hơn về các ứng dụng của học máy trong việc phát triển chatbot và các hệ thống tự động khác.

#mô hình Transformer

#kỹ thuật học máy

#nghiên cứu chatbot

#Tư vấn tuyển sinh Đại học

#Xây dựng chatbot tự động

#Ứng dụng tin nhắn văn bản

Chủ đề

Học máy và trí tuệ nhân tạo

Công nghệ chatbot trong giáo dục

Phát triển ứng dụng chatbot

Xu hướng chatbot hiện nay