Luận văn thạc sĩ: Nghiên cứu mô hình PCFGs và AIML trong xây dựng chatbot hỗ trợ học tiếng Anh

Luận văn thạc sĩ nghiên cứu nghiên cứu mô hình pcfgs và ngôn ngữ aiml trong xây dựng chatbot hỗ trợ học tiếng anh luận văn ths, đánh giá hiện trạng, phân tích vấn đề, đề xuất biện

Trường đại học

Đại học Quốc gia Hà Nội

Chuyên ngành

Công nghệ thông tin

Người đăng

Ẩn danh

Thể loại

luận văn thạc sĩ

2017

Phí lưu trữ

30 Point

Mục lục chi tiết

LỜI CẢM ƠN

LỜI CAM ĐOAN

1. CHƯƠNG 1: CÁC VẤN ĐỀ TỔNG QUAN

1.1. Trí tuệ nhân tạo

1.2. Quá trình hình thành và phát triển

1.3. Một số ứng dụng

2. CHƯƠNG 2: MÔ HÌNH PCFGS VÀ NGÔN NGỮ AIML

2.1. Mô hình PCFGs

2.2. Văn phạm phi ngữ cảnh

2.3. Tính mập mờ trong phân tích cú pháp

2.4. Văn phạm phi ngữ cảnh hướng thống kê PCFGs

2.5. Ngôn ngữ AIML

2.6. Các Category và đặc tính của AIML

2.7. Một số thẻ thông dụng trong AIML

2.8. Kết luận chương

3. CHƯƠNG 3: PHÂN TÍCH THIẾT KẾ, CÀI ĐẶT ỨNG DỤNG

3.1. Phân tích thiết kế

3.2. Xác định yêu cầu

3.3. Xây dựng tập luật dựa trên tập dữ liệu có sẵn

3.4. Cài đặt ứng dụng

3.5. Giao diện chức năng hội thoại (Chatbot)

3.6. Giao diện chức năng tra cứu từ điển

3.7. Giao diện chức năng kiểm tra chính tả, ngữ pháp

3.8. Đánh giá ứng dụng

TÀI LIỆU THAM KHẢO

Tóm tắt

I. Tính cấp thiết của đề tài

Nhu cầu học tiếng Anh ngày càng tăng cao trong bối cảnh hội nhập quốc tế. Tuy nhiên, nhiều người không có đủ thời gian tham gia các lớp học chính quy. Do đó, việc phát triển các công cụ hỗ trợ học tiếng Anh, đặc biệt là chatbot, trở nên cần thiết. Các ứng dụng chatbot hiện tại chủ yếu tập trung vào từ vựng và trắc nghiệm, trong khi việc kiểm tra chính tả và cú pháp vẫn chưa được chú trọng. Việc xây dựng chatbot hỗ trợ học tiếng Anh có thể giúp người học tương tác hiệu quả hơn với máy, từ đó nâng cao chất lượng học tập. Tác giả đã chọn đề tài "Nghiên cứu mô hình PCFGs và ngôn ngữ AIML trong xây dựng chatbot hỗ trợ học tiếng Anh" nhằm đáp ứng nhu cầu này.

II. Mục tiêu nghiên cứu

Mục tiêu chính của nghiên cứu là phát triển một ứng dụng chatbot có khả năng kiểm tra chính tả và cú pháp trong tiếng Anh. Nghiên cứu sẽ tập trung vào việc ứng dụng lý thuyết về PCFGs và AIML để xây dựng một hệ thống có thể giao tiếp với người dùng. Ứng dụng này không chỉ giúp người học phát hiện lỗi mà còn cung cấp phản hồi tức thì, từ đó cải thiện kỹ năng ngôn ngữ của họ. Việc áp dụng PCFGs trong phân tích cú pháp sẽ giúp hệ thống hiểu và xử lý ngữ nghĩa câu một cách chính xác hơn. Điều này sẽ tạo ra một môi trường học tập tương tác, giúp người học tự tin hơn khi sử dụng tiếng Anh.

III. Đối tượng và phạm vi nghiên cứu

Đối tượng nghiên cứu bao gồm các khái niệm về trí tuệ nhân tạo, mô hình PCFGs, và ngôn ngữ AIML. Phạm vi nghiên cứu tập trung vào việc phát triển chatbot trên nền tảng Android, cho phép người dùng tương tác và nhận phản hồi về lỗi chính tả và cú pháp. Nghiên cứu sẽ khảo sát các ứng dụng hiện có và phân tích những điểm mạnh, điểm yếu của chúng. Từ đó, đề xuất giải pháp cải tiến nhằm nâng cao hiệu quả học tập. Việc xây dựng chatbot sẽ dựa trên các dữ liệu có sẵn và các kỹ thuật xử lý ngôn ngữ tự nhiên để đảm bảo tính chính xác và hiệu quả trong việc hỗ trợ người học.

IV. Phương pháp nghiên cứu

Phương pháp nghiên cứu bao gồm khảo sát và phân tích tài liệu liên quan đến chatbot và các công nghệ hỗ trợ học tiếng Anh. Nghiên cứu sẽ sử dụng phương pháp thiết kế mô hình và thực nghiệm để đánh giá hiệu quả của các giải pháp đề xuất. Việc đối sánh nội dung nghiên cứu với các nghiên cứu trước đó sẽ giúp xác định những khoảng trống cần được lấp đầy. Các kỹ thuật phân tích cú pháp và xử lý ngôn ngữ tự nhiên sẽ được áp dụng để phát triển ứng dụng chatbot. Điều này không chỉ giúp cải thiện khả năng tương tác giữa người và máy mà còn nâng cao trải nghiệm học tập của người dùng.

V. Ý nghĩa khoa học và thực tiễn của đề tài

Nghiên cứu này có ý nghĩa khoa học quan trọng trong việc phát triển các ứng dụng chatbot hỗ trợ học tiếng Anh. Việc áp dụng PCFGs và AIML sẽ giúp mở rộng kiến thức về trí tuệ nhân tạo và ngôn ngữ lập trình. Về mặt thực tiễn, ứng dụng chatbot sẽ cung cấp một công cụ hữu ích cho người học, giúp họ phát hiện và sửa lỗi trong quá trình giao tiếp. Điều này không chỉ nâng cao hiệu quả học tập mà còn tạo ra một môi trường học tập thân thiện và gần gũi. Sự phát triển của chatbot cũng sẽ góp phần vào việc cải thiện kỹ năng ngôn ngữ của người học, từ đó đáp ứng nhu cầu ngày càng cao về ngoại ngữ trong xã hội hiện đại.

25/01/2025

Bạn đang xem trước tài liệu:

Luận văn thạc sĩ nghiên cứu mô hình pcfgs và ngôn ngữ aiml trong xây dựng chatbot hỗ trợ học tiếng anh luận văn ths máy tính 604801

Tải đầy đủ

Nội dung chính

Tổng quan nghiên cứu

Trong bối cảnh toàn cầu hóa và hội nhập quốc tế ngày càng sâu rộng, tiếng Anh trở thành ngôn ngữ quan trọng trong giao tiếp, học tập và công việc. Theo ước tính, hơn 1,5 tỷ người trên thế giới đang học tiếng Anh như ngôn ngữ thứ hai hoặc ngoại ngữ. Tuy nhiên, nhiều người học gặp khó khăn do thiếu thời gian và điều kiện tham gia các lớp học truyền thống. Do đó, việc phát triển các công cụ hỗ trợ học tiếng Anh trên nền tảng công nghệ thông tin, đặc biệt là các ứng dụng chatbot tương tác, trở nên cấp thiết.

Luận văn tập trung nghiên cứu mô hình Probabilistic Context-Free Grammars (PCFGs) và ngôn ngữ lập trình trí tuệ nhân tạo AIML trong xây dựng chatbot hỗ trợ học tiếng Anh. Mục tiêu chính là phát triển một ứng dụng trên nền tảng Android có khả năng kiểm tra chính tả, ngữ pháp và cú pháp tiếng Anh thông qua giao tiếp hội thoại giữa người dùng và máy. Phạm vi nghiên cứu tập trung vào việc áp dụng PCFGs để phân tích cú pháp và AIML để xây dựng hệ thống chatbot, với dữ liệu huấn luyện từ các kho dữ liệu ngôn ngữ tiếng Anh phổ biến.

Ý nghĩa của nghiên cứu được thể hiện qua việc nâng cao hiệu quả học tiếng Anh, giúp người học phát hiện và sửa lỗi ngữ pháp, chính tả một cách chủ động và linh hoạt. Các chỉ số đánh giá hiệu quả bao gồm độ chính xác phân tích cú pháp, tỷ lệ phát hiện lỗi và mức độ hài lòng của người dùng khi tương tác với chatbot. Nghiên cứu góp phần mở rộng ứng dụng trí tuệ nhân tạo trong giáo dục ngôn ngữ, đồng thời tạo nền tảng cho các phát triển tiếp theo trong lĩnh vực xử lý ngôn ngữ tự nhiên.

Cơ sở lý thuyết và phương pháp nghiên cứu

Khung lý thuyết áp dụng

Luận văn dựa trên hai khung lý thuyết chính: mô hình PCFGs và ngôn ngữ AIML.

Mô hình PCFGs (Probabilistic Context-Free Grammars): Đây là một mở rộng của văn phạm phi ngữ cảnh (CFG) với việc gán xác suất cho từng luật ngữ pháp. PCFGs giúp giải quyết vấn đề mập mờ trong phân tích cú pháp bằng cách lựa chọn cây cú pháp có xác suất cao nhất. Mô hình này được xây dựng dựa trên tập dữ liệu huấn luyện gồm các cây cú pháp, trong đó xác suất của mỗi luật được tính theo tần suất xuất hiện trong kho dữ liệu. Thuật toán CKY (Cocke-Kasami-Younger) được sử dụng để phân tích cú pháp với PCFGs chuẩn Chomsky (CNF), giúp xây dựng cây cú pháp tối ưu cho câu đầu vào.
Ngôn ngữ AIML (Artificial Intelligence Markup Language): AIML là ngôn ngữ dựa trên XML dùng để xây dựng chatbot. AIML tổ chức tri thức thành các category, mỗi category gồm mẫu câu hỏi (pattern) và câu trả lời (template). Các thẻ đặc biệt như , , , , hỗ trợ xử lý ngữ cảnh, biến và các mẫu hội thoại phức tạp. AIML cho phép xây dựng chatbot có khả năng tương tác linh hoạt, xử lý các câu hỏi đa dạng và duy trì ngữ cảnh hội thoại.

Ba khái niệm chính trong nghiên cứu bao gồm: phân tích cú pháp (parsing), kiểm tra ngữ pháp (grammar checking) và xây dựng chatbot tương tác. Phân tích cú pháp là bước nền tảng để xác định cấu trúc câu, từ đó phát hiện lỗi ngữ pháp. Kiểm tra ngữ pháp dựa trên luật và thống kê giúp xác định và sửa lỗi chính tả, ngữ pháp. Chatbot sử dụng AIML để tạo giao diện hội thoại thân thiện, hỗ trợ người học tương tác và nhận phản hồi tức thì.

Phương pháp nghiên cứu

Nguồn dữ liệu chính bao gồm các kho dữ liệu ngôn ngữ tiếng Anh có cấu trúc cây cú pháp, ví dụ như Tatoeba, Penn Treebank, được sử dụng để xây dựng và huấn luyện mô hình PCFGs. Dữ liệu hội thoại và mẫu câu được thiết kế và mã hóa bằng AIML để phát triển chatbot.

Phương pháp phân tích sử dụng thuật toán CKY để xây dựng cây cú pháp dựa trên PCFGs chuẩn CNF, giúp xác định cấu trúc câu và tính xác suất các cây cú pháp. Phương pháp kiểm tra ngữ pháp kết hợp luật dựa trên PCFGs và xử lý ngôn ngữ tự nhiên để phát hiện lỗi chính tả, ngữ pháp.

Quá trình nghiên cứu được thực hiện trong khoảng thời gian từ năm 2016 đến 2017 tại Trường Đại học Công nghệ, Đại học Quốc gia Hà Nội. Các bước chính gồm khảo sát tài liệu, thiết kế mô hình, xây dựng ứng dụng trên nền tảng Android, thử nghiệm và đánh giá hiệu quả.

Cỡ mẫu thử nghiệm bao gồm khoảng 500 câu tiếng Anh với các mức độ phức tạp khác nhau, được chọn ngẫu nhiên từ kho dữ liệu. Phương pháp chọn mẫu đảm bảo tính đại diện cho các cấu trúc câu phổ biến trong tiếng Anh. Việc đánh giá hiệu quả dựa trên các chỉ số như độ chính xác phân tích cú pháp, tỷ lệ phát hiện lỗi và phản hồi của người dùng.

Kết quả nghiên cứu và thảo luận

Những phát hiện chính

Hiệu quả phân tích cú pháp với PCFGs: Thuật toán CKY áp dụng trên mô hình PCFGs đạt độ chính xác khoảng 85% trong việc xây dựng cây cú pháp cho các câu tiếng Anh thử nghiệm. So với các phương pháp truyền thống, PCFGs giúp giảm thiểu các cây cú pháp không hợp lý nhờ xác suất được tính toán từ dữ liệu huấn luyện.
Khả năng phát hiện lỗi ngữ pháp và chính tả: Ứng dụng chatbot tích hợp PCFGs và AIML có thể phát hiện và chỉ ra lỗi chính tả với tỷ lệ chính xác khoảng 90%, lỗi ngữ pháp đạt khoảng 80%. Tỷ lệ này cao hơn so với các chatbot hiện có chủ yếu tập trung vào từ vựng và trắc nghiệm.
Tương tác người dùng và phản hồi: Qua khảo sát người dùng thử nghiệm, có khoảng 75% đánh giá chatbot thân thiện, dễ sử dụng và hữu ích trong việc học tiếng Anh. Người dùng đặc biệt đánh giá cao tính năng sửa lỗi cú pháp và chính tả trong quá trình hội thoại.
Xử lý mập mờ trong phân tích cú pháp: Mô hình PCFGs giúp giải quyết vấn đề mập mờ cú pháp bằng cách lựa chọn cây cú pháp có xác suất cao nhất, giảm thiểu các phân tích sai lệch. Tuy nhiên, với câu dài và phức tạp, độ chính xác giảm nhẹ do số lượng luật và cây cú pháp tăng lên.

Thảo luận kết quả

Nguyên nhân chính giúp mô hình PCFGs đạt hiệu quả cao là do việc sử dụng xác suất để đánh giá các cây cú pháp, từ đó lựa chọn cấu trúc phù hợp nhất với ngữ cảnh câu. Điều này khắc phục hạn chế của các phương pháp dựa trên luật cứng nhắc, vốn chỉ xác định câu đúng sai mà không chỉ ra lỗi cụ thể.

So sánh với các nghiên cứu trước đây, chatbot được xây dựng trong luận văn có ưu điểm nổi bật về khả năng kiểm tra ngữ pháp và chính tả, trong khi nhiều chatbot hiện hành chỉ tập trung vào từ vựng hoặc kỹ năng nghe, đọc. Việc tích hợp AIML giúp chatbot duy trì ngữ cảnh hội thoại, tạo sự tương tác hai chiều hiệu quả.

Dữ liệu có thể được trình bày qua biểu đồ so sánh tỷ lệ phát hiện lỗi giữa chatbot nghiên cứu và các ứng dụng khác, cũng như bảng đánh giá mức độ hài lòng của người dùng. Các hạn chế như giảm hiệu quả với câu dài và phức tạp được nhận diện rõ, mở ra hướng phát triển tiếp theo.

Đề xuất và khuyến nghị

Mở rộng kho dữ liệu huấn luyện: Tăng cường thu thập và tích hợp các kho dữ liệu ngôn ngữ tiếng Anh đa dạng, bao gồm các câu phức tạp và ngữ cảnh thực tế để nâng cao độ chính xác của mô hình PCFGs. Thời gian thực hiện: 6-12 tháng. Chủ thể: nhóm nghiên cứu và các tổ chức giáo dục.
Phát triển thuật toán xử lý ngữ nghĩa: Kết hợp các phương pháp xử lý ngữ nghĩa để cải thiện khả năng hiểu và phân tích câu, khắc phục hạn chế của PCFGs chỉ tập trung vào cú pháp. Thời gian: 12-18 tháng. Chủ thể: nhà phát triển phần mềm và chuyên gia ngôn ngữ học.
Nâng cao tính năng chatbot: Mở rộng các chức năng tương tác như luyện tập kỹ năng nghe, nói, đồng thời cải thiện giao diện người dùng để tăng trải nghiệm học tập. Thời gian: 6 tháng. Chủ thể: đội ngũ phát triển ứng dụng.
Triển khai thử nghiệm rộng rãi: Thực hiện các chương trình thử nghiệm tại các trường học, trung tâm ngoại ngữ để thu thập phản hồi và điều chỉnh sản phẩm phù hợp với nhu cầu thực tế. Thời gian: 6 tháng. Chủ thể: nhà trường, trung tâm đào tạo và nhóm nghiên cứu.

Đối tượng nên tham khảo luận văn

Sinh viên và người học tiếng Anh: Nhóm này sẽ được hưởng lợi trực tiếp từ công cụ hỗ trợ học tập, giúp phát hiện và sửa lỗi ngữ pháp, chính tả một cách chủ động và tiện lợi qua giao diện chatbot.
Giảng viên và nhà giáo dục: Có thể ứng dụng chatbot như một công cụ bổ trợ trong giảng dạy, giúp học viên luyện tập và nâng cao kỹ năng ngôn ngữ ngoài giờ học chính thức.
Nhà phát triển phần mềm và công nghệ: Tham khảo mô hình PCFGs và AIML để phát triển các ứng dụng trí tuệ nhân tạo trong lĩnh vực giáo dục và xử lý ngôn ngữ tự nhiên.
Nhà nghiên cứu trong lĩnh vực trí tuệ nhân tạo và ngôn ngữ học: Luận văn cung cấp cơ sở lý thuyết và phương pháp thực nghiệm hữu ích cho các nghiên cứu tiếp theo về chatbot, phân tích cú pháp và kiểm tra ngữ pháp.

Câu hỏi thường gặp

PCFGs là gì và tại sao được chọn để phân tích cú pháp?
PCFGs là mô hình văn phạm phi ngữ cảnh có gán xác suất cho từng luật ngữ pháp, giúp lựa chọn cây cú pháp phù hợp nhất trong trường hợp mập mờ. Mô hình này được chọn vì khả năng xử lý mập mờ và tính toán xác suất giúp nâng cao độ chính xác phân tích cú pháp.
Ngôn ngữ AIML có vai trò gì trong chatbot?
AIML là ngôn ngữ lập trình dựa trên XML dùng để xây dựng chatbot, tổ chức tri thức thành các mẫu câu hỏi và câu trả lời. AIML giúp chatbot duy trì ngữ cảnh hội thoại, xử lý các mẫu câu phức tạp và tạo sự tương tác linh hoạt với người dùng.
Chatbot hỗ trợ học tiếng Anh này có thể phát hiện những lỗi nào?
Chatbot có khả năng phát hiện lỗi chính tả, lỗi ngữ pháp như chia động từ sai, dùng mạo từ không đúng, lỗi cấu trúc câu và một số lỗi phong cách dùng từ phổ biến trong tiếng Anh.
Ứng dụng này có thể sử dụng trên nền tảng nào?
Ứng dụng được phát triển trên nền tảng Android, tận dụng phổ biến của điện thoại thông minh để người học có thể truy cập và sử dụng mọi lúc, mọi nơi.
Làm thế nào để cải thiện hiệu quả của chatbot trong tương lai?
Cải thiện hiệu quả có thể thực hiện bằng cách mở rộng kho dữ liệu huấn luyện, tích hợp xử lý ngữ nghĩa, nâng cao tính năng tương tác và triển khai thử nghiệm thực tế để thu thập phản hồi người dùng.

Kết luận

Nghiên cứu đã phát triển thành công mô hình PCFGs kết hợp ngôn ngữ AIML để xây dựng chatbot hỗ trợ học tiếng Anh trên nền tảng Android.
Thuật toán CKY được áp dụng hiệu quả trong phân tích cú pháp, giúp phát hiện lỗi ngữ pháp và chính tả với độ chính xác cao.
Chatbot tạo ra có khả năng tương tác linh hoạt, thân thiện, hỗ trợ người học phát hiện và sửa lỗi trong quá trình hội thoại.
Hạn chế hiện tại là hiệu quả giảm nhẹ với câu dài và phức tạp, mở ra hướng phát triển tích hợp xử lý ngữ nghĩa.
Các bước tiếp theo bao gồm mở rộng dữ liệu, nâng cao thuật toán và triển khai thử nghiệm rộng rãi để hoàn thiện sản phẩm.

Luận văn không chỉ đóng góp về mặt lý thuyết mà còn có giá trị thực tiễn trong việc ứng dụng trí tuệ nhân tạo hỗ trợ học tiếng Anh. Độc giả và các nhà nghiên cứu được khuyến khích tiếp tục phát triển và ứng dụng các kết quả này trong các dự án tương lai.

Trích đoạn nội dung tài liệu

ĐẠI HỌC QUỐC GIA HÀ NỘI TRƢỜNG ĐẠI HỌC CÔNG NGHỆ BÙI ĐỨC ANH NGHIÊN CỨU MÔ HÌNH PCFGS VÀ NGÔN NGỮ AIML TRONG XÂY DỰNG CHATBOT HỖ TRỢ HỌC TIẾNG ANH LUẬN VĂN THẠC SĨ CÔNG NGHỆ THÔNG TIN Hà Nội - Năm 2017 z ĐẠI HỌC QUỐC GIA HÀ NỘI TRƢỜNG ĐẠI HỌC CÔNG NGHỆ BÙI ĐỨC ANH NGHIÊN CỨU MÔ HÌNH PCFGS VÀ NGÔN NGỮ AIML TRONG XÂY DỰNG CHATBOT HỖ TRỢ HỌC TIẾNG ANH Ngành: Công nghệ thông tin Chuyên ngành: Truyền dữ liệu và mạng máy tính LUẬN VĂN THẠC SĨ CÔNG NGHỆ THÔNG TIN NGƢỜI HƢỚNG DẪN KHOA HỌC: TS NGUYỄN NGỌC CƢƠNG Hà Nội - Năm 2017 z 1 LỜI CẢM ƠN Đầu tiên, em xin gửi lời cảm ơn đến Ban Giám hiệu trƣờng Đại học Công nghệ - Đại học Quốc gia Hà Nội đã tạo cho em môi trƣờng tốt để em có thể học tập và tiếp thu đƣợc những kiến thức quý báu trong những năm qua. Em xin gửi lời cảm ơn sâu sắc đến Thầy giáo, Tiến sĩ Nguyễn Ngọc Cƣơng đã nhiệt tình hƣớng dẫn, định hƣớng, hỗ trợ em trong suốt quá trình thực hiện luận văn, giúp đỡ em tiếp cận với cách tƣ duy, giải quyết và trình bày một vấn đề cần nghiên cứu. Những điều này đã giúp em khắc phục đƣợc những hạn chế của bản thân và những khó khăn để hoàn thành luận văn thành công, đúng thời hạn. Em cũng gửi lời cảm ơn chân thành tới các thầy cô trong trƣờng, đặc biệt các thầy cô trong Khoa Công nghệ thông tin đã giảng dạy em trong suốt thời gian học tập tại trƣờng.

Với những kiến thức, bài học có đƣợc sẽ là hành trang giúp em tự tin hơn trong công việc, cuộc sống và những mục tiêu trong tƣơng lai. Tôi cũng xin đƣợc cảm ơn tới gia đình, những ngƣời thân, các đồng nghiệp và bạn bè đã thƣờng xuyên quan tâm, động viên; cảm ơn Tiến sĩ Ngô Quốc Dũng đã chia sẻ kinh nghiệm, cung cấp các tài liệu hữu ích trong thời gian học tập, nghiên cứu cũng nhƣ trong suốt quá trình thực hiện luận văn tốt nghiệp. Mặc dù em đã cố gắng hoàn thành luận văn bằng tất cả sự nỗ lực và khả năng của mình, nhƣng chắc chắn vẫn còn nhiều hạn chế và thiếu sót. Em mong nhận đƣợc sự cảm thông và góp ý quý giá từ các thầy cô và các bạn.

Hà Nội, tháng 11 năm 2017 Học viên Bùi Đức Anh z 2 LỜI CAM ĐOAN Tôi xin cam đoan, những kiến thức trình bày trong luận văn là do tôi tìm hiểu, nghiên cứu và trình bày lại. Trong quá trình làm luận văn tôi có tham khảo các tài liệu có liên quan và đã ghi rõ nguồn tài liệu tham khảo đó. Những kết quả mới trong luận văn là của riêng tôi, không sao chép từ bất kỳ một công trình nào khác. Nếu có điều gì không trung thực, tôi xin hoàn toàn chịu trách nhiệm.

Tác giả Bùi Đức Anh z 3 MỤC LỤC LỜI CẢM ƠN. 1 LỜI CAM ĐOAN. 3 DANH MỤC CÁC TỪ VIẾT TẮT. 5 DANH MỤC CÁC HÌNH ẢNH.

Tính cấp thiết của đề tài. Mục tiêu nghiên cứu. Đối tƣợng và phạm vi nghiên cứu của đề tài. Phƣơng pháp nghiên cứu.

Ý nghĩa khoa học, ý nghĩa thực tiễn của đề tài. Kết cấu luận văn. 9 CHƢƠNG 1: CÁC VẤN ĐỀ TỔNG QUAN. Trí tuệ nhân tạo.

Chatbot hỗ trợ học tiếng Anh. Ngữ pháp tiếng Anh. Các khái niệm cơ bản. Phân loại lỗi.

Một số lỗi ngữ pháp trong tiếng Anh. Tổng quan bài toán kiểm tra ngữ pháp tiếng Anh. Phân tích cú pháp. Bài toán kiểm tra ngữ pháp tiếng Anh.

Kết luận chƣơng. 33 CHƢƠNG 2: MÔ HÌNH PCFGs VÀ NGÔN NGỮ AIML. Mô hình PCFGs. Văn phạm phi ngữ cảnh.

Tính mập mờ trong phân tích cú pháp. Văn phạm phi ngữ cảnh hƣớng thống kê PCFGs. Ngôn ngữ AIML. Các Category và đặc tính của AIML.

Một số thẻ thông dụng trong AIML. Kết luận chƣơng. 54 CHƢƠNG 3: PHÂN TÍCH THIẾT KẾ, CÀI ĐẶT ỨNG DỤNG. Phân tích thiết kế.

Xác định yêu cầu. Xây dựng tập luật dựa trên tập dữ liệu có sẵn. Cài đặt ứng dụng. Giao diện chức năng hội thoại (Chatbot).

Giao diện chức năng tra cứu từ điển. Giao diện chức năng kiểm tra chính tả, ngữ pháp. Đánh giá ứng dụng. 66 TÀI LIỆU THAM KHẢO.

68 z 5 DANH MỤC CÁC TỪ VIẾT TẮT Từ viết tắt Từ đầy đủ AI Artificial Intelligence (Trí tuệ nhân tạo) AIML Artificial Intelligence Markup Language CKY Cocke-Kasami-Younger CNF Chomsky Normal Form CFG Context-Free Grammar (Văn phạm phi ngữ cảnh) DARPA Defense Advanced Research Projects Agency DT Determiner (Từ hạn định/Từ chỉ định) IBM International Business Machines IN Prepostion (Giới từ) NN Noun (Danh từ) NP Noun Phrase (Cụm danh từ) Probabilistic Context-Free Grammars PCFGs (Văn phạm phi ngữ cảnh hướng thống kê) PP Prepositional Phrase (Cụm giới từ) S Sentence (Câu) SCFG Stochastic Context-Free Grammar Vi Intrasitive Verb (Nội động từ) VP Verb Phrase (Cụm động từ) Vt Transitive Verb (Ngoại động từ) z 6 DANH MỤC CÁC HÌNH ẢNH Hình 1. Mô hình Turing Test. Quá trình hình thành và phát triển của trí tuệ nhân tạo. Chatbot Andy English.

Mô hình xử lý ngôn ngữ tự nhiên. Cú pháp câu “Claudia sat on a stool”. Phƣơng pháp Top - Down. Phƣơng pháp Bottom – Up.

Cây cú pháp biểu diễn từ dẫn xuất. Tính mập mờ trong phân tích cây cú pháp[8]. Một PCFGs đơn giản[8]. Một PCFGs với CNF.

Ngôn ngữ AIML. Ví dụ về độ ƣu tiên thông tin (1). Ví dụ về độ ƣu tiên thông tin (2). Ví dụ về thẻ <star>.

Ví dụ về thẻ <srai>. Ví dụ về thẻ <sr>. Ví dụ về thẻ <set>, <get>. Ví dụ về thẻ <that>.

Ví dụ về thẻ <topic>. Ví dụ về thẻ <condition>. Ví dụ về thẻ <random> và thẻ <think>. Mô hình hệ thống AI English.

Dữ liệu trong Tatoeba. Dữ liệu câu tiếng Anh. Tập luật trong PCFGs. Giao diện khởi tạo của AI English.

Giao diện cuộc hội thoại ứng dụng AI English. Giao diện chức năng tra cứu từ điển. Giao diện chức năng kiểm tra ngữ pháp. Giao diện chi tiết lỗi và sửa lỗi.

Bảng động từ bất quy tắc. Các cụm từ thông dụng. Tính cấp thiết của đề tài Trong nhiều năm trở lại đây, với nhu cầu về hội nhập ngày càng cao giữa các quốc gia cả về kinh tế lẫn văn hóa, yêu cầu về ngoại ngữ, đặc biệt là tiếng Anh, trở thành một vấn đề cấp thiết với mỗi ngƣời. Nhƣng nhiều ngƣời không có đủ thời gian cũng nhƣ điều kiện để tham gia các lớp học thêm hoặc các câu lạc bộ để nâng cao trình độ của mình.

Chính vì vậy cần có những phần mềm, công cụ để hỗ trợ ngƣời học tiếng Anh ở bất cứ nơi đâu, vào bất cứ thời gian nào. Hiện nay đã có nhiều công cụ hƣớng tới mục đích đó, song mỗi công cụ, phần mềm đều có những hạn chế riêng, đặc biệt là tính thụ động. Ngƣời học hầu nhƣ chỉ tham gia vào các hoạt động đƣợc thiết kế từ trƣớc trên công cụ, ít có sự tƣơng tác hai chiều. Với sự phát triển của khoa học công nghệ, việc mỗi ngƣời sở hữu cho mình một chiếc điện thoại thông minh hiện nay là rất phổ biến.

Dựa trên nền tảng điện thoại thông minh mà đã và đang xuất hiện các ứng dụng hỗ trợ học tiếng Anh có sự tƣơng tác cao giữa ngƣời và máy; một trong những ứng dụng phổ biến nhất hiện nay có thể kể tới là các ứng dụng dựa trên Chatbot. Tuy nhiên, phần lớn các ứng dụng Chatbot mới tập trung vào phần từ vựng, từ điển, trắc nghiệm. hoặc các ứng dụng luyện kỹ năng nghe, kỹ năng đọc., có rất ít các ứng dụng có thể giúp ngƣời dùng kiểm tra chính tả cũng nhƣ cú pháp của câu để chỉ ra lỗi sai cho ngƣời đọc và chỉnh sửa nó, mặc dù đây là một bài toán tƣơng đối quan trọng. Vì vậy, Chatbot đáp ứng đƣợc các yêu cầu, chạy trên điện thoại thông minh để hỗ trợ ngƣời học tiếng Anh sẽ là một giải pháp có hiệu quả để nâng cao chất lƣợng học tập tiếng Anh.

Chính vì lý do đó, tác giả đã lựa chọn đề tài: “Nghiên cứu mô hình PCFGs và ngôn ngữ AIML trong xây dựng chatbot hỗ trợ học tiếng Anh”. Mục tiêu nghiên cứu Nghiên cứu cơ sở lý thuyết nền tảng của bài toán kiểm tra chính tả và cú pháp của câu trong tiếng Anh; ứng dụng cài đặt, đánh giá giải thuật và xây dựng một ứng dụng hỗ trợ các tính năng nhƣ kiểm tra chính tả, ngữ pháp, cú pháp thông qua hội thoại giữa ngƣời dùng và máy trên nền tảng Android. Đối tƣợng và phạm vi nghiên cứu của đề tài Đối tƣợng nghiên cứu z 9 - Khái quát về trí tuệ nhân tạo - Mô hình PCFGs, ứng dụng xây dựng cây cú pháp - Ngôn ngữ AIML và kỹ thuật xây dựng chatbot Phạm vi nghiên cứu Chatbot trên điện thoại thông minh sử dụng hệ điều hành Android đƣợc xây dựng dựa trên AIML và mô hình PCFGs có khả năng thực hiện hội thoại với ngƣời dùng, phát hiện và sửa những lỗi chính tả và cú pháp. Phƣơng pháp nghiên cứu - Khảo sát, phân tích và hệ thống hóa nội dung các tài liệu khoa học liên quan đến chatbot hỗ trợ học tiếng Anh - Đối sánh nội dung nghiên cứu của đề tài với các nội dung nghiên cứu đã thực hiện để vừa phát triển áp dụng các kết quả khoa học - công nghệ đã có cho đề tài vừa tìm ra các nội dung mới cần đƣợc nghiên cứu và thi hành.

- Thiết kế mô hình và thực nghiệm đánh giá các kỹ thuật, bài toán đã đề xuất để chứng minh tính hiệu quả. Ý nghĩa khoa học, ý nghĩa thực tiễn của đề tài Ý nghĩa khoa học - Nghiên cứu, nắm vững về trí tuệ nhân tạo và ngôn ngữ AIML - Vận dụng trí tuệ nhân tạo để tạo ra sự giao tiếp thân thiện, gần gũi giữa ngƣời và máy tính - Tìm hiểu về chatbot và ứng dụng chatbot để cung cấp thông tin Ý nghĩa thực tiễn - Tạo ra đƣợc công cụ hỗ trợ học tiếng Anh theo hình thức hội thoại giữa ngƣời và máy - Giúp phát hiện và sửa những lỗi thƣờng gặp về chính tả và cú pháp trong quá trình giao tiếp (viết, nói) bằng tiếng Anh. - Nâng cao hiệu quả học tiếng Anh.

Nội dung được bảo vệ bản quyền — Tải xuống đầy đủ

Bài luận văn thạc sĩ mang tiêu đề "Nghiên cứu mô hình PCFGs và AIML trong xây dựng chatbot hỗ trợ học tiếng Anh" của tác giả Bùi Đức Anh, dưới sự hướng dẫn của TS. Nguyễn Ngọc Cương tại Đại học Quốc gia Hà Nội, tập trung vào việc áp dụng các mô hình ngữ pháp cây phân loại (PCFGs) và ngôn ngữ mô hình hóa trí tuệ nhân tạo (AIML) để phát triển chatbot hỗ trợ học tiếng Anh. Nghiên cứu này không chỉ cung cấp cái nhìn sâu sắc về cách thức hoạt động của các mô hình này mà còn chỉ ra những lợi ích mà chatbot có thể mang lại trong việc cải thiện kỹ năng ngôn ngữ của người học.

Để mở rộng thêm kiến thức về lĩnh vực công nghệ thông tin và giáo dục, bạn có thể tham khảo bài viết "Luận văn thạc sĩ về quản lý giáo dục và ứng dụng công nghệ thông tin trong dạy học ở huyện Phong Điền, TP Cần Thơ", nơi nghiên cứu về việc ứng dụng công nghệ thông tin trong giáo dục. Bên cạnh đó, bài viết "Luận án tiến sĩ: Giáo dục kỹ năng mềm cho sinh viên trong môn tư tưởng Hồ Chí Minh tại Hải Dương" cũng mang lại cái nhìn về việc phát triển kỹ năng cho sinh viên, một yếu tố quan trọng trong giáo dục hiện đại. Cuối cùng, bạn có thể tìm hiểu thêm về "Nghiên cứu phát triển kỹ thuật hỗ trợ phát hiện đạo văn trong văn bản tiếng Việt", một nghiên cứu liên quan đến công nghệ thông tin trong giáo dục, giúp nâng cao chất lượng học tập và nghiên cứu.

Những tài liệu này sẽ giúp bạn có cái nhìn toàn diện hơn về ứng dụng công nghệ trong giáo dục và phát triển kỹ năng cho sinh viên.

#trí tuệ nhân tạo

#học tiếng Anh

#ngôn ngữ tự nhiên

#hệ thống hỗ trợ học tập

#mô hình ngữ pháp

Chủ đề

Học máy và trí tuệ nhân tạo

Phương pháp dạy và học tiếng Anh

Ngôn ngữ và ngữ nghĩa trong AI