Mô Hình và Phương Pháp Lập Luận Để Trả Lời Câu Hỏi 'Tại Sao' Trong Phân Tích Diễn Ngôn Tiếng Việt

Luận án tiến sĩ khám phá mô hình và phương pháp lập luận trong khoa học máy tính, tập trung vào phân tích diễn ngôn tiếng Việt để trả lời câu hỏi tại sao.

Trường đại học

Đại Học Quốc Gia TPHCM

Chuyên ngành

Khoa Học Máy Tính

Người đăng

Ẩn danh

Thể loại

luận án

2023

170

Phí lưu trữ

45 Point

Tóm tắt

I. Tổng Quan Về Mô Hình Trả Lời Câu Hỏi Tại Sao Tiếng Việt

Các nghiên cứu về hỏi-đáp tự động (QA) cho thấy cần có phương pháp phù hợp cho từng dạng câu hỏi. Phần lớn tập trung vào câu hỏi factoid, trong khi câu hỏi "TẠI SAO" (Why-question) ít được nghiên cứu và hiệu quả chưa cao. Luận án này tập trung vào phương pháp trả lời câu hỏi "TẠI SAO" tiếng Việt. Các nghiên cứu hiện tại cho thấy cấu trúc nguyên nhân - kết quả là đặc trưng quan trọng. Một số sử dụng lý thuyết cấu trúc tu từ (RST) hoặc mô hình phân lớp để nhận dạng cấu trúc này, từ đó xác định câu trả lời. Phân tích diễn ngôn là một cách tiếp cận phù hợp, nhưng kết quả còn hạn chế. Luận án giả thiết rằng cấu trúc diễn ngôn và lập luận chứa câu trả lời cho câu hỏi "TẠI SAO".

1.1. Bài Toán Trả Lời Câu Hỏi Tại Sao Trong QA

Bài toán trả lời câu hỏi "TẠI SAO" là một thách thức lớn trong lĩnh vực xử lý ngôn ngữ tự nhiên (NLP). Không giống như câu hỏi factoid, câu hỏi "TẠI SAO" đòi hỏi sự hiểu biết sâu sắc về ngữ cảnh và khả năng suy luận. Các phương pháp truyền thống thường dựa vào việc tìm kiếm các mẫu câu hoặc từ khóa liên quan đến nguyên nhân và kết quả. Tuy nhiên, cách tiếp cận này thường không hiệu quả khi câu trả lời được diễn đạt một cách gián tiếp hoặc phức tạp. Do đó, cần có những phương pháp tiên tiến hơn để giải quyết bài toán này.

1.2. Hướng Tiếp Cận Phân Tích Diễn Ngôn và Lập Luận

Luận án này đề xuất một hướng tiếp cận mới kết hợp phân tích diễn ngôn và lập luận để trả lời câu hỏi "TẠI SAO". Phân tích diễn ngôn giúp xác định mối liên hệ giữa các câu trong văn bản, trong khi lập luận giúp suy luận ra những thông tin không được diễn đạt một cách rõ ràng. Bằng cách kết hợp hai phương pháp này, luận án hy vọng sẽ tạo ra một hệ thống có khả năng trả lời câu hỏi "TẠI SAO" một cách chính xác và hiệu quả hơn. Cách tiếp cận này cũng giúp làm rõ cơ chế xác định câu trả lời, khác với các mô hình mạng nơ-ron học sâu thường được coi là "hộp đen".

II. Thách Thức Trong Phân Tích Diễn Ngôn Tiếng Việt

Mặc dù các mô hình mạng nơ-ron học sâu có thể trả lời câu hỏi "TẠI SAO", luận án chọn cách tiếp cận phân tích diễn ngôn tiếng Việt kết hợp với lập luận để làm rõ cơ chế xác định câu trả lời. Theo Đỗ Hữu Châu, diễn ngôn là một nhóm câu liên tiếp đảm bảo tính mạch lạc và thể hiện chủ đích của người viết. Phân tích diễn ngôn là phân tích sự liên hệ giữa các câu để thấy được chủ đích này. Luận án chọn cách tiếp cận này để xác định mối liên hệ giữa các câu trong các lập luận hoặc lời giải thích. Trong diễn ngôn, có những lập luận không thể hiện rõ ràng qua các quan hệ diễn ngôn, gọi là lập luận không tường minh. Cần có phương pháp lập luận để xác định những lập luận này.

2.1. Sự Khó Khăn Trong Nhận Dạng Quan Hệ Diễn Ngôn

Một trong những thách thức lớn nhất trong phân tích diễn ngôn là nhận dạng chính xác các quan hệ diễn ngôn giữa các đơn vị diễn ngôn (EDU). Các quan hệ này có thể được biểu thị một cách rõ ràng thông qua các từ nối hoặc cấu trúc ngữ pháp, nhưng cũng có thể được suy ra từ ngữ cảnh và kiến thức nền. Việc tự động nhận dạng các quan hệ diễn ngôn đòi hỏi các mô hình có khả năng hiểu sâu sắc về ngôn ngữ và thế giới.

2.2. Xử Lý Lập Luận Không Tường Minh Trong Diễn Ngôn

Lập luận không tường minh là một vấn đề phức tạp trong phân tích diễn ngôn. Trong nhiều trường hợp, người viết không trình bày lập luận một cách rõ ràng, mà dựa vào người đọc để suy luận ra kết luận từ các tiền đề. Việc tự động nhận dạng và tái cấu trúc các lập luận không tường minh đòi hỏi các mô hình có khả năng suy luận và sử dụng kiến thức nền một cách hiệu quả. Đây là một lĩnh vực nghiên cứu đầy thách thức nhưng cũng rất tiềm năng.

2.3. Tính Đặc Thù Của Diễn Ngôn Tiếng Việt

Diễn ngôn tiếng Việt có những đặc thù riêng so với các ngôn ngữ khác. Ví dụ, việc sử dụng các từ ngữ liên kết và cấu trúc ngữ pháp có thể khác biệt, và các quy tắc diễn ngôn có thể phụ thuộc vào văn hóa và ngữ cảnh xã hội. Do đó, các phương pháp phân tích diễn ngôn được phát triển cho các ngôn ngữ khác có thể không hoạt động tốt trên tiếng Việt. Cần có những nghiên cứu chuyên sâu để phát triển các phương pháp phân tích diễn ngôn phù hợp với đặc điểm của tiếng Việt.

III. Phương Pháp Lập Luận Dựa Trên Biểu Diễn Văn Bản Tiếng Việt

Việc sử dụng các quan hệ diễn ngôn để tìm câu trả lời cho câu hỏi "TẠI SAO" là một giải pháp không mới, nhưng việc sử dụng lập luận để trả lời câu hỏi "TẠI SAO" dựa trên cách tiếp cận phân tích diễn ngôn là một cách tiếp cận mới. Luận án chọn đề tài "Mô hình và phương pháp lập luận để trả lời câu hỏi TẠI SAO dựa trên cách tiếp cận phân tích diễn ngôn cho văn bản tiếng Việt" để nghiên cứu vấn đề phân tích diễn ngôn tiếng Việt và lập luận trên biểu diễn văn bản tiếng Việt, từ đó kết hợp chúng trong một mô hình hệ thống hỏi-đáp cho câu hỏi "TẠI SAO" để làm rõ khả năng áp dụng của cách tiếp cận này.

3.1. Cơ Chế Lập Luận Loại Suy Trong Phân Tích Diễn Ngôn

Luận án tập trung vào cơ chế lập luận loại suy để suy luận ra những thông tin không được diễn đạt một cách rõ ràng trong văn bản. Lập luận loại suy dựa trên việc tìm kiếm sự tương đồng giữa hai tình huống hoặc sự kiện, và suy ra rằng nếu một điều gì đó đúng trong tình huống này, thì nó cũng có thể đúng trong tình huống kia. Cơ chế này có thể được sử dụng để suy luận ra nguyên nhân của một sự kiện dựa trên các sự kiện tương tự đã xảy ra trước đó.

3.2. Tính Toán Độ Thuyết Phục Của Lập Luận

Một yếu tố quan trọng trong lập luận là độ thuyết phục. Không phải tất cả các lập luận đều có giá trị như nhau, và một số lập luận có thể bị phản bác bởi các bằng chứng hoặc lý lẽ khác. Luận án đề xuất một phương pháp để tính toán độ thuyết phục của một lập luận dựa trên các yếu tố như độ tin cậy của nguồn thông tin, mức độ tương đồng giữa các tình huống, và sự tồn tại của các lập luận phản bác. Độ thuyết phục của một lập luận có thể được sử dụng để xếp hạng các câu trả lời tiềm năng cho câu hỏi "TẠI SAO".

3.3. Ứng Dụng BERT Trong Nhận Dạng Lập Luận

Luận án sử dụng kiến trúc mạng BERT (Bidirectional Encoder Representations from Transformers) để huấn luyện mô hình nhận dạng lập luận trên biểu diễn văn bản. BERT là một mô hình ngôn ngữ mạnh mẽ có khả năng hiểu sâu sắc về ngữ cảnh và mối quan hệ giữa các từ trong câu. Mô hình BERT được tinh chỉnh để nhận dạng các lập luận loại suy trong văn bản tiếng Việt, và được sử dụng để xác định các câu trả lời tiềm năng cho câu hỏi "TẠI SAO".

IV. Mô Hình Lập Luận Để Trả Lời Câu Hỏi Tại Sao Hiệu Quả

Mục đích của luận án là nghiên cứu phương pháp lập luận và phương pháp phân tích diễn ngôn làm cơ sở để xác lập cơ chế tìm câu trả lời có trong văn bản tiếng Việt cho các câu hỏi "TẠI SAO". Cơ chế này có đặc điểm là rõ ràng và phù hợp với cách tìm câu trả lời cho câu hỏi “TẠI SAO” của người Việt. Sự rõ ràng thể hiện qua kết quả từng bước trong quá trình tìm câu trả lời. Sự phù hợp với cách tìm câu trả lời của người Việt được thể hiện qua việc phân tích diễn ngôn và lập luận bởi vì diễn ngôn tiếng Việt và lập luận là phương tiện trình bày lý lẽ của người Việt.

4.1. Thành Phần Phân Tích Diễn Ngôn Trong Mô Hình

Thành phần phân tích diễn ngôn đóng vai trò quan trọng trong việc xác định mối liên hệ giữa các câu trong văn bản. Thành phần này sử dụng các quy tắc và mô hình ngôn ngữ học để phân tích cấu trúc diễn ngôn của văn bản, và xác định các quan hệ diễn ngôn như nguyên nhân - kết quả, điều kiện - kết quả, và tương phản. Thông tin này được sử dụng để xác định các câu trả lời tiềm năng cho câu hỏi "TẠI SAO".

4.2. Thành Phần Lập Luận Loại Suy Trong Mô Hình

Thành phần lập luận loại suy được sử dụng để suy luận ra những thông tin không được diễn đạt một cách rõ ràng trong văn bản. Thành phần này tìm kiếm sự tương đồng giữa các tình huống hoặc sự kiện, và suy ra rằng nếu một điều gì đó đúng trong tình huống này, thì nó cũng có thể đúng trong tình huống kia. Thành phần này giúp mở rộng phạm vi tìm kiếm câu trả lời và tìm ra những câu trả lời tiềm năng mà thành phần phân tích diễn ngôn có thể bỏ sót.

4.3. Thành Phần Chọn Quan Hệ Lý Do Tối Ưu

Sau khi đã xác định được các câu trả lời tiềm năng, thành phần chọn quan hệ lý do sẽ đánh giá và xếp hạng các câu trả lời này dựa trên các tiêu chí như độ thuyết phục của lập luận, mức độ liên quan đến câu hỏi, và độ tin cậy của nguồn thông tin. Thành phần này sử dụng các thuật toán và mô hình học máy để đưa ra quyết định cuối cùng về câu trả lời tốt nhất cho câu hỏi "TẠI SAO".

V. Ứng Dụng Thực Tiễn và Kết Quả Nghiên Cứu Đột Phá

Để đạt được mục đích nghiên cứu, các nội dung cần được nghiên cứu trong luận án như sau: Tổng quan về hỏi-đáp tự động và các nghiên cứu về câu hỏi "TẠI SAO". Mô hình và phương pháp phân tích một số quan hệ diễn ngôn cấp độ câu và liên câu trong tiếng Việt. Phương pháp lập luận trên biểu diễn văn bản tiếng Việt. Phương pháp xác định câu trả lời cho các câu hỏi "TẠI SAO" dựa trên lập luận và phân tích diễn ngôn. Mô hình lập luận để trả lời câu hỏi "TẠI SAO" dựa trên cách tiếp cận phân tích diễn ngôn cho văn bản tiếng Việt.

5.1. Xây Dựng Ngữ Liệu Thử Nghiệm Đánh Giá Mô Hình

Để đánh giá hiệu quả của mô hình, luận án xây dựng một ngữ liệu thử nghiệm bao gồm các câu hỏi "TẠI SAO" và các đoạn văn bản tiếng Việt. Ngữ liệu này được sử dụng để đo lường độ chính xác và khả năng bao phủ của mô hình trong việc tìm kiếm câu trả lời. Ngữ liệu thử nghiệm được thiết kế để phản ánh sự đa dạng của các loại câu hỏi "TẠI SAO" và các phong cách viết khác nhau.

5.2. So Sánh Với Các Phương Pháp Trả Lời Câu Hỏi Khác

Luận án so sánh hiệu quả của mô hình đề xuất với các phương pháp trả lời câu hỏi khác, bao gồm các mô hình dựa trên mạng nơ-ron học sâu và các phương pháp dựa trên tìm kiếm thông tin. Kết quả so sánh cho thấy mô hình đề xuất có hiệu quả tốt hơn trong việc trả lời câu hỏi "TẠI SAO", đặc biệt là trong các trường hợp mà câu trả lời đòi hỏi sự suy luận và hiểu biết sâu sắc về ngữ cảnh.

5.3. Phân Tích Ưu Điểm và Nhược Điểm Của Mô Hình

Luận án phân tích ưu điểm và nhược điểm của mô hình đề xuất. Ưu điểm của mô hình bao gồm khả năng suy luận và hiểu biết sâu sắc về ngữ cảnh, khả năng xử lý các lập luận không tường minh, và khả năng thích ứng với các phong cách viết khác nhau. Nhược điểm của mô hình bao gồm độ phức tạp tính toán cao và sự phụ thuộc vào chất lượng của dữ liệu huấn luyện.

VI. Kết Luận và Hướng Phát Triển Mô Hình Tại Sao Tương Lai

Từ mục đích của luận án, đối tượng nghiên cứu được xác định là các phương pháp lập luận và phân tích diễn ngôn có thể áp dụng để trả lời câu hỏi "TẠI SAO" trong văn bản tiếng Việt. Phạm vi nghiên cứu bao gồm các quan hệ diễn ngôn cấp độ câu và liên câu, các cơ chế lập luận loại suy, và các mô hình học máy có thể sử dụng để nhận dạng và tái cấu trúc lập luận. Ý nghĩa khoa học của đề tài là đóng góp vào lĩnh vực xử lý ngôn ngữ tự nhiên và phát triển các hệ thống hỏi-đáp thông minh. Ý nghĩa thực tiễn của đề tài là cung cấp một công cụ hữu ích cho việc tìm kiếm thông tin và giải quyết vấn đề trong nhiều lĩnh vực khác nhau.

6.1. Đóng Góp Mới Của Luận Án Về QA Tiếng Việt

Luận án đóng góp vào lĩnh vực xử lý ngôn ngữ tự nhiên bằng cách đề xuất một phương pháp mới để trả lời câu hỏi "TẠI SAO" dựa trên sự kết hợp giữa phân tích diễn ngôn và lập luận. Phương pháp này có thể được sử dụng để phát triển các hệ thống hỏi-đáp thông minh có khả năng hiểu sâu sắc về ngôn ngữ và thế giới.

6.2. Hướng Nghiên Cứu Mở Rộng và Phát Triển Mô Hình

Luận án đề xuất một số hướng nghiên cứu mở rộng, bao gồm việc cải thiện hiệu quả của thành phần phân tích diễn ngôn, phát triển các cơ chế lập luận phức tạp hơn, và tích hợp kiến thức nền vào mô hình. Các hướng nghiên cứu này có thể giúp nâng cao khả năng của mô hình trong việc trả lời câu hỏi "TẠI SAO" và mở rộng phạm vi ứng dụng của mô hình.

6.3. Ứng Dụng Tiềm Năng Trong Thực Tế và Nghiên Cứu

Mô hình đề xuất có thể được ứng dụng trong nhiều lĩnh vực khác nhau, bao gồm giáo dục, y tế, và kinh doanh. Ví dụ, mô hình có thể được sử dụng để tạo ra các hệ thống học tập cá nhân hóa, giúp người dùng tìm kiếm thông tin y tế chính xác, hoặc hỗ trợ các nhà quản lý đưa ra quyết định kinh doanh sáng suốt.

27/05/2025

Bạn đang xem trước tài liệu:

Luận án tiến sĩ khoa học máy tính mô hình và phương pháp lập luận để trả lời các câu hỏi tại sao dựa trên cách tiếp cận phân tích diễn ngôn tiếng việt

Tải đầy đủ

Trích đoạn nội dung tài liệu

MỞ ĐẦU Lý do lựa chọn đề tài Theo khảo sát các nghiên cứu về hỏi-đáp tự động, được trình bày ở Mục 1.5, những dạng câu hỏi khác nhau cần được nghiên cứu dé tim ra phương pháp phù hợp trả lời phù hợp. Các nghiên cứu về hoi-dap tự động phan lớn tập trung vào dạng câu hỏi factoid. Số lượng nghiên cứu phương pháp trả lời câu hỏi “TẠI SAO” (Why-question) chưa nhiều và hiệu quả còn chưa cao, thể hiện ở kết quả tốt nhất là Fi=69,66% khi trả lời câu hỏi “TẠI SAO” trên bộ ngữ liệu SQuAD V1. Vì thế, luận án chọn đề tài nghiên cứu phương pháp trả lời câu hỏi “TẠI SAO” tiếng Việt.

Các nghiên cứu về phương pháp trả lời câu hỏi “TẠI SAO” được khảo sát và được trình bày trong Mục 1.5 cho thay rằng cấu trúc nguyên nhân — kết qua của một câu là một đặc trưng quan trọng để tìm câu trả lời. Các nghiên cứu này sử dụng các từ ngữ liên kết trong cấu trúc nguyên nhân — kết quả theo lý thuyết cấu trúc tu từ hoặc một sử dụng một mô hình phân lớp dé nhận dạng cấu trúc nguyên nhân — kết quả. Kết quả nhận dạng là cơ sở xác định câu trả lời chính là mệnh đề chỉ nguyên nhân. Trong các phương pháp được nghiên cứu, phương pháp của Azmi sử dụng một chương trình phân tích diễn ngôn tiếng Ả-rập theo lý thuyết cấu trúc tu từ (Rhetorical Structure Theory — RST) để xác định câu trả lời.

Điều này cho thấy phân tích diễn ngôn là một cách tiếp cận phù hợp để tìm câu trả lời cho câu hỏi “TẠI SAO”. Tuy nhiên, các kết quả nghiên cứu về phân tích diễn ngôn, được trình bay ở Mục 2.5, còn nhiều hạn chế với hiệu quả cao nhất đạt Fi=57,6% khi phân tích diễn ngôn của toàn văn bản tiếng Anh. Bên cạnh đó, câu trả lời của câu hỏi “TẠI SAO” còn có thé tìm được trong một lập luận bởi vì lập luận cũng có dạng nguyên nhân — kết quả trong đó các tiền đề và kết luận tương ứng với vị trí của nguyên nhân và kết quả. Vì thế, luận án giả thiết rằng, cấu trúc diễn ngôn và lập luận là những đối tượng chứa câu trả lời cho câu hỏi “TAI SAO”.

Mặc dù các mô hình mạng nơ-ron học sâu có thé trả lời câu hỏi “TAI SAO” như được trình bày ở Mục 1.3, luận án không chọn cách tiếp cận dùng mạng nơ- ron học sâu. Bởi vì theo cách tiếp cận này, mô hình mạng nơ-ron học sâu là một hộp đen, không giải thích được quá trình tìm câu trả lời cho câu hỏi “TAI SAO”. Luan án chọn cách tiếp cận phân tích diễn ngôn tiếng Việt kết hợp với lập luận dé có thé làm rõ cơ chế xác định câu trả lời cho câu hỏi “TẠI SAO” tiếng Việt trên máy tính. Theo tác giả Đỗ Hữu Châu, diễn ngôn là một khái niệm trong ngôn ngữ học để chỉ một nhóm câu liên tiếp đảm bảo được tính mạch lạc và thể hiện được một chủ đích của người viết như tự sự, lập luận,.

Từ khái niệm diễn ngôn này, một đoạn văn là một diễn ngôn và một văn bản với kích thước bat kỳ cũng là một diễn ngôn. Phân tích diễn ngôn là phân tích sự liên hệ giữa các câu trong đoạn văn hay văn bản dé thay được chủ dich của người viết. Nói cách khác, phân tích nghĩa của văn bản dựa trên các quy tắc do người viết sử dụng dé xây dựng văn bản, tương tự như việc phân tích nghĩa của câu dựa trên các quy tắc cú pháp, cần phải phân tích diễn ngôn. Luận án chọn cách tiếp cận phân tích diễn ngôn cho văn bản tiếng Việt để xác định mỗi liên hệ giữa các câu trong các lập luận hoặc lời giải thích được trình bày ở dạng văn bản.

Bởi vì câu hỏi “TẠI SAO” được đặt ra dé tìm lý do của một sự việc nên cách tiếp cận phân tích diễn ngôn sẽ phù hợp với quá trình xác định câu trả lời do con người thực hiện và do đó có cơ sở để giải thích quá trình tìm câu trả lời. Trong diễn ngôn, có những lập luận không thể hiện rõ ràng qua các quan hệ diễn ngôn trong văn bản, tạm gọi là những lập luận không tường minh. Người đọc nhận ra những lập luận này qua quá trình lập luận dựa trên những tri thức có trong văn ban và những tri thức mà họ đã biết trước đó (gọi là tiền giả định). Vì thế, khi phương pháp phân tích diễn ngôn không xác định được những lập luận không tường minh, luận án cần có phương pháp lập luận dé xác định những lập luận này, tương tự như cách người đọc đã tiến hành.

Việc sử dụng các quan hệ diễn ngôn dé tìm câu trả lời cho câu hỏi “TẠI SAO” là một giải pháp không mới, nhưng việc sử dụng lập luận để trả lời câu hỏi “TẠI SAO” dựa trên cách tiếp cận phân tích diễn ngôn là một cách tiếp cận mới. Vì thế, luận án chọn đề tài “Mô hình và phương pháp lập luận để trả lời câu hỏi TẠI SAO dựa trên cách tiếp cận phân tích diễn ngôn cho văn bản tiếng Việt” để nghiên cứu van dé phân tích diễn ngôn tiếng Việt và lập luận trên biểu diễn văn bản tiếng Việt, từ đó kết hợp chúng trong một mô hình hệ thống hỏi-đáp cho câu hỏi “TẠI SAO” dé làm rõ khả năng áp dụng của cách tiếp cận này. Mục đích của luận án Mục đích của luận án là nghiên cứu phương pháp lập luận và phương pháp phân tích diễn ngôn làm cơ sở để xác lập cơ chế tìm câu trả lời có trong văn bản tiếng Việt cho các câu hỏi "TẠI SAO". Cơ chế này có đặc điểm là rõ ràng và phù hợp với cách tìm câu trả lời cho câu hỏi “TẠI SAO” của người Việt.

Sự rõ ràng thê hiện qua kết quả từng bước trong quá trình tìm câu trả lời. Sự phù hợp với cách tìm câu trả lời của người Việt được thể hiện qua việc phân tích diễn ngôn và lập luận bởi vì diễn ngôn tiếng Việt và lập luận là phương tiện trình bày lý lẽ của người Việt. Nội dung nghiên cứu Đề đạt được mục đích nghiên cứu, các nội dung cần được nghiên cứu trong luận án như sau: - Tổng quan về hỏi-đáp tự động và các nghiên cứu về câu hỏi "TẠI SAO". - M6 hình và phương pháp phân tích một số quan hệ diễn ngôn cấp độ câu và liên câu trong tiếng Việt.

- Phuong pháp lập luận trên biểu diễn văn bản tiếng Việt. - Phuong pháp xác định câu trả lời cho các câu hỏi "TAI SAO" dựa trên lập luận và phân tích diễn ngôn. - M6 hình lập luận dé trả lời câu hỏi "TẠI SAO" dựa trên cách tiếp cận phân tích diễn ngôn cho văn bản tiếng Việt. Đối tượng nghiên cứu Từ mục đích của luận án, đôi tượng nghiên cứu được xác định gôm: - _ Mô hình diễn ngôn áp dụng dé biểu diễn diễn ngôn cho văn bản tiếng Việt.

- Don vị diễn ngôn trong văn bản tiếng Việt. Quan hệ diễn ngôn trong văn bản tiếng Việt. Lập luận theo cơ chế loại SUY. Nhận dạng lập luận và tạo lập luận theo cơ chế loại suy.

Pham vi nghiên cứu Luan án được nghiên cứu trong phạm vi như sau: Phạm vi áp dụng là dạng bài toán là tìm câu trả lời cho câu hỏi “TẠI SAO” trong một văn bản ngắn. Một văn bản ngắn là một văn bản có nội dung trình bày một chủ đề duy nhất với số từ không vượt quá 500 từ. Một văn bản ngắn có thê là một bài luận, một bản tin ngắn hoặc một nhóm liên tiếp vài đoạn văn trình bày một ý trong một văn bản. Phân tích quan hệ diễn ngôn trong luận án chỉ thực hiện ở cấp độ câu và liên câu cho một số quan hệ diễn ngôn được chọn, tập trung vào việc xác định câu trả lời cho câu hỏi “TAI SAO” của luận án.

Bởi vì phân tích diễn ngôn ở cấp độ toàn văn bản là một bài toán khó, đặc biệt đối với tiếng Việt do thiếu ngữ liệu chú giải diễn ngôn ở cấp độ toàn văn bản. Vấn đề phân tích diễn ngôn ở cấp độ toàn văn bảng cho tiếng Việt cần được nghiên cứu riêng. Cơ chế lập luận được xác định là cơ chế loại suy theo lược đồ loại Suy của Juthe. Lập luận có thé được thực hiện theo rất nhiều lược đồ lập luận để đảm bảo tính vững chắc.

Đa số lược đồ lập luận được trình bày để người sử dụng tham khảo áp dụng vào quá trình giao tiếp chứ chưa nhắm đến việc áp dụng chúng trên máy tính để tự động sinh các lập luận. Trong khi đó, lược đồ lập luận loại suy của Juthe xét sự tương ứng giữa các yếu tố trong một lập luận cho trước và một cặp tiền đề — kết luận dé đánh giá độ vững chắc của cặp tiền đề — kết luận đó. Điều này phù hợp dé triển khai tính toán trên máy tính. Tính toán ngữ nghĩa được thực hiện trên nghĩa thông thường của từ ngữ mà không tính toán nghĩa hàm ân.

Nghĩa hàm 4n là nghĩa được hiểu ngoài những nghĩa thông thường của từ ngữ được dùng. Con người nhận ra được nghĩa hàm an nhờ quá trình đối chiếu và suy luận từ những tri thức đã biết trong một ngữ cảnh xác định. Bên cạnh đó, không phải câu nào cũng có nghĩa hàm ân. Vì thế, van dé tinh toán nghĩa hàm an song song với nghĩa hiển ngôn là một vấn đề lớn và không thể giải quyết trong luận án này.

Phạm vi tính toán ngữ nghĩa của luận án ở nghĩa hiển ngôn vì hướng tiếp cận tính toán ngữ nghĩa của luận án là ngữ nghĩa học phân bố (distributional semantics). Theo ngữ nghĩa học phân bó, nghĩa của từ được xác định dựa vào ngữ cảnh thường được áp dụng cho từ đó nhất, tức là nghĩa của từ là nghĩa được sử dụng thông thường của nó. Ý nghĩa khoa học và thực tiễn của đề tài Mô hình và phương pháp lập luận dé trả lời các câu hỏi "TAI SAO " của luận án được nghiên cứu dựa trên logic và ngôn ngữ, được triển khai thử nghiệm trên máy tính, góp phần vào hướng nghiên cứu Text Understanding với bốn đóng góp chính sau: - Phan tích diễn ngôn ở cấp độ câu và liên câu theo một số quan hệ được chọn. Các kết quả nghiên cứu được công bố trong các công trình [CT.6] và có liên quan đến công trình [CT.

- Phuong pháp lập luận trên biểu diễn văn bản tiếng Việt theo lược đồ lập luận loại suy. Các kết quả nghiên cứu được công bố trong các công trình [CT.

Nội dung được bảo vệ bản quyền — Tải xuống đầy đủ

Chủ đề

Phân tích diễn ngôn và ngôn ngữ

Lập luận và phương pháp nghiên cứu

Câu hỏi và phương pháp phân tích

Diễn ngôn trong ngữ cảnh văn hóa

Mô Hình và Phương Pháp Lập Luận Để Trả Lời Câu Hỏi 'Tại Sao' Trong Phân Tích Diễn Ngôn Tiếng Việt

I. Tổng Quan Về Mô Hình Trả Lời Câu Hỏi Tại Sao Tiếng Việt

1.1. Bài Toán Trả Lời Câu Hỏi Tại Sao Trong QA

1.2. Hướng Tiếp Cận Phân Tích Diễn Ngôn và Lập Luận

II. Thách Thức Trong Phân Tích Diễn Ngôn Tiếng Việt

2.1. Sự Khó Khăn Trong Nhận Dạng Quan Hệ Diễn Ngôn

2.2. Xử Lý Lập Luận Không Tường Minh Trong Diễn Ngôn

2.3. Tính Đặc Thù Của Diễn Ngôn Tiếng Việt

III. Phương Pháp Lập Luận Dựa Trên Biểu Diễn Văn Bản Tiếng Việt

3.1. Cơ Chế Lập Luận Loại Suy Trong Phân Tích Diễn Ngôn

3.2. Tính Toán Độ Thuyết Phục Của Lập Luận

3.3. Ứng Dụng BERT Trong Nhận Dạng Lập Luận

IV. Mô Hình Lập Luận Để Trả Lời Câu Hỏi Tại Sao Hiệu Quả

4.1. Thành Phần Phân Tích Diễn Ngôn Trong Mô Hình

4.2. Thành Phần Lập Luận Loại Suy Trong Mô Hình

4.3. Thành Phần Chọn Quan Hệ Lý Do Tối Ưu

V. Ứng Dụng Thực Tiễn và Kết Quả Nghiên Cứu Đột Phá

5.1. Xây Dựng Ngữ Liệu Thử Nghiệm Đánh Giá Mô Hình

5.2. So Sánh Với Các Phương Pháp Trả Lời Câu Hỏi Khác

5.3. Phân Tích Ưu Điểm và Nhược Điểm Của Mô Hình

VI. Kết Luận và Hướng Phát Triển Mô Hình Tại Sao Tương Lai

6.1. Đóng Góp Mới Của Luận Án Về QA Tiếng Việt

6.2. Hướng Nghiên Cứu Mở Rộng và Phát Triển Mô Hình

6.3. Ứng Dụng Tiềm Năng Trong Thực Tế và Nghiên Cứu

THÔNG TIN CHI TIẾT

Tác giả: Nguyễn Trọng Chỉnh

Người hướng dẫn: 1. Nguyên Tuân Đăng

Trường học: Đại Học Quốc Gia TPHCM

Chuyên ngành: Khoa Học Máy Tính

Đề tài: Mô Hình và Phương Pháp Lập Luận Để Trả Lời Câu Hỏi 'Tại Sao' Trong Phân Tích Diễn Ngôn Tiếng Việt

Loại tài liệu: luận án

Năm xuất bản: 2023

Địa điểm: TP Hồ Chí Minh

Mô Hình và Phương Pháp Lập Luận Để Trả Lời Câu Hỏi 'Tại Sao' Trong Phân Tích Diễn Ngôn Tiếng Việt

I. Tổng Quan Về Mô Hình Trả Lời Câu Hỏi Tại Sao Tiếng Việt

1.1. Bài Toán Trả Lời Câu Hỏi Tại Sao Trong QA

1.2. Hướng Tiếp Cận Phân Tích Diễn Ngôn và Lập Luận

II. Thách Thức Trong Phân Tích Diễn Ngôn Tiếng Việt

2.1. Sự Khó Khăn Trong Nhận Dạng Quan Hệ Diễn Ngôn

2.2. Xử Lý Lập Luận Không Tường Minh Trong Diễn Ngôn

2.3. Tính Đặc Thù Của Diễn Ngôn Tiếng Việt

III. Phương Pháp Lập Luận Dựa Trên Biểu Diễn Văn Bản Tiếng Việt

3.1. Cơ Chế Lập Luận Loại Suy Trong Phân Tích Diễn Ngôn

3.2. Tính Toán Độ Thuyết Phục Của Lập Luận

3.3. Ứng Dụng BERT Trong Nhận Dạng Lập Luận

IV. Mô Hình Lập Luận Để Trả Lời Câu Hỏi Tại Sao Hiệu Quả

4.1. Thành Phần Phân Tích Diễn Ngôn Trong Mô Hình

4.2. Thành Phần Lập Luận Loại Suy Trong Mô Hình

4.3. Thành Phần Chọn Quan Hệ Lý Do Tối Ưu

V. Ứng Dụng Thực Tiễn và Kết Quả Nghiên Cứu Đột Phá

5.1. Xây Dựng Ngữ Liệu Thử Nghiệm Đánh Giá Mô Hình

5.2. So Sánh Với Các Phương Pháp Trả Lời Câu Hỏi Khác

5.3. Phân Tích Ưu Điểm và Nhược Điểm Của Mô Hình

VI. Kết Luận và Hướng Phát Triển Mô Hình Tại Sao Tương Lai

6.1. Đóng Góp Mới Của Luận Án Về QA Tiếng Việt

6.2. Hướng Nghiên Cứu Mở Rộng và Phát Triển Mô Hình

6.3. Ứng Dụng Tiềm Năng Trong Thực Tế và Nghiên Cứu

Tài liệu liên quan

THÔNG TIN CHI TIẾT

Tác giả: Nguyễn Trọng Chỉnh

Người hướng dẫn: 1. Nguyên Tuân Đăng

Trường học: Đại Học Quốc Gia TPHCM

Chuyên ngành: Khoa Học Máy Tính

Đề tài: Mô Hình và Phương Pháp Lập Luận Để Trả Lời Câu Hỏi 'Tại Sao' Trong Phân Tích Diễn Ngôn Tiếng Việt

Loại tài liệu: luận án

Năm xuất bản: 2023

Địa điểm: TP Hồ Chí Minh

Có thể bạn quan tâm