I. Tổng Quan Về Cấu Trúc Ngôn Ngữ và Chuỗi Ngôn Ngữ
Các biểu thức ngôn ngữ giống như tảng băng trôi: chuỗi từ ngữ mà chúng ta nghe được chỉ là phần nhỏ có thể quan sát được trên mặt nước, trong khi thông tin cú pháp và ngữ nghĩa quan trọng ẩn chứa bên dưới. Mục tiêu của lý thuyết cú pháp là nắm bắt hình dạng của đối tượng ẩn và bản chất tương ứng của nó với chuỗi có thể quan sát được. Do đó, một câu hỏi trung tâm cho ngôn ngữ học là quan hệ giữa cấu trúc và chuỗi liên quan đến nhau như thế nào. Phần lớn các khuôn khổ hiện có ngày nay giả định rằng trật tự từ phải được giải thích độc quyền về mặt cấu trúc. Trong ngữ pháp cấu trúc cụm từ và những người kế nhiệm của nó, cấu trúc là các cây mà trên đó các quan hệ thống trị và ưu tiên được chỉ định một cách đầy đủ. Các từ của biểu thức ngôn ngữ tạo thành các nút lá của cây và các quan hệ ưu tiên giữa chúng xác định chuỗi. Do đó, lý thuyết ngữ pháp chỉ là một lý thuyết về thành phần tạo ra cấu trúc. Một lý thuyết về ánh xạ chuỗi cấu trúc không được yêu cầu, ngoài việc xác định cái sau là các phép chiếu chiều thấp hơn của cái trước.
1.1. Mô Hình Ngôn Ngữ Tách Biệt Cấu Trúc và Tuyến Tính
Có thể thiết kế một lý thuyết ngữ pháp xem thành phần tạo ra cấu trúc tách biệt với thành phần tuyến tính hóa, có thể tính đến bất kỳ sự kết hợp nào của các sự kiện cấu trúc, âm vị học và diễn ngôn. Theo quan điểm này, các mối quan hệ cấu trúc ảnh hưởng đến dạng chuỗi, nhưng có thể bị ghi đè bởi các cân nhắc mạnh mẽ hơn. Luận án này sẽ chỉ ra rằng việc tách lý thuyết về cấu trúc khỏi lý thuyết về chuỗi đặc biệt hiệu quả khi kết hợp với quan điểm lý thuyết tối ưu về sự biến đổi trật tự từ. Một hệ thống như vậy có thể được xây dựng trên cơ sở bất kỳ số lượng hình thức hiện có nào, công trình này nằm trong khuôn khổ ngữ pháp phụ thuộc. Sự lựa chọn được thúc đẩy bởi mong muốn tránh sự phức tạp cấu trúc do lý thuyết điều khiển không cần thiết ở giai đoạn đầu này, đặc biệt vì một phần đáng kể của bộ máy lý thuyết khổng lồ được tích lũy bởi các hình thức dựa trên thành phần là do sự hợp nhất của cấu trúc thứ bậc với quyền ưu tiên.
1.2. Định Nghĩa Cấu Trúc Ngôn Ngữ Các Yếu Tố Cốt Lõi
Không có lý do tiền lý thuyết nào buộc chúng ta giới hạn khái niệm này vào bất kỳ tập hợp đối tượng trừu tượng cụ thể nào. Có sự đồng thuận chung rằng các phụ thuộc có điều kiện và ngữ nghĩa giữa các từ, chẳng hạn như vai trò chủ đề và khung phân loại phụ, nên được phản ánh ở cấp độ cấu trúc, cho dù là cấu hình hay thực chất. Trong khi một số cách tiếp cận coi sự đồng ý là một sự phụ thuộc có điều kiện, những cách tiếp cận khác chọn quy nó cho các yếu tố tâm lý ngôn ngữ bên ngoài ngữ pháp. Tình hình tương tự với các tính năng diễn ngôn, chẳng hạn như sự nổi bật hoặc tính mới. Trong một số khuôn khổ, chúng được trình bày ngang hàng với các thuộc tính lựa chọn của các mục từ vựng, trong khi những khuôn khổ khác để chúng cho các thành phần bên ngoài.
II. Vấn Đề và Thách Thức Trong Phân Tích Cấu Trúc Chuỗi Ngôn Ngữ
Một số câu hỏi này một phần phụ thuộc vào mức độ mà trật tự từ nên được coi là một phần của mô tả cấu trúc. Nếu trật tự từ được coi là một hệ quả thuần túy về cấu trúc, bất kỳ sự khác biệt nào về trật tự từ đều ngụ ý một sự khác biệt về cấu trúc. Do đó, tất cả các yếu tố ảnh hưởng đến trật tự từ phải được tái hiện trong cấu trúc, mặc dù theo cách tiết kiệm nhất. Hãy xem xét các hiện tượng dịch chuyển tùy chọn như xáo trộn. Đã có bằng chứng cho thấy xáo trộn không ảnh hưởng đến ý nghĩa có điều kiện đúng hay tính đúng ngữ pháp. Một lý thuyết cấu trúc không theo thứ tự có thể gán các phiên bản xáo trộn của cùng một câu cho một cấu trúc duy nhất. Ngược lại, một lý thuyết thứ tự cố định phải gán chúng cho các cấu trúc khác nhau, ngay cả khi chúng chứa cùng một tập hợp các từ và tương ứng với cùng một điều kiện đúng.
2.1. Lý Thuyết Ngôn Ngữ Vai Trò Của Trật Tự Từ Trong Cấu Trúc
Các lý thuyết ngữ pháp không dựa vào một thành phần tuyến tính hóa phong phú thường không có lựa chọn nào khác ngoài việc coi trật tự từ là một đặc điểm cấu trúc trên thực tế. Một phiên bản triệt để của cách tiếp cận này được nêu trong đề xuất chống đối xứng của Kayne [Kayne, 1994]. Nếu một thành phần bị dịch chuyển khỏi vị trí dự kiến do vị trí thứ bậc của nó quy định, nó phải được gán cho một vị trí thứ bậc khác. Bao gồm trật tự từ như một đặc điểm cấu trúc thường bị lách bằng cách giả định rằng cấu trúc phản ánh không chỉ ngữ nghĩa có điều kiện đúng mà còn cả diễn ngôn hoặc ngữ dụng. Điều này đạt được thông qua việc kết hợp các tính năng diễn ngôn như Chủ đề và Tiêu điểm vào cú pháp. Tuy nhiên, một cách tiếp cận như vậy phản bội ý tưởng ban đầu rằng cú pháp được cho là để giải thích sự khác biệt giữa các chuỗi ngữ pháp và phi ngữ pháp. Thay vào đó, lý thuyết chuyển sang giải thích các chuỗi phù hợp so với không phù hợp trong tất cả các ngữ cảnh có thể có - một doanh nghiệp được xác định một cách tồi tệ.
2.2. Biến Đổi Ngôn Ngữ Ảnh Hưởng Đến Số Lượng và Loại Cấu Trúc
Nếu một sự khác biệt về trật tự từ được cho là ngụ ý sự khác biệt về cấu trúc, thì có một sự gia tăng lớn về số lượng và loại cấu trúc được cho phép trong và giữa các ngôn ngữ. Nó cũng đảm bảo rằng bản thân các cấu trúc không thể được coi là bất biến giữa các ngôn ngữ. Với sự đa dạng về trật tự từ giữa các ngôn ngữ, các bất biến bị giới hạn ở các khía cạnh trừu tượng của cấu trúc. Ngược lại, nếu trật tự từ tách biệt với khái niệm cấu trúc, các câu giữa các ngôn ngữ chỉ khác nhau về trật tự từ có thể được gán cùng một cấu trúc và lý thuyết về cấu trúc có thể trở thành lý thuyết về bất biến.
III. Phương Pháp Tách Biệt Cấu Trúc và Chuỗi Trong Ngôn Ngữ Học
Một lợi ích quan trọng từ việc tách các mô tả thứ bậc khỏi quyền ưu tiên là các mô tả cấu trúc có thể tự do chuyển sang đồ thị thay vì cây. Trong khi ngữ pháp cấu trúc cụm từ (PS) ban đầu là một nỗ lực để chính thức hóa phân tích truyền thống về các câu phù hợp với sơ đồ giống như cây, nó sớm chuyển sang sử dụng các đối tượng phức tạp hơn làm mô tả cấu trúc trong khuôn khổ biến đổi. Cây đã được thay thế bằng các chuỗi cây, trên đó các hình thức tiếp theo áp đặt các hạn chế khác nhau. Việc từ bỏ các cấu trúc cây đơn giản là cần thiết do bằng chứng phong phú về nhiều đầu (hoặc đa thống trị) trong ngôn ngữ tự nhiên. Đa đầu xảy ra khi một từ dường như phụ thuộc vào nhiều hơn một cha mẹ trong cấu trúc phụ thuộc của câu.
3.1. Ngữ Pháp Phụ Thuộc Giải Pháp Cho Đa Thống Trị
Từ lâu, người ta đã lưu ý trong hầu hết các khuôn khổ rằng từ wh trong các câu hỏi như (1) vừa phụ thuộc vào trợ động từ nghi vấn, vừa phụ thuộc vào động từ chính. (1) Vua đã mua gì? Do đó, biểu diễn dựa trên dữ liệu về các phụ thuộc sẽ trông giống như Hình (0. Tương tự, theo ít nhất một quan điểm, cấu trúc của (2) phải là Hình (0. (2) Vua thích sở hữu lạc đà. Những loại hiện tượng này chịu trách nhiệm cho việc giới thiệu các thiết bị lý thuyết như chuyển động và kiểm soát. Chuyển động là một thao tác được áp dụng cho cây PS, lần đầu tiên được hình thành với sự ra đời của Ngữ pháp Biến đổi (TG). Trong khi nó được coi là một thao tác nguyên khối, gần đây nó đã được định nghĩa lại về hai thao tác nguyên thủy có thứ tự Sao chép và Xóa ([Chomsky, 1995], trang. Các thao tác đầu tiên sao chép một cái gì đó.
3.2. Lý Thuyết Kiểm Soát Xử Lý Đa Thống Trị Trong Ngôn Ngữ
Đa đầu liên quan đến các trường hợp như (2) được xử lý thông qua lý thuyết kiểm soát, phần lớn là do chuyển động giữa các trang web liên quan là không mong muốn về mặt lý thuyết. Không giống như từ wh ở trên, một tài khoản chuyển động của (2) sẽ liên quan đến các vị trí được gắn ngữ nghĩa với hai động từ từ vựng khác nhau. Điều này kéo theo việc một động từ sẽ không gán vai trò chủ đề của nó. Lý thuyết kiểm soát chỉ đơn giản nói rằng chủ ngữ được hiểu của một mệnh đề vô định phải phụ thuộc một cách anaphoric vào một đối số cụ thể của mệnh đề ma trận. Chuyển động và kiểm soát giúp các lý thuyết cú pháp giữ lại các biểu diễn cây của chúng. Điều này rất quan trọng vì các chuỗi có thể được đọc một cách tầm thường từ cây theo quyền ưu tiên. Việc xác định quyền ưu tiên trên một đối tượng đồ họa tùy ý phức tạp hơn nhiều. Tuy nhiên, nếu quyền ưu tiên được tách rời khỏi cấu trúc, thì việc biểu diễn đa đầu bằng các đồ thị chu kỳ tổng quát sẽ minh bạch hơn nhiều.
IV. Ứng Dụng Thực Tiễn Phân Tích Cấu Trúc và Chuỗi Trong NLP
Chương 1 tập trung vào cách các lý thuyết cú pháp hiện có tiếp cận sự gián đoạn thành phần và các phụ thuộc đường dài. Các lý thuyết được chia thành hai loại theo thái độ của chúng đối với sự tương ứng giữa cấu trúc và chuỗi. Lớp lý thuyết tương ứng nghiêm ngặt tuân thủ các nguyên tắc về Tính độc quyền và Không vướng víu. Do đó, sự biến đổi trật tự từ nhất thiết phải được phản ánh ở cấp độ cấu trúc. Tôi thảo luận về vai trò của các thiết bị lý thuyết như biến đổi, dấu vết, chuyển động và kiểm soát trong việc duy trì...
4.1. Xử Lý Ngôn Ngữ Tự Nhiên NLP Ứng Dụng Của Cấu Trúc và Chuỗi
Các lý thuyết được chia thành hai loại theo thái độ của chúng đối với sự tương ứng giữa cấu trúc và chuỗi. Lớp lý thuyết tương ứng nghiêm ngặt tuân thủ các nguyên tắc về Tính độc quyền và Không vướng víu. Do đó, sự biến đổi trật tự từ nhất thiết phải được phản ánh ở cấp độ cấu trúc. Tôi thảo luận về vai trò của các thiết bị lý thuyết như biến đổi, dấu vết, chuyển động và kiểm soát trong việc duy trì...
4.2. Học Máy Ngôn Ngữ Phân Tích Cấu Trúc Sâu và Bề Mặt
Các lý thuyết được chia thành hai loại theo thái độ của chúng đối với sự tương ứng giữa cấu trúc và chuỗi. Lớp lý thuyết tương ứng nghiêm ngặt tuân thủ các nguyên tắc về Tính độc quyền và Không vướng víu. Do đó, sự biến đổi trật tự từ nhất thiết phải được phản ánh ở cấp độ cấu trúc. Tôi thảo luận về vai trò của các thiết bị lý thuyết như biến đổi, dấu vết, chuyển động và kiểm soát trong việc duy trì...
V. Biến Thể Trật Tự Từ Trong Ngôn Ngữ Ảnh Hưởng Diễn Ngôn
Chương 1 tập trung vào cách các lý thuyết cú pháp hiện có tiếp cận sự gián đoạn thành phần và các phụ thuộc đường dài. Các lý thuyết được chia thành hai loại theo thái độ của chúng đối với sự tương ứng giữa cấu trúc và chuỗi. Lớp lý thuyết tương ứng nghiêm ngặt tuân thủ các nguyên tắc về Tính độc quyền và Không vướng víu. Do đó, sự biến đổi trật tự từ nhất thiết phải được phản ánh ở cấp độ cấu trúc. Tôi thảo luận về vai trò của các thiết bị lý thuyết như biến đổi, dấu vết, chuyển động và kiểm soát trong việc duy trì...
5.1. Ngữ Cảnh Ảnh Hưởng Đến Trật Tự Từ Trong Câu Hỏi
Các lý thuyết được chia thành hai loại theo thái độ của chúng đối với sự tương ứng giữa cấu trúc và chuỗi. Lớp lý thuyết tương ứng nghiêm ngặt tuân thủ các nguyên tắc về Tính độc quyền và Không vướng víu. Do đó, sự biến đổi trật tự từ nhất thiết phải được phản ánh ở cấp độ cấu trúc. Tôi thảo luận về vai trò của các thiết bị lý thuyết như biến đổi, dấu vết, chuyển động và kiểm soát trong việc duy trì...
5.2. Âm Vị Học Tác Động Đến Tuyến Tính Hóa Trong Ngôn Ngữ
Các lý thuyết được chia thành hai loại theo thái độ của chúng đối với sự tương ứng giữa cấu trúc và chuỗi. Lớp lý thuyết tương ứng nghiêm ngặt tuân thủ các nguyên tắc về Tính độc quyền và Không vướng víu. Do đó, sự biến đổi trật tự từ nhất thiết phải được phản ánh ở cấp độ cấu trúc. Tôi thảo luận về vai trò của các thiết bị lý thuyết như biến đổi, dấu vết, chuyển động và kiểm soát trong việc duy trì...
VI. Kết Luận Tương Lai Nghiên Cứu Cấu Trúc và Chuỗi Ngôn Ngữ
Chương 1 tập trung vào cách các lý thuyết cú pháp hiện có tiếp cận sự gián đoạn thành phần và các phụ thuộc đường dài. Các lý thuyết được chia thành hai loại theo thái độ của chúng đối với sự tương ứng giữa cấu trúc và chuỗi. Lớp lý thuyết tương ứng nghiêm ngặt tuân thủ các nguyên tắc về Tính độc quyền và Không vướng víu. Do đó, sự biến đổi trật tự từ nhất thiết phải được phản ánh ở cấp độ cấu trúc. Tôi thảo luận về vai trò của các thiết bị lý thuyết như biến đổi, dấu vết, chuyển động và kiểm soát trong việc duy trì...
6.1. Lý Thuyết Ngôn Ngữ Hướng Phát Triển Mới Trong Nghiên Cứu
Các lý thuyết được chia thành hai loại theo thái độ của chúng đối với sự tương ứng giữa cấu trúc và chuỗi. Lớp lý thuyết tương ứng nghiêm ngặt tuân thủ các nguyên tắc về Tính độc quyền và Không vướng víu. Do đó, sự biến đổi trật tự từ nhất thiết phải được phản ánh ở cấp độ cấu trúc. Tôi thảo luận về vai trò của các thiết bị lý thuyết như biến đổi, dấu vết, chuyển động và kiểm soát trong việc duy trì...
6.2. Ứng Dụng Thực Tế Tiềm Năng Trong Công Nghệ Ngôn Ngữ
Các lý thuyết được chia thành hai loại theo thái độ của chúng đối với sự tương ứng giữa cấu trúc và chuỗi. Lớp lý thuyết tương ứng nghiêm ngặt tuân thủ các nguyên tắc về Tính độc quyền và Không vướng víu. Do đó, sự biến đổi trật tự từ nhất thiết phải được phản ánh ở cấp độ cấu trúc. Tôi thảo luận về vai trò của các thiết bị lý thuyết như biến đổi, dấu vết, chuyển động và kiểm soát trong việc duy trì...