I. Tổng Quan Nghiên Cứu Ngữ Liệu Song Ngữ Nhật Việt Hiện Nay
Việc nghiên cứu ngữ liệu, đặc biệt là ngữ liệu song ngữ Nhật Việt, đóng vai trò then chốt trong nghiên cứu ngôn ngữ và giảng dạy. Kỹ năng tìm kiếm, chọn lọc và phân tích ngữ liệu là yếu tố tiên quyết để triển khai các bước tiếp theo. Trong lĩnh vực nghiên cứu ngôn ngữ, việc thống kê, so sánh và đối chiếu để tìm ra quy luật ngôn ngữ, quy luật chuyển ngữ, điểm tương đồng và khác biệt giữa các ngôn ngữ là vô cùng quan trọng. Để thực hiện điều này, cần có dữ liệu, được gọi là ngữ liệu. Theo Đinh Điền (2005), ngữ liệu là tập hợp văn bản đơn ngữ, đa ngữ hoặc song ngữ, phù hợp với lĩnh vực, thể loại và niên đại cần nghiên cứu. Đã có nhiều nghiên cứu về kho ngữ liệu và ngữ liệu song ngữ trong và ngoài nước. Các nghiên cứu này bao gồm ứng dụng ngữ liệu song ngữ Anh-Việt trong giảng dạy ngôn ngữ, xây dựng và khai thác ngữ liệu song ngữ Anh-Việt điện tử, và nghiên cứu xây dựng kho ngữ liệu song ngữ phục vụ xử lý tiếng Việt. Ở Nhật Bản, có các nghiên cứu về ứng dụng từ điển điện tử để phân tích hình thái học của từ vựng bổ sung vào kho ngữ liệu ngôn ngữ học Nhật Bản, và thiết kế hệ thống tìm kiếm toàn văn cho các tài liệu ngôn ngữ cấu trúc. Kế thừa những nghiên cứu về kho ngữ liệu, nghiên cứu này tập trung vào việc đưa ra các tiêu chí cụ thể để phân tích ngữ liệu song ngữ Nhật Việt phục vụ cho việc làm bài tập và đề tài đối chiếu của sinh viên khoa Ngôn ngữ và văn hóa Nhật Bản, Trường Đại học Ngoại ngữ Huế. Nghiên cứu này sử dụng tài liệu gốc từ Đại học Huế về nghiên cứu các cách thức tìm kiếm và phân tích nguồn ngữ liệu song ngữ của sinh viên Khoa tiếng Nhật.
1.1. Định Nghĩa và Vai Trò Của Ngữ Liệu Song Ngữ Nhật Việt
Ngữ liệu là tư liệu ngôn ngữ được dùng làm căn cứ để nghiên cứu ngôn ngữ. Ngữ liệu là những dữ liệu, cứ liệu của ngôn ngữ, tức là những chứng cứ thực tế sử dụng ngôn ngữ. Ngữ liệu song ngữ gồm các cặp văn bản đã được dịch thủ công, dịch tương ứng 1-1 về mặt ngữ nghĩa. Trong ngữ liệu song ngữ, các bản dịch tương ứng của mỗi ngôn ngữ phải được đặt song song với nhau hay còn được gọi là gióng hàng với nhau (alignment). Mức độ gióng hàng này có thể ở cấp độ văn bản (text alignment), nghĩa là từng văn bản trong ngôn ngữ nguồn được gióng (liên kết) với văn bản dịch tương ứng trong ngôn ngữ đích.
1.2. Các Nghiên Cứu Điển Hình Về Ngữ Liệu Song Ngữ Nhật Việt
Nghiên cứu của Đinh Điền và Lý Ngọc Minh (2015) về ứng dụng ngữ liệu song ngữ Anh-Việt trong giảng dạy ngôn ngữ là một ví dụ điển hình. Nghiên cứu của Hoàng Như Quỳnh (2011) về xây dựng kho ngữ liệu song ngữ phục vụ xử lý tiếng Việt cũng là một đóng góp quan trọng. Các nghiên cứu tại Nhật Bản tập trung vào việc phát triển các công cụ và hệ thống để quản lý và phân tích ngữ liệu ngôn ngữ.
II. Vấn Đề Thách Thức Nghiên Cứu Ngữ Liệu Song Ngữ Nhật Việt
Đối với sinh viên học Ngôn ngữ học đối chiếu Nhật Việt, việc tiếp cận ngữ liệu là bước đầu tiên và quan trọng. Sinh viên thường có kiến thức nền ngoại ngữ tốt, có khả năng đọc hiểu, chọn lọc và phân tích ngữ liệu ngoại ngữ. Tuy nhiên, vì không nắm chắc kiến thức về ngôn ngữ học và Việt ngữ học theo từng cấp độ (từ vựng, ngữ pháp, văn bản), cùng với việc không để ý đến tính "tương đương" của các ngữ liệu song ngữ, sinh viên gặp nhiều khó khăn trong việc tìm kiếm và xử lý ngữ liệu Tiếng Việt. Nghiên cứu này tập trung vào các cách thức tìm kiếm và các thao tác phân tích ngữ liệu ứng với các phạm trù và cấp độ của ngôn ngữ, để làm các dạng bài tập và đề tài ngôn ngữ học đối chiếu Nhật Việt. Qua đó, nghiên cứu cũng chỉ ra những thuận lợi và khó khăn của sinh viên trong quá trình tìm kiếm và phân tích ngữ liệu, và trang bị cho sinh viên những kỹ năng làm việc trên ngữ liệu để học tốt học phần ngôn ngữ học đối chiếu Nhật Việt.
2.1. Khó Khăn Thường Gặp Khi Phân Tích Ngữ Liệu Song Ngữ
Các khó khăn sinh viên thường gặp phải bao gồm nguồn tài liệu chưa phong phú, chưa đủ năng lực ngoại ngữ để phân tích ngữ liệu tiếng Nhật, kiến thức về ngôn ngữ học và Việt ngữ học chưa đủ để lựa chọn và phân tích ngữ liệu tiếng Việt, và tìm được ngữ liệu nhưng không biết cách làm việc trên ngữ liệu.
2.2. Tầm Quan Trọng Của Kiến Thức Ngôn Ngữ Học Việt Ngữ Học
Kết quả khảo sát cho thấy việc trang bị thêm kiến thức về ngoại ngữ và Việt ngữ học là rất cần thiết cho sinh viên. Cụ thể, 98% sinh viên cho rằng rất cần thiết được giáo viên trang bị thêm kiến thức về ngôn ngữ học và Việt ngữ học để dễ dàng phân tích ngữ liệu tiếng Việt. Điều này cho thấy việc trang bị kiến thức về ngôn ngữ học và Việt ngữ học cho sinh viên là rất quan trọng.
III. Phương Pháp Xây Dựng Phân Tích Ngữ Liệu Song Ngữ Nhật Việt
Trong nghiên cứu ngữ liệu, người nghiên cứu cần khai thác tối đa các nguồn hỗ trợ truy cập thông tin, tài liệu như: thầy cô, chuyên gia, bạn bè, thư viện, đơn vị chuyên ngành, tổ chức quốc tế, diễn đàn chuyên môn và các nguồn đáng tin cậy trên mạng. Quan trọng nhất là phải định hướng ngữ liệu bám sát chủ đề nghiên cứu. Có thể tiếp cận ngữ liệu từ các nguồn cụ thể như thư viện, trung tâm tài liệu, tủ sách chuyên ngành, cơ sở dữ liệu tóm tắt, danh bạ mạng và bộ máy tìm kiếm trên Internet. Với sự ra đời của máy tính và Internet, việc tập hợp ngữ liệu song ngữ đã được tự động hóa. Việc xây dựng kho ngữ liệu thủ công tốn kém, nên các nhà nghiên cứu tìm kiếm các phương pháp xây dựng tự động. Internet trở thành một nguồn cung cấp tài liệu song ngữ tiềm năng và hiệu quả.
3.1. Các Nguồn Thu Thập Ngữ Liệu Song Ngữ Nhật Việt
Các nguồn thu thập ngữ liệu song ngữ bao gồm thư viện, trung tâm tài liệu, tủ sách chuyên ngành, cơ sở dữ liệu tóm tắt, danh bạ mạng và bộ máy tìm kiếm trên Internet. Internet là một nguồn cung cấp tài liệu song ngữ rất tiềm năng và hiệu quả.
3.2. Xây Dựng Ngữ Liệu Song Ngữ Tự Động Tiềm Năng và Hạn Chế
Việc xây dựng kho ngữ liệu thủ công tốn kém, nên các nhà nghiên cứu tìm kiếm các phương pháp xây dựng tự động. Tuy nhiên, độ tin cậy của thông tin tìm được bằng các công cụ này không phải lúc nào cũng tốt, thường đòi hỏi người tìm kiếm phải biết đánh giá các kết quả tìm thấy và chọn lọc những tài liệu có giá trị liên quan đến đề tài nghiên cứu.
IV. Ứng Dụng Ngữ Liệu Song Ngữ Đối Chiếu Dịch Thuật Nhật Việt
Trong các dạng bài tập thực hành và đối chiếu ngôn ngữ, ngữ liệu song song chỉ là một phần. Còn có một dạng ngữ liệu "tương đối", tức là ngữ liệu Nhật Việt "tương đương" theo các cấp độ ngôn ngữ ứng với từng yêu cầu của đề tài. Ngữ liệu "tương đương" còn có thể mở rộng là "tương đương" về độ khó của văn bản. Chẳng hạn, khi đối chiếu một đoạn trích có nhiều câu phức, sinh viên phải tập trung ở các đoạn trích ở trình độ tiếng Nhật trung, cao cấp (N1, N2), và ở ngữ liệu Tiếng Việt cũng là những đoạn trích trong văn học, pháp luật, khoa học. Khi có một bài tập: "Đối chiếu câu đơn Nhật Việt theo mục đích giao tiếp", thì một ngữ liệu gọi là "tương đương" về kiến thức phải đáp ứng các tiêu chí nhất định.
4.1. Tiêu Chí Đánh Giá Ngữ Liệu Song Ngữ Tương Đương
Ngữ liệu "tương đương" phải đáp ứng các tiêu chí về độ khó của văn bản, cấp độ ngôn ngữ và mục đích sử dụng. Ví dụ, khi đối chiếu câu đơn theo mục đích giao tiếp, ngữ liệu tiếng Nhật và tiếng Việt phải có đầy đủ các dạng câu hỏi, cầu khiến, cảm thán, v.v.
4.2. Ví Dụ Phân Tích Ngữ Liệu Tương Đương Nhật Việt
Khi đối chiếu hội thoại, ngữ liệu tiếng Nhật có thể là trích đoạn trong luyện nghe năng lực Nhật ngữ (N2), còn ngữ liệu tiếng Việt có thể là trích đoạn trong văn học. Cả hai ngữ liệu phải đáp ứng tiêu chí về độ khó của văn bản và có đầy đủ các dạng câu theo mục đích giao tiếp.
V. Phân Tích Ngữ Liệu Song Ngữ Nhật Việt Các Cấp Độ Ngôn Ngữ
Các dạng bài tập về ngôn ngữ đối chiếu phủ đều trên các cấp độ ngôn ngữ, nên sinh viên phải có kỹ năng làm việc trên ngữ liệu theo từng cấp độ. Dựa vào kết quả khảo sát, có thể phân loại ra từng cấp độ ngôn ngữ cụ thể như: từ vựng – ngữ nghĩa; cú pháp – ngữ dụng; văn bản. Sinh viên thường gặp khó khăn trong việc phân tích ngữ liệu ở cấp độ ngữ pháp - ngữ dụng. Tuy nhiên, những đề xuất về các thao tác phân tích ngữ liệu theo các cấp độ rất cần thiết để giúp sinh viên hoàn thiện kỹ năng làm việc trên ngữ liệu tốt hơn.
5.1. Phân Tích Ngữ Liệu Ở Cấp Độ Từ Vựng Ngữ Nghĩa
Sinh viên phải có kiến thức nền về ngôn ngữ liên quan đến mảng từ vựng - ngữ nghĩa Nhật Việt, như hệ thống từ loại, cấu tạo từ, chuyển loại từ, cụm từ, v.v. Ví dụ, với đề tài "Đối chiếu các hiện tượng chuyển loại từ Nhật Việt", có thể tìm ngữ liệu đoạn trích chứa những hiện tượng chuyển loại từ (động từ → danh từ, tính từ → danh từ).
5.2. Phân Tích Ngữ Liệu Ở Cấp Độ Cú Pháp Ngữ Dụng
Người học phải nắm vững các hình thái câu trong tiếng Nhật và tiếng Việt: các dạng câu đơn, ghép, phức; và các phạm trù từ vựng – ngữ pháp xoay quanh các kiểu câu, như câu theo mục đích giao tiếp (trần thuật, nghi vấn, cảm thán, mệnh lệnh, v.v.).
5.3. Phân Tích Ngữ Liệu Ở Cấp Độ Văn Bản Phong Cách
Ở cấp độ văn bản, đòi hỏi người học phải nắm thật vững cấu trúc câu, các phương tiện liên kết trong văn bản. Người học cũng cần nắm vững các phong cách chức năng của ngôn ngữ, cách lựa chọn và sử dụng từ ngữ theo đúng phong cách chức năng như: báo chí, hành chính, sinh hoạt hàng ngày v. Biết cách đối chiếu sau khi đã liệt kê và phân tích ngữ liệu.
VI. Giải Pháp Nâng Cao Hiệu Quả Nghiên Cứu Ngữ Liệu Song Ngữ
Học phần Ngôn ngữ học đối chiếu hiện đang được giảng dạy tại Trường Đại học Ngoại ngữ, Đại học Huế chú trọng đến việc hướng dẫn sinh viên làm các bài thực hành đối chiếu Tiếng Việt và ngoại ngữ theo từng dạng và cấp độ ngôn ngữ. Sinh viên ngoài việc trang bị kiến thức về ngoại ngữ và ngôn ngữ thì phải nắm được các thao tác tìm kiếm và phân tích ngữ liệu hiệu quả. Nghiên cứu này đưa ra kết quả khảo sát thực trạng của sinh viên năm 3 Khoa Ngôn ngữ và Văn hóa Nhật Bản, Trường Đại học Ngoại ngữ, Đại học Huế trong việc tìm kiếm và xử lý ngữ liệu song ngữ phục vụ cho việc học học phần Ngôn ngữ học đối chiếu (Nhật – Việt).
6.1. Đề Xuất Giải Pháp Nâng Cao Kỹ Năng Phân Tích Ngữ Liệu
Nghiên cứu đưa ra các thảo luận và đề xuất cụ thể trong việc nâng cao kỹ năng làm việc trên ngữ liệu của sinh viên như: Bên cạnh việc chú trọng trang bị kiến thức về ngoại ngữ cho sinh viên thì giảng viên nên tập trung vào kiến thức nền về ngôn ngữ, Việt ngữ học để sinh viên có thể phân tích ngữ liệu Tiếng Việt một cách hiệu quả nhất
6.2. Mở Rộng Các Đề Tài Nghiên Cứu Ngôn Ngữ Đối Chiếu Nhật Việt
Trong quá trình giảng dạy giảng viên cần gợi ý cho sinh viên tìm thêm các đề tài mới liên quan đến ngữ dụng học, phong cách học, để giúp sinh viên có tầm nhin sâu rộng về các vấn đề nghiên cứu ngôn ngữ nói chung và ngôn ngữ học đối chiếu nói riêng. Thêm vào đó, giảng viên cần khuyến khích sinh viên tiến hành đăng ký đề tài nghiên cứu khoa học từ cấp Khoa trở lên để các em có cơ hội rèn luyện kỹ năng làm việc trên ngữ liệu một cách thành thạo và phục vụ cho việc học tập của bản thân.