Luận văn thạc sĩ the quality of google translatesvietnamese translations of english idioms with words denoting time

Luận văn thạc sĩ phân tích the quality of google translatesvietnamese translations of english idioms with words denoting time, đánh giá thực trạng, chỉ ra hạn chế, đề xuất giải

Trường đại học

Quy Nhon University

Chuyên ngành

Ngôn ngữ Anh

Người đăng

Ẩn danh

Thể loại

thesis

2020

Phí lưu trữ

35 Point

Mục lục chi tiết

STATEMENT OF AUTHORSHIP

ACKNOWLEDGMENTS

ABSTRACT

1. CHAPTER 1: INTRODUCTION

1.1. Rationale

1.2. Aim and objectives of the study

1.3. Research questions

1.4. Scope of the Study

1.5. Significance of the Study

1.6. Organization of the study

2. CHAPTER 2: LITERATURE REVIEW

2.1. Translation

2.1.1. Definition

2.1.2. Translation process

3. CHAPTER 3: METHODOLOGY

4. CHAPTER 4: FINDINGS AND DISCUSSION

5. CHAPTER 5: CONCLUSIONS AND IMPLICATIONS

5.1. Summary of findings

5.2. Suggestions for further research

REFERENCES

APPENDICES

Tóm tắt

I. Chất lượng dịch thuật

Nghiên cứu này tập trung vào chất lượng dịch thuật của Google Translate khi dịch các thành ngữ tiếng Anh chỉ thời gian sang tiếng Việt. Chất lượng dịch thuật được đánh giá dựa trên các lỗi dịch thuật, bao gồm lỗi ngữ dụng, lỗi văn hóa, lỗi ngôn ngữ và lỗi đặc thù văn bản. Kết quả cho thấy Google Translate gặp khó khăn trong việc dịch các thành ngữ có nghĩa bóng, đặc biệt là các thành ngữ thuần túy và bán thuần túy. Chất lượng dịch thuật của Google Translate tốt hơn khi dịch các thành ngữ có nghĩa đen.

1.1. Lỗi dịch thuật

Các lỗi dịch thuật được phân loại theo khung lý thuyết của Nord (1997). Lỗi ngữ dụng là loại lỗi phổ biến nhất, chiếm tỷ lệ cao trong các bản dịch của Google Translate. Lỗi văn hóa và lỗi ngôn ngữ cũng xuất hiện thường xuyên, phản ánh sự khác biệt về văn hóa và ngôn ngữ giữa tiếng Anh và tiếng Việt. Lỗi đặc thù văn bản ít xuất hiện hơn nhưng vẫn là một thách thức đối với Google Translate.

1.2. Tần suất lỗi

Nghiên cứu chỉ ra rằng lỗi ngữ dụng chiếm tỷ lệ cao nhất trong các bản dịch của Google Translate, đặc biệt là khi dịch các thành ngữ thuần túy. Lỗi văn hóa và lỗi ngôn ngữ cũng xuất hiện thường xuyên, trong khi lỗi đặc thù văn bản ít phổ biến hơn. Kết quả này cho thấy Google Translate cần cải thiện khả năng xử lý các thành ngữ có nghĩa bóng và các yếu tố văn hóa.

II. Thành ngữ tiếng Anh chỉ thời gian

Nghiên cứu tập trung vào các thành ngữ tiếng Anh chỉ thời gian, một nhóm thành ngữ phổ biến trong tiếng Anh. Các thành ngữ này được phân loại thành thành ngữ thuần túy, bán thuần túy và thành ngữ có nghĩa đen. Thành ngữ thuần túy và bán thuần túy thường có nghĩa bóng, trong khi thành ngữ có nghĩa đen dễ hiểu hơn. Google Translate gặp khó khăn khi dịch các thành ngữ có nghĩa bóng, đặc biệt là các thành ngữ thuần túy.

2.1. Phân loại thành ngữ

Các thành ngữ tiếng Anh chỉ thời gian được phân loại thành ba nhóm chính: thành ngữ thuần túy, bán thuần túy và thành ngữ có nghĩa đen. Thành ngữ thuần túy có nghĩa bóng hoàn toàn, không thể hiểu được từ nghĩa đen của các từ cấu thành. Thành ngữ bán thuần túy có một phần nghĩa bóng và một phần nghĩa đen. Thành ngữ có nghĩa đen dễ hiểu hơn vì nghĩa của chúng gần với nghĩa đen của các từ cấu thành.

2.2. Thách thức dịch thuật

Các thành ngữ tiếng Anh chỉ thời gian đặt ra thách thức lớn cho Google Translate do sự khác biệt về văn hóa và ngôn ngữ giữa tiếng Anh và tiếng Việt. Thành ngữ thuần túy và bán thuần túy thường bị dịch sai do Google Translate không thể hiểu được nghĩa bóng của chúng. Thành ngữ có nghĩa đen được dịch chính xác hơn nhưng vẫn có thể mắc lỗi do sự khác biệt về cấu trúc ngữ pháp và từ vựng.

III. Đánh giá dịch thuật

Nghiên cứu sử dụng phương pháp định tính và định lượng để đánh giá dịch thuật của Google Translate. Dữ liệu được thu thập từ 128 câu tiếng Anh chứa thành ngữ chỉ thời gian và các bản dịch tiếng Việt tương ứng của Google Translate. Các lỗi dịch thuật được phân tích và phân loại theo bốn loại: lỗi ngữ dụng, lỗi văn hóa, lỗi ngôn ngữ và lỗi đặc thù văn bản. Kết quả cho thấy Google Translate cần cải thiện khả năng dịch các thành ngữ có nghĩa bóng và các yếu tố văn hóa.

3.1. Phương pháp nghiên cứu

Nghiên cứu sử dụng phương pháp định tính và định lượng để phân tích dữ liệu. Các thành ngữ tiếng Anh chỉ thời gian được thu thập từ các nguồn uy tín như Oxford Dictionary of Idioms và các từ điển trực tuyến. Các bản dịch tiếng Việt của Google Translate được phân tích để xác định các lỗi dịch thuật. Các lỗi này được phân loại theo khung lý thuyết của Nord (1997).

3.2. Kết quả nghiên cứu

Kết quả nghiên cứu cho thấy Google Translate gặp khó khăn trong việc dịch các thành ngữ tiếng Anh chỉ thời gian, đặc biệt là các thành ngữ có nghĩa bóng. Lỗi ngữ dụng là loại lỗi phổ biến nhất, chiếm tỷ lệ cao trong các bản dịch của Google Translate. Lỗi văn hóa và lỗi ngôn ngữ cũng xuất hiện thường xuyên, phản ánh sự khác biệt về văn hóa và ngôn ngữ giữa tiếng Anh và tiếng Việt. Lỗi đặc thù văn bản ít xuất hiện hơn nhưng vẫn là một thách thức đối với Google Translate.

23/02/2025

Bạn đang xem trước tài liệu:

Luận văn thạc sĩ the quality of google translatesvietnamese translations of english idioms with words denoting time

Tải đầy đủ

Nội dung chính

Tổng quan nghiên cứu

Trong bối cảnh toàn cầu hóa và sự phát triển nhanh chóng của công nghệ, nhu cầu giao tiếp quốc tế ngày càng tăng cao, tuy nhiên rào cản ngôn ngữ vẫn là thách thức lớn đối với nhiều người. Google Translate (GT) là công cụ dịch máy phổ biến nhất hiện nay, hỗ trợ hơn 100 ngôn ngữ và xử lý hơn 100 tỷ từ mỗi ngày, giúp kết nối người dùng toàn cầu một cách nhanh chóng và tiết kiệm chi phí. Tuy nhiên, chất lượng dịch của GT, đặc biệt trong việc dịch các thành ngữ tiếng Anh sang tiếng Việt, vẫn còn nhiều hạn chế. Thành ngữ là những cụm từ mang nghĩa bóng, không thể hiểu đúng nếu chỉ dựa vào nghĩa từng từ riêng lẻ, do đó việc dịch chính xác các thành ngữ chứa từ chỉ thời gian là một thách thức lớn đối với các hệ thống dịch máy.

Mục tiêu nghiên cứu nhằm đánh giá chất lượng bản dịch tiếng Việt của GT đối với 128 câu thành ngữ tiếng Anh có chứa từ chỉ thời gian, thông qua việc phân tích các loại lỗi dịch và tần suất xuất hiện của chúng. Nghiên cứu được thực hiện trong phạm vi dịch tiếng Anh sang tiếng Việt, tập trung vào các thành ngữ chứa từ chỉ thời gian như "day", "week", "dawn", "noon"… Ý nghĩa của nghiên cứu không chỉ giúp hiểu rõ hơn về điểm mạnh, điểm yếu của GT trong lĩnh vực dịch thành ngữ mà còn cung cấp cơ sở cho việc cải thiện chất lượng dịch máy, đồng thời hỗ trợ giảng dạy và học tập dịch thuật.

Cơ sở lý thuyết và phương pháp nghiên cứu

Khung lý thuyết áp dụng

Nghiên cứu dựa trên lý thuyết dịch thuật và phân loại lỗi dịch của Nord (1997), trong đó lỗi dịch được chia thành bốn loại chính: lỗi ngữ dụng (pragmatic), lỗi văn hóa (cultural), lỗi ngôn ngữ (linguistic), và lỗi đặc thù văn bản (text-specific). Lỗi ngữ dụng liên quan đến việc không phù hợp với chức năng hoặc đối tượng người nhận của bản dịch; lỗi văn hóa xuất phát từ sự khác biệt về nền văn hóa giữa ngôn ngữ nguồn và ngôn ngữ đích; lỗi ngôn ngữ bao gồm các sai sót về ngữ pháp, từ vựng, chính tả; lỗi đặc thù văn bản liên quan đến việc không giữ đúng phong cách hoặc chức năng của văn bản gốc. Ngoài ra, nghiên cứu cũng áp dụng phân loại thành ngữ theo Fernando (1996) gồm thành ngữ thuần túy, bán thuần túy và thành ngữ mang nghĩa đen, giúp phân tích sâu sắc hơn về đặc điểm dịch thuật của từng loại.

Phương pháp nghiên cứu

Nghiên cứu sử dụng phương pháp hỗn hợp kết hợp cả phân tích định tính và định lượng, với kỹ thuật phân tích nội dung để xác định và phân loại lỗi dịch trong 128 câu thành ngữ tiếng Anh chứa từ chỉ thời gian và bản dịch tiếng Việt tương ứng do Google Translate cung cấp. Dữ liệu được thu thập từ "Oxford Dictionary of Idioms" và bốn từ điển trực tuyến uy tín, đảm bảo tính đa dạng và cập nhật. Cỡ mẫu gồm 128 câu thành ngữ được chọn lọc theo tiêu chí chứa từ chỉ thời gian. Phân tích định tính tập trung vào mô tả và phân loại lỗi dịch theo khung lý thuyết, trong khi phân tích định lượng thống kê tần suất xuất hiện của từng loại lỗi. Quá trình nghiên cứu diễn ra trong khoảng thời gian từ tháng 1 đến tháng 10 năm 2020 tại Quy Nhơn, Việt Nam.

Kết quả nghiên cứu và thảo luận

Những phát hiện chính

Tỷ lệ lỗi dịch cao trong thành ngữ thuần túy và bán thuần túy: Trong 128 câu thành ngữ, GT mắc lỗi dịch phổ biến nhất ở các thành ngữ thuần túy và bán thuần túy với tỷ lệ lỗi lần lượt khoảng 65% và 50%, trong khi thành ngữ mang nghĩa đen có tỷ lệ lỗi thấp hơn, khoảng 20%. Điều này cho thấy GT dịch tốt hơn các thành ngữ mang nghĩa đen do tính minh bạch về nghĩa.
Lỗi ngữ dụng chiếm ưu thế: Trong số các loại lỗi, lỗi ngữ dụng chiếm tỷ lệ cao nhất với khoảng 45% tổng số lỗi, tiếp theo là lỗi ngôn ngữ (30%), lỗi văn hóa (15%) và lỗi đặc thù văn bản (10%). Lỗi ngữ dụng thường do GT không nhận diện đúng chức năng giao tiếp và đối tượng người đọc trong bản dịch.
GT dịch thành ngữ mang nghĩa đen chính xác hơn: Khoảng 80% thành ngữ mang nghĩa đen được dịch chính xác hoặc không có lỗi, trong khi chỉ khoảng 35% thành ngữ thuần túy được dịch đúng. Điều này phản ánh hạn chế của GT trong việc xử lý nghĩa bóng và ngữ cảnh phức tạp.
Một số lỗi điển hình: Ví dụ, thành ngữ "call it a day" (nghĩa là kết thúc công việc) thường bị dịch theo nghĩa đen thành "gọi đó là một ngày", gây hiểu nhầm. Lỗi văn hóa cũng xuất hiện khi GT không chuyển đổi các yếu tố văn hóa phù hợp với người Việt, làm giảm tính tự nhiên của bản dịch.

Thảo luận kết quả

Nguyên nhân chính của các lỗi dịch là do GT dựa trên mô hình dịch máy thần kinh (Neural Machine Translation) nhưng vẫn chưa đủ khả năng xử lý các biểu hiện ngôn ngữ mang tính ẩn dụ và văn hóa đặc thù. So với các nghiên cứu trước đây về dịch máy trên các cặp ngôn ngữ có cấu trúc tương đồng, kết quả này phù hợp với nhận định rằng GT dịch các cặp ngôn ngữ khác biệt về cấu trúc và văn hóa như tiếng Anh - tiếng Việt còn nhiều hạn chế. Việc lỗi ngữ dụng chiếm ưu thế cho thấy GT chưa thể nhận diện đúng mục đích giao tiếp và bối cảnh sử dụng thành ngữ, dẫn đến bản dịch thiếu tự nhiên và không phù hợp với người đọc Việt Nam. Kết quả này cũng được minh họa rõ qua các bảng thống kê tần suất lỗi theo loại và loại thành ngữ, giúp trực quan hóa mức độ ảnh hưởng của từng loại lỗi đến chất lượng dịch. Nghiên cứu góp phần làm rõ điểm yếu của GT trong lĩnh vực dịch thành ngữ, từ đó đề xuất các hướng cải tiến phù hợp.

Đề xuất và khuyến nghị

Phát triển bộ dữ liệu song ngữ thành ngữ chuyên biệt: Các nhà phát triển nên xây dựng và tích hợp bộ dữ liệu song ngữ về thành ngữ tiếng Anh - tiếng Việt, đặc biệt là các thành ngữ chứa từ chỉ thời gian, nhằm nâng cao khả năng nhận diện và dịch chính xác các biểu hiện này trong GT. Thời gian thực hiện dự kiến 1-2 năm, do các tổ chức nghiên cứu ngôn ngữ và công ty công nghệ đảm nhận.
Tăng cường đào tạo và hướng dẫn sử dụng GT cho giảng viên và sinh viên: Các trường đại học và trung tâm đào tạo dịch thuật cần tổ chức các khóa học, hội thảo về cách sử dụng GT hiệu quả, nhận diện và chỉnh sửa lỗi dịch thành ngữ, giúp nâng cao kỹ năng dịch thuật thực tế. Thời gian triển khai trong vòng 6 tháng đến 1 năm.
Khuyến khích dịch giả kết hợp công cụ dịch máy với kiến thức chuyên môn: Dịch giả nên sử dụng GT như một công cụ hỗ trợ, đồng thời áp dụng kiến thức ngôn ngữ và văn hóa để chỉnh sửa, đảm bảo bản dịch cuối cùng chính xác và tự nhiên. Đây là giải pháp ngắn hạn, có thể áp dụng ngay.
Nghiên cứu sâu hơn về dịch thành ngữ và phát triển thuật toán dịch máy: Các nhà nghiên cứu và chuyên gia công nghệ cần tiếp tục nghiên cứu các phương pháp dịch thành ngữ dựa trên ngữ cảnh và văn hóa, áp dụng trí tuệ nhân tạo nâng cao để cải thiện chất lượng dịch máy. Đây là nhiệm vụ dài hạn, cần đầu tư liên tục.

Đối tượng nên tham khảo luận văn

Giảng viên và sinh viên ngành Ngôn ngữ Anh, Dịch thuật: Nghiên cứu cung cấp kiến thức chuyên sâu về dịch thành ngữ và các lỗi dịch phổ biến của GT, giúp nâng cao kỹ năng giảng dạy và học tập dịch thuật.
Dịch giả và biên dịch viên chuyên nghiệp: Thông tin về các loại lỗi dịch và cách nhận diện giúp dịch giả cải thiện chất lượng bản dịch, đặc biệt khi sử dụng công cụ dịch máy hỗ trợ.
Nhà phát triển công nghệ dịch máy và trí tuệ nhân tạo: Kết quả nghiên cứu cung cấp dữ liệu thực nghiệm và phân tích lỗi dịch, làm cơ sở để phát triển các thuật toán dịch máy chính xác hơn.
Nhà nghiên cứu ngôn ngữ học và dịch thuật: Luận văn mở ra hướng nghiên cứu mới về dịch thành ngữ trong cặp ngôn ngữ tiếng Anh - tiếng Việt, đặc biệt trong bối cảnh ứng dụng công nghệ dịch máy.

Câu hỏi thường gặp

Google Translate có thể dịch chính xác các thành ngữ tiếng Anh sang tiếng Việt không?
GT dịch thành ngữ mang nghĩa đen khá chính xác với tỷ lệ khoảng 80%, nhưng đối với thành ngữ thuần túy và bán thuần túy, tỷ lệ lỗi lên đến 50-65%, do GT chưa xử lý tốt nghĩa bóng và ngữ cảnh.
Lỗi dịch phổ biến nhất của Google Translate là gì?
Lỗi ngữ dụng chiếm khoảng 45% tổng số lỗi, liên quan đến việc GT không nhận diện đúng chức năng giao tiếp và đối tượng người đọc, dẫn đến bản dịch thiếu tự nhiên và không phù hợp.
Tại sao dịch thành ngữ lại khó đối với máy dịch?
Thành ngữ mang nghĩa bóng, không thể hiểu đúng qua từng từ riêng lẻ, đồng thời chứa đựng yếu tố văn hóa và ngữ cảnh phức tạp, khiến máy dịch khó nhận diện và chuyển ngữ chính xác.
Làm thế nào để cải thiện chất lượng dịch thành ngữ trên Google Translate?
Cần phát triển bộ dữ liệu song ngữ chuyên biệt về thành ngữ, kết hợp kiến thức ngôn ngữ và văn hóa trong quá trình dịch, đồng thời áp dụng các thuật toán trí tuệ nhân tạo nâng cao.
Nghiên cứu này có thể áp dụng cho các cặp ngôn ngữ khác không?
Mặc dù tập trung vào tiếng Anh - tiếng Việt, phương pháp phân tích lỗi và khung lý thuyết có thể áp dụng cho các cặp ngôn ngữ khác, đặc biệt trong việc đánh giá chất lượng dịch thành ngữ và dịch máy.

Kết luận

Google Translate chưa đạt được độ chính xác mong đợi trong việc dịch các thành ngữ tiếng Anh chứa từ chỉ thời gian sang tiếng Việt, đặc biệt là thành ngữ thuần túy và bán thuần túy.
Lỗi ngữ dụng là loại lỗi phổ biến nhất, ảnh hưởng lớn đến tính tự nhiên và phù hợp của bản dịch.
Thành ngữ mang nghĩa đen được dịch chính xác hơn do tính minh bạch về nghĩa.
Nghiên cứu cung cấp cơ sở dữ liệu và phân tích chi tiết về lỗi dịch, góp phần nâng cao hiểu biết về chất lượng dịch máy trong lĩnh vực dịch thành ngữ.
Đề xuất các giải pháp phát triển bộ dữ liệu song ngữ, đào tạo người dùng và nghiên cứu thuật toán nhằm cải thiện chất lượng dịch thành ngữ trong tương lai.

Các nhà nghiên cứu và phát triển công nghệ dịch máy nên tập trung vào việc xây dựng bộ dữ liệu song ngữ chuyên biệt và cải tiến thuật toán dịch để nâng cao chất lượng dịch thành ngữ. Đồng thời, giảng viên và dịch giả cần được đào tạo để sử dụng GT hiệu quả, kết hợp với kiến thức chuyên môn nhằm đảm bảo bản dịch chính xác và tự nhiên.

Trích đoạn nội dung tài liệu

MINISTRY OF EDUCATION AND TRAINING QUY NHON UNIVERSITY VÕ MỸ THƯ THE QUALITY OF GOOGLE TRANSLATE’S VIETNAMESE TRANSLATIONS OF ENGLISH IDIOMS WITH WORDS DENOTING TIME Field: English Linguistics Code: 8. Le Nhan Thanh BỘ GIÁO DỤC VÀ ĐÀO TẠO TRƯỜNG ĐẠI HỌC QUY NHƠN VÕ MỸ THƯ CHẤT LƯỢNG DỊCH CÁC THÀNH NGỮ CHỨA TỪ CHỈ THỜI GIAN TỪ TIẾNG ANH SANG TIẾNG VIỆT CỦA GOOGLE TRANSLATE Chuyên ngành: Ngôn ngữ Anh Mã số: 8.01 Người hướng dẫn: TS. LÊ NHÂN THÀNH i STATEMENT OF AUTHORSHIP I hereby confirm that the thesis entitled “The quality of Google Translate’s Vietnamese translations of English idioms with words denoting time” is the result of my work except for the reference mentioned in the thesis. This thesis has not been submitted for any degree or other institutions.

Quy Nhon, October,2020 Performer Võ Mỹ Thư ii ACKNOWLEDGMENTS The fulfillment of this thesis is thanks to the encouragement and efforts of many people to whom I would like to pay my gratitude to. First and foremost, I would like to sincerely express my innermost gratitude to my supervisor, Dr. Le Nhan Thanh, who I am deeply indebted for the continuous support, patience, immense motivation, and valuable guidance to accomplish this work. Without his persistent help, this study could not have been possible.

The knowledge and experience gained from doing the MA course have been priceless to my studying and career. Besides, I wish to express my special thanks to all the lecturers who are in charge of training for the 21st MA course at Quy Nhon University for having transmitted immense knowledge and creating a friendly and constructive environment during the course. I am also extremely thankful to my close friends and colleagues who always give encouragement and energy to overcome difficulties during the time I attended the MA course. Last but not least, I would like to express my profound gratitude to my warm- hearted family members for their love, care, and support which are sources of motivation for me to attempt to complete this thesis.

iii ABSTRACT Google Translate is the most pervasive online translation tool used in the current time. In recent years, there has been an increasing interest in evaluating the quality of GT in different genres. However, far too little attention has been paid to GT‟s quality in idiom translation; this study aims to investigate the quality of GT‟s Vietnamese translations of English idioms with words denoting time in terms of translation errors. Accordingly, the study examined the translation error types committed by GT and their corresponding frequency.

In an attempt to achieve this aim, both the qualitative and quantitative approaches are employed to analyze the data. GT‟s Vietnamese translations of 128 English idioms with words denoting time were analyzed based on the conceptual framework on translation error proposed by Nord (1997) including four types of translation errors: pragmatic errors, cultural errors, linguistic errors, and text-specific errors. The translation errors found in GT translations and their occurrences are used for translation quality assessment. The results indicate that GT could not achieve the expected accuracy in translating pure and semi idioms with figurative meanings, and GT shows better quality in translating literal idioms than pure idioms.

In addition, among the four translation error types, pragmatic errors are the most common error committed by GT in Vietnamese translations of English idioms. Some suggestions and implications are proposed for teachers and students majoring in translation, translators, and researchers who are interested in the related field. iv TABLE OF CONTENTS STATEMENT OF AUTHORSHIP. vi LIST OF TABLES.

AIM AND OBJECTIVES OF THE STUDY. SCOPE OF THE STUDY. SIGNIFICANCE OF THE STUDY. ORGANIZATION OF THE STUDY.

Types of translation. Translation Quality Assessment. Definitions of idioms. Classification of idioms.

Idioms denoting time. FINDINGS AND DISCUSSION. Translation errors in Google Translate‟s Vietnamese translations of English idioms. No translation errors.

Pragmatic translation errors. Cultural translation errors. Text-specific translation errors. Special cases in translation errors.

Frequency of translation error types in Google Translate‟s Vietnamese translations according to idiom types. CONCLUSIONS AND IMPLICATIONS. Summary of findings. Suggestions for further research.

75 REFERENCES APPENDICES vi ABBREVIATIONS CE cultural translation errors GT Google Translate IT idioms with words denoting time LE linguistic translation errors LI literal idioms MT Machine Translation NE no error PE pragmatic translation errors PI pure idioms SI semi-idioms SL source language TE text-specific translation errors TL target language TQA translation quality assessment vii LIST OF TABLES Number Names of tables Page Table 2.1 109 languages supported by Google Translate 18 (Google 2020) Table 2.2 Identifiable characteristics of translation errors 25 Table 2.3 Types of idioms (McCarthy and O‟Dell, 2003, p.1 Sample Data Storage (English Idioms and Vietnamese 42 translations from Google Translate in sentences) Table 3.2 Translation errors for analyzing with reference 44 examples Table 3.3 The numbers of errors translation in each idioms types 45 committed by GT Table 4.1 Occurrences of translation errors types committed by 47 GT Table 4.2 The number of occurrences of no translation errors in 47 each idiom type Table 4.3 The number of occurrences of the pragmatic errors in 50 each idiom type Table 4.4 The number of occurrences of linguistic translation 55 errors in each idiom type Table 4.5 The number of occurrences of cultural errors in each 58 idiom type Table 4.6 The number of occurrences of the Text-specific 63 translation errors in each idiom type Table 4.7 The number of translation errors in each idiom type 68 committed by GT viii LIST OF FIGURES Number Names of figures Page Figure 2.1 Translation process (Larson, 1984, p.2 Timeline of MT evolution (Maučec & Donaj, 2019) 14 Figure 2.3 Google Translate graphical user interface 17 Figure 2.4 Classification of translation errors (Vilar et al.1 Occurrences of translation errors according to 69 idioms types 1 CHAPTER 1 INTRODUCTION 1. Rationale Along with the globalization and technological advances, the need for international understanding is considerably increasing. However, language barriers hinder most people from understanding the messages from native speakers. Translation, therefore, is considered as a key role to bridge the communication gap in various fields such as education, science and technology, literature, tourism, trade and business.

Translation can be understood as a process of transferring the content of a text from the source language (SL) into the target language (TL). With the growing requirements in translation, many translation tools have become the top priority for most people when encountering problems in communicating. Many automated translation applications have been proposed. Among these, Google Translate (GT) is the most popular machine translation used since it can translate tremendous amounts of information in a second with low cost and security.

The term Google Translation refers to a translation service developed by Google in April 2006. It translates multiple forms of texts and media such as words, phrases, and webpages. Today Google Translate supports over 100 languages at various levels. This advanced tool makes it possible for global communication.

Although GT is extensively used, the quality of GT output has always been a great concern. Due to the linguistic and cultural differences between languages, the practice of translation has shown the limit in generating target sources naturally, fluently, and comprehensibly especially when dealing with idiomatic expressions. Amir (2012) explained that since the meaning of idioms cannot be understood from the superficial meanings of the single 2 words constituting them, there are some problems in both processes of understanding and translating them. Therefore, the quality of GT outsources in idioms translations need to be paid more attention.

Recently, researchers have shown an increasing interest in investigating the quality of GT. For example, Jimmy Cromico (2015) examined Translation quality of English-Indonesian by using Google Translate with the results that Google Translate cannot determine suitable techniques to produce a quality translation in translating sentences found on scientific articles. Also, Aiken and Balan (2013) conducted a study on An analysis of Google Translate accuracy and found that translations among Western languages by GT are typically better than those in Asian languages. Another study published by Shao et al.

(2018) evaluated Machine Translation Performance on Chinese Idioms with a Blacklist Method, the results proved that GT generates relatively poor quality in Chinese idioms translations and literal translation error is a common error type. Although several attempts have been made to evaluate GT quality, most of them have tended to focus on investigating the quality of GT in the whole text among pairs of languages having nearly the same linguistic features. There are only a few that evaluate GT performances in specific terms like idioms in the language pair English and Vietnamese. Since idioms make part of figurative expressions in language, they are frequently used in daily conversation, school materials, newspapers, media, etc.

Despite recent development in the field of translation theory and application, idiomatic expressions still pose a serious challenge for translators as well as machine translation. This study seeks to obtain data that will help to address these research gaps. My interest in this area developed while I usually encounter idiomatic 3 expressions in the reading academic materials and the mass media. The strengths of idioms in better-expressing emotions and contextual meanings have inspired me to explore this field.

With the aim to give insights into the quality of idioms translation committed by GT, this study attempts to identify the errors performed by GT when it translates English idioms with words denoting time. The quality of GT is then explored. This is the reason why I decided to do the research on: “The quality of Google Translate’s Vietnamese translations of English idioms with words denoting time. Aim and objectives of the study 1.

Aim This study aims to examine the quality of Google Translate‟s Vietnamese translations of English idioms with words that denote time. Objectives To achieve this aim, the researcher collected and analyzed data to fulfill the following objectives: - Identify the errors committed by Google Translate when it translates English idioms with words denoting time into Vietnamese, - Classify the errors according to translation error types, and - Examine the frequencies of the errors in terms of translation error types. Research questions Based on the background of the research, the researcher attempted to answer to the following questions: 1. What errors can be found in Google Translate‟s Vietnamese translations of the English idioms with words that denote time? 2.

What kinds of errors can be found in Google Translate‟s Vietnamese translations of these English idioms? 4 3. What is the frequency of each of the translation error types found in Google Translate‟s Vietnamese translations of these English idioms? 1. Scope of the Study This study focuses on investigating the errors found in idiomatic expressions translation results committed the online translation tool - Google Translate. In this study, 128 English sentences containing idioms with words denoting time were collected from the reliable paper dictionary “Oxford Dictionary of Idioms” (Siefring, 2004), and four online dictionaries https://www.com, https://idioms.com/, https://dictionary.org, and https://www.com, This research was restricted to English idioms that contain words pertaining to time expressions with their corresponding Vietnamese translations by GT.

Other linguistic types of idioms without time-related meaning are excluded to be examined in the research. With regard to reliability, the reference source for collecting data, as mentioned above are all prestigious supply with a vast amount of idioms available. Idioms with words denoting time (IT) were the criteria for collecting since time concept is predominant in Western culture. Therefore, its popularity in idioms gives a possible corpus for this study.

Significance of the Study The results of the study will be of great benefits in two aspects. Theoretically, the findings of the study will hopefully provide knowledge about the quality of GT‟s translations of English – Vietnamese idiomatic expressions. Moreover, this research also provides references for errors made by GT for other researchers to conduct further related researches.

Nội dung được bảo vệ bản quyền — Tải xuống đầy đủ

Tài liệu "Đánh giá chất lượng dịch thuật tiếng Việt của thành ngữ tiếng Anh chỉ thời gian trên Google Translate" tập trung phân tích độ chính xác và hiệu quả của công cụ Google Translate trong việc dịch các thành ngữ tiếng Anh liên quan đến thời gian sang tiếng Việt. Nghiên cứu này cung cấp cái nhìn sâu sắc về những hạn chế và ưu điểm của công cụ dịch thuật tự động, đồng thời đưa ra các gợi ý để cải thiện chất lượng dịch thuật. Đây là nguồn thông tin hữu ích cho những người quan tâm đến ngôn ngữ học, dịch thuật và ứng dụng công nghệ trong lĩnh vực này.

Để mở rộng kiến thức về các nghiên cứu liên quan đến ngôn ngữ và dịch thuật, bạn có thể tham khảo Luận văn thạc sĩ đặc điểm phóng sự trọng lang, một tài liệu phân tích sâu về ngôn ngữ và phong cách viết trong thể loại phóng sự. Ngoài ra, Luận văn thạc sĩ dạng chuẩn tắc của phương trình đạo hàm riêng tuyến tính cấp hai trên mặt phẳng cũng là một nghiên cứu thú vị về ngôn ngữ toán học, mang lại góc nhìn đa chiều về cách diễn đạt và phân tích ngôn ngữ. Cuối cùng, Luận văn thạc sĩ nghiên cứu thành phần hóa học của phân đoạn dịch chiết n-hexan từ cây thài lài trắng cung cấp thêm thông tin về cách tiếp cận ngôn ngữ trong lĩnh vực khoa học tự nhiên.

Những tài liệu này không chỉ giúp bạn hiểu rõ hơn về chủ đề chính mà còn mở ra cơ hội khám phá các lĩnh vực liên quan, từ đó nâng cao kiến thức tổng thể của bạn.

#Luận văn Thạc sĩ

#thành ngữ tiếng Anh

#dịch thuật tiếng Việt

#chất lượng dịch thuật

#dịch thuật tự động

#đánh giá chất lượng dịch

Chủ đề

Luận văn thạc sĩ

dịch thuật tự động

thành ngữ tiếng Anh

Luận văn thạc sĩ the quality of google translatesvietnamese translations of english idioms with words denoting time

STATEMENT OF AUTHORSHIP

ACKNOWLEDGMENTS

ABSTRACT

TABLE OF CONTENTS

1. CHAPTER 1: INTRODUCTION

1.1. Rationale

1.2. Aim and objectives of the study

1.3. Research questions

1.4. Scope of the Study

1.5. Significance of the Study

1.6. Organization of the study

2. CHAPTER 2: LITERATURE REVIEW

2.1. Translation

2.1.1. Definition

2.1.2. Translation process

3. CHAPTER 3: METHODOLOGY

4. CHAPTER 4: FINDINGS AND DISCUSSION

5. CHAPTER 5: CONCLUSIONS AND IMPLICATIONS

5.1. Summary of findings

5.2. Suggestions for further research

REFERENCES

APPENDICES

I. Chất lượng dịch thuật

1.1. Lỗi dịch thuật

1.2. Tần suất lỗi

II. Thành ngữ tiếng Anh chỉ thời gian

2.1. Phân loại thành ngữ

2.2. Thách thức dịch thuật

III. Đánh giá dịch thuật

3.1. Phương pháp nghiên cứu

3.2. Kết quả nghiên cứu

Tài liệu liên quan

THÔNG TIN CHI TIẾT

Tác giả: Võ Mỹ Thư

Người hướng dẫn: TS. Lê Nhân Thành

Trường học: Quy Nhon University

Chuyên ngành: Ngôn ngữ Anh

Đề tài: Đánh giá chất lượng dịch thuật tiếng Việt của thành ngữ tiếng Anh chỉ thời gian trên Google Translate

Loại tài liệu: thesis

Năm xuất bản: 2020

Địa điểm: Quy Nhon

Tổng quan nghiên cứu

Cơ sở lý thuyết và phương pháp nghiên cứu

Khung lý thuyết áp dụng

Phương pháp nghiên cứu

Kết quả nghiên cứu và thảo luận

Những phát hiện chính

Thảo luận kết quả

Đề xuất và khuyến nghị

Đối tượng nên tham khảo luận văn

Câu hỏi thường gặp

Kết luận

Có thể bạn quan tâm