Tổng hợp giọng nói cho ngôn ngữ ít tài nguyên: Ứng dụng cho ngôn ngữ Mường

Chuyên ngành

Computer Science

Người đăng

Ẩn danh

Thể loại

Doctoral Dissertation

2023

178
0
0

Phí lưu trữ

30.000 VNĐ

Mục lục chi tiết

DECLARATION OF AUTHORSHIP

ACKNOWLEDGMENT

ABSTRACT

CONTENT

1. PART 1 : BACKGROUND AND RELATED WORKS

1.1. OVERVIEW OF SPEECH SYNTHESIS AND SPEECH SYNTHESIS FOR LOW-RESOURCED LANGUAGE

1.1.1. Overview of speech synthesis

1.1.2. Evolution of TTS methods over time

1.1.3. TTS using unit-selection method

1.1.4. Statistical parameter speech synthesis

1.1.5. Speech synthesis using deep neural networks

1.1.6. Neural speech synthesis

1.1.7. Speech synthesis for low-resourced languages

1.1.8. TTS using emulating input approach

1.1.9. TTS using the polyglot approach

1.1.10. Speech synthesis for low-resourced language using the adaptation approach

1.1.11. Neural translation model

1.1.12. Attention in neural machine translation

1.1.13. Statistical machine translation based on phrase

1.1.14. Statistical machine translation problem based on phrase

1.1.15. Translation model and language model

1.1.16. Decode the input sentence in the translation system

1.1.17. Model for building a statistical translation system

1.1.18. Machine translation through intermediate representation

1.1.19. Speech translation for unwritten low-resourced languages

1.1.20. Speech synthesis evaluation metrics

1.1.20.1. Mean Opinion Score (MOS)
1.1.20.2. Mel Cepstral Distortion (MCD)
1.1.20.3. MCD with Dynamic Time Warping (MCD – DTW)
1.1.20.4. Analysis of variance (Anova)

1.2. VIETNAMESE AND MUONG LANGUAGE

1.2.1. History of Vietnamese

1.2.2. Vietnamese phonetic system

1.2.3. Vietnamese syllabus structure

1.2.4. Vietnamese tone system

1.2.5. Overview of Muong people and Muong language

1.2.6. Viet Muong group

1.2.7. Muong written script

1.2.8. Muong phonetics system

1.2.9. Muong syllable structure

1.2.10. Muong phoneme system

1.2.11. Muong tone system

1.2.12. Comparison between Vietnamese and Muong

1.2.13. Dicussion and proposal approach

2. PART 2 : SPEECH SYNTHESIS FOR MUONG AS A WRITTEN LANGUAGE

2.1. EMULATING OF THE MUONG TTS BASED ON INPUT TRANSFORMATION OF THE VIETNAMESE TTS

2.1.1. Muong emulating IPA module

2.1.2. Analysis by ANOVA method

2.1.3. MOS analysis by ANOVA

2.1.4. Intelligibility analysis by ANOVA

2.2. CROSS-LINGUAL TRANSFER LEARNING FOR MUONG SPEECH SYNTHESIS

2.2.1. Muong Project‘s data

2.2.2. Muong fine-tuning data

2.2.3. Graphemes to phonemes

2.2.4. Training the pretrained model using Vietnamese dataset

2.2.5. Finetuned TTS model on Muong datasets

2.2.6. MOS analysis by ANOVA

3. PART 3 : SPEECH SYNTHESIS FOR MUONG AS AN UNWRITTEN LANGUAGE

3.1. GENERATE UNWRITTEN LOW-RESOURCED LANGUAGE’S SPEECH DIRECTLY FROM RICH-RESOURCE LANGUAGE’S TEXT

3.1.1. Training the speech synthesis system

3.1.2. MOS analysis by ANOVA

3.1.3. ANOVA analysis in Muong Bi speech synthesis

3.1.4. ANOVA analysis in Muong Tan Son speech synthesis

3.2. SPEECH SYNTHESIS FOR UNWRITTEN LOW-RESOURCED LANGUAGE USING INTERMEDIATE REPRESENTATION

3.2.1. Text to phone translation

3.2.2. Phone to Sound Conversion

3.2.3. Evaluation in Muong Bi and Muong Tan Son

3.2.4. MOS analysis by ANOVA

3.2.5. ANOVA analysis in Muong Bi speech synthesis

3.2.6. ANOVA analysis in Muong Tan Son speech synthesis

3.2.7. Conclusion and comparison

CONCLUSION AND FUTURE WORKS

ABBREVIATIONS

LIST OF TABLES

LIST OF FIGURES

Nghiên cứu tổng hợp tiếng nói cho ngôn ngữ ít nguồn tài nguyên theo hướng thích nghi ứng dụng với tiếng mường

Bạn đang xem trước tài liệu:

Nghiên cứu tổng hợp tiếng nói cho ngôn ngữ ít nguồn tài nguyên theo hướng thích nghi ứng dụng với tiếng mường

Tài liệu "Nghiên cứu tổng hợp giọng nói cho ngôn ngữ ít tài nguyên: Ứng dụng cho ngôn ngữ Mường" trình bày một nghiên cứu quan trọng về việc phát triển công nghệ tổng hợp giọng nói cho các ngôn ngữ ít tài nguyên, với trọng tâm là ngôn ngữ Mường. Nghiên cứu này không chỉ giúp nâng cao khả năng giao tiếp cho cộng đồng người Mường mà còn mở ra cơ hội cho việc bảo tồn và phát triển ngôn ngữ của họ trong thời đại số. Các điểm chính của tài liệu bao gồm phương pháp tổng hợp giọng nói, ứng dụng thực tiễn trong giáo dục và truyền thông, cũng như tiềm năng phát triển trong các lĩnh vực khác.

Để hiểu rõ hơn về các phương pháp liên quan đến ngôn ngữ và ứng dụng của chúng, bạn có thể tham khảo tài liệu Luận văn các phương pháp phân đoạn tiếng việt và ứng dụng. Tài liệu này sẽ cung cấp cho bạn cái nhìn sâu sắc hơn về các kỹ thuật phân đoạn ngôn ngữ, từ đó giúp bạn mở rộng kiến thức trong lĩnh vực ngôn ngữ học và công nghệ thông tin.