Luận Văn Thạc Sĩ Về Tổng Hợp Tiếng Nói Sử Dụng Giải Thuật TD_PSOLA

2013

96
1
0

Phí lưu trữ

30 Point

Mục lục chi tiết

LỜI CAM ĐOAN

CẢM TẠ

TÓM TẮT

ABSTRACT

1. CHƯƠNG 1: TỔNG QUAN VỀ TỔNG HỢP TIẾNG NÓI

1.1. Lịch sử phát triển

1.2. Mục đích của đề tài

1.3. Nhiệm vụ của đề tài và giới hạn đề tài

1.4. Phương pháp nghiên cứu

1.5. Kế hoạch thực hiện

2. CHƯƠNG 2: CƠ SỞ LÝ THUYẾT

2.1. Lý thuyết về tiếng nói

2.1.1. Các khái niệm cơ bản

2.1.1.1. Âm và cường độ âm
2.1.1.2. Các đặc trưng sinh học của âm
2.1.1.3. Các tham số âm
2.1.1.4. Một số khái niệm ngữ âm

2.1.2. Đặc tính âm học của tiếng nói

2.1.2.1. Âm hữu thanh và âm vô thanh
2.1.2.2. Âm vị
2.1.2.3. Các đặc tính khác

2.1.3. Bộ máy phát âm

2.1.3.1. Cấu tạo bộ máy phát âm
2.1.3.2. Cơ chế phát âm

2.1.4. Biểu diễn tín hiệu tiếng nói

2.1.4.1. Tần số lấy mẫu
2.1.4.2. Lượng tử hoá

2.1.5. Các phương pháp tổng hợp tiếng nói

2.1.5.1. Mô hình tạo tiếng nói
2.1.5.2. Tổng hợp tiếng nói
2.1.5.2.1. Tổng hợp tiếng nói theo cách phát âm
2.1.5.2.2. Tổng hợp đầu cuối tự nhiên
2.1.5.3. Các phương pháp tổng hợp tiếng nói
2.1.5.3.1. Phương pháp mô phỏng hệ thống phát âm
2.1.5.3.2. Phương pháp tổng hợp Formant
2.1.5.3.3. Phương pháp ghép nối
2.1.5.3.4. So sánh các phương pháp tổng hợp tiếng nói

2.1.6. Phân tích giải thuật TD_PSOLA

2.1.6.1. Giải thuật PSOLA
2.1.6.1.1. Phân tích PSOLA
2.1.6.1.2. Tổng hợp PSOLA
2.1.6.2. Giải thuật TD_PSOLA
2.1.6.3. TD_PSOLA và tín hiệu tiếng nói
2.1.6.4. Các vấn đề liên quan
2.1.6.4.1. Xác định tần số cơ bản
2.1.6.4.2. Làm trơn tín hiệu khi ghép nối

2.1.7. Mô hình tổng hợp tiếng nói từ văn bản

2.1.7.1. Mô hình tổng quát
2.1.7.2. Tổng hợp mức cao
2.1.7.3. Phân tích cách phát âm
2.1.7.4. Tổng hợp mức thấp

3. CHƯƠNG 3: THIẾT KẾ CHƯƠNG TRÌNH TỔNG HỢP TIẾNG VIỆT

3.1. Phân tích giải thuật

3.2. Diphone trong tiếng việt

3.3. Xây dựng cơ sở dữ liệu

3.3.1. Lưu trữ dữ liệu

3.4. Phân tích văn bản thành diphone

3.4.1. Phân tích văn bản tiếng Việt thành các từ

3.4.2. Tách từ thành các diphone

3.5. Ghép nối các diphone và điều khiển tần số cơ bản

3.5.1. Ghép nối các diphone

3.5.2. Biến đổi tần số cơ bản

3.6. Mô phỏng hệ thống tổng hợp tiếng nói tiếng Việt trên Matlab

3.6.1. Mô phỏng chương trình tổng hợp tiếng nói

3.6.2. Mô phỏng quá trình thu âm và tách từ

3.6.3. Mô phỏng quá trình tách diphone

3.6.4. Mô phỏng quá trình ghép nối các diphone

3.6.5. Mô phỏng giải thuật TD_PSOLA

3.6.6. Lưu trữ và quản lý cơ sở dữ liệu

4. CHƯƠNG 4: KẾT LUẬN VÀ HƯỚNG PHÁT TRIỂN

4.1. Đánh giá kết quả

4.2. Hướng phát triển của đề tài

TÀI LIỆU THAM KHẢO

PHỤ LỤC

1. Phụ lục 1: Bảng mã TCVN3 – ABC các ký tự tiếng Việt chữ thường

2. Phụ lục 2: Bảng các diphone tiếng Việt đã lưu trong cơ sở dữ liệu

3. Phụ lục 3: Code chương trình trên matlab