Luận văn thạc sĩ về nhận dạng tiếng nói tiếng Việt sử dụng mạng nơron trên Kit ARM

Trường đại học

Trường đại học SPKT TpHCM

Người đăng

Ẩn danh

2011

87
0
0

Phí lưu trữ

30 Point

Mục lục chi tiết

LỜI CAM ĐOAN

LỜI CẢM ƠN

TÓM TẮT

ABSTRACT

MỤC LỤC

DANH SÁCH CÁC CHỮ VIẾT TẮT

DANH SÁCH CÁC HÌNH

DANH SÁCH CÁC BẢNG

LỜI MỞ ĐẦU

1. CHƯƠNG 1: ĐẶC TRƯNG TIẾNG NÓI TIẾNG VIỆT

1.1. Tổng quan về tiếng nói

1.2. Các đặc điểm cơ bản của Tiếng Việt

1.3. Ngữ âm Tiếng Việt

1.4. Thanh điệu Tiếng Việt

1.5. Cấu trúc âm tiết Tiếng Việt

1.6. Hệ thống nhận dạng tiếng nói Tiếng Việt

1.6.1. Tổng quan về hệ thống nhận dạng tiếng nói

1.6.2. Các yếu tố ảnh hưởng đến hệ thống nhận dạng tiếng nói

1.6.3. Nhận dạng độc lập và phụ thuộc người nói

1.7. Lưu đồ giải thuật nhận dạng tiếng nói dừng mạng nơron

1.8. Lấy mẫu tín hiệu

1.8.1. Lọc thông thấp chống chồng phổ

1.8.2. Lấy mẫu tín hiệu tiếng nói

1.8.3. Chia khung (frame) tín hiệu

1.8.4. Tách tín hiệu ra khỏi nền

2. Phương pháp xác định điểm đầu, điểm cuối dùng năng lượng thời gian ngắn

2.1. Phương pháp xác định điểm đầu, điểm cuối dùng tỉ lệ biên độ tín hiệu qua điểm Zero

2.2. Phương pháp trích đặc trưng MFCC (Mel-scale Frequency Cepstral Coefficient)

2.2.1. Lọc cửa sổ

2.2.2. Biến đổi Fourier rời rạc (DFT)

2.2.3. Lọc tần số theo thang tần số Mel

2.2.4. Lấy logarit tín hiệu thang Mel

2.2.5. Biến đổi Fourier ngược (IFFT)

3. CHƯƠNG 3: MẠNG NƠRON NHÂN TẠO

3.1. Khái niệm về mạng nơron nhân tạo

3.2. Cấu trúc mạng nơron nhân tạo

3.2.1. Mạng nơron kết nối đầy đủ

3.2.2. Mạng nơron phân lớp

3.2.3. Mạng nơron truyền thẳng

3.3. Huấn luyện mạng nơron theo giải thuật lan truyền ngược

3.3.1. Tính toán ngõ ra nút mạng nơron theo hướng tới

3.3.2. Cập nhật trọng số mạng nơron theo luật delta

3.3.3. Giải thuật huấn luyện mạng nơron theo giải thuật lan truyền ngược

4. CHƯƠNG 4: BỘ KIT LM3S2965

4.1. Đặc tả bộ Kit LM3S2965

4.2. Cấu trúc Kit LM3S2965

4.3. Bộ chuyển đổi tương tự - số (ADC)

4.4. Khối hiển thị OLED

4.5. Một số hàm thư viện của Kit LM3S2965

4.5.1. Hàm cho bộ ADC

4.5.2. Hàm cho màn hình OLED

4.5.3. Hàm cho điều khiển hệ thống

4.5.4. Hàm cho bộ nhớ Flash

4.6. Thiết kế hệ thống nhận dạng tiếng nói Tiếng Việt

4.6.1. Thiết kế mạch thu âm

4.6.1.1. Khối mạch tiền khuếch đại micro tự điều chỉnh độ lợi
4.6.1.2. Khối mạch lọc thông dãy
4.6.1.3. Khối mạch giao tiếp ADC

4.6.2. Thiết kế chương trình lấy mẫu tín hiệu

4.6.2.1. Lấy mẫu tín hiệu cho chương trình nhận dạng chạy trên PC
4.6.2.2. Lấy mẫu tín hiệu cho chương trình nhận dạng chạy trên Kit LM3S2965

4.6.3. Thiết kế chương trình trích đặc trưng tín hiệu tiếng nói Tiếng Việt

4.6.4. Thiết kế cấu trúc mạng nơron

4.6.5. Thiết kế giao diện chương trình chạy trên Kit LM3S2965

4.7. Kết quả đạt được và hướng phát triển

4.7.1. Kết quả đạt được của chương trình chạy trên PC

4.7.2. Kết quả đạt được của chương trình chạy trên Kit LM3S2965

4.7.3. Hạn chế của đề tài và hướng phát triển

4.7.3.1. Đối với chương trình nhận dạng trên máy tính cá nhân
4.7.3.2. Đối với chương trình nhận dạng chạy trên Kit LM3S2965

Tài liệu tham khảo

Luận văn thạc sĩ nhận dạng tiếng nói tiếng việt dùng mạng nơron triển khai trên kit arm

Tài liệu "Nhận dạng tiếng nói tiếng Việt bằng mạng nơron trên Kit ARM" trình bày một phương pháp tiên tiến trong việc nhận diện tiếng nói bằng cách sử dụng mạng nơron trên nền tảng Kit ARM. Bài viết không chỉ giải thích cách thức hoạt động của mạng nơron mà còn nêu rõ những lợi ích mà công nghệ này mang lại, như khả năng nhận diện chính xác và nhanh chóng, phù hợp với nhu cầu phát triển ứng dụng trong lĩnh vực công nghệ thông tin và trí tuệ nhân tạo.

Để mở rộng kiến thức của bạn về các ứng dụng và nghiên cứu liên quan, bạn có thể tham khảo thêm tài liệu Luận văn thạc sĩ ứng dụng neural network vào nhận dạng tiếng nói trên kit arm cortex m3, nơi cung cấp cái nhìn sâu sắc về việc áp dụng mạng nơron trong nhận diện tiếng nói. Ngoài ra, tài liệu Khóa luận tốt nghiệp kỹ thuật máy tính nghiên cứu cải tiến tích hợp thuật toán yolo trên fpga zynq7020 cũng có thể giúp bạn hiểu rõ hơn về các thuật toán học máy trong các ứng dụng thực tế. Cuối cùng, tài liệu Luận văn thạc sĩ nhận dạng tiếng nói dùng giải thuật trích đặc trưng mfcc và lượng tử vector trên kit dsktms320c6713 của ti sẽ cung cấp thêm thông tin về các phương pháp trích xuất đặc trưng trong nhận diện tiếng nói.

Những tài liệu này không chỉ giúp bạn mở rộng kiến thức mà còn cung cấp những góc nhìn đa dạng về công nghệ nhận diện tiếng nói và ứng dụng của nó trong thực tiễn.