Nghiên cứu về nhận diện cảm xúc trong giọng nói sử dụng hệ thống suy diễn mờ dựa trên bộ nhớ liên kết mờ

Trường đại học

Soongsil University

Chuyên ngành

Digital Media

Người đăng

Ẩn danh

Thể loại

thesis

2014

128
2
0

Phí lưu trữ

30 Point

Mục lục chi tiết

ACKNOWLEDGEMENT

ABSTRACT IN ENGLISH

ABSTRACT IN KOREAN

1. CHAPTER 1: INTRODUCTION

1.1. Rationale and Incentives

1.2. Related Concepts and Definitions

1.3. Applications of Speech Emotion Recognition

1.4. Problem Statement

1.5. Dissertation Outline

2. CHAPTER 2: RELATED WORKS

2.1. Speech Emotion Features

2.1.1. Excitation Source Features

2.2. Vocal Tract Features

2.3. Prosodic Features

2.4. Combination of Features

2.5. Emotion Classification Methods

3. CHAPTER 3: FUZZY INFERENCE SYSTEM BASED ON FUZZY ASSOCIATIVE MEMORY

3.1. The Principal Structure of the Fuzzy Associative Memory

3.2. Model of the FAM-based Fuzzy Inference System

3.3. Layers of the FAM-based Fuzzy Inference System

3.4. Building up Membership Functions

3.5. Basic Model of Inference and Fuzzy Rules

3.6. Determining Weight Matrix

3.7. The Model of Speech Emotion Recognition using FAM-based Fuzzy Inference System

4. CHAPTER 4: SPEECH EMOTION RECOGNITION TOOLBOX

4.1. Main Interface Window

4.2. Features Group

4.3. Framing Modes Group

4.4. Tools Group

4.4.1. Check Database Tool

4.4.2. Convert HTK to TXT Tool

4.4.3. Cut Wav Files Tool

4.4.4. Trim Wav Files Tool

4.5. Resample Wav Files

4.6. Operations Group

4.7. Commands Group

4.8. Recognition Group

4.8.1. CHE SVM Tool

4.8.2. FAM FIS Tool

5. CHAPTER 5: PERFORMANCE AND RESULTS

5.1. Databases

5.2. Speech Emotion Feature Extraction

5.2.1. Mel Frequency Cepstral Coefficients (MFCCs)

5.2.2. Generalized Frequency Cepstral Coefficients (GFCCs)

5.2.3. Generalized Perceptual Linear Prediction

5.2.4. Pre-Emphasis Filter

5.2.5. Hamming Window

5.2.6. Power Spectrum Estimation

5.2.7. Filter Bank Analysis

5.2.8. Equal Loudness Normalization

5.2.9. Intensity-loudness Power Law

5.2.10. Autoregressive Modeling

5.2.11. Cepstral Domain Transformation

5.3. The Classification

5.3.1. Emo-DB Database

5.3.2. SAVEE Database

5.3.3. Comparison Results

6. CHAPTER 6: CONCLUSION AND FUTURE WORK

6.1. Overall Performance

6.2. Suggestion of Applications

6.3. Future Work

REFERENCES

APPENDICES

Luận văn thạc sĩ speech emotion recognition using fuzzy inference system based on fuzzy associative memory

Tài liệu có tiêu đề "Nhận diện cảm xúc trong giọng nói bằng hệ thống suy diễn mờ dựa trên bộ nhớ liên kết mờ" trình bày một phương pháp tiên tiến để nhận diện cảm xúc thông qua giọng nói, sử dụng hệ thống suy diễn mờ kết hợp với bộ nhớ liên kết mờ. Phương pháp này không chỉ giúp cải thiện độ chính xác trong việc phân tích cảm xúc mà còn mở ra những ứng dụng tiềm năng trong các lĩnh vực như chăm sóc sức khỏe, giáo dục và dịch vụ khách hàng. Độc giả sẽ tìm thấy những thông tin hữu ích về cách mà công nghệ này có thể được áp dụng trong thực tiễn, từ đó nâng cao khả năng giao tiếp và hiểu biết về cảm xúc con người.

Nếu bạn muốn tìm hiểu sâu hơn về các phương pháp nhận diện cảm xúc khác, hãy tham khảo tài liệu Luận văn tốt nghiệp khoa học máy tính phát triển hệ thống nhận diện cảm xúc qua giọng nói, nơi cung cấp cái nhìn tổng quan về các hệ thống tương tự. Bên cạnh đó, tài liệu Luận văn thạc sĩ kỹ thuật viễn thông nhận dạng cảm xúc người nói dựa trên học sâu sẽ giúp bạn khám phá thêm về các kỹ thuật học sâu trong nhận diện cảm xúc. Cuối cùng, bạn cũng có thể tìm hiểu về nhận diện cảm xúc qua khuôn mặt trong tài liệu Đề tài nhận dạng cảm xúc thông qua khuôn mặt dùng mạng nơ ron tích chập cnn. Những tài liệu này sẽ giúp bạn mở rộng kiến thức và cái nhìn đa chiều về lĩnh vực nhận diện cảm xúc.