Nghiên cứu về việc sử dụng thông tin quang phổ trong phân loại tải nhận thức qua giọng nói

Trường đại học

The University of New South Wales

Người đăng

Ẩn danh

Thể loại

thesis

2012

174
0
0

Phí lưu trữ

30.000 VNĐ

Mục lục chi tiết

Abstract

Acknowledgements

List of publications

Acronyms and Abbreviations

Contents

2. Chapter 2: Automatic cognitive load classification system

2.1. Working memory and its limitation

2.2. Cognitive load theory

2.3. Types of cognitive load

2.4. Overview of cognitive load measurement

2.4.1. Subjective or self-reporting measures

2.5. Cognitive load and speech

2.5.1. Effect of cognitive load variation on high-level speech features

2.5.2. Human speech production

2.5.3. Effect of cognitive load variation on low-level speech features

2.6. Automatic speech-based cognitive load classification system

2.6.1. Gaussian mixture model

2.6.3. Existing CL classification systems

2.7. Cognitive load speech corpora

2.7.1. Collection of the Stroop test database

2.7.2. Collection of the Reading and Comprehension database

3. Chapter 3: Investigation of the effectiveness of speech features for cognitive load classification

3.1. Source-filter model of human speech production system

3.1.1. The source component

3.1.2. The filter component

3.1.3. Combining the source and the filter components

3.2. Human listening test

3.2.2. Results and discussion

3.3. Speech cues of cognitive load

3.4. Baseline cognitive load classification system

3.4.2. Allocation of training and testing data

3.5. The effectiveness of source and filter based features

3.5.1. Source-based features

3.5.1.3. Source Mel frequency cepstral coefficients (SMFCC)

3.5.2. Filter-based features

3.5.2.2. Filter Mel frequency cepstral coefficients (FMFCC)
3.5.2.1. Mel frequency cepstral coefficients (MFCCs)
3.5.2.2. Spectral slope and spectral intercept
3.5.2.3. Group delay feature (GD)

3.6. The effectiveness of spectral centroid features

3.6.2. Complementary behavior between spectral centroid and MFCC features

3.6.3. Cognitive load (CL) discrimination ability of spectral centroid features

3.6.4. Performance of the spectral centroid features

3.7. Comparison and discussion of performance of different speech features

4. Chapter 4: Multi-band approach for cognitive load classification

4.2. Motivation for using a multi-band approach

4.2.1. Advantage of multi-band over full-band approach

4.2.1.1. Effect of band-limited noise
4.2.1.2. Effect of different types of noise

4.2.2. Variation of CL information in different subbands

4.2.2.1. Subband based feature extraction
4.2.2.2. Distribution of CL information in different mel subbands

4.3. Multi-band classification system

4.3.1. Overview of multi-band system

4.3.2. Classification experiment setup for multi-band approach

4.3.3. Estimation of weighting coefficients for likelihood combination

4.4. Performance of multi-band approach in clean condition

4.5. Performance of multi-band approach under noisy conditions

4.5.1. Reliability of subband speech features

4.5.2. Weighting schemes for likelihood combination

4.5.3. Comparison of the effectiveness of multi-band and full-band approaches

4.5.4. Performance of the multi-band system based on three subbands

5. Chapter 5: Investigation of cognitive load information distribution and filterbank design

5.2. The effect of varying the feature dimension of the spectral features

5.2.2. System performance with different feature dimensions

5.3. Evaluation of the correlation of SCF and SCA

5.3. The distribution of CL information across different frequency bands

5.3.1. Analysis on cepstral coefficients

5.3.1.1. Feature-based measure
5.3.1.2. Model-based measure
5.3.1.3. Performance based measure

5.3.2. Results from the analysis on SCF, SCA, and energy

5.3.3. Spectral distribution of CL information

5.4. Filterbank design for CL classification

5.4.1. Procedure to allocate center frequencies and bandwidths of the filters

5.4.2. Designing filterbank to extract cepstral coefficients

5.4.2.2. Performance of the designed filterbanks

5.4.3. Designing a filterbank to extract spectral centroid features

5.4.3.2. Performance of the designed filterbanks

5.4.4. Performance of designed filterbanks in noisy conditions

6. Chapter 6: Speech enhancement for cognitive load classification

6.2. Proposed speech enhancement methods

6.2.1. Kalman filtering method

6.2.1.1. Kalman filtering for speech enhancement
6.2.1.2. Traditional full-band Kalman filtering method
6.2.1.3. Proposed non-uniform subband Kalman filtering

6.2.2. Empirical mode decomposition based method

6.2.2.1. Empirical mode decomposition
6.2.2.2. Proposed speech enhancement method based on empirical mode decomposition

6.2.3. Speech enhancement in DCT domain

6.2.3.1. Traditional soft thresholding method
6.2.3.2. Proposed improved soft thresholding method

6.2.4. Comparison of the proposed speech enhancement methods

6.3. Incorporating the thresholding DCT module into CL classification system

7. Chapter 7: Conclusion and Future work

7.1. Implementation of human listening test

7.2. The use of spectral based speech features

7.3. Analysis of the distribution of cognitive load information

7.4. Multi-band approach and the effectiveness of weighting schemes

7.5. Designing effective filterbanks to extract spectral features

7.6. Proposed speech enhancement methods

List of Figures

List of Tables

Bài viết với tiêu đề "Kỹ thuật mới trong phân loại tải nhận thức dựa trên thông tin quang phổ" giới thiệu những tiến bộ trong việc phân loại tải nhận thức, một lĩnh vực quan trọng trong nghiên cứu và ứng dụng công nghệ thông tin. Bài viết nêu bật các kỹ thuật mới sử dụng thông tin quang phổ để cải thiện độ chính xác và hiệu quả trong việc phân loại, từ đó giúp các nhà nghiên cứu và kỹ sư có thêm công cụ hữu ích trong công việc của họ.

Độc giả có thể tìm hiểu thêm về các ứng dụng liên quan trong lĩnh vực công nghệ thông tin qua bài viết "Phân loại chủ đề bản tin online sử dụng máy học", nơi khám phá cách máy học có thể được áp dụng để phân loại thông tin. Ngoài ra, bài viết "Nghiên cứu các phương pháp trích xuất thông tin trong ảnh tài liệu và ứng dụng" cũng sẽ cung cấp cái nhìn sâu sắc về việc trích xuất thông tin từ hình ảnh, một kỹ thuật có thể bổ sung cho các phương pháp phân loại tải nhận thức. Cuối cùng, bài viết "Suy luận trong điều khiển truy xuất dữ liệu GIS" sẽ mở rộng thêm về cách suy luận có thể hỗ trợ trong việc quản lý và truy xuất dữ liệu, một khía cạnh quan trọng trong việc tối ưu hóa quy trình phân loại.

Những liên kết này không chỉ giúp bạn mở rộng kiến thức mà còn cung cấp những góc nhìn đa dạng về các ứng dụng công nghệ hiện đại trong lĩnh vực thông tin.