A PITCH BASED NOISE ESTIMATION TECHNIQUE FOR ROBUST SPEECH RECOGNITION WITH MISSING DATA

被引：0

作者：

Morales-Cordovilla, Juan A. ^{[1
]}

Ma, Ning ^{[2
]}

Sanchez, Victoria ^{[1
]}

Carmona, Jose L. ^{[1
]}

Peinado, Antonio M. ^{[1
]}

Barker, Jon ^{[2
]}

机构：

[1] Univ Granada, Dept Teoria Senal Telemat & Comunicac, E-18071 Granada, Spain

[2] Univ Sheffield, Dept Comp Sci, Sheffield, South Yorkshire, England

来源：

2011 IEEE INTERNATIONAL CONFERENCE ON ACOUSTICS, SPEECH, AND SIGNAL PROCESSING | 2011年

基金：

英国工程与自然科学研究理事会;

关键词：

Robust speech recognition; missing data; noise estimation; VAD; harmonic tunnelling;

D O I：

暂无

中图分类号：

O42 [声学];

学科分类号：

070206 ; 082403 ;

摘要：

This paper presents a noise estimation technique based on knowledge of pitch information for robust speech recognition. In the first stage the noise is estimated by means of extrapolating the noise from frames where speech is believed to be absent. These frames are detected with a proposed pitch based VAD (Voice Activity Detector). In the second stage the noise estimation is revised in voiced frames using harmonic tunnelling thechnique. The tunnelling noise estimation is used at high SNRs as an upper bound of the noise rather than a suitable estimation. A spectrogram MD (Missing Data) recognition system is chosen to evaluate the proposed noise estimation. The proposed system is compared in Aurora-2 with other similar techniques like cepstral SS (Spectral Subtraction).

引用

页码：4808 / 4811

页数：4

共 50 条

[21] Sequential noise estimation with optimal forgetting for robust speech recognition
Afify, M
Siohan, O
2001 IEEE INTERNATIONAL CONFERENCE ON ACOUSTICS, SPEECH, AND SIGNAL PROCESSING, VOLS I-VI, PROCEEDINGS: VOL I: SPEECH PROCESSING 1; VOL II: SPEECH PROCESSING 2 IND TECHNOL TRACK DESIGN & IMPLEMENTATION OF SIGNAL PROCESSING SYSTEMS NEURALNETWORKS FOR SIGNAL PROCESSING; VOL III: IMAGE & MULTIDIMENSIONAL SIGNAL PROCESSING MULTIMEDIA SIGNAL PROCESSING - VOL IV: SIGNAL PROCESSING FOR COMMUNICATIONS; VOL V: SIGNAL PROCESSING EDUCATION SENSOR ARRAY & MULTICHANNEL SIGNAL PROCESSING AUDIO & ELECTROACOUSTICS; VOL VI: SIGNAL PROCESSING THEORY & METHODS STUDENT FORUM, 2001, : 229 - 232
[22] Histogram equalization with Bayesian estimation for noise robust speech recognition
1600, Acoustical Society of America (143):
[23] Histogram equalization with Bayesian estimation for noise robust speech recognition
Suh, Youngjoo
Kim, Hoirin
JOURNAL OF THE ACOUSTICAL SOCIETY OF AMERICA, 2018, 143 (02): : 677 - 685
[24] GENERATIVE ADVERSARIAL NETWORKS BASED DATA AUGMENTATION FOR NOISE ROBUST SPEECH RECOGNITION
Hu, Hu
Tan, Tian
Qian, Yanmin
2018 IEEE INTERNATIONAL CONFERENCE ON ACOUSTICS, SPEECH AND SIGNAL PROCESSING (ICASSP), 2018, : 5044 - 5048
[25] Reinforcement Learning based Data Augmentation for Noise Robust Speech Emotion Recognition
Ranjan, Sumit
Chakraborty, Rupayan
Kopparapu, Sunil Kumar
INTERSPEECH 2024, 2024, : 1040 - 1044
[26] A missing data-based feature fusion strategy for noise-robust automatic speech recognition using noisy sensors
Demiroglu, Cenk
Anderson, David V.
Clements, Mark. A.
2007 IEEE INTERNATIONAL SYMPOSIUM ON CIRCUITS AND SYSTEMS, VOLS 1-11, 2007, : 965 - 968
[27] AN MCMC APPROACH TO JOINT ESTIMATION OF CLEAN SPEECH AND NOISE FOR ROBUST SPEECH RECOGNITION
Mushtaq, Aleem
Lee, Chin-Hui
2013 IEEE INTERNATIONAL CONFERENCE ON ACOUSTICS, SPEECH AND SIGNAL PROCESSING (ICASSP), 2013, : 7107 - 7111
[28] HMM/ANN based spectral peak location estimation for noise robust speech recognition
Ikbal, S
Bourlard, H
Magimai-Doss, M
2005 IEEE INTERNATIONAL CONFERENCE ON ACOUSTICS, SPEECH, AND SIGNAL PROCESSING, VOLS 1-5: SPEECH PROCESSING, 2005, : 453 - 456
[29] Noise suppression based on neurophysiologically-motivated SNR estimation for robust speech recognition
Tchorz, J
Kleinschmidt, M
Kollmeier, B
ADVANCES IN NEURAL INFORMATION PROCESSING SYSTEMS 13, 2001, 13 : 821 - 827
[30] A Comparative Study of Noise Estimation Algorithms for VTS-Based Robust Speech Recognition
Zhao, Yong
Juang, Biing-Hwang
11TH ANNUAL CONFERENCE OF THE INTERNATIONAL SPEECH COMMUNICATION ASSOCIATION 2010 (INTERSPEECH 2010), VOLS 3 AND 4, 2010, : 2090 - 2093

← 1 2 3 4 5 →