Articulatory Feature based Multilingual MLPs for Low-Resource Speech Recognition

被引：0

作者：

Qian, Yanmin ^{[1
]}

Liu, Jia ^{[1
]}

机构：

[1] Tsinghua Univ, Dept Elect Engn, Tsinghua Natl Lab Informat Sci & Technol, Beijing 100084, Peoples R China

来源：

13TH ANNUAL CONFERENCE OF THE INTERNATIONAL SPEECH COMMUNICATION ASSOCIATION 2012 (INTERSPEECH 2012), VOLS 1-3 | 2012年

关键词：

low-resource language; multilayer perceptrons; articulatory features; hierarchical architectures;

D O I：

暂无

中图分类号：

TP18 [人工智能理论];

学科分类号：

081104 ; 0812 ; 0835 ; 1405 ;

摘要：

Large vocabulary continuous speech recognition is particularly difficult for low-resource languages. In the scenario we focus on here is that there is a very limited amount of acoustic training data in the target language, but more plentiful data in other languages. In our approach, we investigate approaches based on Automatic Speech Attribute Transcription (ASAT) framework, and train universal classifiers using multi-languages to learn articulatory features. A hierarchical architecture is applied on both the articulatory feature and phone level, to make the neural network more discriminative. Finally we train the multilayer perceptrons using multi-streams from cross-languages and obtain MLPs for this low-resource application. In our experiments, we get significant improvements of about 12% relative versus a conventional baseline in this low-resource scenario.

引用

页码：2601 / 2604

页数：4

共 50 条

[21] Cross-Lingual Self-training to Learn Multilingual Representation for Low-Resource Speech Recognition
Zhang, Zi-Qiang
Song, Yan
Wu, Ming-Hui
Fang, Xin
McLoughlin, Ian
Dai, Li-Rong
CIRCUITS SYSTEMS AND SIGNAL PROCESSING, 2022, 41 (12) : 6827 - 6843
[22] Fast and Efficient Multilingual Self-Supervised Pre-training for Low-Resource Speech Recognition
Zhang, Zhilong
Wang, Wei
Qian, Yanmin
INTERSPEECH 2023, 2023, : 2248 - 2252
[23] A Comparative Study of BNF and DNN Multilingual Training on Cross-lingual Low-resource Speech Recognition
Xu, Haihua
Van Hai Do
Xiao, Xiong
Chng, Eng-Siong
16TH ANNUAL CONFERENCE OF THE INTERNATIONAL SPEECH COMMUNICATION ASSOCIATION (INTERSPEECH 2015), VOLS 1-5, 2015, : 2132 - 2136
[24] DEEP MAXOUT NETWORKS FOR LOW-RESOURCE SPEECH RECOGNITION
Miao, Yajie
Metze, Florian
Rawat, Shourabh
2013 IEEE WORKSHOP ON AUTOMATIC SPEECH RECOGNITION AND UNDERSTANDING (ASRU), 2013, : 398 - 403
[25] Speech recognition datasets for low-resource Congolese languages
Kimanuka, Ussen
Maina, Ciira wa
Buyuk, Osman
DATA IN BRIEF, 2024, 52
[26] Frontier Research on Low-Resource Speech Recognition Technology
Slam, Wushour
Li, Yanan
Urouvas, Nurmamet
SENSORS, 2023, 23 (22)
[27] LRSpeech: Extremely Low-Resource Speech Synthesis and Recognition
Xu, Jin
Tan, Xu
Ren, Yi
Qin, Tao
Li, Jian
Zhao, Sheng
Liu, Tie-Yan
KDD '20: PROCEEDINGS OF THE 26TH ACM SIGKDD INTERNATIONAL CONFERENCE ON KNOWLEDGE DISCOVERY & DATA MINING, 2020, : 2802 - 2812
[28] Optimizing Data Usage for Low-Resource Speech Recognition
Qian, Yanmin
Zhou, Zhikai
IEEE-ACM TRANSACTIONS ON AUDIO SPEECH AND LANGUAGE PROCESSING, 2022, 30 : 394 - 403
[29] Low-Resource Speech Recognition and Keyword-Spotting
Gales, Mark J. F.
Knill, Kate M.
Ragni, Anton
SPEECH AND COMPUTER, SPECOM 2017, 2017, 10458 : 3 - 19
[30] ON SCALING CONTRASTIVE REPRESENTATIONS FOR LOW-RESOURCE SPEECH RECOGNITION
Borgholt, Lasse
Tax, Tycho M. S.
Havtorn, Jakob D.
Maaloe, Lars
Igel, Christian
2021 IEEE INTERNATIONAL CONFERENCE ON ACOUSTICS, SPEECH AND SIGNAL PROCESSING (ICASSP 2021), 2021, : 3885 - 3889

← 1 2 3 4 5 →