Learning Cross-lingual Mappings for Data Augmentation to Improve Low-Resource Speech Recognition

被引：0

作者：

Farooq, Muhammad Umar ^{[1
]}

Hain, Thomas ^{[1
]}

机构：

[1] Univ Sheffield, Speech & Hearing Res Grp, Sheffield, England

来源：

INTERSPEECH 2023 | 2023年

关键词：

automatic speech recognition; low-resource; cross-lingual; multilingual; data augmentation; DEEP NEURAL-NETWORK; ADAPTATION;

D O I：

10.21437/Interspeech.2023-1613

中图分类号：

O42 [声学];

学科分类号：

070206 ; 082403 ;

摘要：

Exploiting cross-lingual resources is an effective way to compensate for data scarcity of low resource languages. Recently, a novel multilingual model fusion technique has been proposed where a model is trained to learn cross-lingual acoustic-phonetic similarities as a mapping function. However, hand-crafted lexicons have been used to train hybrid DNN-HMM ASR systems. To remove this dependency, we extend the concept of learnable cross-lingual mappings for end-to-end speech recognition. Furthermore, mapping models are employed to transliterate the source languages to the target language without using parallel data. Finally, the source audio and its transliteration is used for data augmentation to retrain the target language ASR. The results show that any source language ASR model can be used for a low-resource target language recognition followed by proposed mapping model. Furthermore, data augmentation results in a relative gain up to 5% over baseline monolingual model.

引用

页码：5072 / 5076

页数：5

共 50 条

[21] UniSplice: Universal Cross-Lingual Data Splicing for Low-Resource ASR
Wang, Wei
Qian, Yanmin
INTERSPEECH 2023, 2023, : 2253 - 2257
[22] MetaXL: Meta Representation Transformation for Low-resource Cross-lingual Learning
Xia, Mengzhou
Zheng, Guoqing
Mukherjee, Subhabrata
Shokouhi, Milad
Neubig, Graham
Awadallah, Ahmed Hassan
2021 CONFERENCE OF THE NORTH AMERICAN CHAPTER OF THE ASSOCIATION FOR COMPUTATIONAL LINGUISTICS: HUMAN LANGUAGE TECHNOLOGIES (NAACL-HLT 2021), 2021, : 499 - 511
[23] End-to-end Text-to-speech for Low-resource Languages by Cross-Lingual Transfer Learning
Chen, Yuan-Jui
Tu, Tao
Yeh, Cheng-chieh
Lee, Hung-yi
INTERSPEECH 2019, 2019, : 2075 - 2079
[24] MIXSPEECH: DATA AUGMENTATION FOR LOW-RESOURCE AUTOMATIC SPEECH RECOGNITION
Meng, Linghui
Xu, Jin
Tan, Xu
Wang, Jindong
Qin, Tao
Xu, Bo
2021 IEEE INTERNATIONAL CONFERENCE ON ACOUSTICS, SPEECH AND SIGNAL PROCESSING (ICASSP 2021), 2021, : 7008 - 7012
[25] Cross-lingual embedding for cross-lingual question retrieval in low-resource community question answering
HajiAminShirazi, Shahrzad
Momtazi, Saeedeh
MACHINE TRANSLATION, 2020, 34 (04) : 287 - 303
[26] Cross-Lingual Morphological Tagging for Low-Resource Languages
Buys, Jan
Botha, Jan A.
PROCEEDINGS OF THE 54TH ANNUAL MEETING OF THE ASSOCIATION FOR COMPUTATIONAL LINGUISTICS, VOL 1, 2016, : 1954 - 1964
[27] UniBridge: A Unified Approach to Cross-Lingual Transfer Learning for Low-Resource Languages
Trinh Pham
Le, Khoi M.
Luu Anh Tuan
PROCEEDINGS OF THE 62ND ANNUAL MEETING OF THE ASSOCIATION FOR COMPUTATIONAL LINGUISTICS, VOL 1: LONG PAPERS, 2024, : 3168 - 3184
[28] Adversarial Cross-Lingual Transfer Learning for Slot Tagging of Low-Resource Languages
He, Keqing
Yan, Yuanmeng
Xu, Weiran
2020 INTERNATIONAL JOINT CONFERENCE ON NEURAL NETWORKS (IJCNN), 2020,
[29] Unsupervised Cross-Lingual Part-of-Speech Tagging for Truly Low-Resource Scenarios
Eskander, Ramy
Muresan, Smaranda
Collins, Michael
PROCEEDINGS OF THE 2020 CONFERENCE ON EMPIRICAL METHODS IN NATURAL LANGUAGE PROCESSING (EMNLP), 2020, : 4820 - 4831
[30] Translation Errors Significantly Impact Low-Resource Languages in Cross-Lingual Learning
Agrawal, Ashish Sunil
Fazili, Barah
Jyothi, Preethi
PROCEEDINGS OF THE 18TH CONFERENCE OF THE EUROPEAN CHAPTER OF THE ASSOCIATION FOR COMPUTATIONAL LINGUISTICS, VOL 2: SHORT PAPERS, 2024, : 319 - 329

← 1 2 3 4 5 →