Multiple-hypothesis CTC-based semi-supervised adaptation of end-to-end speech recognition

被引：0

作者：

Do, Cong-Thanh ^{[1
]}

Doddipatla, Rama ^{[1
]}

Hain, Thomas ^{[2
]}

机构：

[1] Do, Cong-Thanh

[2] Doddipatla, Rama

[3] Hain, Thomas

来源：

| 2021年 / arXiv卷

关键词：

723.4 Artificial Intelligence - 751.5 Speech;

D O I：

暂无

中图分类号：

学科分类号：

摘要：

引用

共 50 条

[31] STREAMING END-TO-END SPEECH RECOGNITION WITH JOINT CTC-ATTENTION BASED MODELS
Moritz, Niko
Hori, Takaaki
Le Roux, Jonathan
2019 IEEE AUTOMATIC SPEECH RECOGNITION AND UNDERSTANDING WORKSHOP (ASRU 2019), 2019, : 936 - 943
[32] End-to-End Semi-Supervised Object Detection with Soft Teacher
Xu, Mengde
Zhang, Zheng
Hu, Han
Wang, Jianfeng
Wang, Lijuan
Wei, Fangyun
Bai, Xiang
Liu, Zicheng
2021 IEEE/CVF INTERNATIONAL CONFERENCE ON COMPUTER VISION (ICCV 2021), 2021, : 3040 - 3049
[33] Semi-Supervised Learning with Data Augmentation for End-to-End ASR
Weninger, Felix
Mana, Franco
Gemello, Roberto
Andres-Ferrer, Jesus
Zhan, Puming
INTERSPEECH 2020, 2020, : 2802 - 2806
[34] TRANSFORMER-BASED ONLINE CTC/ATTENTION END-TO-END SPEECH RECOGNITION ARCHITECTURE
Miao, Haoran
Cheng, Gaofeng
Gao, Changfeng
Zhang, Pengyuan
Yan, Yonghong
2020 IEEE INTERNATIONAL CONFERENCE ON ACOUSTICS, SPEECH, AND SIGNAL PROCESSING, 2020, : 6084 - 6088
[35] Online Hybrid CTC/Attention Architecture for End-to-end Speech Recognition
Miao, Haoran
Cheng, Gaofeng
Zhang, Pengyuan
Li, Ta
Yan, Yonghong
INTERSPEECH 2019, 2019, : 2623 - 2627
[36] Selective Adaptation of End-to-End Speech Recognition using Hybrid CTC/Attention Architecture for Noise Robustness
Cong-Thanh Do
Zhang, Shucong
Hain, Thomas
28TH EUROPEAN SIGNAL PROCESSING CONFERENCE (EUSIPCO 2020), 2021, : 321 - 325
[37] Speaker Adaptation for Attention-Based End-to-End Speech Recognition
Meng, Zhong
Gaur, Yashesh
Li, Jinyu
Gong, Yifan
INTERSPEECH 2019, 2019, : 241 - 245
[38] SPEAKER ADAPTATION FOR MULTICHANNEL END-TO-END SPEECH RECOGNITION
Ochiai, Tsubasa
Watanabe, Shinji
Katagiri, Shigeru
Hori, Takaaki
Hershey, John
2018 IEEE INTERNATIONAL CONFERENCE ON ACOUSTICS, SPEECH AND SIGNAL PROCESSING (ICASSP), 2018, : 6707 - 6711
[39] Tic action recognition for children tic disorder with end-to-end video semi-supervised learning
Wang, Xiangyang
Yang, Kun
Ding, Qiang
Wang, Rui
Sun, Jinhua
VISUAL COMPUTER, 2025,
[40] CTC-Based End-To-End ASR for the Low Resource Sanskrit Language with Spectrogram Augmentation
Anoop, C. S.
Ramakrishnan, A. G.
2021 NATIONAL CONFERENCE ON COMMUNICATIONS (NCC), 2021, : 111 - 116

← 1 2 3 4 5 →