LOW-RESOURCE CONTEXTUAL TOPIC IDENTIFICATION ON SPEECH

被引：0

作者：

Liu, Chunxi ^{[1
]}

Wiesner, Matthew ^{[1
]}

Watanabe, Shinji ^{[1
]}

Harman, Craig ^{[1
]}

Trmal, Jan ^{[1
,2
]}

Dehak, Najim ^{[1
]}

Khudanpur, Sanjeev ^{[1
,2
]}

机构：

[1] Johns Hopkins Univ, Ctr Language & Speech Proc, Baltimore, MD 21218 USA

[2] Johns Hopkins Univ, Human Language Technol Ctr Excellence, Baltimore, MD 21218 USA

来源：

2018 IEEE WORKSHOP ON SPOKEN LANGUAGE TECHNOLOGY (SLT 2018) | 2018年

关键词：

Topic identification; universal acoustic modeling; recurrent neural networks; attention;

D O I：

暂无

中图分类号：

TP18 [人工智能理论];

学科分类号：

081104 ; 0812 ; 0835 ; 1405 ;

摘要：

In topic identification (topic ID) on real-world unstructured audio, an audio instance of variable topic shifts is first broken into sequential segments, and each segment is independently classified. We first present a general purpose method for topic ID on spoken segments in low-resource languages, using a cascade of universal acoustic modeling, translation lexicons to English, and English-language topic classification. Next, instead of classifying each segment independently, we demonstrate that exploring the contextual dependencies across sequential segments can provide large improvements. In particular, we propose an attention-based contextual model which is able to leverage the contexts in a selective manner. We test both our contextual and non-contextual models on four LORELEI languages, and on all but one our attention-based contextual model significantly outperforms the context-independent models.

引用

页码：656 / 663

页数：8

共 50 条

[1] Speech-to-speech Low-resource Translation
Liu, Hsiao-Chuan
Day, Min-Yuh
Wang, Chih-Chien
2023 IEEE 24TH INTERNATIONAL CONFERENCE ON INFORMATION REUSE AND INTEGRATION FOR DATA SCIENCE, IRI, 2023, : 91 - 95
[2] LOW-RESOURCE LANGUAGE IDENTIFICATION FROM SPEECH USING TRANSFER LEARNING
Feng, Kexin
Chaspari, Theodora
2019 IEEE 29TH INTERNATIONAL WORKSHOP ON MACHINE LEARNING FOR SIGNAL PROCESSING (MLSP), 2019,
[3] CURRICULUM OPTIMIZATION FOR LOW-RESOURCE SPEECH RECOGNITION
Kuznetsova, Anastasia
Kumar, Anurag
Fox, Jennifer Drexler
Tyers, Francis M.
2022 IEEE INTERNATIONAL CONFERENCE ON ACOUSTICS, SPEECH AND SIGNAL PROCESSING (ICASSP), 2022, : 8187 - 8191
[4] Low-Resource Speech-to-Text Translation
Bansal, Sameer
Kamper, Herman
Livescu, Karen
Lopez, Adam
Goldwater, Sharon
19TH ANNUAL CONFERENCE OF THE INTERNATIONAL SPEECH COMMUNICATION ASSOCIATION (INTERSPEECH 2018), VOLS 1-6: SPEECH RESEARCH FOR EMERGING MARKETS IN MULTILINGUAL SOCIETIES, 2018, : 1298 - 1302
[5] Text-to-speech for low-resource systems
Schnell, M
Küstner, M
Jokisch, O
Hoffmann, R
PROCEEDINGS OF THE 2002 IEEE WORKSHOP ON MULTIMEDIA SIGNAL PROCESSING, 2002, : 259 - 262
[6] Enrollment in low-resource speech recognition systems
Deligne, S
Dharanipragada, S
2004 IEEE INTERNATIONAL CONFERENCE ON ACOUSTICS, SPEECH, AND SIGNAL PROCESSING, VOL I, PROCEEDINGS: SPEECH PROCESSING, 2004, : 341 - 344
[7] A Study on Low-resource Language Identification
Qi, Zhaodi
Ma, Yong
Gu, Mingliang
2019 ASIA-PACIFIC SIGNAL AND INFORMATION PROCESSING ASSOCIATION ANNUAL SUMMIT AND CONFERENCE (APSIPA ASC), 2019, : 1897 - 1902
[8] Data Selection using Spoken Language Identification for Low-Resource and Zero-Resource Speech Recognition
Chen, Jianan
Chu, Chenhui
Li, Sheng
Kawahara, Tatsuya
APSIPA ASC 2024 - Asia Pacific Signal and Information Processing Association Annual Summit and Conference 2024, 2024,
[9] Cross-lingual offensive speech identification with transfer learning for low-resource languages
Shi, Xiayang
Liu, Xinyi
Xu, Chun
Huang, Yuanyuan
Chen, Fang
Zhu, Shaolin
COMPUTERS & ELECTRICAL ENGINEERING, 2022, 101
[10] Towards A Framework for Holistic Contextual Design for Low-Resource Settings
Aranda-Jan, Clara B.
Jagtap, Santosh
Moultrie, James
INTERNATIONAL JOURNAL OF DESIGN, 2016, 10 (03): : 43 - 63

← 1 2 3 4 5 →