Self-supervised speech representation learning based on positive sample comparison and masking reconstruction

被引：0

作者：

Zhang, Wenlin ^{[1
]}

Liu, Xuepeng ^{[1
]}

Niu, Tong ^{[1
]}

Chen, Qi ^{[1
]}

Qu, Dan ^{[1
]}

机构：

[1] College of Information System Engineering, Information Engineering University, Zhengzhou,450001, China

来源：

Tongxin Xuebao/Journal on Communications | 2022年 / 43卷 / 07期

关键词：

Compendex;

D O I：

暂无

中图分类号：

学科分类号：

摘要：

Network architecture

引用

页码：163 / 171

共 50 条

[21] Self-Supervised Disentangled Representation Learning for Robust Target Speech Extraction
Mu, Zhaoxi
Yang, Xinyu
Sun, Sining
Yang, Qing
THIRTY-EIGHTH AAAI CONFERENCE ON ARTIFICIAL INTELLIGENCE, VOL 38 NO 17, 2024, : 18815 - 18823
[22] Whitening for Self-Supervised Representation Learning
Ermolov, Aleksandr
Siarohin, Aliaksandr
Sangineto, Enver
Sebe, Nicu
INTERNATIONAL CONFERENCE ON MACHINE LEARNING, VOL 139, 2021, 139
[23] Self-Supervised Representation Learning for CAD
Jones, Benjamin T.
Hu, Michael
Kodnongbua, Milin
Kim, Vladimir G.
Schulz, Adriana
2023 IEEE/CVF CONFERENCE ON COMPUTER VISION AND PATTERN RECOGNITION (CVPR), 2023, : 21327 - 21336
[24] Self-supervised Adversarial Masking for 3D Point Cloud Representation Learning
Szachniewicz, Michal
Kozlowski, Wojciech
Stypulkowski, Michal
Zieba, Maciej
INTELLIGENT INFORMATION AND DATABASE SYSTEMS, PT II, ACIIDS 2024, 2024, 14796 : 156 - 168
[25] AN ADAPTER BASED PRE-TRAINING FOR EFFICIENT AND SCALABLE SELF-SUPERVISED SPEECH REPRESENTATION LEARNING
Kessler, Samuel
Thomas, Bethan
Karout, Salah
2022 IEEE INTERNATIONAL CONFERENCE ON ACOUSTICS, SPEECH AND SIGNAL PROCESSING (ICASSP), 2022, : 3179 - 3183
[26] DinoSR: Self-Distillation and Online Clustering for Self-supervised Speech Representation Learning
Liu, Alexander H.
Chang, Heng-Jui
Auli, Michael
Hsu, Wei-Ning
Glass, James
ADVANCES IN NEURAL INFORMATION PROCESSING SYSTEMS 36 (NEURIPS 2023), 2023,
[27] DISENTANGLED SPEECH REPRESENTATION LEARNING BASED ON FACTORIZED HIERARCHICAL VARIATIONAL AUTOENCODER WITH SELF-SUPERVISED OBJECTIVE
Xie, Yuying
Arildsen, Thomas
Tan, Zheng-Hua
2021 IEEE 31ST INTERNATIONAL WORKSHOP ON MACHINE LEARNING FOR SIGNAL PROCESSING (MLSP), 2021,
[28] Self-supervised Representation Fusion for Speech and Wearable Based Emotion Recognition
Dissanayake, Vipula
Seneviratne, Sachith
Suriyaarachchi, Hussel
Wen, Elliott
Nanayakkara, Suranga
INTERSPEECH 2022, 2022, : 3598 - 3602
[29] A Comparative Study of Self-Supervised Speech Representation Based Voice Conversion
Huang, Wen-Chin
Yang, Shu-Wen
Hayashi, Tomoki
Toda, Tomoki
IEEE JOURNAL OF SELECTED TOPICS IN SIGNAL PROCESSING, 2022, 16 (06) : 1308 - 1318
[30] Emotion-Aware Speech Self-Supervised Representation Learning with Intensity Knowledge
Liu, Rui
Ma, Zening
INTERSPEECH 2024, 2024, : 3180 - 3184

← 1 2 3 4 5 →