Enhancing Speaker Diarization with Deep Neural Network Embeddings and Spectral Clustering

被引：0

作者：

Yanshan University, China ^{[1
]}

机构：

来源：

关键词：

D O I：

暂无

中图分类号：

学科分类号：

摘要：

Deep neural networks - Network embeddings

引用

共 50 条

[21] INVESTIGATION OF SPEAKER EMBEDDINGS FOR CROSS-SHOW SPEAKER DIARIZATION
Rouvier, Mickael
Favre, Benoit
2016 IEEE INTERNATIONAL CONFERENCE ON ACOUSTICS, SPEECH AND SIGNAL PROCESSING PROCEEDINGS, 2016, : 5585 - 5589
[22] ECAPA-TDNN Embeddings for Speaker Diarization
Dawalatabad, Nauman
Ravanelli, Mirco
Grondin, Francois
Thienpondt, Jenthe
Desplanques, Brecht
Na, Hwidong
INTERSPEECH 2021, 2021, : 3560 - 3564
[23] SPEAKER EMBEDDINGS INCORPORATING ACOUSTIC CONDITIONS FOR DIARIZATION
Higuchi, Yosuke
Suzuki, Masayuki
Kurata, Gakuto
2020 IEEE INTERNATIONAL CONFERENCE ON ACOUSTICS, SPEECH, AND SIGNAL PROCESSING, 2020, : 7129 - 7133
[24] Deep Speaker Embeddings with Convolutional Neural Network on Supervector for Text-Independent Speaker Recognition
Cai, Danwei
Cai, Zexin
Li, Ming
2018 ASIA-PACIFIC SIGNAL AND INFORMATION PROCESSING ASSOCIATION ANNUAL SUMMIT AND CONFERENCE (APSIPA ASC), 2018, : 1478 - 1482
[25] DEEP NEURAL NETWORK-BASED SPEAKER EMBEDDINGS FOR END-TO-END SPEAKER VERIFICATION
Snyder, David
Ghahremani, Pegah
Povey, Daniel
Garcia-Romero, Daniel
Carmiel, Yishay
Khudanpur, Sanjeev
2016 IEEE WORKSHOP ON SPOKEN LANGUAGE TECHNOLOGY (SLT 2016), 2016, : 165 - 170
[26] Graph attention-based deep embedded clustering for speaker diarization
Wei, Yi
Guo, Haiyan
Ge, Zirui
Yang, Zhen
SPEECH COMMUNICATION, 2023, 155
[27] Semi-supervised audio-driven TV-news speaker diarization using deep neural embeddings
Tsipas, Nikolaos
Vrysis, Lazaros
Konstantoudakis, Konstantinos
Dimoulas, Charalampos
JOURNAL OF THE ACOUSTICAL SOCIETY OF AMERICA, 2020, 148 (06): : 3751 - 3761
[28] INVESTIGATING DEEP NEURAL NETWORKS FOR SPEAKER DIARIZATION IN THE DIHARD CHALLENGE
Himawan, Ivan
Rahman, Md Hafizur
Sridharan, Sridha
Fookes, Clinton
Kanagasundaram, Ahilan
2018 IEEE WORKSHOP ON SPOKEN LANGUAGE TECHNOLOGY (SLT 2018), 2018, : 1029 - 1035
[29] Robust End-to-end Speaker Diarization with Generic Neural Clustering
Yang, Chenyu
Wang, Yu
INTERSPEECH 2022, 2022, : 1471 - 1475
[30] CONVOLUTIONAL NEURAL NETWORK FOR SPEAKER CHANGE DETECTION IN TELEPHONE SPEAKER DIARIZATION SYSTEM
Hruz, Marek
Zajic, Zbynek
2017 IEEE INTERNATIONAL CONFERENCE ON ACOUSTICS, SPEECH AND SIGNAL PROCESSING (ICASSP), 2017, : 4945 - 4949

← 1 2 3 4 5 →