The SAIL Speaker Diarization System for Analysis of Spontaneous Meetings

被引：0

作者：

Han, Kyu J. ^{[1
]}

Georgiou, Panayiotis G. ^{[1
]}

Narayanan, Shrikanth S. ^{[1
]}

机构：

[1] Univ So Calif, Viterbi Sch Engn, Ming Hsieh Dept Elect Engn, SAIL, Los Angeles, CA 90089 USA

来源：

2008 IEEE 10TH WORKSHOP ON MULTIMEDIA SIGNAL PROCESSING, VOLS 1 AND 2 | 2008年

关键词：

D O I：

暂无

中图分类号：

TP18 [人工智能理论];

学科分类号：

081104 ; 0812 ; 0835 ; 1405 ;

摘要：

In this paper, we propose a novel approach to speaker diarization of spontaneous meetings in our own multimodal SmartRoom environment. The proposed speaker diarization system first applies a sequential clustering concept to segmentation of a given audio data source, and then performs agglomerative hierarchical clustering for speaker-specific classification (or speaker clustering) of speech segments. The speaker clustering algorithm utilizes an incremental Gaussian mixture cluster modeling strategy, and a stopping point estimation method based on information change rate. Through experiments on various meeting conversation data of approximately 200 minutes total length, this system is demonstrated to provide diarization error rate of 18.90% on average.

引用

页码：970 / 975

页数：6

共 50 条

[1] IMPROVED SPEAKER DIARIZATION SYSTEM FOR MEETINGS
El-Khoury, Elie
Senac, Christine
Pinquier, Julien
2009 IEEE INTERNATIONAL CONFERENCE ON ACOUSTICS, SPEECH, AND SIGNAL PROCESSING, VOLS 1- 8, PROCEEDINGS, 2009, : 4097 - 4100
[2] A DOA based speaker diarization system for real meetings
Araki, Shoko
Fujimoto, Masakiyo
Ishizuka, Kentaro
Sawada, Hiroshi
Makino, Shoji
2008 HANDS-FREE SPEECH COMMUNICATION AND MICROPHONE ARRAYS, 2008, : 30 - 33
[3] Acoustic beamforming for speaker diarization of meetings
Anguera, Xavier
Wooters, Chuck
Hernando, Javier
IEEE TRANSACTIONS ON AUDIO SPEECH AND LANGUAGE PROCESSING, 2007, 15 (07): : 2011 - 2022
[4] KL-HMM BASED SPEAKER DIARIZATION SYSTEM FOR MEETINGS
Madikeri, Srikanth
Bourlard, Herve
2015 IEEE INTERNATIONAL CONFERENCE ON ACOUSTICS, SPEECH, AND SIGNAL PROCESSING (ICASSP), 2015, : 4435 - 4439
[5] Analysis of transition cost and model parameters in speaker diarization for meetings
Beatriz Martínez-González
José M. Pardo
José A. Vallejo-Pinto
Rubén San-Segundo
Javier Ferreiros
EURASIP Journal on Audio, Speech, and Music Processing, 2021
[6] Analysis of transition cost and model parameters in speaker diarization for meetings
Martinez-Gonzalez, Beatriz
Pardo, Jose M.
Vallejo-Pinto, Jose A.
San-Segundo, Ruben
Ferreiros, Javier
EURASIP JOURNAL ON AUDIO SPEECH AND MUSIC PROCESSING, 2021, 2021 (01)
[7] Purity algorithms for speaker diarization of meetings data
Anguera, Xavier
Wooters, Chuck
Hernando, Javier
2006 IEEE International Conference on Acoustics, Speech and Signal Processing, Vols 1-13, 2006, : 1025 - 1028
[8] Improving Speaker Diarization for CHIL Lecture Meetings
Huang, Jing
Marcheret, Etienne
Visweswariah, Karthik
INTERSPEECH 2007: 8TH ANNUAL CONFERENCE OF THE INTERNATIONAL SPEECH COMMUNICATION ASSOCIATION, VOLS 1-4, 2007, : 2628 - 2631
[9] Robust speaker diarization for meetings: ICSI RT06S meetings evaluation system
Anguera, Xavier
Wooters, Chuck
Pardo, Jose M.
MACHINE LEARNING FOR MULTIMODAL INTERACTION, 2006, 4299 : 346 - +
[10] INTEGRATION OF SPEECH SEPARATION, DIARIZATION, AND RECOGNITION FOR MULTI-SPEAKER MEETINGS: SYSTEM DESCRIPTION, COMPARISON, AND ANALYSIS
Raj, Desh
Denisov, Pavel
Chen, Zhuo
Erdogan, Hakan
Huang, Zili
He, Maokui
Watanabe, Shinji
Du, Jun
Yoshioka, Takuya
Luo, Yi
Kanda, Naoyuki
Li, Jinyu
Wisdom, Scott
Hershey, John R.
2021 IEEE SPOKEN LANGUAGE TECHNOLOGY WORKSHOP (SLT), 2021, : 897 - 904

← 1 2 3 4 5 →