HMM-based singing voice synthesis system using pitch-shifted pseudo training data

被引：0

作者：

Mase, Ayami ^{[1
]}

Oura, Keiichiro ^{[1
]}

Nankaku, Yoshihiko ^{[1
]}

Tokuda, Keiichi ^{[1
]}

机构：

[1] Nagoya Inst Technol, Dept Comp Sci, Nagoya, Aichi, Japan

来源：

11TH ANNUAL CONFERENCE OF THE INTERNATIONAL SPEECH COMMUNICATION ASSOCIATION 2010 (INTERSPEECH 2010), VOLS 1-2 | 2010年

关键词：

singing voice synthesis; HMM-based speech synthesis; pitch-shift;

D O I：

暂无

中图分类号：

TP18 [人工智能理论];

学科分类号：

081104 ; 0812 ; 0835 ; 1405 ;

摘要：

Over the last few years, a statistical parametric approach to singing voice synthesis based on hidden Markov models (HMMs) has been grown over. In this approach, spectrum, excitation, and duration of singing voices are simultaneously modeled by context-dependent HMMs, and waveforms are generated from HMMs themselves. However, pitches that rarely appear in training data cannot be properly generated because the system cannot model their fundamental frequency (F-0) contours. In this paper, we propose a technique for training HMMs using pitch-shifted pseudo data. Subjective listening test results show that the proposed technique improves the naturalness of the synthesized singing voices.

引用

页码：845 / 848

页数：4

共 50 条

[21] FACTOR ANALYZED VOICE MODELS FOR HMM-BASED SPEECH SYNTHESIS
Kazumi, Kyosuke
Nankaku, Yoshihiko
Tokuda, Keiichi
2010 IEEE INTERNATIONAL CONFERENCE ON ACOUSTICS, SPEECH, AND SIGNAL PROCESSING, 2010, : 4234 - 4237
[22] Usage of the HMM-Based Speech Synthesis for intelligent Arabic voice
Fares, Tamer S.
Khalil, Awad H.
Hegazy, Abd El-Fatah A.
INTELLIGENT SYSTEMS AND AUTOMATION, 2008, 1019 : 93 - +
[23] An HMM-based Vietnamese Speech Synthesis System
Vu, Thang Tat
Luong, Mai Chi
Nakamura, Satoshi
ORIENTAL COCOSDA 2009 - INTERNATIONAL CONFERENCE ON SPEECH DATABASE AND ASSESSMENTS, 2009, : 116 - +
[24] An HMM-based Cantonese Speech Synthesis System
Wang, Xin
Wu, Zhiyong
2012 IEEE GLOBAL HIGH TECH CONGRESS ON ELECTRONICS (GHTCE), 2012,
[25] Using HMM-based Speech Synthesis to Reconstruct the Voice of Individuals with Degenerative Speech Disorders
Veaux, Christophe
Yamagishi, Junichi
King, Simon
13TH ANNUAL CONFERENCE OF THE INTERNATIONAL SPEECH COMMUNICATION ASSOCIATION 2012 (INTERSPEECH 2012), VOLS 1-3, 2012, : 966 - 969
[26] Singing Voice Conversion Method Based on Many-to-Many Eigenvoice Conversion and Training Data Generation Using a Singing-to-Singing Synthesis System
Doi, Hironori
Toda, Tomoki
Nakano, Tomoyasu
Goto, Masataka
Nakamura, Satoshi
2012 ASIA-PACIFIC SIGNAL AND INFORMATION PROCESSING ASSOCIATION ANNUAL SUMMIT AND CONFERENCE (APSIPA ASC), 2012,
[27] HMM-Based Persian Speech Synthesis Using Limited Adaptation Data
Bahmaninezhad, Fahimeh
Sameti, Hossein
Khorram, Soheil
PROCEEDINGS OF 2012 IEEE 11TH INTERNATIONAL CONFERENCE ON SIGNAL PROCESSING (ICSP) VOLS 1-3, 2012, : 585 - 589
[28] HMM-BASED PSEUDO-CLEAN SPEECH SYNTHESIS FOR SPLICE ALGORITHM
Du, Jun
Hu, Yu
Dai, Li-Rong
Wang, Ren-Hua
2010 IEEE INTERNATIONAL CONFERENCE ON ACOUSTICS, SPEECH, AND SIGNAL PROCESSING, 2010, : 4570 - 4573
[29] Generation of creaky voice for improving the quality of HMM-based speech synthesis
Narendra, N. P.
Rao, K. Sreenivasa
COMPUTER SPEECH AND LANGUAGE, 2017, 42 : 38 - 58
[30] Improved Training of Excitation for HMM-based Parametric Speech Synthesis
Shiga, Yoshinori
Toda, Tomoki
Sakai, Shinsuke
Kawai, Hisashi
11TH ANNUAL CONFERENCE OF THE INTERNATIONAL SPEECH COMMUNICATION ASSOCIATION 2010 (INTERSPEECH 2010), VOLS 1-2, 2010, : 809 - 812

← 1 2 3 4 5 →