Bayesian estimation methods for N-gram language model adaptation

被引：0

作者：

Federico, M

机构：

来源：

ICSLP 96 - FOURTH INTERNATIONAL CONFERENCE ON SPOKEN LANGUAGE PROCESSING, PROCEEDINGS, VOLS 1-4 | 1996年

关键词：

D O I：

暂无

中图分类号：

O42 [声学];

学科分类号：

070206 ; 082403 ;

摘要：

Stochastic n-gram language models have been successfully applied in continuous speech recognition for several years. Such language models provide many computational advantages but also require huge text corpora for parameter estimation. Moreover, the texts must exactly reflect, in a statistical sense, the user's language. Estimating a language model on a sample that is not representative severely affects speech recognition performance. A solution to this problem is provided by the Bayesian learning framework. Beyond the classical estimates, a Bayes derived interpolation model is proposed. Empirical comparisons have been carried out on a 10,000-word radiological reporting domain. Results are provided in terms of perplexity and recognition accuracy.

引用

页码：240 / 243

页数：4

共 50 条

[1] UNSUPERVISED LANGUAGE MODEL ADAPTATION USING N-GRAM WEIGHTING
Haidar, Md. Akmal
O'Shaughnessy, Douglas
2011 24TH CANADIAN CONFERENCE ON ELECTRICAL AND COMPUTER ENGINEERING (CCECE), 2011, : 857 - 860
[2] Task adaptation using MAP estimation in N-gram language modeling
Masataki, H
Sagisaka, Y
Hisaki, K
Kawahara, T
1997 IEEE INTERNATIONAL CONFERENCE ON ACOUSTICS, SPEECH, AND SIGNAL PROCESSING, VOLS I - V: VOL I: PLENARY, EXPERT SUMMARIES, SPECIAL, AUDIO, UNDERWATER ACOUSTICS, VLSI; VOL II: SPEECH PROCESSING; VOL III: SPEECH PROCESSING, DIGITAL SIGNAL PROCESSING; VOL IV: MULTIDIMENSIONAL SIGNAL PROCESSING, NEURAL NETWORKS - VOL V: STATISTICAL SIGNAL AND ARRAY PROCESSING, APPLICATIONS, 1997, : 783 - 786
[3] TOPIC N-GRAM COUNT LANGUAGE MODEL ADAPTATION FOR SPEECH RECOGNITION
Haidar, Md. Akmal
O'Shaughnessy, Douglas
2012 IEEE WORKSHOP ON SPOKEN LANGUAGE TECHNOLOGY (SLT 2012), 2012, : 165 - 169
[4] Similar N-gram Language Model
Gillot, Christian
Cerisara, Christophe
Langlois, David
Haton, Jean-Paul
11TH ANNUAL CONFERENCE OF THE INTERNATIONAL SPEECH COMMUNICATION ASSOCIATION 2010 (INTERSPEECH 2010), VOLS 3 AND 4, 2010, : 1824 - 1827
[5] Bayesian learning of n-gram statistical language modeling
Bai, Shuanhu
Li, Haizhou
2006 IEEE International Conference on Acoustics, Speech and Signal Processing, Vols 1-13, 2006, : 1045 - 1048
[6] Efficient MDI Adaptation for n-gram Language Models
Huang, Ruizhe
Li, Ke
Arora, Ashish
Povey, Daniel
Khudanpur, Sanjeev
INTERSPEECH 2020, 2020, : 4916 - 4920
[7] Language model adaptation for fixed phrases by amplifying partial N-gram sequences
Akiba, Tomoyosi
Itou, Katunobu
Fuji, Atsushi
Systems and Computers in Japan, 2007, 38 (04): : 63 - 73
[8] A New Estimate of the n-gram Language Model
Aouragh, Si Lhoussain
Yousfi, Abdellah
Laaroussi, Saida
Gueddah, Hicham
Nejja, Mohammed
AI IN COMPUTATIONAL LINGUISTICS, 2021, 189 : 211 - 215
[9] Development of the N-gram Model for Azerbaijani Language
Bannayeva, Aliya
Aslanov, Mustafa
2020 IEEE 14TH INTERNATIONAL CONFERENCE ON APPLICATION OF INFORMATION AND COMMUNICATION TECHNOLOGIES (AICT2020), 2020,
[10] A language independent n-gram model for word segmentation
Kang, Seung-Shik
Hwang, Kyu-Baek
Lect. Notes Comput. Sci., 1600, (557-565):

← 1 2 3 4 5 →