计算语言学中的语言模型

被引:8
作者
冯志伟 [1 ]
丁晓梅 [2 ]
机构
[1] 鲁东大学
[2] 大连海事大学
关键词
计算语言学; 语言模型; 基于规则的语言模型; 基于统计的语言模型; 基于神经网络的语言模型;
D O I
暂无
中图分类号
TP391.1 [文字信息处理]; H08 [应用语言学];
学科分类号
081203 ; 0835 ; 050211 ;
摘要
计算语言学中的语言模型可以分为基于规则的语言模型、基于统计的语言模型、基于神经网络的语言模型三种类型。基于规则的语言模型主要有短语结构语法模型和依存语法模型,此类语言模型在某些"子语言"的计算语言学应用系统中获得了一定的成功,但用它们来处理真实文本仍有很大的困难。基于统计的语言模型十分重视统计在模型构建中的作用,语言学知识主要使用概率和统计的计算从大规模真实的语料库中获取,这样获得的知识能够更加全面、准确地反映自然语言的真实面貌,因此,基于统计的语言模型在计算语言学中广泛地流行开来。21世纪以来出现了基于神经网络的语言模型,该模型比基于统计的语言模型更胜一筹,占据了当前自然语言处理研究的主流地位。
引用
收藏
页码:17 / 24+3 +3
页数:9
相关论文
共 13 条
[1]   神经网络、深度学习与自然语言处理 [J].
冯志伟 .
上海师范大学学报(哲学社会科学版), 2021, 50 (02) :110-122
[2]   生成词向量的三种方法 [J].
冯志伟 .
外语电化教学, 2021, (01) :18-26+3
[3]   自然语言处理中的预训练范式 [J].
冯志伟 ;
李颖 .
外语研究, 2021, 38 (01) :1-14+112
[4]   罗塞塔石碑与机器翻译 [J].
冯志伟 .
外语学刊, 2020, (01) :1-17
[5]   词向量及其在自然语言处理中的应用 [J].
冯志伟 .
外语电化教学, 2019, (01) :3-11
[6]   机器翻译与人工智能的平行发展 [J].
冯志伟 .
外国语(上海外国语大学学报), 2018, 41 (06) :35-48
[7]   基于短语和句法的统计机器翻译 [J].
冯志伟 .
燕山大学学报, 2015, 39 (06) :546-554+560
[8]   隐马尔可夫模型及其在自动词类标注中的应用 [J].
冯志伟 .
燕山大学学报, 2013, 37 (04) :283-298
[9]  
语料库研究前沿.[M].胡开宝.上海外语教育出版社.2020,
[10]   First Links in the Markov Chain [J].
Hayes, Brian .
AMERICAN SCIENTIST, 2013, 101 (02) :92-97