基于词向量和条件随机场的领域术语识别方法

被引:22
作者
冯艳红 [1 ,2 ]
于红 [1 ,2 ]
孙庚 [1 ,2 ]
赵禹锦 [3 ]
机构
[1] 大连海洋大学信息工程学院
[2] 辽宁省海洋信息技术重点实验室(大连海洋大学)
[3] 大连海洋大学经济管理学院
关键词
词向量; 条件随机场; 术语识别; 相似度特征;
D O I
暂无
中图分类号
TP391.1 [文字信息处理];
学科分类号
081203 ; 0835 ;
摘要
针对基于统计特征的领域术语识别方法忽略了术语的语义和领域特性,从而影响识别结果这一问题,提出一种基于词向量和条件随机场(CRF)的领域术语识别方法。该方法利用词向量具有较强的语义表达能力、词语与领域术语之间的相似度具有较强的领域表达能力这一特点,在统计特征的基础上,增加了词语的词向量与领域术语的词向量之间的相似度特征,构成基于词向量的特征向量,并采用CRF方法综合这些特征实现了领域术语识别。最后在领域语料库和Sogou CA语料库上进行实验,识别结果的准确率、召回率和F测度分别达到了0.985 5、0.943 9和0.964 3,表明所提的领域术语识别方法取得了较好的效果。
引用
收藏
页码:3146 / 3151
页数:6
相关论文
共 8 条
[1]  
水产辞典.[M].潘迎捷; 主编.上海辞书出版社.2007,
[2]   基于构成模式和条件随机场的企业简称预测 [J].
孙丽萍 ;
过弋 ;
唐文武 ;
徐永斌 .
计算机应用, 2016, 36 (02) :449-454
[3]   基于信息熵和词频分布变化的术语抽取研究 [J].
李丽双 ;
王意文 ;
黄德根 .
中文信息学报, 2015, (01) :82-87
[4]   CRF与规则相结合的医学病历实体识别 [J].
栗伟 ;
赵大哲 ;
李博 ;
彭新茗 ;
刘积仁 .
计算机应用研究, 2015, 32 (04) :1082-1086
[6]   基于条件随机场的领域术语识别研究 [J].
施水才 ;
王锴 ;
韩艳铧 ;
吕学强 .
计算机工程与应用, 2013, 49 (10) :147-149+155
[7]   自动术语识别存在的问题及发展趋势综述 [J].
祝清松 ;
冷伏海 .
图书情报工作, 2012, (18) :104-109
[8]   语义信息与CRF结合的汉语功能块自动识别 [J].
刘海霞 ;
黄德根 .
中文信息学报, 2011, (05) :53-59