基于CRF和规则相结合的地理命名实体识别方法

被引:71
作者
何炎祥 [1 ,2 ]
罗楚威 [2 ]
胡彬尧 [2 ]
机构
[1] 武汉大学软件工程国家重点实验室
[2] 武汉大学计算机学院
关键词
地理命名实体识别; 特征模版; 条件随机场; 修正规则; 结合修正;
D O I
暂无
中图分类号
TP391.1 [文字信息处理];
学科分类号
081203 ; 0835 ;
摘要
为了识别文本中海量的地理命名信息,以CRF(条件随机场)模型识别为基础,加入制定的规则,来提高CRF模型识别的召回率,从而提高整体的地理命名实体识别效果。通过选取适合的地理命名实体识别的特征模板,验证特征的有效性以及分析CRF模型识别结果中的未识别实体样本,设计针对未识别实体的规则用以修正识别结果。实验表明,对地名和组织名结合规则进行修正后的F值达到了91.61%和85.74%,有了显著提高。
引用
收藏
页码:179 / 185+202 +202
页数:8
相关论文
共 1 条
[1]  
MUC.2http://www-nlpir.nist.gov/relatedprojects/muc.