基于CRF和规则相结合的地理命名实体识别方法

被引:67
|
作者
何炎祥 [1 ,2 ]
罗楚威 [2 ]
胡彬尧 [2 ]
机构
[1] 武汉大学软件工程国家重点实验室
[2] 武汉大学计算机学院
关键词
地理命名实体识别; 特征模版; 条件随机场; 修正规则; 结合修正;
D O I
暂无
中图分类号
TP391.1 [文字信息处理];
学科分类号
摘要
为了识别文本中海量的地理命名信息,以CRF(条件随机场)模型识别为基础,加入制定的规则,来提高CRF模型识别的召回率,从而提高整体的地理命名实体识别效果。通过选取适合的地理命名实体识别的特征模板,验证特征的有效性以及分析CRF模型识别结果中的未识别实体样本,设计针对未识别实体的规则用以修正识别结果。实验表明,对地名和组织名结合规则进行修正后的F值达到了91.61%和85.74%,有了显著提高。
引用
收藏
页码:179 / 185+202 +202
页数:8
相关论文
共 10 条
  • [1] 基于条件随机场的文本分类模型[J].张春元. 计算机技术与发展.2011(07)
  • [2] 基于条件随机场的大范围地形感知框架[J].王明军,周俊,屠珺,刘成良. 机器人.2010(03)
  • [3] 基于层叠条件随机场模型的中文机构名自动识别[J].周俊生,戴新宇,尹存燕,陈家骏. 电子学报.2006(05)
  • [4] 特征选择方法综述[J].王娟,慈林林,姚康泽. 计算机工程与科学.2005(12)
  • [5] 基于语料库的中文姓名识别方法研究[J].郑家恒,李鑫,谭红叶. 中文信息学报.2000(01)
  • [6] 中文机构名称的识别与分析[J].张小衡,王玲玲. 中文信息学报.1997(04)
  • [7] Namedentityrecognitionwithmultiplesegmentrepresentations[J].Han-CheolCho,NaoakiOkazaki,MakotoMiwa,Jun’ichiTsujii. InformationProcessingandManagement.2013(4)
  • [8] CombiningSelfLearningandActiveLearningforChineseNamedEntityRecognition[J].LinYao,ChengjieSun,XiaolongWang,XuanWang. JournalofSoftware.2010(5)
  • [9] Featureselectionforclassification[J].M.Dash,H.Liu. IntelligentDataAnalysis.1997(1)
  • [10] MUC.2http://www-nlpir.nist.gov/relatedprojects/muc.