基于CRF的互联网文本命名实体识别研究

被引:8
作者
郑秋生
刘守喜
机构
[1] 中原工学院
关键词
命名实体识别; CRF; 互联网文本; 匹配规则; 特征;
D O I
暂无
中图分类号
TP391.1 [文字信息处理];
学科分类号
081203 ; 0835 ;
摘要
针对互联网文本形式多样化造成的有效信息提取难度增加(尤其是命名实体识别方面)的问题,提出了一种统计和规则相结合的互联网文本命名实体识别方法。首先进行文本规范化,然后使用CRF模型,以词及词性作为特征进行训练,结合互联网文本的日常性、随意性和娱乐性等特点,以及若干匹配规则对文本进行命名实体识别。实验结果表明,该方法的准确率、召回率和F值分别达到了94.76%、85.34%、89.80%,能够有效地进行命名实体识别。
引用
收藏
页码:70 / 73+95 +95
页数:5
相关论文
共 11 条
[1]   基于CRF和规则相结合的地理命名实体识别方法 [J].
何炎祥 ;
罗楚威 ;
胡彬尧 .
计算机应用与软件, 2015, 32 (01) :179-185+202
[2]   面向微博文本的命名实体识别 [J].
姜仁会 ;
王挺 ;
唐晋韬 .
计算机与数字工程, 2014, 42 (04) :647-651
[3]   中文微博命名实体识别 [J].
邱泉清 ;
苗夺谦 ;
张志飞 .
计算机科学, 2013, 40 (06) :196-198
[4]   基于HMM的京剧机构命名实体识别算法 [J].
乐娟 ;
赵玺 .
计算机工程, 2013, 39 (06) :266-271+286
[5]   面向短文本的命名实体识别 [J].
王丹 ;
樊兴华 .
计算机应用, 2009, 29 (01) :143-145+171
[6]   基于单字提示特征的中文命名实体识别快速算法 [J].
冯元勇 ;
孙乐 ;
李文波 ;
张大鲲 .
中文信息学报, 2008, (01) :104-110
[7]   基于层次模式匹配的命名实体识别模型 [J].
王昊 .
现代图书情报技术, 2007, (05) :62-68
[8]   一个统计与规则相结合的中文命名实体识别系统 [J].
向晓雯 ;
史晓东 ;
曾华琳 .
计算机应用, 2005, (10) :2404-2406
[9]   命名实体识别研究 [J].
张晓艳 ;
王挺 ;
陈火旺 .
计算机科学, 2005, (04) :44-48
[10]   中文金融新闻中公司名的识别 [J].
王宁 ;
葛瑞芳 ;
苑春法 ;
黄锦辉 ;
李文捷 .
中文信息学报, 2002, (02) :1-6