共 11 条
基于CRF的互联网文本命名实体识别研究
被引:8
作者:
郑秋生
刘守喜
机构:
[1] 中原工学院
来源:
关键词:
命名实体识别;
CRF;
互联网文本;
匹配规则;
特征;
D O I:
暂无
中图分类号:
TP391.1 [文字信息处理];
学科分类号:
081203 ;
0835 ;
摘要:
针对互联网文本形式多样化造成的有效信息提取难度增加(尤其是命名实体识别方面)的问题,提出了一种统计和规则相结合的互联网文本命名实体识别方法。首先进行文本规范化,然后使用CRF模型,以词及词性作为特征进行训练,结合互联网文本的日常性、随意性和娱乐性等特点,以及若干匹配规则对文本进行命名实体识别。实验结果表明,该方法的准确率、召回率和F值分别达到了94.76%、85.34%、89.80%,能够有效地进行命名实体识别。
引用
收藏
页码:70 / 73+95
+95
页数:5
相关论文

