一种松耦合的生物医学命名实体识别算法

被引:2
|
作者
胡俊锋
陈蓉
陈源
陈浩
于中华
机构
[1] 四川大学计算机学院
基金
高等学校博士学科点专项科研基金;
关键词
生物医学命名实体; 启发规则过滤器; 词性模板匹配; 词根匹配; 隐马尔科夫模型; 松耦合算法;
D O I
暂无
中图分类号
TP391.4 [模式识别与装置];
学科分类号
0811 ; 081101 ; 081104 ; 1405 ;
摘要
生物医学命名实体识别(Bio-NER)是生物医学文献挖掘利用的基础工作。针对目前Bio-NER存在的困难和问题,提出了松耦合的Bio-NER算法LCA,该算法利用启发规则过滤器、词性模板匹配及改良的隐马尔科夫模型(HMM)识别生物医学命名实体。在GENIA corpus3.02语料库上进行的实验表明,LCA可以达到80%的准确率和89%的召回率,优于相关工作中的结果。
引用
收藏
页码:2866 / 2869
页数:4
相关论文
共 3 条
  • [1] 统计自然语言处理基础[M]. 电子工业出版社 , (美)ChristopherD.Manning, 2005
  • [2] Using BLAST for identifying gene and protein names in journal articles[J] . Michael Krauthammer,Andrey Rzhetsky,Pavel Morozov,Carol Friedman. Gene . 2000 (1)
  • [3] Notions of correct-ness when evaluating protein name taggers[C/OL] .2 OLSSON F,ERIKSSONG,FRANZENK,et al. Proceedings of the19th International Conference on Computational Linguistics . 2002