基于条件随机场的中医命名实体识别

被引:33
作者
王世昆
李绍滋
陈彤生
机构
[1] 厦门大学信息科学与技术学院
关键词
条件随机场; 中医命名实体; 数据清洗; 交叉验证;
D O I
暂无
中图分类号
R2-03 [中医现代化研究];
学科分类号
100602 ;
摘要
中医医案蕴藏着丰富的知识,如何完成对海量医案的自动标注以便对其进行知识挖掘显得尤为重要.针对明清古医案中症状、病机的自动识别标注问题,采用了基于条件随机场(CRF)的方法,提出数据清洗以及缩减合并词性以减少特征空间规模.最后,通过仿真实验将该方法与最大熵、支持向量机这两种统计方法进行对比.结果表明:该方法在针对明清古医案中症状、病机这类中医命名实体识别具有明显的优势.
引用
收藏
页码:359 / 364
页数:6
相关论文
共 5 条
[1]   北京大学现代汉语语料库基本加工规范 [J].
俞士汶 ;
段慧明 ;
朱学锋 ;
孙斌 .
中文信息学报, 2002, (05) :49-64
[2]   一种松耦合的生物医学命名实体识别算法 [J].
胡俊锋 ;
陈蓉 ;
陈源 ;
陈浩 ;
于中华 .
计算机应用, 2007, (11) :2866-2869
[3]  
中文命名实体识别方法研究[D]. 廖先桃.哈尔滨工业大学 2006
[4]  
基于条件随机场的中文命名实体识别[D]. 向晓雯.厦门大学 2006
[5]  
Maximum Entropy Modeling Toolkit for Python and C++. ZHANG Le. http://homepages.inf.ed.ac.uk/s0450736 . 2004