基于层叠条件随机场的旅游领域命名实体识别

被引:37
作者
郭剑毅 [1 ,2 ]
薛征山 [1 ]
余正涛 [1 ,2 ]
张志坤 [1 ]
张宜浩 [1 ]
姚贤明 [1 ]
机构
[1] 昆明理工大学信息工程与自动化学院
[2] 云南省计算机技术应用重点实验室智能信息处理研究所
关键词
计算机应用; 中文信息处理; 旅游领域; 命名实体识别; 层叠条件随机场; 特征模板;
D O I
暂无
中图分类号
TP391.41 [];
学科分类号
080203 ;
摘要
针对旅游领域,提出了一种基于层叠条件随机场模型的旅游领域命名实体识别方法。该方法在低层条件随机场中以字为切分粒度,结合旅游景点常用字表、景点常用后缀表、地名常用字表等特征词典,实现简单旅游命名实体的识别;其识别结果传递到高层模型,以词为切分粒度,结合复杂特征,实现嵌套景点、特产风味、地点的识别。最后进行了两组相关实验,结果表明,在开放测试中,层叠条件随机场模型相比于单层模型,F值提高了8个百分点;相比于HMM模型,正确率提高了8个百分点,召回率提高了22个百分点,F值提高了15个百分点。
引用
收藏
页码:47 / 52
页数:6
相关论文
共 9 条
[1]   MARKOV-FIELDS AND LOG-LINEAR INTERACTION MODELS FOR CONTINGENCY-TABLES [J].
DARROCH, JN ;
LAURITZEN, SL ;
SPEED, TP .
ANNALS OF STATISTICS, 1980, 8 (03) :522-539
[2]   基于单字提示特征的中文命名实体识别快速算法 [J].
冯元勇 ;
孙乐 ;
李文波 ;
张大鲲 .
中文信息学报, 2008, (01) :104-110
[3]   基于HMM的生物医学命名实体的识别与分类 [J].
陈锦 ;
常致全 ;
许军 .
计算机时代, 2006, (10) :40-42
[4]   边界模板和局部统计相结合的中国人名识别 [J].
李中国 ;
刘颖 .
中文信息学报, 2006, (05) :44-50
[5]   基于层叠条件随机场模型的中文机构名自动识别 [J].
周俊生 ;
戴新宇 ;
尹存燕 ;
陈家骏 .
电子学报, 2006, (05) :804-809
[6]   基于层叠隐马尔可夫模型的中文命名实体识别 [J].
俞鸿魁 ;
张华平 ;
刘群 ;
吕学强 ;
施水才 .
通信学报, 2006, (02) :87-94
[7]   面向商务信息抽取的产品命名实体识别研究 [J].
刘非凡 ;
赵军 ;
吕碧波 ;
徐波 ;
于浩 ;
夏迎炬 .
中文信息学报, 2006, (01) :7-13
[8]   中文机构名称的识别与分析 [J].
张小衡 ;
王玲玲 .
中文信息学报, 1997, (04) :22-33
[9]  
HMM与自动规则提取相结合的中文命名实体识别.[A].廖先桃;于海滨;秦兵;刘挺;.第二届全国学生计算语言学研讨会.2004,