SVM与规则相结合的中文地名自动识别

被引:28
作者
李丽双
黄德根
陈春荣
杨元生
机构
[1] 大连理工大学计算机科学与工程系
关键词
计算机应用; 中文信息处理; 中文地名识别; 支持向量机; 机器学习; 基于规则的后处理;
D O I
暂无
中图分类号
TP391.43 [];
学科分类号
0811 ; 081101 ; 081104 ; 1405 ;
摘要
在分析中文文本中地名特点的基础上,提出了一种支持向量机(SVM)与规则相结合的中文地名自动识别方法:按字抽取特征向量的属性,然后将这些属性转换成二进制向量并建立训练集,采用多项式Kernel函数,得到SVM识别地名的机器学习模型;通过对错误识别结果的分析,构建规则库对识别结果进行后处理,弥补了机器学习模型获取知识不够全面导致召回率偏低的不足。实验表明,用SVM与规则相结合的机制识别中文文本中的地名是有效的:系统开式召回率、精确率和F-值分别达89.57%、93.52%和91.50%。
引用
收藏
页码:51 / 57
页数:7
相关论文
共 6 条
[1]   结合决策树方法的中文姓名识别 [J].
王振华 ;
孔祥龙 ;
陆汝占 ;
刘绍明 .
中文信息学报, 2004, (06) :10-15
[2]   基于统计的中文地名识别 [J].
黄德根 ;
岳广玲 ;
杨元生 .
中文信息学报, 2003, (02) :36-41
[3]   中国地名自动识别系统的设计与实现 [J].
谭红叶 ;
郑家恒 ;
刘开瑛 .
计算机工程, 2002, (08) :128-129+270
[4]   基于统计方法的中文姓名识别 [J].
黄德根 ;
杨元生 ;
王省 ;
张艳丽 ;
钟万勰 .
中文信息学报, 2001, (02) :31-37+44
[5]   基于分解与动态规划策略的汉语未登录词识别 [J].
吕雅娟 ;
赵铁军 ;
杨沐昀 ;
于浩 ;
李生 .
中文信息学报, 2001, (01) :28-33
[6]  
中国地名录[M]. 地图出版社 , 国家测绘局地名研究所 编, 1983