SVM与规则相结合的中文地名自动识别

被引:28
|
作者
李丽双
黄德根
陈春荣
杨元生
机构
[1] 大连理工大学计算机科学与工程系
关键词
计算机应用; 中文信息处理; 中文地名识别; 支持向量机; 机器学习; 基于规则的后处理;
D O I
暂无
中图分类号
TP391.43 [];
学科分类号
摘要
在分析中文文本中地名特点的基础上,提出了一种支持向量机(SVM)与规则相结合的中文地名自动识别方法:按字抽取特征向量的属性,然后将这些属性转换成二进制向量并建立训练集,采用多项式Kernel函数,得到SVM识别地名的机器学习模型;通过对错误识别结果的分析,构建规则库对识别结果进行后处理,弥补了机器学习模型获取知识不够全面导致召回率偏低的不足。实验表明,用SVM与规则相结合的机制识别中文文本中的地名是有效的:系统开式召回率、精确率和F-值分别达89.57%、93.52%和91.50%。
引用
收藏
页码:51 / 57
页数:7
相关论文
共 6 条
  • [1] 结合决策树方法的中文姓名识别
    王振华
    孔祥龙
    陆汝占
    刘绍明
    [J]. 中文信息学报, 2004, (06) : 10 - 15
  • [2] 基于统计的中文地名识别
    黄德根
    岳广玲
    杨元生
    [J]. 中文信息学报, 2003, (02) : 36 - 41
  • [3] 中国地名自动识别系统的设计与实现
    谭红叶
    郑家恒
    刘开瑛
    [J]. 计算机工程, 2002, (08) : 128 - 129+270
  • [4] 基于统计方法的中文姓名识别
    黄德根
    杨元生
    王省
    张艳丽
    钟万勰
    [J]. 中文信息学报, 2001, (02) : 31 - 37+44
  • [5] 基于分解与动态规划策略的汉语未登录词识别
    吕雅娟
    赵铁军
    杨沐昀
    于浩
    李生
    [J]. 中文信息学报, 2001, (01) : 28 - 33
  • [6] 中国地名录[M]. 地图出版社 , 国家测绘局地名研究所 编, 1983