改进的基于《知网》的词汇语义相似度计算

被引:53
作者
朱征宇 [1 ,2 ]
孙俊华 [1 ,2 ]
机构
[1] 重庆大学计算机学院
[2] 软件工程重庆市重点实验室
关键词
知网; 义原; 概念; 权重; 语义相似度;
D O I
暂无
中图分类号
TP391.1 [文字信息处理];
学科分类号
081203 ; 0835 ;
摘要
针对当前基于《知网》的词汇语义相似度计算方法没有充分考虑知识库描述语言对概念描述的线性特征的情况,提出一种改进的词汇语义相似度计算方法。首先,充分考虑概念描述式中各义原之间的线性关系,提出一种位置相关的权重分配策略;然后,将所提出的策略结合二部图最大权匹配进行概念相似度计算。实验结果表明,采用改进方法得到的聚类结果 F值较对比方法平均提高了5%,从而验证了改进方法的合理性和有效性。
引用
收藏
页码:2276 / 2279+2288 +2288
页数:5
相关论文
共 6 条
[1]   改进的基于知网的词语相似度算法 [J].
王小林 ;
王义 .
计算机应用, 2011, 31 (11) :3075-3077+3090
[2]   基于《知网》的词语相似度算法研究 [J].
刘青磊 ;
顾小丰 .
中文信息学报, 2010, (06) :31-36
[3]   中文词语语义相似度计算——基于《知网》2000 [J].
李峰 ;
李芳 .
中文信息学报, 2007, (03) :99-105
[4]   基于词汇语义计算的文本相似度研究 [J].
余刚 ;
裴仰军 ;
朱征宇 ;
陈华月 .
计算机工程与设计, 2006, (02) :241-244
[5]  
基于语义网计算英语词语相似度.[J].荀恩东;颜伟;.情报学报.2006, 01
[6]  
数据挖掘.[M].(加)JiaweiHan;(加)MichelineKamber著;范明;孟小峰等译;.机械工业出版社.2001,