基于HNC理论的词语相似度计算

被引:10
作者
吴佐衍
王宇
机构
[1] 大连理工大学管理科学与工程学院
基金
国家自然科学基金重大项目;
关键词
概念层次网络; 语义相似度; 中文信息处理;
D O I
暂无
中图分类号
TP391.1 [文字信息处理];
学科分类号
081203 ; 0835 ;
摘要
该文运用自然语言处理的概念层次网络(Hierarchical Network of Concepts,HNC)理论提出了一种词语相似度计算方法。该方法利用HNC理论词汇层面联想的概念表述体系,根据HNC映射符号的编码规则和符号映射理论,综合概念内涵、概念外部特征、概念类别和组合符号来计算词语的相似度,并与基于知网的词语相似度算法和人工的主观判断的相似度进行了比较分析。实验结果表明,该方法能够较好地反映词语之间的语义差别,与人的直观判断基本一致,是一种有效可行的方法。
引用
收藏
页码:37 / 43+50 +50
页数:8
相关论文
共 13 条
[1]  
语料库研究.[D].何婷婷.华中师范大学.2003, 03
[2]  
基于HNC的汉语句子相似度算法的研究.[D].史燕.江苏大学.2009, 07
[3]  
基于语义距离的概念语义相似度研究.[D].赵巾帼.中南大学.2008, 01
[4]   基于语义网络的中文词汇链构造方法 [J].
宋培彦 ;
杨代庆 .
图书情报工作, 2011, 55 (22) :26-29+41
[5]   基于同义词词林的词语相似度计算方法 [J].
田久乐 ;
赵蔚 .
吉林大学学报(信息科学版), 2010, 28 (06) :602-608
[6]   基于《知网》的词语相似度算法研究 [J].
刘青磊 ;
顾小丰 .
中文信息学报, 2010, (06) :31-36
[7]   基于语义树的中文词语相似度计算与分析 [J].
张亮 ;
尹存燕 ;
陈家骏 .
中文信息学报, 2010, 24 (06) :23-30
[8]   中文词语语义相似度计算——基于《知网》2000 [J].
李峰 ;
李芳 .
中文信息学报, 2007, (03) :99-105
[9]   基于HNC理论的语义相关度计算方法 [J].
张运良 ;
张全 .
计算机工程与应用, 2005, (34) :1-3+18
[10]   知网与同义词词林的信息融合研究 [J].
梅立军 ;
周强 ;
臧路 ;
陈祖舜 .
中文信息学报, 2005, (01) :63-70