一种基于WordNet的短文本语义相似性算法

被引:30
作者
翟延冬 [1 ]
王康平 [1 ,2 ]
张东娜 [1 ]
黄岚 [1 ,2 ]
周春光 [1 ,2 ]
机构
[1] 吉林大学计算机科学与技术学院
[2] 吉林大学符号计算与知识工程教育部重点实验室
关键词
短文本语义相似性; WordNet; 基于文集的方法;
D O I
暂无
中图分类号
TP391.1 [文字信息处理];
学科分类号
081203 ; 0835 ;
摘要
短文本语义相似性计算在文献检索、信息抽取、文本挖掘等方面应用日益广泛.本文提出了一种短文本语义相似性计算算法ST-CW.此算法使用WordNet和Brown文集来计算文本中的概念相似性,在此基础上提出了一个新的方法综合考虑概念、句法等信息来计算短文本的语义相似性.在R&B及Miller数据集上进行实验,实验结果验证了算法的有效性.
引用
收藏
页码:617 / 620
页数:4
相关论文
共 6 条
[1]  
基于WordNet的本体构建及其在安全领域应用关键技术研究.[D].周子力.华东师范大学.2009, 12
[2]   Evaluating WordNet-based measures of lexical semantic relatedness [J].
Budanitsky, Alexander ;
Hirst, Graeme .
COMPUTATIONAL LINGUISTICS, 2006, 32 (01) :13-47
[3]   Explorations in context space: Words, sentences, discourse [J].
Burgess, C ;
Livesay, K ;
Lund, K .
DISCOURSE PROCESSES, 1998, 25 (2-3) :211-257
[4]  
A vector space model for automatic indexing.[J].G. Salton;A. Wong;C. S. Yang.Communications of the ACM.1975, 11
[5]   一种基于WordNet和Corpus Statistics的语义相似性计算方法 [J].
张东娜 ;
周春光 ;
刘彦斌 ;
郭东伟 .
吉林大学学报(理学版), 2010, 48 (05) :811-816
[6]   基于语义的文本流形研究 [J].
杨震 ;
范科峰 ;
雷建军 ;
郭军 .
电子学报, 2009, 37 (03) :557-561