基于Wikipedia的语义相关度计算

被引:9
作者
刘军
姚天昉
机构
[1] 上海交通大学计算机科学与工程系
关键词
语义相关度; 领域知识; Wikipedia类别树; 意见挖掘;
D O I
暂无
中图分类号
TP391.1 [文字信息处理];
学科分类号
081203 ; 0835 ;
摘要
在意见挖掘中,为实现特殊领域知识的语义相关度计算,提出基于Wikipedia的语义相关度计算方法。在构建Wikipedia类别树的基础上,通过Wikipedia类别向量表示Wikipedia中的词汇,形成一部包含各种领域知识的Wikipedia词典,利用该词典计算语义相关度。实验结果表明,该方法的斯皮尔曼等级相关系数可达到0.77。
引用
收藏
页码:42 / 43+46 +46
页数:3
相关论文
共 3 条
[1]   基于主题概念抽取的多文档文摘方法 [J].
宋宣辰 ;
刘贵全 .
计算机工程, 2010, 36 (04) :190-192
[2]   文本意见挖掘综述 [J].
姚天昉 ;
程希文 ;
徐飞玉 ;
汉思乌思克尔特 ;
王睿 .
中文信息学报, 2008, (03) :71-80
[3]  
Similarity-Based Models of Word Cooccurrence Probabilities[J] . Ido Dagan,Lillian Lee,Fernando C. N. Pereira.Machine Learning . 1999 (1)