基于多个领域本体的文本层次被定义聚类方法

被引:10
作者
张爱琦
左万利
王英
梁浩
机构
[1] 吉林大学计算机科学与技术学院
基金
高等学校博士学科点专项科研基金;
关键词
领域本体; 相似度计算; 凝聚层次聚类;
D O I
暂无
中图分类号
TP391.1 [文字信息处理];
学科分类号
081203 ; 0835 ;
摘要
传统的聚类方法常常将文本中关键词的相似度作为聚类的依据,丢失了很多重要的语义信息,导致聚类结果不够准确且计算量大。提出了一种基于多个领域本体的文本层次聚类方法,利用多个领域本体将用关键词表示的文本特征向量表示为与之匹配的概念向量集,定义文本相似度的计算公式,设计并实现基于多个领域本体的文本凝聚聚类算法。实验结果表明,该方法从概念层次上表示和处理文本,降低了聚类对象空间的维度,减少了计算量,提高了文本聚类的精确度和聚类效率。
引用
收藏
页码:199 / 204
页数:6
相关论文
共 2 条
[1]   基于本体的Web页面聚类研究 [J].
谢红薇 ;
颜小林 ;
余雪丽 .
计算机科学, 2008, (09) :153-155
[2]   一种改进的本体语义相似度计算及其应用 [J].
李鹏 ;
陶兰 ;
王弼佐 .
计算机工程与设计, 2007, (01) :227-229