文档聚类综述

被引:64
作者
刘远超
王晓龙
徐志明
关毅
机构
[1] 哈尔滨工业大学计算机科学与技术学院
关键词
计算机应用; 中文信息处理; 综述; 文档聚类; 降维; 概念相关; 聚类算法;
D O I
暂无
中图分类号
TP391.1 [文字信息处理];
学科分类号
081203 ; 0835 ;
摘要
聚类作为一种自动化程度较高的无监督机器学习方法,近年来在信息检索、多文档自动文摘等领域获得了广泛的应用。本文首先讨论了文档聚类的应用背景和体系结构,然后对文档聚类算法、聚类空间的构造和降维方法、文档聚类中的语义问题进行了综述。最后还介绍了聚类质量评测问题。
引用
收藏
页码:55 / 62
页数:8
相关论文
共 9 条
[1]   SELF-ORGANIZED FORMATION OF TOPOLOGICALLY CORRECT FEATURE MAPS [J].
KOHONEN, T .
BIOLOGICAL CYBERNETICS, 1982, 43 (01) :59-69
[2]   基于k-means聚类的无导词义消歧 [J].
陈浩 ;
何婷婷 ;
姬东鸿 .
中文信息学报, 2005, (04) :10-16
[3]   一种基于参考点和密度的快速聚类算法 [J].
马帅 ;
王腾蛟 ;
唐世渭 ;
杨冬青 ;
高军 .
软件学报, 2003, (06) :1089-1095
[4]   基于主题的Web文档聚类研究 [J].
孙学刚 ;
陈群秀 ;
马亮 .
中文信息学报, 2003, (03) :21-26
[5]   基于免疫规划的K-means聚类算法 [J].
行小帅 ;
潘进 ;
焦李成 .
计算机学报, 2003, (05) :605-610
[6]   一种基于群体智能的Web文档聚类算法 [J].
吴斌 ;
傅伟鹏 ;
郑毅 ;
刘少辉 ;
史忠植 .
计算机研究与发展, 2002, (11) :1429-1435
[7]   基于聚类的文本过滤模型 [J].
林鸿飞 ;
马雅彬 .
大连理工大学学报, 2002, (02) :249-252
[8]  
数据分析.[M].范金城;梅长林编著;.科学出版社.2002,
[9]  
知识发现.[M].史忠植著;.清华大学出版社.2002,