首页
学术期刊
论文检测
AIGC检测
热点
更多
数据
文档聚类综述
被引:64
作者
:
刘远超
论文数:
0
引用数:
0
h-index:
0
机构:
哈尔滨工业大学计算机科学与技术学院
刘远超
王晓龙
论文数:
0
引用数:
0
h-index:
0
机构:
哈尔滨工业大学计算机科学与技术学院
王晓龙
徐志明
论文数:
0
引用数:
0
h-index:
0
机构:
哈尔滨工业大学计算机科学与技术学院
徐志明
论文数:
引用数:
h-index:
机构:
关毅
机构
:
[1]
哈尔滨工业大学计算机科学与技术学院
来源
:
中文信息学报
|
2006年
/ 03期
关键词
:
计算机应用;
中文信息处理;
综述;
文档聚类;
降维;
概念相关;
聚类算法;
D O I
:
暂无
中图分类号
:
TP391.1 [文字信息处理];
学科分类号
:
081203 ;
0835 ;
摘要
:
聚类作为一种自动化程度较高的无监督机器学习方法,近年来在信息检索、多文档自动文摘等领域获得了广泛的应用。本文首先讨论了文档聚类的应用背景和体系结构,然后对文档聚类算法、聚类空间的构造和降维方法、文档聚类中的语义问题进行了综述。最后还介绍了聚类质量评测问题。
引用
收藏
页码:55 / 62
页数:8
相关论文
共 9 条
[1]
SELF-ORGANIZED FORMATION OF TOPOLOGICALLY CORRECT FEATURE MAPS
[J].
KOHONEN, T
论文数:
0
引用数:
0
h-index:
0
KOHONEN, T
.
BIOLOGICAL CYBERNETICS,
1982,
43
(01)
:59
-69
[2]
基于k-means聚类的无导词义消歧
[J].
论文数:
引用数:
h-index:
机构:
陈浩
;
何婷婷
论文数:
0
引用数:
0
h-index:
0
机构:
华中师范大学计算机科学系,华中师范大学计算机科学系,新加坡信息通讯研究所湖北武汉,湖北武汉,新加坡
何婷婷
;
姬东鸿
论文数:
0
引用数:
0
h-index:
0
机构:
华中师范大学计算机科学系,华中师范大学计算机科学系,新加坡信息通讯研究所湖北武汉,湖北武汉,新加坡
姬东鸿
.
中文信息学报,
2005,
(04)
:10
-16
[3]
一种基于参考点和密度的快速聚类算法
[J].
马帅
论文数:
0
引用数:
0
h-index:
0
机构:
北京大学计算机科学技术系
马帅
;
王腾蛟
论文数:
0
引用数:
0
h-index:
0
机构:
北京大学计算机科学技术系
王腾蛟
;
论文数:
引用数:
h-index:
机构:
唐世渭
;
杨冬青
论文数:
0
引用数:
0
h-index:
0
机构:
北京大学计算机科学技术系
杨冬青
;
高军
论文数:
0
引用数:
0
h-index:
0
机构:
北京大学计算机科学技术系
高军
.
软件学报,
2003,
(06)
:1089
-1095
[4]
基于主题的Web文档聚类研究
[J].
孙学刚
论文数:
0
引用数:
0
h-index:
0
机构:
智能技术与系统国家重点实验室清华大学计算机科学与技术系
孙学刚
;
陈群秀
论文数:
0
引用数:
0
h-index:
0
机构:
智能技术与系统国家重点实验室清华大学计算机科学与技术系
陈群秀
;
马亮
论文数:
0
引用数:
0
h-index:
0
机构:
智能技术与系统国家重点实验室清华大学计算机科学与技术系
马亮
.
中文信息学报,
2003,
(03)
:21
-26
[5]
基于免疫规划的K-means聚类算法
[J].
行小帅
论文数:
0
引用数:
0
h-index:
0
机构:
西安电子科技大学雷达信号处理国家重点实验室,西安通信学院计算机与信息工程系,西安电子科技大学雷达信号处理国家重点实验室西安,山西师范大学物理与信息工程学院,临汾,西安,西安
行小帅
;
论文数:
引用数:
h-index:
机构:
潘进
;
论文数:
引用数:
h-index:
机构:
焦李成
.
计算机学报,
2003,
(05)
:605
-610
[6]
一种基于群体智能的Web文档聚类算法
[J].
论文数:
引用数:
h-index:
机构:
吴斌
;
论文数:
引用数:
h-index:
机构:
傅伟鹏
;
论文数:
引用数:
h-index:
机构:
郑毅
;
刘少辉
论文数:
0
引用数:
0
h-index:
0
机构:
中国科学院计算技术研究所智能信息处理开放重点实验室,中国科学院计算技术研究所智能信息处理开放重点实验室,中国科学院计算技术研究所智能信息处理开放重点实验室,中国科学院计算技术研究所智能信息处理开放重点实验室,中国科学院计算技术研究所智能信息处理开放重点实验室
刘少辉
;
史忠植
论文数:
0
引用数:
0
h-index:
0
机构:
中国科学院计算技术研究所智能信息处理开放重点实验室,中国科学院计算技术研究所智能信息处理开放重点实验室,中国科学院计算技术研究所智能信息处理开放重点实验室,中国科学院计算技术研究所智能信息处理开放重点实验室,中国科学院计算技术研究所智能信息处理开放重点实验室
史忠植
.
计算机研究与发展,
2002,
(11)
:1429
-1435
[7]
基于聚类的文本过滤模型
[J].
论文数:
引用数:
h-index:
机构:
林鸿飞
;
马雅彬
论文数:
0
引用数:
0
h-index:
0
机构:
大连理工大学计算机系
马雅彬
.
大连理工大学学报,
2002,
(02)
:249
-252
[8]
数据分析.[M].范金城;梅长林编著;.科学出版社.2002,
[9]
知识发现.[M].史忠植著;.清华大学出版社.2002,
←
1
→
共 9 条
[1]
SELF-ORGANIZED FORMATION OF TOPOLOGICALLY CORRECT FEATURE MAPS
[J].
KOHONEN, T
论文数:
0
引用数:
0
h-index:
0
KOHONEN, T
.
BIOLOGICAL CYBERNETICS,
1982,
43
(01)
:59
-69
[2]
基于k-means聚类的无导词义消歧
[J].
论文数:
引用数:
h-index:
机构:
陈浩
;
何婷婷
论文数:
0
引用数:
0
h-index:
0
机构:
华中师范大学计算机科学系,华中师范大学计算机科学系,新加坡信息通讯研究所湖北武汉,湖北武汉,新加坡
何婷婷
;
姬东鸿
论文数:
0
引用数:
0
h-index:
0
机构:
华中师范大学计算机科学系,华中师范大学计算机科学系,新加坡信息通讯研究所湖北武汉,湖北武汉,新加坡
姬东鸿
.
中文信息学报,
2005,
(04)
:10
-16
[3]
一种基于参考点和密度的快速聚类算法
[J].
马帅
论文数:
0
引用数:
0
h-index:
0
机构:
北京大学计算机科学技术系
马帅
;
王腾蛟
论文数:
0
引用数:
0
h-index:
0
机构:
北京大学计算机科学技术系
王腾蛟
;
论文数:
引用数:
h-index:
机构:
唐世渭
;
杨冬青
论文数:
0
引用数:
0
h-index:
0
机构:
北京大学计算机科学技术系
杨冬青
;
高军
论文数:
0
引用数:
0
h-index:
0
机构:
北京大学计算机科学技术系
高军
.
软件学报,
2003,
(06)
:1089
-1095
[4]
基于主题的Web文档聚类研究
[J].
孙学刚
论文数:
0
引用数:
0
h-index:
0
机构:
智能技术与系统国家重点实验室清华大学计算机科学与技术系
孙学刚
;
陈群秀
论文数:
0
引用数:
0
h-index:
0
机构:
智能技术与系统国家重点实验室清华大学计算机科学与技术系
陈群秀
;
马亮
论文数:
0
引用数:
0
h-index:
0
机构:
智能技术与系统国家重点实验室清华大学计算机科学与技术系
马亮
.
中文信息学报,
2003,
(03)
:21
-26
[5]
基于免疫规划的K-means聚类算法
[J].
行小帅
论文数:
0
引用数:
0
h-index:
0
机构:
西安电子科技大学雷达信号处理国家重点实验室,西安通信学院计算机与信息工程系,西安电子科技大学雷达信号处理国家重点实验室西安,山西师范大学物理与信息工程学院,临汾,西安,西安
行小帅
;
论文数:
引用数:
h-index:
机构:
潘进
;
论文数:
引用数:
h-index:
机构:
焦李成
.
计算机学报,
2003,
(05)
:605
-610
[6]
一种基于群体智能的Web文档聚类算法
[J].
论文数:
引用数:
h-index:
机构:
吴斌
;
论文数:
引用数:
h-index:
机构:
傅伟鹏
;
论文数:
引用数:
h-index:
机构:
郑毅
;
刘少辉
论文数:
0
引用数:
0
h-index:
0
机构:
中国科学院计算技术研究所智能信息处理开放重点实验室,中国科学院计算技术研究所智能信息处理开放重点实验室,中国科学院计算技术研究所智能信息处理开放重点实验室,中国科学院计算技术研究所智能信息处理开放重点实验室,中国科学院计算技术研究所智能信息处理开放重点实验室
刘少辉
;
史忠植
论文数:
0
引用数:
0
h-index:
0
机构:
中国科学院计算技术研究所智能信息处理开放重点实验室,中国科学院计算技术研究所智能信息处理开放重点实验室,中国科学院计算技术研究所智能信息处理开放重点实验室,中国科学院计算技术研究所智能信息处理开放重点实验室,中国科学院计算技术研究所智能信息处理开放重点实验室
史忠植
.
计算机研究与发展,
2002,
(11)
:1429
-1435
[7]
基于聚类的文本过滤模型
[J].
论文数:
引用数:
h-index:
机构:
林鸿飞
;
马雅彬
论文数:
0
引用数:
0
h-index:
0
机构:
大连理工大学计算机系
马雅彬
.
大连理工大学学报,
2002,
(02)
:249
-252
[8]
数据分析.[M].范金城;梅长林编著;.科学出版社.2002,
[9]
知识发现.[M].史忠植著;.清华大学出版社.2002,
←
1
→