一种改进的CURE聚类算法

被引:2
作者
郭俊
樊彦国
机构
[1] 石油大学(华东)资源与信息学院
关键词
数据挖掘; 层次聚类; 代表对象;
D O I
暂无
中图分类号
TP311.13 [];
学科分类号
1201 ;
摘要
聚类分析是数据挖掘领域的一个重要研究方向。已经有多种用于大规模数据库的聚类算法,CURE就是一个典型的代表。本文对CURE进行了改进,新方法用多点表示一个类,但舍弃了代表点收缩的过程;通过对类内最邻近距离统计特征的分析,提出了自动分离子类的方法,因而不用预先给定聚类个数;在CURE对原始数据进行随机采样和分区聚类的基础上,增加了划分网格一步,能降低噪声影响并缩短聚类时间。对二维数据的测试表明:改进的CURE能正确识别大多数类,速度上优于原算法。
引用
收藏
页码:12 / 15
页数:4
相关论文
共 2 条
[1]   一种基于密度的快速聚类算法 [J].
周水庚 ;
周傲英 ;
曹晶 ;
胡运发 .
计算机研究与发展, 2000, (11) :1287-1292
[2]   Clustering in very large databases based on distance and density [J].
Qian, WN ;
Gong, XQ ;
Zhou, AY .
JOURNAL OF COMPUTER SCIENCE AND TECHNOLOGY, 2003, 18 (01) :67-76