基于最近邻优先的高效聚类算法

被引:24
作者
胡建军
唐常杰
李川
彭京
元昌安
陈安龙
蒋永光
机构
[1] 四川大学计算机学院,四川大学计算机学院,四川大学计算机学院,四川大学计算机学院,四川大学计算机学院,四川大学计算机学院,成都中医药大学四川成都,四川成都,四川成都,四川成都成都市公安局科技处四川成都,四川成都广西师范学院信息技术系广西南宁,四川成都,四川成都
基金
高等学校博士学科点专项科研基金;
关键词
数据挖掘; 聚类分析; 最近邻优先吸收; 多层次聚类;
D O I
10.15961/j.jsuese.2004.06.021
中图分类号
TP301.6 [算法理论];
学科分类号
081202 ;
摘要
针对高维空间中任意形状的多层次聚类问题,基于"同类相近"的思想,提出并实现了最近邻优先吸收聚类算法NNAF算法。证明了最近邻点搜索定理,基于这一定理又提出了SNN(SearchingNearestNeighbors)算法和GSNN(Grid basedSearchingNearestNeighbors)算法,其时间复杂度为O(n log(n)),当用扫描图像所得数据时,时间复杂度会降为O(n);而使用传统的搜索算法,时间复杂度为O(n2);提出了实现任意形状高维空间聚类的NNAF算法,时间复杂度为O(n);提出了MLCA(Multi layerClusterAlgorithm)算法并证明了两个相关的定理,在改变阈值后重新聚类时,使用MLCA算法可以节省90%以上的时间。实验结果显示,以上算法适应于任意形状的高维空间数据的聚类,可以有效过滤噪声数据,且用户需要的先验知识少、可快速获得各种层次的聚类结果。
引用
收藏
页码:93 / 99
页数:7
相关论文
empty
未找到相关数据