核密度估计及其在聚类算法构造中的应用

被引:64
作者
李存华
孙志挥
陈耿
胡云
机构
[1] 东南大学计算机科学与工程系
[2] 东南大学计算机科学与工程系 南京
[3] 淮海工学院计算机科学系连云港
[4] 南京
关键词
核密度估计; 分箱规则; 聚类算法;
D O I
暂无
中图分类号
TP311.13 [];
学科分类号
1201 ;
摘要
经典数理统计学中的核密度估计理论是构造基于数据集密度函数聚类算法的理论基础 ,采用分箱近似的快速核密度函数估计方法同样为构造高效的聚类算法提供了依据 通过对核密度估计理论及其快速分箱核近似方法的讨论 ,给出分箱近似密度估计相对于核密度估计的均方误差界 ,提出基于网格数据重心的分箱核近似方法 在不改变计算复杂度的条件下 ,基于网格数据重心的分箱核近似密度函数计算可以有效地降低近似误差 ,这一思想方法对于构造高效大规模数据聚类分析算法具有指导意义 揭示了基于网格上密度函数近似的聚类算法与核密度估计理论之间的关系
引用
收藏
页码:1712 / 1719
页数:8
相关论文
共 1 条
[1]   GridOF:面向大规模数据集的高效离群点检测算法 [J].
李存华 ;
孙志挥 .
计算机研究与发展, 2003, (11) :1586-1592