共 8 条
用于大数据分类的KNN算法研究
被引:58
作者:
耿丽娟
李星毅
机构:
[1] 江苏大学计算机科学与通信工程学院
来源:
关键词:
大数据;
KNN;
差分多层;
D O I:
暂无
中图分类号:
TP301.6 [算法理论];
学科分类号:
081202 ;
摘要:
针对KNN算法在处理大数据时的两个不足对其进行了研究,提出多层差分KNN算法。算法对已知样本根据类域进行分层,既避免了传统改进算法中剪辑样本带来的判别误差,又大大降低了无效的计算量;同时在最后一层采用差分的方法进行决策,而不是直接根据最近邻进行分类,大大提高了分类的准确性。实验结果表明,该算法在对样本容量大、涉及邻域多的大数据样本进行分类时能取得较好的分类效果。
引用
收藏
页码:1342 / 1344+1373
+1373
页数:4
相关论文

