具有容噪特性的C4.5算法改进

被引:10
作者
王伟
李磊
张志鸿
机构
[1] 郑州大学信息工程学院
关键词
高维数据噪声; 容噪; 主成分分析; C4.5算法;
D O I
暂无
中图分类号
TP301.6 [算法理论];
学科分类号
081202 ;
摘要
针对有噪声的高维数据引起决策树预测准确率下降的问题,利用容噪主成分分析(Noise-free Principal Component Anlysis,NFPCA)算法思想对C4.5算法改进而形成NFPCA-in-C4.5算法。该算法一方面将高维数据噪声控制问题转化为拟合数据特征与控制平滑度相结合的最优化问题,从而获得主成分空间;另一方面在决策树自顶向下构建新节点的过程中,再将主成分空间恢复到原始数据空间来避免降维过程中属性特征信息永久消失。实验结果表明NFPCA-in-C4.5算法兼具降维和容噪功能,避免了降维中由特征信息损失和噪声残留造成的预测模型准确率大幅降低的问题。
引用
收藏
页码:268 / 271+287 +287
页数:5
相关论文
共 10 条
[1]   一种新的应用变精度粗糙集的决策树构造方法 [J].
王越 ;
万洪 .
重庆理工大学学报(自然科学), 2013, 27 (11) :58-64
[2]   基于多尺度粗糙集模型的决策树优化算法 [J].
陈家俊 ;
苏守宝 ;
徐华丽 .
计算机应用, 2011, 31 (12) :3243-3246
[3]   基于主成分分析的决策树构造方法 [J].
孟凡荣 ;
蒋晓云 ;
田恬 ;
施蕾 ;
申丽君 .
小型微型计算机系统, 2008, (07) :1245-1249
[4]   容噪学习机制及其在Robocup中的应用研究 [J].
承文俊 ;
沈建强 ;
谢琪 ;
陈兆乾 .
计算机科学, 2004, (04) :101-103
[5]  
谱聚类维数约简算法研究与应用.[D].周斯斯.西安电子科技大学.2010, 11
[6]  
决策树在数据挖掘中若干问题的研究.[D].倪春鹏.天津大学.2004, 06
[7]   Credal-C4.5: Decision tree based on imprecise probabilities to classify noisy data [J].
Mantas, Carlos J. ;
Abellan, Joaquin .
EXPERT SYSTEMS WITH APPLICATIONS, 2014, 41 (10) :4625-4637
[8]   Noise-free principal component analysis: An efficient dimension reduction technique for high dimensional molecular data [J].
Rezghi, Mansoor ;
Obulkasim, Askar .
EXPERT SYSTEMS WITH APPLICATIONS, 2014, 41 (17) :7797-7804
[9]  
数值线性代数.[M].徐树方等编;.北京大学出版社.2000,
[10]  
高维数据挖掘中若干关键问题的研究.[D].杨风召.复旦大学.2003, 02