优化的支持向量机集成分类器在非平衡数据集分类中的应用

被引:9
作者
章少平
梁雪春
机构
[1] 南京工业大学自动化与电气工程学院
关键词
非平衡数据; 分类算法; 支持向量机; 集成分类器;
D O I
暂无
中图分类号
TP391.4 [模式识别与装置];
学科分类号
0811 ; 081101 ; 081104 ; 1405 ;
摘要
传统的分类算法大都建立在平衡数据集的基础上,当样本数据不平衡时,这些学习算法的性能往往会明显下降。对于非平衡数据分类问题,提出了一种优化的支持向量机(SVM)集成分类器模型,采用KSMOTE和Bootstrap对非平衡数据进行预处理,生成相应的SVM模型并用复合形算法优化模型参数,最后利用优化的参数并行生成SVM集成分类器模型,采用投票机制得到分类结果。对5组UCI标准数据集进行实验,结果表明采用优化的SVM集成分类器模型较SVM模型、优化的SVM模型等分类精度有了明显的提升,同时验证了不同的boot Num取值对分类器性能效果的影响。
引用
收藏
页码:1306 / 1309
页数:4
相关论文
共 6 条
[1]  
SMOTE: synthetic minority over-sampling technique. Nitesh V. Chawla,Kevin W. Bowyer,Lawrence O. Hall,W. Philip Kegelmeyer. Journal of Artificial Organs . 2002
[2]   基于K近邻的过抽样算法在不平衡的医学资料中的应用 [J].
周舒冬 ;
张磊 ;
李丽霞 .
中国卫生统计, 2008, (06) :566-569
[3]   Lecture Notes in Computer Science [C]. 
The First International Conference on Web-Age Information Management
,1600
[4]  
A new method of constrained optimization and a comparison with other methods. Box M J. Computer Journal . 1965
[5]  
Learning Boolean Formulae or Factoring. Kearns M,Valiant L G. Tech.Rep.TR 14-88 . 1988
[6]  
Neural Network Ensembles. Hansen LK,Salamon P. IEEE Transactions on Pattern Analysis and Machine Intelligence . 1990