基于后验概率的不平衡数据集特征选择算法

被引:6
|
作者
曹苏群
王士同
陈晓峰
机构
[1] 江南大学信息学院
关键词
不平衡数据集; 特征选择; 后验概率;
D O I
暂无
中图分类号
TP18 [人工智能理论];
学科分类号
081104 ; 0812 ; 0835 ; 1405 ;
摘要
针对不平衡数据集,提出一种基于后验概率的特征选择算法。该算法引入基于Parzen-window方法估算的不均衡因子,并以Tomeklinks中点为初始值进行迭代,找出满足后验概率相等的判别边界点,通过对这些点法向量进行投影计算得到各特征的权值。实验表明,对于不平衡数据集,该算法在不降低分类器总体性能的基础上,不仅可以有效降低维度,节省计算开销,而且能够避免常规特征选择算法用于不平衡数据时忽视小类的缺点。
引用
收藏
页码:1 / 3
页数:3
相关论文
共 1 条
  • [1] Theoretically optimal parameter choices for support vector regression machines with noisy input
    Wang, ST
    Zhu, JG
    Chung, FL
    Lin, Q
    Hu, DW
    [J]. SOFT COMPUTING, 2005, 9 (10) : 732 - 741