基于互信息的主成分分析特征选择算法

被引:103
|
作者
范雪莉
冯海泓
原猛
机构
[1] 不详
[2] 中国科学院声学研究所东海研究站
[3] 不详
基金
上海市自然科学基金;
关键词
互信息; 主成分分析; 特征选择;
D O I
10.13195/j.cd.2013.06.117.fanxl.026
中图分类号
TP18 [人工智能理论];
学科分类号
081104 ; 0812 ; 0835 ; 1405 ;
摘要
主成分分析是一种常用的特征选择算法,经典方法是计算各个特征之间的相关,但是相关无法评估变量间的非线性关系.互信息可用于衡量两个变量间相互依赖的强弱程度,且不局限于线性相关,鉴于此,提出一种基于互信息的主成分分析特征选择算法.该算法计算特征间的互信息,以互信息矩阵的特征值作为评价准则确定主成分的个数,并衡量主成分分析特征选择的效果.通过实例对所提出方法和传统主成分分析方法进行比较,并以神经网络为分类器分析分类效果.
引用
收藏
页码:915 / 919
页数:5
相关论文
共 4 条
  • [1] 基于互信息最大化的特征选择算法及应用
    唐亮
    段建国
    许洪波
    梁玲
    [J]. 计算机工程与应用, 2008, (13) : 130 - 133
  • [2] 信息论基础[M]. 人民邮电出版社 , 田宝玉等, 2008
  • [3] A mathematical theory of communication[J] . C. E. Shannon.ACM SIGMOBILE Mobile Computing and Communications Review . 2001 (1)
  • [4] Genetic A lgorithm s in Search Pptim ization and M ach ine Learn ing .2 Goldberg D E. Add ision-W esley . 1989