基于GA与SVM融合的网页分类算法

被引:7
作者
刘晓勇 [1 ,2 ,3 ]
机构
[1] 中国科学院文献情报中心
[2] 广东技术师范学院计算机科学学院
[3] 中国科学院研究生院
关键词
遗传算法; 支持向量机; 文本分类; 网页分类;
D O I
暂无
中图分类号
TP393.092 [];
学科分类号
080402 ;
摘要
为了实现对大量的网络信息的正确分类以便使用户迅速获取所需信息,提出一种新的网页内容分类算法,该算法将遗传算法(GA)与支持向量机(SVM)结合起来,利用遗传算法良好的寻优能力优化SVM的分类性能。在由新闻网页文本构成的数据集上的仿真实验结果表明,GA和SVM融合的算法能够有效提高SVM的分类性能,新算法的分类正确率相比基本的SVM有非常显著的提高。由此证明,提出的基于GA的SVM改进算法是有效的,能够用于对大量网络信息的分类问题中。
引用
收藏
页码:953 / 955
页数:3
相关论文
共 9 条
[1]   基于RSOM-Bayes的网页分类方法 [J].
冯和龙 ;
夏胜平 .
计算机工程, 2008, (13) :61-63
[2]   基于近似支持向量机的Web文本分类研究 [J].
钟将 ;
温罗生 ;
冯永 ;
叶春晓 ;
李志国 .
计算机科学, 2008, (03) :167-169+202
[3]   基于改进的SVM文本分类建模 [J].
刘秀松 .
情报理论与实践, 2007, (06) :841-843
[4]   基于体裁的中文网页分类的特征选取 [J].
黄臻臻 ;
吴扬扬 .
计算机工程与设计, 2007, (11) :2743-2745
[5]   支持向量机在网页信息分类中的应用研究 [J].
刘丽珍 ;
贺海军 ;
陆玉昌 ;
宋瀚涛 .
小型微型计算机系统, 2007, (02) :337-340
[6]   基于自组织特征映射的网页分类研究 [J].
张义忠 ;
赵明生 ;
梁久祯 .
信息与控制, 2003, (02) :108-112+117
[7]   一种基于粗糙集的网页分类方法 [J].
李滔 ;
王俊普 ;
徐杨 .
小型微型计算机系统, 2003, (03) :520-522
[8]  
统计学习理论的本质.[M].(美)VladimirN.Vapnik著;张学工译;.清华大学出版社.2000,
[9]  
Evolutionary tuning of SVM parameter values in multiclass problems.[J].Ana Carolina Lorena;André C.P.L.F. de Carvalho.Neurocomputing.2008, 16