基于SVM的多类文本分类研究

被引:15
作者
张爱丽
刘广利
刘长宇
不详
机构
[1] 中国农业大学
[2] 石家庄陆军指挥学院
关键词
文本分类; 支持向量机(SVM); 模型选择; 留一法(loo);
D O I
暂无
中图分类号
TP391.1 [文字信息处理];
学科分类号
081203 ; 0835 ;
摘要
基于统计学习理论 ,构建了SVM文本分类模型 ,并给出了模型参数的loo自动选择算法 ,解决了以往参数靠经验确定的弊端。传统的文本分类系统不能处理一篇文档同属多类别的情形 ,论文将该情形归结为多类文本分类问题 ,提出二叉决策树SVM模型 ,并就农业机械化工程文档进行了实证分析。结果表明 ,该算法具有较好的分类效果
引用
收藏
页码:6 / 7+10 +10
页数:3
相关论文
共 6 条
[1]   中文文本自动分类研究进展 [J].
王闰强 ;
胡铁军 .
医学情报工作, 2002, (06) :342-345+347
[2]   关于统计学习理论与支持向量机 [J].
张学工 .
自动化学报, 2000, (01) :36-46
[3]   自动分类研究现状与展望 [J].
成颖 ;
史九林 .
情报学报, 1999, (01) :20-26
[4]   中文文献自动分类研究 [J].
叶新明 ;
徐进鸿 .
情报科学, 1992, (05) :31-34
[5]  
多类多标签汉语文本自动分类的研究[J]. 施彤年,卢忠良,荣融,王家云.情报学报. 2003 (03)
[6]  
模式识别[M]. - 清华大学出版社 , 边肇祺等编著, 2000