基于KNN和SVM的中文文本自动分类研究

被引：10

作者：

张野

杨建林

机构：

[1] 南京大学信息管理系

来源：

关键词：

自动分类; KNN; SVM; 中文信息处理;

D O I：

暂无

中图分类号：

TP391.1 [文字信息处理];

学科分类号：

081203 ; 0835 ;

摘要：

借助文本分类系统软件,采用来自10个大类的中文文本数据,按照训练集与测试集2:1的比例,使用KNN和SVM分类算法,对数据集进行自动分类的实验。旨在通过具体的语料库实验,探讨文本自动分类的关键技术,分析、比较与评价实验结果,探讨文本分类中具体参数的设置和不同分类算法之优劣。

引用

页码：1313 / 1317+1377 +1377

页数：6

共 6 条

[1] 基于机器学习的文本分类技术研究进展 [J].

苏金树 ;

张博锋 ;

徐昕 .

[2] 文本自动分类系统文本预处理方法的研究 [J].

周钦强 ;

孙炳达 ;

王义 .

[3] 中文文本分类中特征抽取方法的比较研究 [J].

代六玲 ;

黄河燕 ;

陈肇雄 .

庞剑锋 ;

卜东波 ;

白硕 .

[5] Machine learning in automated text categorization [J].

Sebastiani, F .

[6]

A vector space model for automatic indexing[J] . G. Salton,A. Wong,C. S. Yang.Communications of the ACM . 1975 (11)