首页
学术期刊
论文检测
AIGC检测
热点
更多
数据
基于KNN和SVM的中文文本自动分类研究
被引:10
作者
:
论文数:
引用数:
h-index:
机构:
张野
论文数:
引用数:
h-index:
机构:
杨建林
机构
:
[1]
南京大学信息管理系
来源
:
情报科学
|
2011年
/ 29卷
/ 09期
关键词
:
自动分类;
KNN;
SVM;
中文信息处理;
D O I
:
暂无
中图分类号
:
TP391.1 [文字信息处理];
学科分类号
:
081203 ;
0835 ;
摘要
:
借助文本分类系统软件,采用来自10个大类的中文文本数据,按照训练集与测试集2:1的比例,使用KNN和SVM分类算法,对数据集进行自动分类的实验。旨在通过具体的语料库实验,探讨文本自动分类的关键技术,分析、比较与评价实验结果,探讨文本分类中具体参数的设置和不同分类算法之优劣。
引用
收藏
页码:1313 / 1317+1377 +1377
页数:6
相关论文
共 6 条
[1]
基于机器学习的文本分类技术研究进展
[J].
苏金树
论文数:
0
引用数:
0
h-index:
0
机构:
国防科学技术大学计算机学院
苏金树
;
张博锋
论文数:
0
引用数:
0
h-index:
0
机构:
国防科学技术大学计算机学院
张博锋
;
徐昕
论文数:
0
引用数:
0
h-index:
0
机构:
国防科学技术大学计算机学院
徐昕
.
软件学报,
2006,
(09)
:1848
-1859
[2]
文本自动分类系统文本预处理方法的研究
[J].
周钦强
论文数:
0
引用数:
0
h-index:
0
机构:
广东工业大学自动化学院,广东技术师范学院,广东工业大学自动化学院广东广州,广东广州,广东广州
周钦强
;
孙炳达
论文数:
0
引用数:
0
h-index:
0
机构:
广东工业大学自动化学院,广东技术师范学院,广东工业大学自动化学院广东广州,广东广州,广东广州
孙炳达
;
王义
论文数:
0
引用数:
0
h-index:
0
机构:
广东工业大学自动化学院,广东技术师范学院,广东工业大学自动化学院广东广州,广东广州,广东广州
王义
.
计算机应用研究,
2005,
(02)
:85
-86
[3]
中文文本分类中特征抽取方法的比较研究
[J].
论文数:
引用数:
h-index:
机构:
代六玲
;
黄河燕
论文数:
0
引用数:
0
h-index:
0
机构:
南京理工大学计算机科学系
黄河燕
;
陈肇雄
论文数:
0
引用数:
0
h-index:
0
机构:
南京理工大学计算机科学系
陈肇雄
.
中文信息学报,
2004,
(01)
:26
-32
[4]
基于向量空间模型的文本自动分类系统的研究与实现
[J].
论文数:
引用数:
h-index:
机构:
庞剑锋
;
论文数:
引用数:
h-index:
机构:
卜东波
;
白硕
论文数:
0
引用数:
0
h-index:
0
机构:
中国科学院计算技术研究所!北京,中国科学院计算技术研究所!北京,中国科学院计算技术研究所!北京
白硕
.
计算机应用研究,
2001,
(09)
:23
-26
[5]
Machine learning in automated text categorization
[J].
Sebastiani, F
论文数:
0
引用数:
0
h-index:
0
机构:
CNR, Ist Elaboraz Informaz, I-56124 Pisa, Italy
CNR, Ist Elaboraz Informaz, I-56124 Pisa, Italy
Sebastiani, F
.
ACM COMPUTING SURVEYS,
2002,
34
(01)
:1
-47
[6]
A vector space model for automatic indexing[J] . G. Salton,A. Wong,C. S. Yang.Communications of the ACM . 1975 (11)
←
1
→
共 6 条
[1]
基于机器学习的文本分类技术研究进展
[J].
苏金树
论文数:
0
引用数:
0
h-index:
0
机构:
国防科学技术大学计算机学院
苏金树
;
张博锋
论文数:
0
引用数:
0
h-index:
0
机构:
国防科学技术大学计算机学院
张博锋
;
徐昕
论文数:
0
引用数:
0
h-index:
0
机构:
国防科学技术大学计算机学院
徐昕
.
软件学报,
2006,
(09)
:1848
-1859
[2]
文本自动分类系统文本预处理方法的研究
[J].
周钦强
论文数:
0
引用数:
0
h-index:
0
机构:
广东工业大学自动化学院,广东技术师范学院,广东工业大学自动化学院广东广州,广东广州,广东广州
周钦强
;
孙炳达
论文数:
0
引用数:
0
h-index:
0
机构:
广东工业大学自动化学院,广东技术师范学院,广东工业大学自动化学院广东广州,广东广州,广东广州
孙炳达
;
王义
论文数:
0
引用数:
0
h-index:
0
机构:
广东工业大学自动化学院,广东技术师范学院,广东工业大学自动化学院广东广州,广东广州,广东广州
王义
.
计算机应用研究,
2005,
(02)
:85
-86
[3]
中文文本分类中特征抽取方法的比较研究
[J].
论文数:
引用数:
h-index:
机构:
代六玲
;
黄河燕
论文数:
0
引用数:
0
h-index:
0
机构:
南京理工大学计算机科学系
黄河燕
;
陈肇雄
论文数:
0
引用数:
0
h-index:
0
机构:
南京理工大学计算机科学系
陈肇雄
.
中文信息学报,
2004,
(01)
:26
-32
[4]
基于向量空间模型的文本自动分类系统的研究与实现
[J].
论文数:
引用数:
h-index:
机构:
庞剑锋
;
论文数:
引用数:
h-index:
机构:
卜东波
;
白硕
论文数:
0
引用数:
0
h-index:
0
机构:
中国科学院计算技术研究所!北京,中国科学院计算技术研究所!北京,中国科学院计算技术研究所!北京
白硕
.
计算机应用研究,
2001,
(09)
:23
-26
[5]
Machine learning in automated text categorization
[J].
Sebastiani, F
论文数:
0
引用数:
0
h-index:
0
机构:
CNR, Ist Elaboraz Informaz, I-56124 Pisa, Italy
CNR, Ist Elaboraz Informaz, I-56124 Pisa, Italy
Sebastiani, F
.
ACM COMPUTING SURVEYS,
2002,
34
(01)
:1
-47
[6]
A vector space model for automatic indexing[J] . G. Salton,A. Wong,C. S. Yang.Communications of the ACM . 1975 (11)
←
1
→