首页
学术期刊
论文检测
AIGC检测
热点
更多
数据
基于归一化向量的文本分类算法
被引:7
作者
:
论文数:
引用数:
h-index:
机构:
钟将
论文数:
引用数:
h-index:
机构:
孙启干
李静
论文数:
0
引用数:
0
h-index:
0
机构:
重庆大学计算机学院
李静
机构
:
[1]
重庆大学计算机学院
来源
:
计算机工程
|
2011年
/ 37卷
/ 08期
关键词
:
文本分类;
矩阵投影;
向量空间模型;
归一化向量;
D O I
:
暂无
中图分类号
:
TP18 [人工智能理论];
学科分类号
:
081104 ;
0812 ;
0835 ;
1405 ;
摘要
:
基于归一化思想和矩阵投影运算提出一种文本分类算法。该算法综合考虑单个类别内的文档频率和词频,用于进行矩阵投影运算。将训练样例中表示文本特征的三维空间投影到二维空间上,得到归一化的特征向量,可有效地达到降低特征空间维数、提高分类效率和精度的目的。与kNN算法的对比实验表明,该算法在时间性能和精度上都有较大提高。
引用
收藏
页码:47 / 49
页数:3
相关论文
共 4 条
[1]
基于Log似然比的特征选择算法
[J].
论文数:
引用数:
h-index:
机构:
林森
;
论文数:
引用数:
h-index:
机构:
唐发根
.
计算机工程,
2009,
35
(19)
:56
-58+61
[2]
基于区分类别能力的高性能特征选择方法
[J].
论文数:
引用数:
h-index:
机构:
徐燕
;
李锦涛
论文数:
0
引用数:
0
h-index:
0
机构:
中国科学院计算技术研究所
李锦涛
;
论文数:
引用数:
h-index:
机构:
王斌
;
孙春明
论文数:
0
引用数:
0
h-index:
0
机构:
中国科学院计算技术研究所
孙春明
.
软件学报,
2008,
(01)
:82
-89
[3]
Machine learning in automated text categorization
[J].
Sebastiani, F
论文数:
0
引用数:
0
h-index:
0
机构:
CNR, Ist Elaboraz Informaz, I-56124 Pisa, Italy
CNR, Ist Elaboraz Informaz, I-56124 Pisa, Italy
Sebastiani, F
.
ACM COMPUTING SURVEYS,
2002,
34
(01)
:1
-47
[4]
中文文本分类语料库-TanCorpV1.0 .2 谭松波,王月粉. http://www.searchforum.org.cn/tansongbo/corpus1.php . 2006
←
1
→
共 4 条
[1]
基于Log似然比的特征选择算法
[J].
论文数:
引用数:
h-index:
机构:
林森
;
论文数:
引用数:
h-index:
机构:
唐发根
.
计算机工程,
2009,
35
(19)
:56
-58+61
[2]
基于区分类别能力的高性能特征选择方法
[J].
论文数:
引用数:
h-index:
机构:
徐燕
;
李锦涛
论文数:
0
引用数:
0
h-index:
0
机构:
中国科学院计算技术研究所
李锦涛
;
论文数:
引用数:
h-index:
机构:
王斌
;
孙春明
论文数:
0
引用数:
0
h-index:
0
机构:
中国科学院计算技术研究所
孙春明
.
软件学报,
2008,
(01)
:82
-89
[3]
Machine learning in automated text categorization
[J].
Sebastiani, F
论文数:
0
引用数:
0
h-index:
0
机构:
CNR, Ist Elaboraz Informaz, I-56124 Pisa, Italy
CNR, Ist Elaboraz Informaz, I-56124 Pisa, Italy
Sebastiani, F
.
ACM COMPUTING SURVEYS,
2002,
34
(01)
:1
-47
[4]
中文文本分类语料库-TanCorpV1.0 .2 谭松波,王月粉. http://www.searchforum.org.cn/tansongbo/corpus1.php . 2006
←
1
→