首页
学术期刊
论文检测
AIGC检测
热点
更多
数据
用于文本分类的特征项权重算法改进
被引:9
作者
:
龚静
论文数:
0
引用数:
0
h-index:
0
机构:
湖南环境生物职业技术学院信息技术系
龚静
胡平霞
论文数:
0
引用数:
0
h-index:
0
机构:
湖南环境生物职业技术学院信息技术系
胡平霞
胡灿
论文数:
0
引用数:
0
h-index:
0
机构:
湖南环境生物职业技术学院信息技术系
胡灿
机构
:
[1]
湖南环境生物职业技术学院信息技术系
来源
:
计算机技术与发展
|
2014年
/ 24卷
/ 09期
关键词
:
文本分类;
特征项;
权重;
改进;
D O I
:
暂无
中图分类号
:
TP391.1 [文字信息处理];
学科分类号
:
081203 ;
0835 ;
摘要
:
TF-IDF算法是文本分类中一种常用的权重计算方法,但是TF-IDF仅仅考虑了特征项在文本中出现的次数以及该特征项在训练集中的出现频率,没有考虑特征项在各个类间的分布情况及特征项的语义信息。因此针对TF-IDF的不足提出了一种改进的TF-IDF算法,此算法既考虑了特征项在类内的分布情况又考虑了特征项的位置及长度等语义因素,能更好地反映特征项的重要性。用朴素贝叶斯分类器验证其有效性,实验结果表明该算法优于TF-IDF算法,能较好地提高文本分类的准确率。
引用
收藏
页码:128 / 132
页数:5
相关论文
共 11 条
[1]
中文文本分类中的特征选择和权重计算方法研究.[D].宋惟然.北京工业大学.2013, 03
[2]
改进TF-IDF算法的文本特征项权值计算方法
[J].
论文数:
引用数:
h-index:
机构:
路永和
;
论文数:
引用数:
h-index:
机构:
李焰锋
.
图书情报工作 ,
2013,
(03)
:90
-95
[3]
基于改进权重贝叶斯的维文文本分类模型
[J].
论文数:
引用数:
h-index:
机构:
李艳姣
;
蒋同海
论文数:
0
引用数:
0
h-index:
0
机构:
中国科学院研究生院
中国科学院研究生院
蒋同海
.
计算机工程与设计,
2012,
33
(12)
:4726
-4730
[4]
基于特征权重与词间相关性的文本特征选择算法
[J].
任永功
论文数:
0
引用数:
0
h-index:
0
机构:
辽宁师范大学计算机与信息技术学院
任永功
;
论文数:
引用数:
h-index:
机构:
杨荣杰
;
论文数:
引用数:
h-index:
机构:
尹明飞
.
计算机应用与软件,
2012,
29
(09)
:33
-36
[5]
动态自适应特征权重的多类文本分类算法研究
[J].
裴颂文
论文数:
0
引用数:
0
h-index:
0
机构:
上海理工大学计算机科学与工程系
上海理工大学计算机科学与工程系
裴颂文
;
论文数:
引用数:
h-index:
机构:
吴百锋
.
计算机应用研究,
2011,
28
(11)
:4092
-4096
[6]
文本分类中基于改进的词语权重算法的研究
[J].
论文数:
引用数:
h-index:
机构:
侯艳钗
;
沈西挺
论文数:
0
引用数:
0
h-index:
0
机构:
河北工业大学计算机科学与软件学院
沈西挺
.
微计算机信息,
2011,
27
(06)
:211
-213
[7]
文本分类特征权重改进算法
[J].
台德艺
论文数:
0
引用数:
0
h-index:
0
机构:
合肥学院机器视觉与智能控制技术重点实验室
台德艺
;
论文数:
引用数:
h-index:
机构:
王俊
.
计算机工程,
2010,
36
(09)
:197
-199+202
[8]
文本分类中词语权重计算方法的改进与应用
[J].
熊忠阳
论文数:
0
引用数:
0
h-index:
0
机构:
重庆大学计算机学院
熊忠阳
;
黎刚
论文数:
0
引用数:
0
h-index:
0
机构:
重庆大学计算机学院
黎刚
;
陈小莉
论文数:
0
引用数:
0
h-index:
0
机构:
重庆大学计算机学院
陈小莉
;
陈伟
论文数:
0
引用数:
0
h-index:
0
机构:
重庆大学计算机学院
陈伟
.
计算机工程与应用,
2008,
(05)
:187
-189
[9]
文本层次分类中特征项权重算法的比较研究
[J].
论文数:
引用数:
h-index:
机构:
谭金波
.
情报杂志,
2007,
(09)
:87
-88+91
[10]
自动文本分类中权值公式的改进
[J].
寇莎莎
论文数:
0
引用数:
0
h-index:
0
机构:
解放军信息工程大学信息研究系,解放军信息工程大学信息研究系河南郑州,河南郑州
寇莎莎
;
魏振军
论文数:
0
引用数:
0
h-index:
0
机构:
解放军信息工程大学信息研究系,解放军信息工程大学信息研究系河南郑州,河南郑州
魏振军
.
计算机工程与设计,
2005,
(06)
:1616
-1618
←
1
2
→
共 11 条
[1]
中文文本分类中的特征选择和权重计算方法研究.[D].宋惟然.北京工业大学.2013, 03
[2]
改进TF-IDF算法的文本特征项权值计算方法
[J].
论文数:
引用数:
h-index:
机构:
路永和
;
论文数:
引用数:
h-index:
机构:
李焰锋
.
图书情报工作 ,
2013,
(03)
:90
-95
[3]
基于改进权重贝叶斯的维文文本分类模型
[J].
论文数:
引用数:
h-index:
机构:
李艳姣
;
蒋同海
论文数:
0
引用数:
0
h-index:
0
机构:
中国科学院研究生院
中国科学院研究生院
蒋同海
.
计算机工程与设计,
2012,
33
(12)
:4726
-4730
[4]
基于特征权重与词间相关性的文本特征选择算法
[J].
任永功
论文数:
0
引用数:
0
h-index:
0
机构:
辽宁师范大学计算机与信息技术学院
任永功
;
论文数:
引用数:
h-index:
机构:
杨荣杰
;
论文数:
引用数:
h-index:
机构:
尹明飞
.
计算机应用与软件,
2012,
29
(09)
:33
-36
[5]
动态自适应特征权重的多类文本分类算法研究
[J].
裴颂文
论文数:
0
引用数:
0
h-index:
0
机构:
上海理工大学计算机科学与工程系
上海理工大学计算机科学与工程系
裴颂文
;
论文数:
引用数:
h-index:
机构:
吴百锋
.
计算机应用研究,
2011,
28
(11)
:4092
-4096
[6]
文本分类中基于改进的词语权重算法的研究
[J].
论文数:
引用数:
h-index:
机构:
侯艳钗
;
沈西挺
论文数:
0
引用数:
0
h-index:
0
机构:
河北工业大学计算机科学与软件学院
沈西挺
.
微计算机信息,
2011,
27
(06)
:211
-213
[7]
文本分类特征权重改进算法
[J].
台德艺
论文数:
0
引用数:
0
h-index:
0
机构:
合肥学院机器视觉与智能控制技术重点实验室
台德艺
;
论文数:
引用数:
h-index:
机构:
王俊
.
计算机工程,
2010,
36
(09)
:197
-199+202
[8]
文本分类中词语权重计算方法的改进与应用
[J].
熊忠阳
论文数:
0
引用数:
0
h-index:
0
机构:
重庆大学计算机学院
熊忠阳
;
黎刚
论文数:
0
引用数:
0
h-index:
0
机构:
重庆大学计算机学院
黎刚
;
陈小莉
论文数:
0
引用数:
0
h-index:
0
机构:
重庆大学计算机学院
陈小莉
;
陈伟
论文数:
0
引用数:
0
h-index:
0
机构:
重庆大学计算机学院
陈伟
.
计算机工程与应用,
2008,
(05)
:187
-189
[9]
文本层次分类中特征项权重算法的比较研究
[J].
论文数:
引用数:
h-index:
机构:
谭金波
.
情报杂志,
2007,
(09)
:87
-88+91
[10]
自动文本分类中权值公式的改进
[J].
寇莎莎
论文数:
0
引用数:
0
h-index:
0
机构:
解放军信息工程大学信息研究系,解放军信息工程大学信息研究系河南郑州,河南郑州
寇莎莎
;
魏振军
论文数:
0
引用数:
0
h-index:
0
机构:
解放军信息工程大学信息研究系,解放军信息工程大学信息研究系河南郑州,河南郑州
魏振军
.
计算机工程与设计,
2005,
(06)
:1616
-1618
←
1
2
→