基于改进KNN的消费者评价信息情感分类研究

被引:2
作者
刘晓菲 [1 ]
丁香乾 [1 ]
石硕 [1 ]
李林春 [2 ]
李忠态 [2 ]
机构
[1] 中国海洋大学信息科学与工程学院
[2] 红塔烟草(集团)有限责任公司信息网络科
关键词
大数据; 特征降维; LSA算法; KNN算法; 情感分类;
D O I
暂无
中图分类号
TP391.1 [文字信息处理];
学科分类号
081203 ; 0835 ;
摘要
面对大数据时代消费者评价的海量信息,为了识别消费者评价信息的情感倾向,及时掌握消费者的评价信息反馈,采用K-近邻(KNN)算法对消费者评价信息进行情感分类,但是该算法在文本分类过程中因文本特征向量的维度高,使得算法的时间复杂度和空间复杂度较高,计算的开销很大。针对这一问题,通过对获取信息的文本结构以及情感表达特点的分析,采用一种改进的KNN算法进行文本情感分类。在对消费者评价信息进行分类时,先由潜在语义分析算法对文本特征向量进行降维处理,然后利用加权KNN算法进行分类。实验结果表明,该方法在提高文本分类速度的同时保持了良好的分类效果。
引用
收藏
页码:81 / 83+86 +86
页数:4
相关论文
共 6 条
[1]   基于K-近邻算法的文本情感分析方法研究 [J].
樊娜 ;
安毅生 ;
李慧贤 .
计算机工程与设计, 2012, 33 (03) :1160-1164
[2]   一种改进的KNN文本分类 [J].
钟将 ;
刘荣辉 .
计算机工程与应用, 2012, 48 (02) :142-144
[3]   基于聚类算法的KNN文本分类算法研究 [J].
江涛 ;
陈小莉 ;
张玉芳 ;
熊忠阳 .
计算机工程与应用, 2009, 45 (07) :153-155+158
[4]   基于密度的kNN文本分类器训练样本裁剪方法 [J].
李荣陆 ;
胡运发 .
计算机研究与发展, 2004, (04) :539-545
[5]  
用于Web文本分类的快速KNN算法.[J].王煜;白石;王正欧;.情报学报.2007, 01
[6]  
Rectified nearest feature line segment for pattern classification.[J].Hao Du;Yan Qiu Chen.Pattern Recognition.2006, 5