基于卷积神经网络的互联网短文本分类方法

被引:14
作者
郭东亮
刘小明
郑秋生
机构
[1] 中原工学院计算机学院
关键词
卷积神经网络; 短文本分类; 深度学习; 机器学习;
D O I
暂无
中图分类号
TP391.1 [文字信息处理]; TP183 [人工神经网络与计算];
学科分类号
081203 ; 0835 ; 081104 ; 0812 ; 1405 ;
摘要
互联网短文本的分类是自然语言处理的一个研究热点。本文提出一种基于卷积神经网络(Convolutional Neural Networks,CNNs)互联网短文本分类方法。首先通过Word2vec的Skip-gram模型获得短文特征,接着送入CNNs中进一步提取高层次特征,最后通过K-max池化操作后放入Softmax分类器得出分类模型。在实验中,该方法和机器学习方法以及DBN方法相比,结果表明本文方法不仅解决了文本向量的维数灾难和局部最优解问题,而且有效地提高了互联网短文本两级分类准确率,证实了基于CNNs的互联网短文本分类的有效性。
引用
收藏
页码:78 / 81
页数:4
相关论文
共 14 条
[1]   基于深度信念网络的文本分类算法 [J].
陈翠平 .
计算机系统应用, 2015, 24 (02) :121-126
[2]   基于最近邻子空间搜索的两类文本分类方法 [J].
李玉鑑 ;
王影 ;
冷强奎 .
计算机工程与科学, 2015, 37 (01) :168-172
[3]   用于大数据分类的KNN算法研究 [J].
耿丽娟 ;
李星毅 .
计算机应用研究, 2014, 31 (05) :1342-1344+1373
[4]   基于LDA主题模型的短文本分类方法 [J].
张志飞 ;
苗夺谦 ;
高灿 .
计算机应用, 2013, 33 (06) :1587-1590
[5]   基于SVM算法的文本分类技术研究 [J].
崔建明 ;
刘建明 ;
廖周宇 .
计算机仿真, 2013, 30 (02) :299-302+368
[6]   一种改进的贝叶斯网络短文本分类算法 [J].
郭泗辉 ;
樊兴华 .
广西师范大学学报(自然科学版), 2010, 28 (03) :140-143
[7]   基于自适应中文分词和近似SVM的文本分类算法 [J].
冯永 ;
李华 ;
钟将 ;
叶春晓 .
计算机科学, 2010, 37 (01) :251-254+293
[8]   TFIDF算法研究综述 [J].
施聪莺 ;
徐朝军 ;
杨晓江 .
计算机应用, 2009, 29(S1) (S1) :167-170+180
[9]   中文停用词表的自动选取 [J].
顾益军 ;
樊孝忠 ;
王建华 ;
汪涛 ;
黄维金 .
北京理工大学学报, 2005, (04) :337-340
[10]   使用KNN算法的文本分类 [J].
张宁 ;
贾自艳 ;
史忠植 .
计算机工程, 2005, (08) :171-172+185