基于卷积神经网络的互联网短文本分类方法

被引:14
作者
郭东亮
刘小明
郑秋生
机构
[1] 中原工学院计算机学院
关键词
卷积神经网络; 短文本分类; 深度学习; 机器学习;
D O I
暂无
中图分类号
TP391.1 [文字信息处理]; TP183 [人工神经网络与计算];
学科分类号
081203 ; 0835 ; 081104 ; 0812 ; 1405 ;
摘要
互联网短文本的分类是自然语言处理的一个研究热点。本文提出一种基于卷积神经网络(Convolutional Neural Networks,CNNs)互联网短文本分类方法。首先通过Word2vec的Skip-gram模型获得短文特征,接着送入CNNs中进一步提取高层次特征,最后通过K-max池化操作后放入Softmax分类器得出分类模型。在实验中,该方法和机器学习方法以及DBN方法相比,结果表明本文方法不仅解决了文本向量的维数灾难和局部最优解问题,而且有效地提高了互联网短文本两级分类准确率,证实了基于CNNs的互联网短文本分类的有效性。
引用
收藏
页码:78 / 81
页数:4
相关论文
共 14 条
[11]  
微博自动分类方法研究及应用[D]. 江斌.哈尔滨工业大学. 2012
[12]  
基于决策树与SVM融合学习的科技文献分类方法研究[D]. 黄华.河南工业大学. 2011
[13]  
统计自然语言处理[M]. 清华大学出版社 , 宗成庆, 2007
[14]   基于SVM的多类文本分类研究 [J].
张爱丽 ;
刘广利 ;
刘长宇 ;
不详 .
情报杂志 , 2004, (09) :6-7+10