基于SVM的高维混合特征短文本情感分类

被引:15
作者
王义真
郑啸
后盾
胡昊
机构
[1] 安徽工业大学计算机科学与技术学院
关键词
情感分类; 混合特征; 支持向量机; 情感词典;
D O I
暂无
中图分类号
TP391.1 [文字信息处理];
学科分类号
081203 ; 0835 ;
摘要
针对短文本具有的稀疏性、不规范性、主题不明确性等相关特点,提出一种基于SVM的高维混合特征模型。首先介绍了兼顾语义和情感的6类特征:表情符号特征、词聚类特征、词性标注特征、n-gram特征、否定特征和情感词典。其中主要介绍了该6类特征的概念、抽取方式以及输出形式;其次在第六届中文倾向性分析评测(COAE2014)为基础的数据集上,采用5折交叉的方法对该模型进行了有效性验证,其平均准确率为84.69%、平均召回率为83.13%,而平均F1值为83.90%;接着探讨了SVM惩罚系数对实验的影响;最后将该模型与一步三分类方法、Recursive Auto Encoder、Doc2vec做了对比分析,结果表明提出的模型对短文本情感分类更有效。
引用
收藏
页码:88 / 93
页数:6
相关论文
共 6 条
[1]   基于深度学习的微博情感分析 [J].
梁军 ;
柴玉梅 ;
原慧斌 ;
昝红英 ;
刘铭 .
中文信息学报, 2014, (05) :155-161
[2]   基于层次结构的多策略中文微博情感分析和特征抽取 [J].
谢丽星 ;
周明 ;
孙茂松 .
中文信息学报, 2012, 26 (01) :73-83
[3]   基于语义理解的中文博文倾向性分析 [J].
何凤英 .
计算机应用, 2011, 31 (08) :2130-2133+2137
[4]   文本情感分析 [J].
赵妍妍 ;
秦兵 ;
刘挺 .
软件学报, 2010, 21 (08) :1834-1848
[5]   基于情感词典扩展技术的网络舆情倾向性分析 [J].
杨超 ;
冯时 ;
王大玲 ;
杨楠 ;
于戈 .
小型微型计算机系统, 2010, 31 (04) :691-695
[6]  
Senti-lexicon and improved Na?ve Bayes algorithms for sentiment analysis of restaurant reviews[J] . Hanhoon Kang,Seong Joon Yoo,Dongil Han.Expert Systems With Applications . 2011 (5)