基于SVM和CRF多特征组合的微博情感分析

被引:81
作者
李婷婷
姬东鸿
机构
[1] 武汉大学计算机学院
基金
国家自然科学基金重点项目;
关键词
微博; 情感分析; 支持向量机; 条件随机场;
D O I
暂无
中图分类号
TP391.1 [文字信息处理]; TP393.092 [];
学科分类号
081203 ; 0835 ; 080402 ;
摘要
近年来,文本的情感分析一直都是自然语言处理领域所研究的热点问题;微博作为一种短文本,用词精炼而简洁,富含观点、倾向和态度。因此,识别微博的情感倾向具有重要的现实意义。提出一种基于SVM和CRF的情感分析方法,使用多种文本特征,包括词、词性、情感词、否定词、程度副词和特殊符号等,并选用不同的特征组合,通过多组实验使情感分析效果最优。实验显示,选用词性、情感词和否定词的特征组合时,SVM模型的正确率达到88.72%,选用情感词、否定词、程度副词和特殊符号的特征组合时,CRF模型的正确率达到90.44%。
引用
收藏
页码:978 / 981
页数:4
相关论文
共 1 条
[1]  
ThumbsUporThumbsDown?SemanticOrientationAppliedtoUnsupervisedClassificationofReviews.2TurneyPeter.Proceedingsofthe40thAnnualMeetingoftheAssociationforComputationalLinguistics.2002