基于词典与机器学习的中文微博情感分析研究

被引:48
作者
孙建旺
吕学强
张雷瀚
机构
[1] 北京信息科技大学网络文化与数字传播北京市重点实验室
基金
北京市自然科学基金;
关键词
微博; 表情符号; 极性值; 位置权重; 情感分类;
D O I
暂无
中图分类号
TP391.1 [文字信息处理];
学科分类号
081203 ; 0835 ;
摘要
随着Web2.0时代的兴起,与微博相关的研究得到学术界和工业界的广泛关注。选取微博文本中的动词和形容词作为特征;提出基于层次结构的特征降维方法;采用设计的基于表情符号的方法计算特征极性值;在此基础上,提出基于特征极性值的位置权重计算方法,借助SVM作为机器学习模型将微博文本分为正面、负面和中性三类。实验结果表明,提出的方法能够比较有效地对中文微博文本进行情感分类。
引用
收藏
页码:177 / 181
页数:5
相关论文
共 7 条
[1]  
现代汉语否定副词研究.[D].郝雷红.首都师范大学.2003, 03
[2]   一种基于极性词典的情感分析方法 [J].
张成功 ;
刘培玉 ;
朱振方 ;
方明 .
山东大学学报(理学版), 2012, 47 (03) :47-50
[3]   基于层次结构的多策略中文微博情感分析和特征抽取 [J].
谢丽星 ;
周明 ;
孙茂松 .
中文信息学报, 2012, 26 (01) :73-83
[4]   基于机器学习的中文微博情感分类实证研究 [J].
刘志明 ;
刘鲁 .
计算机工程与应用, 2012, 48 (01) :1-4
[5]   对层次聚类算法的改进 [J].
段明秀 ;
杨路明 .
湖南理工学院学报(自然科学版), 2008, (02) :28-29+36
[6]   程度副词的特点范围与分类 [J].
蔺璜 ;
郭姝慧 .
山西大学学报(哲学社会科学版), 2003, (02) :71-74
[7]   Use of negation phrases in automatic sentiment classification of product reviews [J].
Na, JC ;
Khoo, C ;
Wu, PHJ .
LIBRARY COLLECTIONS ACQUISITIONS & TECHNICAL SERVICES, 2005, 29 (02) :180-191