基于多线索混合词典的微博情绪识别

被引:7
作者
潘明慧
牛耘
机构
[1] 南京航空航天大学计算机科学与技术学院
关键词
微博; 情绪分析; 情绪词典; 表情符;
D O I
暂无
中图分类号
TP393.092 []; TP391.1 [文字信息处理];
学科分类号
080402 ; 081203 ; 0835 ;
摘要
微博等社交媒体为人们情绪表达提供了重要平台,分析微博的情绪倾向具有重要的商业价值和社会意义。文中提出了基于词典的规则方法识别微博所表达的喜、哀、怒、惧、恶、惊六种情绪。针对情绪表达的重要线索表情符利用互信息法生成了表情符词典,与传统情绪词典相结合,制定了针对否定用法的规则对微博进行分析。建立了第一个包含六种情绪的人工标注微博数据集。实验表明,传统的情绪词典虽然收录了大量词汇,但对于社交媒体文本分析的准确率和覆盖率都不高。表情符词典的应用显著地提高了微博情绪分析的精度和覆盖率。
引用
收藏
页码:28 / 32+36 +36
页数:6
相关论文
共 4 条
[1]   基于情感分布的微博热点事件发现 [J].
杨亮 ;
林原 ;
林鸿飞 .
中文信息学报, 2012, 26 (01) :84-90+109
[2]   基于层次结构的多策略中文微博情感分析和特征抽取 [J].
谢丽星 ;
周明 ;
孙茂松 .
中文信息学报, 2012, 26 (01) :73-83
[3]  
情感词汇本体的构造[J]. 徐琳宏,林鸿飞,潘宇,任惠,陈建美. 情报学报. 2008 (02)
[4]  
Hierarchical versus Flat Classification of Emotions in Text .2 Ghazi D,Inkpen D,Szpakowicz S. Proceedings of the NAACL HLT 2010Workshop on Computational Approaches to Analysis and Generation of Emotion in Text . 2010