基于混合语言信息的词语搭配倾向判别方法

被引:8
作者
王素格 [1 ,2 ]
杨安娜 [1 ]
机构
[1] 山西大学数学科学学院
[2] 山西大学计算智能与中文信息处理教育部重点实验室
关键词
计算机应用; 中文信息处理; 词语搭配; 搭配模式; 情感倾向判别; 概率潜在语义模型;
D O I
暂无
中图分类号
TP391.1 [文字信息处理];
学科分类号
081203 ; 0835 ;
摘要
具有较强褒贬倾向的词语搭配对于文本的情感分析具有重要的价值。该文提出了一种混合语言信息的词语搭配的倾向判别方法。该方法首先根据词语搭配六种模式的特点,确定出各模式的概率潜在语义模型,然后利用这些语义模型判别搭配的情感倾向。最后对部分包含情感词的搭配再利用规则修正其先前标注的情感倾向。基于汽车语料的实验结果表明,基于混合语言信息的词语搭配情感倾向判别方法优于单纯基于概率潜在语义模型或规则的方法。
引用
收藏
页码:69 / 74
页数:6
相关论文
共 5 条
[1]   自动获取汉语词语搭配 [J].
王素格 ;
杨军玲 ;
张武 .
中文信息学报, 2006, (06) :31-37
[2]  
基于Web的评论文本情感分类问题研究[D]. 王素格.上海大学 2008
[3]   Use of negation phrases in automatic sentiment classification of product reviews [J].
Na, JC ;
Khoo, C ;
Wu, PHJ .
LIBRARY COLLECTIONS ACQUISITIONS & TECHNICAL SERVICES, 2005, 29 (02) :180-191
[4]   Unsupervised Learning by Probabilistic Latent Semantic Analysis [J].
Thomas Hofmann .
Machine Learning, 2001, 42 :177-196
[5]  
Probabilistic Latent Semantic Analysis. Hofmann T. Proc of the15th Conference on Uncertainty in Artificial Intelligence . 1999