多语言文本情绪分析模型MF-CSEL

被引:5
作者
徐源音 [1 ]
柴玉梅 [1 ]
王黎明 [1 ]
刘箴 [2 ]
机构
[1] 郑州大学信息工程学院
[2] 宁波大学信息科学与工程学院
关键词
情绪分析; 多语言文本; 代价敏感; 多特征融合;
D O I
暂无
中图分类号
TP391.1 [文字信息处理];
学科分类号
081203 ; 0835 ;
摘要
现有的情绪分析方法大多针对单语言文本,但类似中英文混合的多语言表达方式被广泛应用于微博、Twitter等网络社交平台中,多语言文本情绪分析成为情感分析研究领域的重要问题之一.本文针对中英混合文本提出情绪分析模型MF-CSEL,首先基于CBOW模型训练词向量,提出新的词向量组合方式学习含有语序信息的文本向量,并针对不同语言分别提取文本情感特征,融合TF-IDF权值矩阵,最后通过代价敏感集成学习方法对多语言文本进行细粒度的情感分析.本文提出基于语义相似度的样本空间重构算法以平衡数据集,降低错分代价,使用代价敏感集成策略去融合基分类器SVM和NB的分类结果以得到最终实验结果.同NLPCC2018多语言文本情绪分析任务的评测结果对比,结果表明本文方法具有有效性.
引用
收藏
页码:1026 / 1033
页数:8
相关论文
共 11 条
[1]   文本情绪分析综述 [J].
李然 ;
林政 ;
林海伦 ;
王伟平 ;
孟丹 .
计算机研究与发展, 2018, (01) :30-52
[2]   Twitter推文与情感词典SentiWordNet匹配算法研究 [J].
易顺明 ;
周洪斌 ;
周国栋 .
南京师范大学学报(工程技术版), 2016, 16 (03) :41-47+53
[3]   基于双语词典的微博多类情感分析方法 [J].
栗雨晴 ;
礼欣 ;
韩煦 ;
宋丹丹 ;
廖乐健 .
电子学报, 2016, 44 (09) :2068-2073
[4]   基于深度学习的微博情感分析 [J].
梁军 ;
柴玉梅 ;
原慧斌 ;
昝红英 ;
刘铭 .
中文信息学报, 2014, (05) :155-161
[5]   文本情感分析 [J].
赵妍妍 ;
秦兵 ;
刘挺 .
软件学报, 2010, 21 (08) :1834-1848
[6]   代价敏感分类算法的实验比较 [J].
闫明松 ;
周志华 .
模式识别与人工智能, 2005, 18 (05) :628-635
[7]  
The evolution of sentiment analysis—A review of research topics, venues, and top cited papers [J] . Mika V. M?ntyl?,Daniel Graziotin,Miikka Kuutila.&nbsp&nbspComputer Science Review . 2018
[8]   A Review of Sentiment Analysis Research in Chinese Language [J].
Peng, Haiyun ;
Cambria, Erik ;
Hussain, Amir .
COGNITIVE COMPUTATION, 2017, 9 (04) :423-435
[9]  
Sentiment analysis leveraging emotions and word embeddings [J] . Maria Giatsoglou,Manolis G. Vozalis,Konstantinos Diamantaras,Athena Vakali,George Sarigiannidis,Konstantinos Ch. Chatzisavvas.&nbsp&nbspExpert Systems With Applications . 2017
[10]   Emotion Analysis in Code-Switching Text With Joint Factor Graph Model [J].
Wang, Zhongqing ;
Lee, Sophia Yat Mei ;
Li, Shoushan ;
Zhou, Guodong .
IEEE-ACM TRANSACTIONS ON AUDIO SPEECH AND LANGUAGE PROCESSING, 2017, 25 (03) :469-480