产品评论中的隐式属性抽取研究

被引:8
作者
张莉 [1 ]
许鑫 [2 ]
机构
[1] 南京大学计算机科学与技术系
[2] 华东师范大学商学院信息学系
关键词
意见挖掘; 显式属性; 隐式属性; 产品评论;
D O I
暂无
中图分类号
TP391.1 [文字信息处理];
学科分类号
081203 ; 0835 ;
摘要
【目的】产品领域的意见挖掘是近年来的一个非常热门的话题,意见挖掘结果可以帮助过滤有害信息、进行社会舆情分析、指导用户消费和帮助商家改善产品性能等,而隐式产品属性在网络评论句中十分常见且挖掘难度大,因此对其进行研究有重要的意义。【方法】利用仅包含显式属性的某品牌汽车评论句确定多词性精简意见词,并利用同义词词林进行扩展形成意见簇,同时基于领域常用语确定属性词,并通过搭配关系计算权重,生成记录形如"{属性,意见,权重}"的字典,利用多策略隐式属性抽取算法以字典为基础抽取隐式属性,同时考虑待匹配意见词与字典中的意见词之间的相似度。【结果】可以行之有效地抽取出评论句中的隐式属性,F值达到75.55%,属于隐式产品属性抽取现有研究的较好结果。【局限】前期数据标注工作主要靠人工,较为费时费力。【结论】实验结果表明本文算法效果较好,具有一定的实用价值。
引用
收藏
页码:42 / 47
页数:6
相关论文
共 4 条
[1]   基于正则化主题建模的隐式产品属性抽取 [J].
仇光 ;
郑淼 ;
张晖 ;
朱建科 ;
卜佳俊 ;
陈纯 ;
杭航 .
浙江大学学报(工学版), 2011, 45 (02) :288-294
[2]  
Implicit Feature Identification in Chinese Reviews using Explicit Topic Mining Model[J] . Hua Xu,Fan Zhang,Wei Wang.Knowledge-Based Systems . 2014
[3]  
Determining the sentiment of opinions .2 Soo-Min Kim,Eduard Hovy. Proceedings of the 20th International Conference on Computational Linguistics(COLING 2004) . 2004
[4]  
Computer Processing of Oriental Languages. Beyond the Orient: The ResearchChallenges Ahead .2 Qi Su,Kun Xiang,Houfeng Wang,Bin Sun,Shiwen Yu. . 2006