在线用户评论细粒度属性抽取

被引:27
作者
周清清 [1 ,2 ]
章成志 [1 ,3 ,2 ]
机构
[1] 南京理工大学信息管理系
[2] 福建省信息处理与智能控制重点实验室(闽江学院)
[3] 江苏省数据工程与知识服务重点实验室(南京大学)
关键词
属性抽取; 属性聚类; 深度学习; 近邻传播聚类; 细粒度属性;
D O I
暂无
中图分类号
G254 [文献标引与编目];
学科分类号
1205 ; 120501 ;
摘要
随着在线评论信息数量的快速增长与应用的不断扩展,评论挖掘研究得到学术界的持续关注。当前的评论挖掘任务对属性的全面性、细粒度等要求越来越高,而多数现有研究方法主要关注评价对象主要属性的抽取。尽可能地发现评价对象的全部用户关注属性、并以细粒度方式表述属性,是一项有意义的工作。本文提出一种细粒度属性抽取方法,旨在全面、快速地抽取产品属性。本文首先利用高频名词构建候选属性词;然后通过深度学习构建候选属性词向量,在此基础上完成候选属性的聚类,得到聚类后的候选属性词集;最后对候选属性词集进行噪音过滤,得到细粒度产品属性集。在饮食、手机、图书等三个领域评论语料上的实验结果表明,相对于基于种子词的方法、基于结合人工的LDA方法及基于情感词的方法,本文方法能够更加全面地发现评价对象属性,并且能够给出细粒度的属性。
引用
收藏
页码:484 / 493
页数:10
相关论文
共 2 条
[1]   AN LDA AND SYNONYM LEXICON BASED APPROACH TO PRODUCT FEATURE EXTRACTION FROM ONLINE CONSUMER PRODUCT REVIEWS [J].
Ma, Baizhang ;
Zhang, Dongsong ;
Yan, Zhijun ;
Kim, Taeha .
JOURNAL OF ELECTRONIC COMMERCE RESEARCH, 2013, 14 (04) :304-314
[2]  
A vector space model for automatic indexing[J] . G. Salton,A. Wong,C. S. Yang.Communications of the ACM . 1975 (11)