基于Deep Belief Nets的中文名实体关系抽取

被引:70
作者
陈宇
郑德权
赵铁军
机构
[1] 哈尔滨工业大学计算机科学与技术学院
关键词
DBN(deep belief nets); 神经网络; 关系抽取; 深层网络; 字特征;
D O I
暂无
中图分类号
TP391.1 [文字信息处理];
学科分类号
081203 ; 0835 ;
摘要
关系抽取是信息抽取的一项子任务,用以识别文本中实体之间的语义关系.提出一种利用DBN(deepbelief nets)模型进行基于特征的实体关系抽取方法,该模型是由多层无监督的RBM(restricted Boltzmann machine)网络和一层有监督的BP(back-propagation)网络组成的神经网络分类器.RBM网络以确保特征向量映射达到最优,最后一层BP网络分类RBM网络的输出特征向量,从而训练实体关系分类器.在ACE04语料上进行的相关测试,一方面证明了字特征比词特征更适用于中文关系抽取任务;另一方面设计了3组不同的实验,分别使用正确的实体类别信息、通过实体类型分类器得到实体类型信息和不使用实体类型信息,用以比较实体类型信息对关系抽取效果的影响.实验结果表明,DBN非常适用于基于高维空间特征的信息抽取任务,获得的效果比SVM和反向传播网络更好.
引用
收藏
页码:2572 / 2585
页数:14
相关论文
共 11 条
[1]   基于特征组合的中文实体关系抽取 [J].
黄鑫 ;
朱巧明 ;
钱龙华 ;
刘梅梅 .
微电子学与计算机, 2010, 27 (04) :198-200+204
[2]   基于最大熵模型的观点句主观关系提取 [J].
樊娜 ;
蔡皖东 ;
赵煜 .
计算机工程, 2010, 36 (02) :4-6
[3]   基于核函数中文关系自动抽取系统的实现 [J].
刘克彬 ;
李芳 ;
刘磊 ;
韩颖 .
计算机研究与发展, 2007, (08) :1406-1411
[4]   基于种子自扩展的命名实体关系抽取方法 [J].
何婷婷 ;
徐超 ;
李晶 ;
赵君喆 .
计算机工程, 2006, (21) :183-184+193
[5]   中文名实体识别中的特征组合与特征融合的比较 [J].
赵健 ;
王晓龙 ;
关毅 .
计算机应用, 2005, (11) :2647-2649
[6]   前向神经网络隐含层节点数的一种优化算法 [J].
夏克文 ;
李昌彪 ;
沈钧毅 .
计算机科学, 2005, (10) :143-145
[7]   实体关系自动抽取 [J].
车万翔 ;
刘挺 ;
李生 .
中文信息学报, 2005, (02) :1-6
[8]  
Relation extraction and the influence of automatic named-entity recognition[J] . Claudio Giuliano,Alberto Lavelli,Lorenza Romano.ACM Transactions on Speech and Language Processing (TSLP) . 2007 (1)
[9]   A fast learning algorithm for deep belief nets [J].
Hinton, Geoffrey E. ;
Osindero, Simon ;
Teh, Yee-Whye .
NEURAL COMPUTATION, 2006, 18 (07) :1527-1554
[10]   Training products of experts by minimizing contrastive divergence [J].
Hinton, GE .
NEURAL COMPUTATION, 2002, 14 (08) :1771-1800