基于BLSTM的命名实体识别方法

被引:49
作者
冯艳红 [1 ,2 ]
于红 [1 ,2 ]
孙庚 [1 ,2 ]
孙娟娟 [1 ]
机构
[1] 大连海洋大学信息工程学院
[2] 大连海洋大学辽宁省海洋信息技术重点实验室
关键词
BLSTM; 命名实体; 词向量; 代价函数;
D O I
暂无
中图分类号
TP391.1 [文字信息处理];
学科分类号
081203 ; 0835 ;
摘要
传统的命名实体识别方法直接依靠大量的人工特征和专门的领域知识,解决了监督学习语料不足的问题,但设计人工特征和获取领域知识的代价昂贵。针对该问题,提出一种基于BLSTM(Bidirectional Long Short-Term Memory)的神经网络结构的命名实体识别方法。该方法不再直接依赖于人工特征和领域知识,而是利用基于上下文的词向量和基于字的词向量,前者表达命名实体的上下文信息,后者表达构成命名实体的前缀、后缀和领域信息;同时,利用标注序列中标签之间的相关性对BLSTM的代价函数进行约束,并将领域知识嵌入模型的代价函数中,进一步增强模型的识别能力。实验表明,所提方法的识别效果优于传统方法。
引用
收藏
页码:261 / 268
页数:8
相关论文
共 9 条
[1]   基于词向量和条件随机场的领域术语识别方法 [J].
冯艳红 ;
于红 ;
孙庚 ;
赵禹锦 .
计算机应用, 2016, 36 (11) :3146-3151
[2]   基于词表示方法的生物医学命名实体识别 [J].
李丽双 ;
何红磊 ;
刘珊珊 ;
黄德根 .
小型微型计算机系统, 2016, 37 (02) :302-307
[3]   基于构成模式和条件随机场的企业简称预测 [J].
孙丽萍 ;
过弋 ;
唐文武 ;
徐永斌 .
计算机应用, 2016, 36 (02) :449-454
[4]   面向军事文本的命名实体识别 [J].
冯蕴天 ;
张宏军 ;
郝文宁 .
计算机科学, 2015, 42 (07) :15-18+47
[5]   基于SVM和CRF的双层模型中文机构名识别 [J].
黄德根 ;
李泽中 ;
万如 .
大连理工大学学报, 2010, 50 (05) :782-787
[6]  
基于深度学习的中文命名实体识别研究[D]. 王国昱.北京工业大学. 2015
[7]  
Framewise phoneme classification with bidirectional LSTM and other neural network architectures[J] . Alex Graves,Jürgen Schmidhuber.Neural Networks . 2005 (5)
[8]   Long short-term memory [J].
Hochreiter, S ;
Schmidhuber, J .
NEURAL COMPUTATION, 1997, 9 (08) :1735-1780
[9]  
搜狗全网新闻数据[SogouCA] .2 http://www.sogou.com/labs/dl/ca.html . 2017