在线医疗问答文本的命名实体识别

被引:21
作者
杨文明
褚伟杰
机构
[1] 北京大学软件与微电子学院
关键词
医疗问答; 深度学习; 独立循环神经网络; 膨胀卷积; 双向循环神经网络;
D O I
10.15888/j.cnki.csa.006760
中图分类号
TP391.1 [文字信息处理]; TP183 [人工神经网络与计算];
学科分类号
081203 ; 0835 ; 081104 ; 0812 ; 1405 ;
摘要
本文主要是对在线问诊中产生的医疗文本进行命名实体识别的研究.使用在线医疗问答网站的数据,采用{B, I, O}标注体系构建数据集,抽取疾病、治疗、检查和症状四个医疗实体.以BiLSTM-CRF为基准模型,提出两种深度学习模型IndRNN-CRF和IDCNN-BiLSTM-CRF,并在自构建数据集上验证模型的有效性.将新提出的两种模型与基准模型通过实验对比得出:模型IDCNN-BiLSTM-CRF的F1值0.8116,超过了BiLSTM-CRF的F1值0.8009, IDCNN-BiLSTM-CRF整体性能好于BiLSTM-CRF模型;模型IndRNN-CRF的精确率0.8427,但该模型在召回率上低于基准模型BiLSTM-CRF.
引用
收藏
页码:8 / 14
页数:7
相关论文
共 3 条
[1]   基于深度学习的医疗命名实体识别 [J].
张帆 ;
王敏 .
计算技术与自动化, 2017, 36 (01) :123-127
[2]   在线医疗文本中的实体识别研究 [J].
苏娅 ;
刘杰 ;
黄亚楼 .
北京大学学报(自然科学版), 2016, 52 (01) :1-9
[3]   电子病历命名实体识别和实体关系抽取研究综述 [J].
杨锦锋 ;
于秋滨 ;
关毅 ;
蒋志鹏 .
自动化学报, 2014, 40 (08) :1537-1562