共 3 条
在线医疗问答文本的命名实体识别
被引:21
作者:
杨文明
褚伟杰
机构:
[1] 北京大学软件与微电子学院
来源:
关键词:
医疗问答;
深度学习;
独立循环神经网络;
膨胀卷积;
双向循环神经网络;
D O I:
10.15888/j.cnki.csa.006760
中图分类号:
TP391.1 [文字信息处理];
TP183 [人工神经网络与计算];
学科分类号:
081203 ;
0835 ;
081104 ;
0812 ;
1405 ;
摘要:
本文主要是对在线问诊中产生的医疗文本进行命名实体识别的研究.使用在线医疗问答网站的数据,采用{B, I, O}标注体系构建数据集,抽取疾病、治疗、检查和症状四个医疗实体.以BiLSTM-CRF为基准模型,提出两种深度学习模型IndRNN-CRF和IDCNN-BiLSTM-CRF,并在自构建数据集上验证模型的有效性.将新提出的两种模型与基准模型通过实验对比得出:模型IDCNN-BiLSTM-CRF的F1值0.8116,超过了BiLSTM-CRF的F1值0.8009, IDCNN-BiLSTM-CRF整体性能好于BiLSTM-CRF模型;模型IndRNN-CRF的精确率0.8427,但该模型在召回率上低于基准模型BiLSTM-CRF.
引用
收藏
页码:8 / 14
页数:7
相关论文

