基于电子病历的实体识别和知识图谱构建的研究

被引:28
作者
黄梦醒 [1 ,2 ]
李梦龙 [1 ,2 ]
韩惠蕊 [1 ,2 ]
机构
[1] 海南大学南海海洋资源利用国家重点实验室
[2] 海南大学信息科学技术学院
基金
海南省自然科学基金;
关键词
实体识别; 实体关系; 长短时记忆网络; 知识图谱;
D O I
10.19734/j.issn.1001-3695.2018.07.0414
中图分类号
R197.3 [医院、综合医院]; TP391.1 [文字信息处理];
学科分类号
1004 ; 120402 ; 081203 ; 0835 ;
摘要
针对中文电子病历中命名实体识别和实体关系抽取研究方法中存在的问题,提出了一种基于双向长短时记忆网络(bidirectional long short-term memory)与CRF(conditional random field)结合的实体识别和实体关系抽取方法。该方法首先使用词嵌入技术将文本转换为数值向量,作为神经网络BiLSTM的输入,再结合CRF链式结构进行序列标注,输出最大概率序列,并对识别结果知识图谱化。实验证明,该方法对中文电子病历进行实体识别和实体关系抽取时的准确率、召回率、F值有明显的提升。实验结果满足临床中系统应用需求,对帮助研究构建临床决策支持系统、个性化医疗推荐服务有引导作用。
引用
收藏
页码:3735 / 3739
页数:5
相关论文
共 18 条
[1]  
基于半监督学习的中文电子病历分词和名实体挖掘.[D].张立邦.哈尔滨工业大学.2014, 03
[2]  
面向中文电子病历的词性标注技术研究.[D].赵芳芳.哈尔滨工业大学.2014, 02
[3]  
统计学习方法.[M].李航; 著.清华大学出版社.2012,
[4]   一种基于深度学习的中文医学知识图谱构建方法 [P]. 
郑小林 ;
王维维 ;
扈中凯 ;
黄嘉伟 .
中国专利 :CN106776711B ,2017-05-31
[5]   基于CNN-BLSTM-CRF模型的生物医学命名实体识别 [J].
李丽双 ;
郭元凯 .
中文信息学报, 2018, 32 (01) :116-122
[6]   知识图谱发展与构建的研究进展 [J].
朱木易洁 ;
鲍秉坤 ;
徐常胜 .
南京信息工程大学学报(自然科学版), 2017, 9 (06) :575-582
[7]   CRF与词典相结合的疾病命名实体识别 [J].
龙光宇 ;
徐云 .
微型机与应用, 2017, 36 (21) :51-53
[8]   基于中文电子病历的跨科室组块分析 [J].
戴雪 ;
蒋志鹏 ;
关毅 .
计算机应用研究, 2017, 34 (07) :2084-2087
[9]   中文电子病历命名实体和实体关系语料库构建 [J].
杨锦锋 ;
关毅 ;
何彬 ;
曲春燕 ;
于秋滨 ;
刘雅欣 ;
赵永杰 .
软件学报, 2016, 27 (11) :2725-2746
[10]   知识图谱构建技术综述 [J].
刘峤 ;
李杨 ;
段宏 ;
刘瑶 ;
秦志光 .
计算机研究与发展, 2016, 53 (03) :582-600