基于Lattice LSTM的古汉语命名实体识别

被引:17
作者
崔丹丹
刘秀磊
陈若愚
刘旭红
李臻
齐林
机构
[1] 北京信息科技大学计算机学院
基金
国家重点研发计划;
关键词
古汉语; 命名实体识别; BiLSTM-CRF; Lattice LSTM; 深度学习;
D O I
暂无
中图分类号
H109.2 [古代汉语]; TP391.1 [文字信息处理];
学科分类号
0501 ; 050103 ; 081203 ; 0835 ;
摘要
基于《四库全书》数据集,研究古汉语的命名实体识别技术。提出了基于Lattice LSTM模型的古汉语命名实体识别算法,该方法将字符序列信息和词序列信息共同作为模型的输入。采用甲言(jiayan)分词工具,利用word2vec训练古文字、词向量并作为Lattice LSTM模型的输入,提升了古汉语命名实体识别的效果。基于Lattice LSTM模型和预训练的古文字、词向量,提高了古汉语的实体识别效果,相比传统的BiLSTM-CRF模型,其F1分数提升3.95%左右。
引用
收藏
页码:18 / 22
页数:5
相关论文
共 8 条
[1]   命名实体识别技术综述 [J].
陈曙东 ;
欧阳小叶 .
无线电通信技术, 2020, 46 (03) :251-260
[2]   Lattice LSTM神经网络法中文医学文本命名实体识别模型研究 [J].
王博冉 ;
林夏 ;
朱晓东 ;
朱万琳 ;
马学华 .
中国卫生信息管理杂志, 2019, 16 (01) :84-88
[3]   基于Lattice-LSTM的多粒度中文分词 [J].
张文静 ;
张惠蒙 ;
杨麟儿 ;
荀恩东 .
中文信息学报, 2019, 33 (01) :18-24
[4]   基于LSTM-CRF命名实体识别技术的研究与应用 [J].
张聪品 ;
方滔 ;
刘昱良 .
计算机技术与发展, 2019, 29 (02) :106-108+142
[5]   基于BiLSTM-CNN-CRF模型的维吾尔文命名实体识别 [J].
买买提阿依甫 ;
吾守尔·斯拉木 ;
帕丽旦·木合塔尔 ;
杨文忠 .
计算机工程, 2018, 44 (08) :230-236
[6]   基于词典匹配的蒙古文命名实体识别研究 [J].
包敏娜 ;
斯劳格劳 .
中央民族大学学报(哲学社会科学版), 2017, 44 (03) :165-169
[7]  
Hybrid semi-markovcrf for neural sequence labeling .2 YE Z X,LING Z H. . 2018
[8]  
CharNER:Character-Level Named Entity Recognition .2 Kuru O,Can O A,Yuret D. COLING . 2016