基于深度学习模型的菊花古典诗词命名实体识别

被引:32
作者
崔竞烽
郑德俊
王东波
李婷婷
机构
[1] 南京农业大学信息科技学院
关键词
深度学习; 菊花诗词; 命名实体识别; BERT模型; BiLSTM模型;
D O I
10.16353/j.cnki.1000-7490.2020.11.024
中图分类号
I207.2 [诗歌、韵文]; TP18 [人工智能理论]; TP391.1 [文字信息处理];
学科分类号
0501 ; 081104 ; 0812 ; 0835 ; 1405 ; 081203 ;
摘要
[目的/意义]菊花古典诗词的命名实体识别有助于深度挖掘菊花诗词文本之间的关联,传承菊花文化,助力菊花产业及乡村文化旅游,同时也为其他花卉诗词的文本深度挖掘提供了思路。[方法/过程]文章通过网络、论文和书籍进行菊花古典诗词数据的采集,重点选择诗词中涉及的时间、地点、季节、花名、花色、人物和节日7类命名实体进行标注和识别,得到BiLSTM、BiLSTM-CRF和BERT模型不同识别结果,并与CRF模型识别结果进行对比。[结果/结论]BERT模型在菊花古诗词文本的命名实体识别中表现优异,实体识别的调和平均数高于其他模型,最优调和平均数达到91.60%。BERT模型可用于菊花古诗词文本的深层次挖掘研究,并可向更多的花卉诗词扩展,古诗词文本的命名实体标注体系可以为后续研究提供借鉴。
引用
收藏
页码:150 / 155
页数:6
相关论文
共 15 条
[1]   基于BERT的警情文本命名实体识别 [J].
王月 ;
王孟轩 ;
张胜 ;
杜渂 .
计算机应用, 2020, 40 (02) :535-540
[2]   基于BERT的中文命名实体识别方法 [J].
王子牛 ;
姜猛 ;
高建瓴 ;
陈娅先 .
计算机科学, 2019, 46(S2) (S2) :138-142
[3]   基于BERT嵌入的中文命名实体识别方法 [J].
杨飘 ;
董文永 .
计算机工程, 2020, 46 (04) :40-45+52
[4]   基于BiLSTM-CRF的商情实体识别模型 [J].
张应成 ;
杨洋 ;
蒋瑞 ;
全兵 ;
张利君 ;
任晓雷 .
计算机工程, 2019, 45 (05) :308-314
[5]   Bert在中文阅读理解问答中的应用方法 [J].
蔡鑫怡 ;
姜威宇 ;
韩浪焜 ;
宗鸿伟 .
信息与电脑(理论版), 2019, (08) :39-40
[6]   唐诗知识图谱的构建及其智能知识服务设计 [J].
周莉娜 ;
洪亮 ;
高子阳 .
图书情报工作, 2019, 63 (02) :24-33
[7]   基于E-CNN和BLSTM-CRF的临床文本命名实体识别 [J].
曹春萍 ;
关鹏举 .
计算机应用研究, 2019, 36 (12) :3748-3751
[8]   东盟十国新闻文本的命名实体识别 [J].
郑彦斌 ;
夏志超 ;
郭智 ;
黄永忠 ;
刘文芬 .
科学技术与工程, 2018, 18 (35) :162-168
[9]   基于电子病历的实体识别和知识图谱构建的研究 [J].
黄梦醒 ;
李梦龙 ;
韩惠蕊 .
计算机应用研究, 2019, 36 (12) :3735-3739
[10]   基于条件随机场的方志古籍别名自动抽取模型构建 [J].
李娜 .
中文信息学报, 2018, (11) :41-48+61