共 19 条
基于BLSTM的科技文献术语抽取方法
被引:9
|作者:

赵东玥
论文数: 0 引用数: 0
h-index: 0
机构:
北京工业大学信息学部 北京工业大学信息学部

论文数: 引用数:
h-index:
机构:

石崇德
论文数: 0 引用数: 0
h-index: 0
机构:
中国科学技术信息研究所 北京工业大学信息学部
机构:
[1] 北京工业大学信息学部
[2] 中国科学技术信息研究所
来源:
关键词:
术语抽取;
科技文献;
长短时记忆;
D O I:
暂无
中图分类号:
TP391.1 [文字信息处理];
学科分类号:
摘要:
术语抽取是研究科技文献领域的重要技术,为进一步提高科技文献术语抽取的准确率和召回率,本文采用了基于BLSTM(Bidirectional Long Short-Term Memory)的神经网络模型。使用预先训练的词向量字典将中文分词结果映射为向量作为BLSTM模型的输入,使用序列标注的方法将输出分类结果映射为术语的边界进行术语抽取。在自动化技术、计算机技术领域的数据集上,设计实验对比了使用词为特征的BLSTM模型和条件随机场模型的抽取结果。结果表明基于BLSTM模型的科技文献术语抽取得了更优的性能,在中文数据集上精确率最高0.7821,召回率最高0.8020,F1值最高0.7860,在英文数据集上分别达到0.8525,0.8677和0.8543。
引用
收藏
页码:67 / 74
页数:8
相关论文
共 19 条
- [1] 基于深度神经网络的中文命名实体识别[J]. 中文信息学报, 2017, 31 (04) : 28 - 35张海楠论文数: 0 引用数: 0 h-index: 0机构: 中国科学院计算技术研究所 中国科学院计算技术研究所伍大勇论文数: 0 引用数: 0 h-index: 0机构: 中国科学院计算技术研究所 中国科学院计算技术研究所刘悦论文数: 0 引用数: 0 h-index: 0机构: 中国科学院计算技术研究所 中国科学院计算技术研究所程学旗论文数: 0 引用数: 0 h-index: 0机构: 烟台中科网络技术研究所 中国科学院计算技术研究所
- [2] 用于文本分类的局部化双向长短时记忆[J]. 中文信息学报, 2017, 31 (03) : 62 - 68论文数: 引用数: h-index:机构:兰艳艳论文数: 0 引用数: 0 h-index: 0机构: 中国科学院计算技术研究所 中国科学院计算技术研究所郭嘉丰论文数: 0 引用数: 0 h-index: 0机构: 中国科学院计算技术研究所 中国科学院计算技术研究所徐君论文数: 0 引用数: 0 h-index: 0机构: 中国科学院计算技术研究所 中国科学院计算技术研究所论文数: 引用数: h-index:机构:程学旗论文数: 0 引用数: 0 h-index: 0机构: 中国科学院计算技术研究所 中国科学院计算技术研究所
- [3] 基于深度学习的中文机构名识别研究——一种汉字级别的循环神经网络方法[J]. 现代图书情报技术 , 2016, (12) : 36 - 43朱丹浩论文数: 0 引用数: 0 h-index: 0机构: 不详 江苏警官学院图书馆 不详杨蕾论文数: 0 引用数: 0 h-index: 0机构: 不详 不详王东波论文数: 0 引用数: 0 h-index: 0机构: 南京大学计算机科学与技术系 不详
- [4] 基于LSTM网络的序列标注中文分词法[J]. 计算机应用研究, 2017, 34 (05) : 1321 - 1324+1341论文数: 引用数: h-index:机构:论文数: 引用数: h-index:机构:论文数: 引用数: h-index:机构:论文数: 引用数: h-index:机构:施俊论文数: 0 引用数: 0 h-index: 0机构: 上海大学通信与信息工程学院 上海大学通信与信息工程学院
- [5] 面向本体学习的中文专利术语抽取研究[J]. 情报学报, 2016, (06) : 573 - 585王昊论文数: 0 引用数: 0 h-index: 0机构: 南京大学信息管理学院 南京大学江苏省数据工程与知识服务重点实验室 南京大学信息管理学院论文数: 引用数: h-index:机构:苏新宁论文数: 0 引用数: 0 h-index: 0机构: 南京大学信息管理学院 南京大学江苏省数据工程与知识服务重点实验室 南京大学信息管理学院
- [6] 采用连续词袋模型(CBOW)的领域术语自动抽取研究[J]. 现代图书情报技术, 2016, (02) : 9 - 15论文数: 引用数: h-index:机构:王东波论文数: 0 引用数: 0 h-index: 0机构: 南京农业大学信息科学技术学院 南京大学信息管理学院
- [7] 基于SVR模型的中文领域术语自动抽取研究——面向图书情报领域[J]. 情报理论与实践, 2016, 39 (01) : 24 - 31+15蒋婷论文数: 0 引用数: 0 h-index: 0机构: 南京大学信息管理学院孙建军论文数: 0 引用数: 0 h-index: 0机构: 南京大学信息管理学院
- [8] 新能源汽车领域中文术语抽取方法[J]. 现代图书情报技术, 2015, (10) : 88 - 94论文数: 引用数: h-index:机构:论文数: 引用数: h-index:机构:徐丽萍论文数: 0 引用数: 0 h-index: 0机构: 北京城市系统工程研究中心 北京信息科技大学网络文化与数字传播北京市重点实验室
- [9] 基于TValue融合领域度的术语抽取法[J]. 情报工程, 2015, 1 (05) : 25 - 31杨雅娜论文数: 0 引用数: 0 h-index: 0机构: 中国邮政储蓄银行 中国邮政储蓄银行刘胜奇论文数: 0 引用数: 0 h-index: 0机构: 中国专利信息中心 中国邮政储蓄银行
- [10] 基于信息熵和词频分布变化的术语抽取研究[J]. 中文信息学报, 2015, (01) : 82 - 87李丽双论文数: 0 引用数: 0 h-index: 0机构: 大连理工大学计算机学院王意文论文数: 0 引用数: 0 h-index: 0机构: 大连理工大学计算机学院黄德根论文数: 0 引用数: 0 h-index: 0机构: 大连理工大学计算机学院