构建基于科技文献知识的人工智能引擎

被引:33
作者
张智雄 [1 ,2 ,3 ,4 ]
刘欢 [1 ,2 ,4 ]
于改红 [1 ]
机构
[1] 中国科学院文献情报中心
[2] 中国科学院大学经济与管理学院图书情报与档案管理系
[3] 中国科学院武汉文献情报中心
[4] 科技大数据湖北省重点实验室
关键词
科技文献; 人工智能知识引擎; 预训练语言模型; 微调模型; AI引擎构建实践;
D O I
10.13998/j.cnki.issn1002-1248.20-0797
中图分类号
G252.7 [文献检索];
学科分类号
1205 ; 120501 ;
摘要
[目的/意义]如何利用科技文献中的知识对深度学习算法模型进行训练改进,以获取知识、发现知识是情报研究的重要课题。为充分挖掘和利用科技文献中的知识,本文提出构建基于科技文献知识的人工智能引擎的目标。[方法/过程]本文以文献情报工作为出发点,立足科技文献是人类知识的最重要载体,探究人工智能取得飞速突破的本质所在,创新性提出了文献情报领域从"科技文献库"转变为"科技知识引擎"的建设思路。[结果/结论]本文论述了中国科学院文献情报中心在构建基于科技文献知识的人工智能(AI)引擎的建设实践,探讨了利用深度学习技术挖掘知识以服务情报研究的方法,以期为学界提供参考。
引用
收藏
页码:17 / 31
页数:15
相关论文
共 19 条
[1]  
Sci BERT:A pretrained language model for scientific text . BELTAGY I,KYLE L,ARMAN C. . 2019
[2]  
Unified language model pretraining for natural language understanding and generation . DONG L,YANG N,WANG W,et al. Advances in neural information processing systems . 2019
[3]   基于BERT模型的中文医学文献分类研究 [J].
赵旸 ;
张智雄 ;
刘欢 ;
丁良萍 .
数据分析与知识发现, 2020, 4 (08) :41-49
[4]   不同深度学习模型的科技论文摘要语步识别效果对比研究 [J].
张智雄 ;
刘欢 ;
丁良萍 ;
吴朋民 ;
于改红 .
数据分析与知识发现, 2019, 3 (12) :1-9
[5]   科技文献语篇元素自动标注模型研究综述 [J].
于改红 ;
张智雄 ;
马娜 .
图书情报工作 , 2018, (15) :132-144
[6]   基于图计算的论文审稿自动推荐系统 [J].
谢玮 ;
沈一 ;
马永征 .
计算机应用研究, 2016, 33 (03) :798-801
[7]  
机器学习与应用[B]. 清华大学出版社 , 雷明, 2018
[8]  
A content-based recommender system for computer science publications[J] . Donghui Wang,Yanchun Liang,Dong Xu,Xiaoyue Feng,Renchu Guan. nowledge-Based Systems . 2018
[9]   Long short-term memory [J].
Hochreiter, S ;
Schmidhuber, J .
NEURAL COMPUTATION, 1997, 9 (08) :1735-1780
[10]   Backpropagation Applied to Handwritten Zip Code Recognition [J].
LeCun, Y. ;
Boser, B. ;
Denker, J. S. ;
Henderson, D. ;
Howard, R. E. ;
Hubbard, W. ;
Jackel, L. D. .
NEURAL COMPUTATION, 1989, 1 (04) :541-551