基于词向量扩展的学术资源语义检索技术

被引:11
作者
王仁武
陈川宝
孟现茹
机构
[1] 华东师范大学经济与管理学部信息管理系
关键词
word2vec; Elasticsearch; 语义检索; 学术资源;
D O I
10.13266/j.issn.0252-3116.2018.19.014
中图分类号
G252.7 [文献检索];
学科分类号
1205 ; 120501 ;
摘要
[目的/意义]尝试以统计的方法为指导思想,探究基于词向量扩展的语义检索技术来提升学术资源的语义检索能力。[方法/过程]利用自然语言处理、文本挖掘技术,对采集来的学术资源(主要是学术论文)元数据进行预处理,结合word2vec词向量生成工具和elasticsearch全文检索引擎搭建语义检索系统,对学术资源进行语义检索的探索研究。[结果/结论]本文提出的方法能够有效提升学术信息的检索效果,一定程度上实现学术资源的语义检索,并为后续语义检索的进一步研究提供借鉴。
引用
收藏
页码:111 / 119
页数:9
相关论文
共 12 条
[1]   基于词向量的专利自动扩展查询研究 [J].
刘梦兰 ;
刘斌 ;
彭智勇 .
计算机工程与科学, 2017, 39 (12) :2297-2305
[2]   基于WordNet词义消歧的语义检索研究 [J].
高雪霞 ;
炎士涛 .
湘潭大学自然科学学报, 2017, 39 (02) :118-121
[3]   面向健康问答社区的语义检索技术研究与分析 [J].
范桥青 ;
方钰 .
电子技术与软件工程, 2017, (02) :202-204
[4]   基于HowNet的微博文本语义检索研究 [J].
王李冬 ;
张慧熙 .
情报科学 , 2016, (09) :134-137
[5]   基于语义概念分析的科技文献检索研究 [J].
张孝飞 ;
孔繁秀 .
情报理论与实践 , 2016, (08) :115-118
[6]   基于词向量的学术语义搜索研究 [J].
陈国华 ;
汤庸 ;
许玉赢 ;
贺超波 ;
肖丹阳 .
华南师范大学学报(自然科学版), 2016, 48 (03) :53-58+2
[8]   基于LDA的文本语义检索模型 [J].
刘启华 .
情报科学 , 2014, (08) :38-43+55
[9]  
术语定义抽取、聚类与术语识别研究[D]. 张榕.北京语言大学. 2006
[10]  
基于词向量的微博检索系统研究与实现[D]. 许稳堂.东华大学. 2017