基于开放网络知识的信息检索与数据挖掘

被引:88
作者
王元卓 [1 ]
贾岩涛 [1 ]
刘大伟 [2 ,3 ]
靳小龙 [1 ]
程学旗 [1 ]
机构
[1] 中国科学院网络数据科学与技术重点实验室(中国科学院计算技术研究所)
[2] 烟台中科网络技术研究所
[3] 中国科学院计算技术研究所烟台分所
基金
北京市自然科学基金;
关键词
网络大数据; 开放网络知识; 本体; 信息检索; 数据挖掘;
D O I
暂无
中图分类号
TP311.13 [];
学科分类号
1201 ;
摘要
网络大数据是指"人、机、物"三元世界在网络空间(cyberspace)中交互、融合所产生并在互联网上可获得的大数据.这些数据具有多源异构、交互性、时效性、社会性、突发性和高噪声等特点,不但非结构化数据多,而且数据的实时性强.网络大数据背后蕴含着丰富的、复杂关联的知识.建立面向开放网络的知识库是获取网络大数据中的丰富知识的有效手段.对当前国内外主要的开放网络库进行了比较,分析了相应的构建方法、多源知识的融合以及知识库的更新等关键技术.进一步从用户意图理解、查询扩展、语义问答、线索挖据、关系推理以及关系和属性预测等方面出发,总结了基于开放网络知识库的信息检索、数据挖掘与系统应用的研究现状和主要问题.最后,对开放网络知识库的发展趋势和面临的主要挑战进行了展望.
引用
收藏
页码:456 / 474
页数:19
相关论文
共 25 条
[1]   基于弱监督学习的海量网络数据关系抽取 [J].
陈立玮 ;
冯岩松 ;
赵东岩 .
计算机研究与发展, 2013, 50 (09) :1825-1835
[2]   网络大数据:现状与展望 [J].
王元卓 ;
靳小龙 ;
程学旗 .
计算机学报, 2013, 36 (06) :1125-1138
[3]   大数据研究:未来科技及经济社会发展的重大战略领域——大数据的研究现状与科学思考 [J].
李国杰 ;
程学旗 .
中国科学院院刊, 2012, 27 (06) :647-657
[4]   基于混合推理的知识库的构建及其应用研究 [J].
钟秀琴 ;
刘忠 ;
丁盘苹 .
计算机学报, 2012, 35 (04) :761-766
[5]   基于本体的语义Web服务QoS描述和发现 [J].
万长林 ;
史忠植 ;
胡宏 ;
张大鹏 .
计算机研究与发展, 2011, (06) :1059-1066
[6]   知识库系统的逻辑基础 [J].
许文艳 ;
刘三阳 .
计算机学报, 2009, 32 (11) :2123-2129
[7]   基于自动问答系统的信息检索技术研究进展 [J].
汤庸 ;
林鹭贤 ;
罗烨敏 ;
潘炎 .
计算机应用, 2008, (11) :2745-2748
[8]   知网的理论发现 [J].
董振东 ;
董强 ;
郝长伶 .
中文信息学报, 2007, (04) :3-9
[9]   问答式检索技术及评测研究综述 [J].
吴友政 ;
赵军 ;
段湘煜 ;
徐波 .
中文信息学报, 2005, (03) :1-13
[10]   知网与同义词词林的信息融合研究 [J].
梅立军 ;
周强 ;
臧路 ;
陈祖舜 .
中文信息学报, 2005, (01) :63-70