共 25 条
基于开放网络知识的信息检索与数据挖掘
被引:88
作者:
王元卓
[1
]
贾岩涛
[1
]
刘大伟
[2
,3
]
靳小龙
[1
]
程学旗
[1
]
机构:
[1] 中国科学院网络数据科学与技术重点实验室(中国科学院计算技术研究所)
[2] 烟台中科网络技术研究所
[3] 中国科学院计算技术研究所烟台分所
来源:
基金:
北京市自然科学基金;
关键词:
网络大数据;
开放网络知识;
本体;
信息检索;
数据挖掘;
D O I:
暂无
中图分类号:
TP311.13 [];
学科分类号:
1201 ;
摘要:
网络大数据是指"人、机、物"三元世界在网络空间(cyberspace)中交互、融合所产生并在互联网上可获得的大数据.这些数据具有多源异构、交互性、时效性、社会性、突发性和高噪声等特点,不但非结构化数据多,而且数据的实时性强.网络大数据背后蕴含着丰富的、复杂关联的知识.建立面向开放网络的知识库是获取网络大数据中的丰富知识的有效手段.对当前国内外主要的开放网络库进行了比较,分析了相应的构建方法、多源知识的融合以及知识库的更新等关键技术.进一步从用户意图理解、查询扩展、语义问答、线索挖据、关系推理以及关系和属性预测等方面出发,总结了基于开放网络知识库的信息检索、数据挖掘与系统应用的研究现状和主要问题.最后,对开放网络知识库的发展趋势和面临的主要挑战进行了展望.
引用
收藏
页码:456 / 474
页数:19
相关论文

