一种大规模RDF语义数据的分布式存储方案

被引:7
作者
姜龙翔 [1 ]
王鑫 [2 ]
李旭 [2 ]
冯志勇 [2 ]
机构
[1] 天津大学软件学院
[2] 天津大学计算机科学与技术学院
基金
天津大学自主创新基金;
关键词
RDF语义数据; 分布式存储; 三元组索引; Cassandra集群;
D O I
暂无
中图分类号
TP333 [存贮器];
学科分类号
081201 ;
摘要
随着语义Web的发展,越来越多的RDF数据发布到Web上,需要一个可以提供存储和查询功能的数据管理系统来对海量的RDF数据进行管理。针对上述问题,设计并实现了一种大规模RDF语义数据的分布式存储方案。该方案通过RDF数据装载和预处理,可以有效地管理海量的RDF数据,并通过构建索引可以有效地对大规模RDF数据进行查询。工作包括底层的RDF存储方案的设计与实现,数据的预处理与装载。同时,设计了一系列实验来评估和对比不同节点数目的Cassandra集群之间的性能,数据采用的是从DBpedia获得的13 million行RDF的数据集。实验结果显示,方案对大规模RDF语义数据的存储和查询具有性能优势。
引用
收藏
页码:30 / 32+59 +59
页数:4
相关论文
共 1 条
[1]  
Resource Description Frame work(RDF):Concepts and Abstract Syntax. Klyne, G,J. Carroll. http://www.w3.org/TR/2004/REC-rdf-concepts-20040210 . 2004