基于HBase的RDF数据存储方案研究与设计

被引:5
作者
王媛媛 [1 ]
吕晓丹 [1 ]
胡琪 [1 ]
吴鸿川 [2 ]
机构
[1] 贵州大学计算机科学与技术学院
[2] 贵州大学大数据与信息工程学院
关键词
语义网; RDF数据; HBase; MapReduce; HFile文件;
D O I
暂无
中图分类号
TP333 [存贮器]; TP311.13 [];
学科分类号
081201 ; 1201 ;
摘要
针对RDF数据的存储问题,文章提出一种利用分布式数据库HBase以及设计数据库的Rowkey进行有效存储的方案,主要利用HBase与RDF数据的特点,使用经典的BKDRHash算法对谓词进行散列计算,将散列值与谓词作为主键,实现数据的存储。有效设置HBase的Rowkey不仅避免出现节点堆积现象,BKDRHash算法的使用也保证了数据的完整性。为证明该存储模式的有效性,文章实验选择利用Map Reduce将数据生成HBase内部存储格式HFile文件进行并行加载。实验证明,针对这样的存储模式,当数据量很大时数据加载性能较好。使用LUBM测试集进行仿真实验,证明该方案是有效的。
引用
收藏
页码:59 / 63
页数:5
相关论文
共 12 条
[1]  
海量RDF数据存储与查询技术的研究与实现.[D].宋纪成.北京工业大学.2013, 03
[2]   SW-Store: a vertically partitioned DBMS for Semantic Web data management [J].
Abadi, Daniel J. ;
Marcus, Adam ;
Madden, Samuel R. ;
Hollenbach, Kate .
VLDB JOURNAL, 2009, 18 (02) :385-406
[3]  
LUBM: A benchmark for OWL knowledge base systems.[J].Yuanbo Guo;Zhengxiang Pan;Jeff Heflin.Web Semantics: Science; Services and Agents on the World Wide Web.2005, 2
[4]  
面向大规模RDF数据的语义搜索.[D].王昊奋.上海交通大学.2013, 12
[5]   云计算中面向数据存储的安全访问控制机制 [J].
郑周 ;
张大军 ;
李运发 .
信息网络安全, 2015, (09) :221-226
[6]   分布式存储系统的哈希算法研究 [J].
黄秋兰 ;
程耀东 ;
陈刚 .
计算机工程与应用, 2014, 50 (01) :1-4+77
[7]   一种基于HBase的RDF数据存储模型 [J].
朱敏 ;
程佳 ;
柏文阳 .
计算机研究与发展 , 2013, (S1) :23-31
[8]   RDF数据查询处理技术综述 [J].
杜方 ;
陈跃国 ;
杜小勇 .
软件学报, 2013, 24 (06) :1222-1242
[9]   语义Web数据管理研究进展 [J].
杜小勇 ;
王琰 ;
吕彬 .
软件学报, 2009, 20 (11) :2950-2964
[10]   RDF数据存储模式研究及实现 [J].
易雅鑫 ;
宋自林 ;
尹康银 .
情报科学 , 2007, (08) :1218-1222+1243