云计算环境下的分布存储关键技术

被引:210
|
作者
王意洁
孙伟东
周松
裴晓强
李小勇
机构
[1] 国防科学技术大学计算机学院并行与分布处理国家重点实验室
基金
高等学校博士学科点专项科研基金;
关键词
云计算; 数据中心; 分布存储; 容错; 数据中心网络; 复制; 纠删码; 节能;
D O I
暂无
中图分类号
TP333 [存贮器];
学科分类号
摘要
云计算作为下一代计算模式,在科学计算和商业计算领域均发挥着重要作用,受到当前学术界和企业界的广泛关注.云计算环境下的分布存储主要研究数据在数据中心上的组织和管理,作为云计算环境的核心基础设施,数据中心通常由百万级以上节点组成,存储其上的数据规模往往达到PB级甚至EB级,导致数据失效成为一种常态行为,极大地限制了云计算的应用和推广,增加了云计算的成本.因此,提高可扩展性和容错性、降低成本,成为云计算环境下分布存储研究的若干关键技术.针对如何提高存储的可扩展性、容错性以及降低存储的能耗等目标,从数据中心网络的设计、数据的存储组织方式等方面对当前分布存储的关键技术进行了综述.首先,介绍并对比了当前典型的数据中心网络结构的优缺点;其次,介绍并对比了当前常用的两种分布存储容错技术,即基于复制的容错技术和基于纠删码的容错技术;第三,介绍了当前典型的分布存储节能技术,并分析了各项技术的优缺点;最后指出了当前技术面临的主要挑战和下一步研究的方向.
引用
收藏
页码:962 / 986
页数:25
相关论文
共 12 条
  • [11] Dynamo:Amazon''s highly available key-value store .2 Decandia G,Hastorun D,Jampani M,Kakulapati G,Lakshman A,Pilchin A,Sivasubramanian S,Vosshall P,Vogels W. Proc. of the SOSP 2007 . 2007
  • [12] Does erasure coding have a role to play in my data center-TechnicalReport .2 Zhang Z,Deshpande A,Ma XS,Thereska E,Narayanan D. MSR-TR-2010-52 . 2010