数据湖——一种更好的大数据存储架构

被引:31
作者
郭文惠
机构
[1] 西安石油大学计算机学院
关键词
数据湖; 数据池;
D O I
10.14004/j.cnki.ckt.2016.3963
中图分类号
TP311.13 []; TP333 [存贮器];
学科分类号
1201 ; 081201 ;
摘要
"数据湖"是通过将原始数据分类存储到不同数据池,并在各数据池里将数据整合转化成容易分析的统一存储格式进行存储,以方便用户对大量原始数据池中原本几近废弃的数据加以分析利用,从而产生经济效益。该文首先介绍了数据湖的结构,其次介绍了数据湖中各数据池的特点及应用;最后介绍了各数据池之间的联系并举例说明了数据湖的架构。
引用
收藏
页码:4 / 6
页数:3
相关论文
共 10 条
[1]   GE的工业数据湖平台 [J].
王一扬 .
新理财, 2015, (11) :45-46
[2]   大数据下的机器学习算法综述 [J].
何清 ;
李宁 ;
罗文娟 ;
史忠植 .
模式识别与人工智能, 2014, 27 (04) :327-336
[3]   “大数据”时代科学数据整合研究 [J].
白如江 ;
冷伏海 .
情报理论与实践, 2014, 37 (01) :94-99
[4]   大数据存储和分析技术应用及标准化 [J].
丁兆明 ;
杜学军 ;
王治平 ;
胡捷 .
信息技术与标准化, 2013, (05) :31-35
[5]   大数据管理:概念、技术与挑战 [J].
孟小峰 ;
慈祥 .
计算机研究与发展, 2013, (01) :146-169
[6]   大数据研究:未来科技及经济社会发展的重大战略领域——大数据的研究现状与科学思考 [J].
李国杰 ;
程学旗 .
中国科学院院刊, 2012, 27 (06) :647-657
[7]   云计算服务等级协议(SLA)研究 [J].
张健 .
电信网技术, 2012, (02) :7-10
[8]   基于数据池的异构数据集成 [J].
张晓剑 ;
罗军 .
微处理机, 2009, 30 (02) :61-63+66
[9]   基于搜索空间划分的概念生成算法 [J].
齐红 ;
刘大有 ;
胡成全 ;
卢明 ;
赵亮 .
软件学报, 2005, (12) :2029-2035
[10]  
数据湖不能成为数据沼泽[N]. 邱燕娜.中国计算机报. 2015 (011)