基于Hadoop框架的MapReduce计算模式的优化设计

被引:13
作者
孙彦超
王兴芬
机构
[1] 北京信息科技大学
关键词
Hadoop; 海量数据; MapReduce; 分布式计算;
D O I
暂无
中图分类号
TP311.13 [];
学科分类号
1201 ;
摘要
对某高校教学资源平台的海量日志进行了分析,将传统单机分析处理模式,转变为Hadoop框架下的MapReduce分布式处理模式。MapReduce采用分而治之的思想,很好地解决了单机对海量数据处理产生的瓶颈问题。通过分析Hadoop源码的使用,认真研究MapReduce对海量数据处理作业流程分析,提出了MapReduce分布式作业计算的优化策略,从而更好地提高了海量数据的处理效率。
引用
收藏
页码:333 / 336
页数:4
相关论文
共 8 条
[1]   银行面向大数据分析决策系统的构建 [J].
李小庆 .
金融科技时代, 2013, 21 (08) :63-66
[2]   数据挖掘改善校园网体验 [J].
刘欢 ;
卢蓓蓉 ;
张瑾 .
中国教育网络, 2012, (07) :27-30
[3]   大数据时代下,企业信息管理的新革命 [J].
liusd .
网络与信息, 2012, 26 (04) :7-7
[4]   迎接大数据时代 [J].
白云川 .
中国制造业信息化, 2011, 40 (12) :39-39
[5]  
李开复:云计算[J]. 中国教育网络. 2008(06)
[6]   数据挖掘及其在高校教学系统中的应用 [J].
董彩云 ;
曲守宁 .
济南大学学报(自然科学版), 2004, (01) :65-68
[7]  
Hadoop权威指南[M]. 清华大学出版社 , (美) 怀特 (White, 2010
[8]  
Big data:The next frontier for innovation ompetition and productivity .2 NfcKinsey Global Institute. . 2011