共 24 条
大数据流式计算:关键技术及系统实例
被引:308
|作者:

孙大为
论文数: 0 引用数: 0
h-index: 0
机构:
清华大学计算机科学与技术系 清华大学计算机科学与技术系

论文数: 引用数:
h-index:
机构:

郑纬民
论文数: 0 引用数: 0
h-index: 0
机构:
清华大学计算机科学与技术系 清华大学计算机科学与技术系
机构:
[1] 清华大学计算机科学与技术系
[2] 不详
来源:
关键词:
大数据计算;
流式计算;
流式大数据;
内存计算;
系统实例;
D O I:
10.13328/j.cnki.jos.004558
中图分类号:
TP274 [数据处理、数据处理系统];
学科分类号:
0804 ;
080401 ;
080402 ;
081002 ;
0835 ;
摘要:
大数据计算主要有批量计算和流式计算两种形态,目前,关于大数据批量计算系统的研究和讨论相对充分,而如何构建低延迟、高吞吐且持续可靠运行的大数据流式计算系统是当前亟待解决的问题且研究成果和实践经验相对较少.总结了典型应用领域中流式大数据所呈现出的实时性、易失性、突发性、无序性、无限性等特征,给出了理想的大数据流式计算系统在系统结构、数据传输、应用接口、高可用技术等方面应该具有的关键技术特征,论述并对比了已有的大数据流式计算系统的典型实例,最后阐述了大数据流式计算系统在可伸缩性、系统容错、状态一致性、负载均衡、数据吞吐量等方面所面临的技术挑战.
引用
收藏
页码:839 / 862
页数:24
相关论文
共 24 条
- [1] 网络大数据:现状与展望[J]. 计算机学报, 2013, 36 (06) : 1125 - 1138王元卓论文数: 0 引用数: 0 h-index: 0机构: 中国科学院计算技术研究所网络数据科学与技术重点实验室靳小龙论文数: 0 引用数: 0 h-index: 0机构: 中国科学院计算技术研究所网络数据科学与技术重点实验室程学旗论文数: 0 引用数: 0 h-index: 0机构: 中国科学院计算技术研究所网络数据科学与技术重点实验室
- [2] 大数据的一个重要方面:数据可用性[J]. 计算机研究与发展, 2013, 50 (06) : 1147 - 1162李建中论文数: 0 引用数: 0 h-index: 0机构: 哈尔滨工业大学计算机科学与技术学院刘显敏论文数: 0 引用数: 0 h-index: 0机构: 哈尔滨工业大学计算机科学与技术学院
- [3] 大数据背景下商务管理研究若干前沿课题[J]. 管理科学学报, 2013, (01) : 1 - 9冯芷艳论文数: 0 引用数: 0 h-index: 0机构: 国家自然科学基金委员会管理科学部 国家自然科学基金委员会管理科学部郭迅华论文数: 0 引用数: 0 h-index: 0机构: 清华大学经济管理学院 国家自然科学基金委员会管理科学部曾大军论文数: 0 引用数: 0 h-index: 0机构: 中国科学院自动化研究所 国家自然科学基金委员会管理科学部陈煜波论文数: 0 引用数: 0 h-index: 0机构: 清华大学经济管理学院 国家自然科学基金委员会管理科学部陈国青论文数: 0 引用数: 0 h-index: 0机构: 清华大学经济管理学院 国家自然科学基金委员会管理科学部
- [4] 大数据管理:概念、技术与挑战[J]. 计算机研究与发展, 2013, 50 (01) : 146 - 169孟小峰论文数: 0 引用数: 0 h-index: 0机构: 中国人民大学信息学院慈祥论文数: 0 引用数: 0 h-index: 0机构: 中国人民大学信息学院
- [5] 数据管理技术的新格局[J]. 软件学报, 2013, 24 (02) : 175 - 197论文数: 引用数: h-index:机构:论文数: 引用数: h-index:机构:论文数: 引用数: h-index:机构:论文数: 引用数: h-index:机构:论文数: 引用数: h-index:机构:论文数: 引用数: h-index:机构:论文数: 引用数: h-index:机构:王珊论文数: 0 引用数: 0 h-index: 0机构: 教育部数据工程与知识工程重点实验室(中国人民大学) 萨师烜大数据管理与分析研究中心(中澳) 中国人民大学信息学院 教育部数据工程与知识工程重点实验室(中国人民大学)
- [6] 大数据研究:未来科技及经济社会发展的重大战略领域——大数据的研究现状与科学思考[J]. 中国科学院院刊, 2012, 27 (06) : 647 - 657李国杰论文数: 0 引用数: 0 h-index: 0机构: 中国科学院计算技术研究所程学旗论文数: 0 引用数: 0 h-index: 0机构: 中国科学院计算技术研究所
- [7] 针对高速数据流的大规模数据实时处理方法[J]. 计算机学报, 2012, 35 (03) : 477 - 490论文数: 引用数: h-index:机构:论文数: 引用数: h-index:机构:论文数: 引用数: h-index:机构:论文数: 引用数: h-index:机构:
- [8] 大数据分析——RDBMS与MapReduce的竞争与共生[J]. 软件学报, 2012, 23 (01) : 32 - 45论文数: 引用数: h-index:机构:论文数: 引用数: h-index:机构:论文数: 引用数: h-index:机构:王珊论文数: 0 引用数: 0 h-index: 0机构: 教育部数据工程与知识工程重点实验室(中国人民大学) 中国人民大学信息学院 教育部数据工程与知识工程重点实验室(中国人民大学)
- [9] Analytical Performance Models for MapReduce Workloads[J]. INTERNATIONAL JOURNAL OF PARALLEL PROGRAMMING, 2013, 41 (04) : 495 - 525Vianna, Emanuel论文数: 0 引用数: 0 h-index: 0机构: Univ Fed Minas Gerais, Belo Horizonte, MG, Brazil Univ Fed Minas Gerais, Belo Horizonte, MG, BrazilComarela, Giovanni论文数: 0 引用数: 0 h-index: 0机构: Univ Fed Minas Gerais, Belo Horizonte, MG, Brazil Univ Fed Minas Gerais, Belo Horizonte, MG, BrazilPontes, Tatiana论文数: 0 引用数: 0 h-index: 0机构: Univ Fed Minas Gerais, Belo Horizonte, MG, Brazil Univ Fed Minas Gerais, Belo Horizonte, MG, BrazilAlmeida, Jussara论文数: 0 引用数: 0 h-index: 0机构: Univ Fed Minas Gerais, Belo Horizonte, MG, Brazil Univ Fed Minas Gerais, Belo Horizonte, MG, BrazilAlmeida, Virgilio论文数: 0 引用数: 0 h-index: 0机构: Univ Fed Minas Gerais, Belo Horizonte, MG, Brazil Univ Fed Minas Gerais, Belo Horizonte, MG, BrazilWilkinson, Kevin论文数: 0 引用数: 0 h-index: 0机构: HP Labs, Informat Analyt Lab, Palo Alto, CA USA Univ Fed Minas Gerais, Belo Horizonte, MG, BrazilKuno, Harumi论文数: 0 引用数: 0 h-index: 0机构: HP Labs, Informat Analyt Lab, Palo Alto, CA USA Univ Fed Minas Gerais, Belo Horizonte, MG, BrazilDayal, Umeshwar论文数: 0 引用数: 0 h-index: 0机构: HP Labs, Informat Analyt Lab, Palo Alto, CA USA Univ Fed Minas Gerais, Belo Horizonte, MG, Brazil
- [10] An adaptive ensemble classifier for mining concept drifting data streams[J]. EXPERT SYSTEMS WITH APPLICATIONS, 2013, 40 (15) : 5895 - 5906Farid, Dewan Md.论文数: 0 引用数: 0 h-index: 0机构: Northumbria Univ, Dept Comp Sci & Digital Technol, Computat Intelligence Grp, Newcastle Upon Tyne NE1 8ST, Tyne & Wear, England Northumbria Univ, Dept Comp Sci & Digital Technol, Computat Intelligence Grp, Newcastle Upon Tyne NE1 8ST, Tyne & Wear, EnglandZhang, Li论文数: 0 引用数: 0 h-index: 0机构: Northumbria Univ, Dept Comp Sci & Digital Technol, Computat Intelligence Grp, Newcastle Upon Tyne NE1 8ST, Tyne & Wear, England Northumbria Univ, Dept Comp Sci & Digital Technol, Computat Intelligence Grp, Newcastle Upon Tyne NE1 8ST, Tyne & Wear, EnglandHossain, Alamgir论文数: 0 引用数: 0 h-index: 0机构: Northumbria Univ, Dept Comp Sci & Digital Technol, Computat Intelligence Grp, Newcastle Upon Tyne NE1 8ST, Tyne & Wear, England Northumbria Univ, Dept Comp Sci & Digital Technol, Computat Intelligence Grp, Newcastle Upon Tyne NE1 8ST, Tyne & Wear, EnglandRahman, Chowdhury Mofizur论文数: 0 引用数: 0 h-index: 0机构: United Int Univ, Dept Comp Sci & Engn, Dhaka, Bangladesh Northumbria Univ, Dept Comp Sci & Digital Technol, Computat Intelligence Grp, Newcastle Upon Tyne NE1 8ST, Tyne & Wear, EnglandStrachan, Rebecca论文数: 0 引用数: 0 h-index: 0机构: Northumbria Univ, Dept Comp Sci & Digital Technol, Computat Intelligence Grp, Newcastle Upon Tyne NE1 8ST, Tyne & Wear, England Northumbria Univ, Dept Comp Sci & Digital Technol, Computat Intelligence Grp, Newcastle Upon Tyne NE1 8ST, Tyne & Wear, EnglandSexton, Graham论文数: 0 引用数: 0 h-index: 0机构: Northumbria Univ, Dept Comp Sci & Digital Technol, Computat Intelligence Grp, Newcastle Upon Tyne NE1 8ST, Tyne & Wear, England Northumbria Univ, Dept Comp Sci & Digital Technol, Computat Intelligence Grp, Newcastle Upon Tyne NE1 8ST, Tyne & Wear, EnglandDahal, Keshav论文数: 0 引用数: 0 h-index: 0机构: Univ Bradford, Sch Comp Informat & Media, Artificial Intelligence Res Grp, Bradford BD7 1DP, W Yorkshire, England Northumbria Univ, Dept Comp Sci & Digital Technol, Computat Intelligence Grp, Newcastle Upon Tyne NE1 8ST, Tyne & Wear, England