MapReduce可以说是分布式计算的鼻祖,虽然在技术的发展迭代当中,MapReduce很大程度上被Spark计算引擎所替代,但是了解MapReduce的底层逻辑,对于我们学习分布式仍然有重要的指导意义。今...
查看详情 >>MapReduce作为Hadoop框架的原生计算引擎,在Spark出现之后,受到了冷落,但是从本质上来说,Spark所采取的计算思想,其实也是继承的MapReduce。学习Hadoop,我们仍然需要搞懂MapReduce。今天的...
查看详情 >>MapReduce最初进入我们的实现,是作为Hadoop的核心计算引擎,负责分布式计算,也作为编程模型使用。在整个Hadoop生态当中,MapReduce的影响意义是深远的,也是第一代计算框架代表产品。...
查看详情 >>在流式计算越来越受到主流青睐的市场状况下,流式计算框架技术的掌握,正在成为大数据培训学习当中的重要部分。以Flink框架来说,作为新一代的流计算框架,越来越多地出现在大数...
查看详情 >>在大数据处理上,MapReduce可以说是非常具备代表性的一代框架,尤其是在以Hadoop为首的离线批处理框架当中,MapReduce是核心的数据处理引擎,而随后的Spark其实也是在MapReduce基础之上发展...
查看详情 >>对于大数据处理的诸多计算框架,从Hadoop到Spark,其中受到重用的数据处理思想,其实一直都是MapReduce。MapReduce开创了分布式并行计算的先河,并且在之后的发展当中持续得到应用。今天...
查看详情 >>在Hadoop框架当中,作为三个核心组件之一的HDFS,也是大数据基础架构当中不可或缺的重要组件,负责大数据分布式存储的解决方案。今天的大数据学习分享,我们就主要来讲讲HDFS基础架...
查看详情 >>HDFS作为Hadoop的分布式文件系统而存在,大家都知道其负责解决分布式数据存储的问题,但是具体这个分布式存储是如何实现,要想理解透彻还是需要去深入掌握HDFS的工作原理。今天的大...
查看详情 >>作为Hadoop的分布式文件系统的HDFS,是Hadoop框架学习当中的重点内容,HDFS的设计初衷,是致力于存储超大文件,能够通过构建在普通PC设备上的集群环境,以较低成本完成大规模数据存储...
查看详情 >>