Hbase作为Hadoop生态当中的NOSQL数据库,基于HDFS去完成实际的数据存储任务,高性能是得到普遍的认可的。而Hbase在存储上的高性能,与自身的数据模型设计有很大的关系。今天的大数据培...
查看详情 >>在大数据储存任务当中,针对于具备5V特征的大规模数据集,数据存储从传统的关系型数据库开始转向非关系型数据库(NOSQL),而NOSQL数据库当中,Hbase无疑是非常经典的一个作品。今天...
查看详情 >>MapReduce可以说是分布式计算的鼻祖,虽然在技术的发展迭代当中,MapReduce很大程度上被Spark计算引擎所替代,但是了解MapReduce的底层逻辑,对于我们学习分布式仍然有重要的指导意义。今...
查看详情 >>MapReduce作为Hadoop框架的原生计算引擎,在Spark出现之后,受到了冷落,但是从本质上来说,Spark所采取的计算思想,其实也是继承的MapReduce。学习Hadoop,我们仍然需要搞懂MapReduce。今天的...
查看详情 >>MapReduce最初进入我们的实现,是作为Hadoop的核心计算引擎,负责分布式计算,也作为编程模型使用。在整个Hadoop生态当中,MapReduce的影响意义是深远的,也是第一代计算框架代表产品。...
查看详情 >>在流式计算越来越受到主流青睐的市场状况下,流式计算框架技术的掌握,正在成为大数据培训学习当中的重要部分。以Flink框架来说,作为新一代的流计算框架,越来越多地出现在大数...
查看详情 >>在大数据处理上,MapReduce可以说是非常具备代表性的一代框架,尤其是在以Hadoop为首的离线批处理框架当中,MapReduce是核心的数据处理引擎,而随后的Spark其实也是在MapReduce基础之上发展...
查看详情 >>对于大数据处理的诸多计算框架,从Hadoop到Spark,其中受到重用的数据处理思想,其实一直都是MapReduce。MapReduce开创了分布式并行计算的先河,并且在之后的发展当中持续得到应用。今天...
查看详情 >>在Hadoop框架当中,作为三个核心组件之一的HDFS,也是大数据基础架构当中不可或缺的重要组件,负责大数据分布式存储的解决方案。今天的大数据学习分享,我们就主要来讲讲HDFS基础架...
查看详情 >>