作为Hadoop生态的重要核心组件,Yarn的存在是至关重要的。Hadoop生态下的诸多框架组件,要实现在同一个生态下的集成运行,其中涉及到的任务协调与调度,通通由Yarn来搞定。今天的大数...
查看详情 >>Yarn作为Hadoop生态的资源调度框架,其重要性自是不必多说,从搭建Hadoop基础架构开始,我们就需要对Yarn这个框架做到足够清晰的认识和了解。今天的大数据学习分享,我们主要来讲讲...
查看详情 >>作为Hadoop核心计算引擎的MapReduce,虽然在后来的发展当中,因为不适应新的要求,逐步遭到企业主流的抛弃,但是不得不承认,MapReduce的分布式计算思想,仍然是适用于大数据的。今天...
查看详情 >>Hbase作为Hadoop生态当中的NOSQL数据库,基于HDFS去完成实际的数据存储任务,高性能是得到普遍的认可的。而Hbase在存储上的高性能,与自身的数据模型设计有很大的关系。今天的大数据培...
查看详情 >>在大数据储存任务当中,针对于具备5V特征的大规模数据集,数据存储从传统的关系型数据库开始转向非关系型数据库(NOSQL),而NOSQL数据库当中,Hbase无疑是非常经典的一个作品。今天...
查看详情 >>MapReduce可以说是分布式计算的鼻祖,虽然在技术的发展迭代当中,MapReduce很大程度上被Spark计算引擎所替代,但是了解MapReduce的底层逻辑,对于我们学习分布式仍然有重要的指导意义。今...
查看详情 >>MapReduce作为Hadoop框架的原生计算引擎,在Spark出现之后,受到了冷落,但是从本质上来说,Spark所采取的计算思想,其实也是继承的MapReduce。学习Hadoop,我们仍然需要搞懂MapReduce。今天的...
查看详情 >>MapReduce最初进入我们的实现,是作为Hadoop的核心计算引擎,负责分布式计算,也作为编程模型使用。在整个Hadoop生态当中,MapReduce的影响意义是深远的,也是第一代计算框架代表产品。...
查看详情 >>在流式计算越来越受到主流青睐的市场状况下,流式计算框架技术的掌握,正在成为大数据培训学习当中的重要部分。以Flink框架来说,作为新一代的流计算框架,越来越多地出现在大数...
查看详情 >>