作为大数据主流的框架之一,Hadoop的发展已经进入稳定成熟阶段,针对于大数据处理各个环节当中的问题,都有相应的解决方案,也因此形成了完整的Hadoop生态,其中各个组件的配合,...
查看详情 >>Spark作为大数据主流的计算引擎之一,学习大数据必然少不了学习Spark,从理论体系到编程实战,Spark的入门需要逐步深入。在理论体系学习上,不少同学选择看书学习。那么学Spark看什么...
查看详情 >>对于Spark框架,很多同学都知道的是,Spark在编程上支持多种开发语言,包括Scala、Java、Python等多门主流编程语言,而这些不同的编程语言,在实际的Spark来发当中,选择哪一种更好呢?...
查看详情 >>在Spark框架当中,基于Spark弹性分布式数据集RDD,还涉及到很重要的两个概念就是宽窄依赖,这对于Spark计算性能的提升,起着关键性的作用。今天我们就来谈谈Spark中的宽窄依赖,看看窄...
查看详情 >>在Hadoop生态系统当中,Yarn无疑是关键性的核心组件之一,在Hadoop2.0版本之后,鉴于之前的版本在任务调度上的不足,这才引入了Yarn,主要负责Hadoop集群的任务资源调度管理。关于Hadoo...
查看详情 >>在Spark入门学习阶段,对于Spark如何安装使用等问题,是首先需要解决的问题之一。并且,作为主流的框架之一,Spark在大数据领域的应用也非常广泛,掌握Spark使用是技术开发人员的基本...
查看详情 >>作为大数据领域占据着越来越重要地位的计算框架,Spark也逐渐成为大数据技术开发人员们被要求具备的基本技能之一,越来越多的职位在招聘的JD上清清楚楚地写出Spark的要求,这是大...
查看详情 >>作为大数据领域的后起之秀,Flink框架在大数据计算上同样占据着重要的地位,并且随着Flink在实时数据流计算上的优势表现,Flink越来越受到很大企业平台的青睐。因此在大数据技术的...
查看详情 >>