在大数据学习当中,主流的技术框架通常都是需要有相应程度的掌握的,包括Hadoop、Spark、Storm、Flink等。其中,Storm这个框架,其实处在一个稍微尴尬的地位,市场占有率称不上特别高,...
查看详情 >>前面我们对Flink当中的一些基本语言概念,为大家做了简单的介绍,本篇我们接着来讲Flink。Flink作为新兴的流计算引擎,在大数据流处理上,是具备足够的实力,这也正是Flink热度快速上...
查看详情 >>近年来大热的流计算引擎,非Flink莫属了,从最初的无人可知,到现如今的广受青睐,其实也不过是几年的时间。当然,一方面这是由于流计算正在成为越来越普遍的趋势,另一方面当然...
查看详情 >>Spark框架下,除了支持批处理和流处理,也提供图计算功能,而图计算功能主要由Spark GraphX来提供。而近些年来说,图计算在大数据领域,也得到越来越多的应用。今天的大数据学习分享...
查看详情 >>在Spark生态当中,MLlib往往是被定义为一个机器学习的库,通过用MLlib封装好的算法,可以非常轻松便捷地构建机器学习应用。在大数据处理当中,有了MLlib的出现,可以说是非常有利的一...
查看详情 >>在Spark框架当中,提起流计算,那么主要就是Spark Streaming组件来负责。在大数据的发展历程当中,流计算正在成为越来越受到重视的趋势,而Spark Streaming流计算也在基于实际需求不断调整...
查看详情 >>在这个数据爆发的移动互联网时代,数据流成为一种重要的数据产生形式,而针对于不断新增的流数据处理,大数据生态当中,也有相应的流处理组件,比如说Flume和kafka。今天的大数据...
查看详情 >>大数据技术发展流程当中,Hadoop和Spark这两个框架,发展至今仍然占据着重要的地位,当然,这两者也常常也拿来做比较。作为初代的Hadoop和后来者的Spark,两者之间确实也各有其优势。...
查看详情 >>众所周知,Spark计算引擎,是在Hadoop MapReduce的基础之上进行了优化,已达到提升计算性能的目的。Spark与MapReduce一脉相承,在计算当中,也就涉及到Map阶段和Reduce计算。今天的大数据学习...
查看详情 >>