主页 > 新闻资讯 > Flink是什么?关于Flink框架的入门简介

Flink是什么?关于Flink框架的入门简介

作者:张老师 浏览次数: 2020-02-18 18:53
作为大数据主流运用的计算引擎之一,Flink近年来的发展趋势是非常惊人的,一方面是Flink自身的不断迭代更新,另一方面是选择应用Flink框架的平台越来越多。作为一个年轻的大数据计算引擎,还有很多人对Flink还不够了解。那么Flink是什么?下面为大家带来Flink框架的入门简介。

在Flink之前,主流的计算框架已Hadoop和Spark占据主流。Hadoop可以算得上是第一代大数据计算框架,能够很好地完成批处理任务;而其后的Spark,则是在Hadoop的基础上进行性能的提升,内存计算、迭代计算,实现了计算性能上的大大提升。

Flink是什么

而随着流处理概念的兴起,Spark又开始显现出了不足,因此催生了Flink。Flink框架可以说是实现真正意义上的实时流处理,大大降低了流计算的延迟,更能满足当下的大数据处理需求,因此得到众多平台的重用。

Flink真正开始在大众范围内普及,是在2015年左右,但是其实早在2008年,Flink就已经在开始初步研发了,直到2014年进入Apache孵化器,随后成为Apache的顶级开源项目之一。

Flink是一个针对流数据和批数据的分布式处理引擎。对Flink而言,其所要处理的主要场景就是流数据,批数据只是流数据的一个极限特例而已。在Flink框架当中,所有的任务当成流来处理,因此实现了更低延迟的实时流处理。

发展至今,Flink生态圈也逐步开始完善。Flink首先支持了Scala和Java的API,Python也在测试中。Flink通过Gelly支持了图操作,还有机器学习的FlinkML。

为了更广泛的支持大数据的生态圈,Flink也实现了很多Connector的子项目,比如与Hadoop HDFS集成。并且,Flink也宣布支持了Tachyon、S3以及MapRFS。

关于Flink是什么,以上为大家做了一个简单的入门介绍,深入到Flink框架当中,从理论到架构到实践,还需要更进一步的学习和掌握,才能了解Flink框架为什么性能优异,且受到广泛地欢迎。成都加米谷大数据,大数据知识分享,大数据开发培训,2020春季班正在招生中,详情可联系客服了解!
热点排行
推荐文章
立即申请>>