主页 > 新闻资讯 > Flink用什么语言开发?Flink编程语言基础

Flink用什么语言开发?Flink编程语言基础

作者:张老师 浏览次数: 2020-02-14 15:13
作为大数据领域的后起之秀,Flink框架在大数据计算上同样占据着重要的地位,并且随着Flink在实时数据流计算上的优势表现,Flink越来越受到很大企业平台的青睐。因此在大数据技术的学习上,Flink也是必须掌握的技术之一。那么Flink用什么语言开发?下面我们就为大家介绍一下Flink编程语言基础。

Flink编程,支持Java及Scala开发,作为开源大数据项目,代码开源在GitHub上,也可以使用Maven来编译和构建项目。使用Java或者Scala语言进行开发,需要使用jdk8版本,而如果使用Maven,maven版本需要使用3.0.4及以上。

Flink用什么语言开发

Flink作为实时数据流处理框架,具有强大的数据计算能力。这也与Flink框架的编程模型有关。

Flink运行进程:

①JobManger:

也叫masters,负责协调分布式执行,调度task,协调checkpoint,协调故障恢复。在Flink程序中至少有一个JobManager,高可用可以设置多个JobManager,其中一个是Leader,其他都是standby状态。

②TaskManager:

也叫workers,负责执行dataflow生成的task,负责缓冲数据,及TaskManager之间的交换数据。Flink程序中必须有一个TaskManager。

一般来说,Flink程序可以运行在standalone集群,Yarn或者Mesos资源调度框架中。

Flink执行流程:

在Flink框架当中,数据源有界和无界之分,有界数据源可以编写批处理程序,无界数据源可以编写流式程序。DataSet API用于批处理,DataStream API用于流式处理。

批处理使用Execution Environment和DataSet,流式处理使用Streaming Execution Environment和DataStream。

DataSet和DataStream是Flink中表示数据的特殊类,DataSet处理的数据是有界的,DataStream处理的数据是无界的,这两个类都是不可变的,一旦创建出来就无法添加或者删除数据元。

Flink程序执行的大概流程,首先是获取Flink的执行环境,然后加载数据—soure,再对加载的数据进行转换—transformation,接着对结果进行保存或者打印—sink,最后触发Flink程序的执行(execute(),count(),collect(),print()),例如:调用Execution Environment或者Stream Execution Environment的execute()方法。

关于Flink用什么语言开发,Flink编程语言基础,以上就是简单的介绍了。就目前的趋势来看,Flink框架在实时数据流计算上的优势是明显的,应用场景也非常广泛,因此在学习阶段也要着重学习和掌握。成都加米谷大数据,专业大数据培训机构,大数据开发2020春季班,正在招生中,详情可联系客服了解!
热点排行
推荐文章
立即申请>>