主页 > 新闻资讯 > 大数据Spark是什么意思?Spark大数据入门简介

大数据Spark是什么意思?Spark大数据入门简介

作者:张老师 浏览次数: 2020-02-11 16:46
在大数据计算框架领域,Spark无疑是作为大数据从业者们所必须掌握的,而作为大数据初学者,很多人对于大数据Spark的了解还很少,同时也存在很多的困惑,诸如大数据Spark是什么意思?Spark是做什么的?下面我们就为大家带来Spark大数据入门简介。

Spark是什么?简单来说就是一个大数据计算框架,主要完成大数据计算处理的任务。而具体到Spark的实现逻辑上,主要的指导思想仍然是分布式架构。

大数据Spark是什么意思

从早期的Hadoop,再到现在的Spark,其实都是基于分布式思想来设计的,分布式架构是现在解决大数据计算处理问题的公认解决方案。

同样是基于分布式架构,Hadoop的MapReduce程序框架,在后续面对实时数据流处理上,开始显现出不足来,而Spark在此基础之上,做了优化和调整,同样是MapReduce计算模式,但是除此之外提供了更多的计算模式支持,包括批处理、迭代算法、交互式查询、流处理等。

因此Spark也能适用于更多的分布式计算场景,将不同的计算模式整合到一个统一的框架下,将简单低耗的各种数据处理流程进行整合,在实际的数据处理分析上,整个系统平台的性能得到大大的提升。

Spark作为底层支持框架,提供丰富的接口,基于Python、Java、Scala和SQL的简单易用的API以及内建的丰富的程序库,还能与其他的大数据工具密切配合,包括与Hadoop系统框架的无缝结合。Spark可以运行在Hadoop集群上,访问包括HDFS、Cassandra在内的任意Hadoop数据源。

作为一个大一统的软件栈,Spark大数据框架由多个组件组成,Spark Core负责Spark的核心功能实现,包括部署、存储、任务提交与执行、计算引擎等;Spark SQL提供SQL处理能力,实现交互查询需求;Spark Streaming负责流式计算处理,完成实时数据流处理。

关于大数据Spark是什么意思,在经过上面的一个基本简介之后,相信大家对于Spark也都有了相对清晰的认识了。Spark作为目前主流运用的大数据计算框架之一,是做大数据必须要掌握核心知识点之一。成都加米谷大数据,专业大数据培训机构,大数据知识分享,更多详情可联系客服了解!
热点排行
推荐文章
立即申请>>