大数据技术举例：主流计算引擎简介

作者：张老师浏览次数： 2020-08-19 17:29

在大数据快速获得关注的同时，大数据技术支持着大数据从概念快速走向落地，而正是大数据技术的成熟，才使得大数据落地有了基本的可能性。然而很多人对大数据技术还是认识不够，今天我们就来讲讲，大数据技术举例，主流大数据计算引擎简介。

大数据技术，其实可以说是涵盖了一系列对数据进行存储、计算、分析、挖掘的技术，而要实现这些规模庞大且难度复杂的数据处理任务，往往涉及到分布式计算、高并发处理、高可用处理、集群、实时性计算等。

今天大数据技术举例，我们主要从大方向上来聊聊大数据主流计算引擎：

1、Hadoop

Hadoop是第一代框架，最初主要包含分布式文件系统HDFS和计算框架MapReduce两部分，在2.0版本中，又把资源管理和任务调度功能从MapReduce中剥离形成YARN，使其他框架也可以像MapReduce那样运行在Hadoop之上。

Hadoop不断发展完善，又有了非关系数据库HBase、数据仓库Hive、数据处理工具Sqoop、机器学习算法库Mahout、一致性服务软件ZooKeeper、管理工具Ambari等，形成了相对完整的生态圈和分布式计算事实上的标准。

2、Spark

Spark当初引起关注主要是它与Hadoop的三大件之一的MapReduce之间的比较。MapReduce作为计算引擎，其计算速度当时是弱于Spark的，Spark减少了不必要的磁盘IO；增加迭代计算功能，从而大大提升数据处理效率。

3、Storm

Storm主要用于实时的流式数据处理，它与Spark最大的区别在于“实时性”的差异：Spark是“准实时”的，它先收集一段时间的数据再进行统一处理；而Storm则是“完全实时”的，来一条数据就立刻处理一条，源源不断地流入。

但Storm的缺点在于，无论是离线、高延迟，还是交互式查询，它都不如Spark框架，不同的机制决定了二者所适用的场景不同。

4、Flink

Flink同样是分布式的计算引擎，主要基于Java实现，但它的特色主要体现在流式计算。这个引擎流行的主要推手是阿里。阿里在19年初开源了它修改过的Flink，收购了Flink的母公司，并在各种线下技术论坛上推广Flink，让Flink在19年的关注度极速上升。

关于大数据技术举例，主流计算引擎简介，以上就为大家做了简单的入门介绍了。大数据技术是大数据产业发展的重要支撑，并且随着行业的发展还在持续更新迭代。成都加米谷大数据，专业大数据培训机构，大数据高级技术提升班，本月正在招生中，课程大纲及试学视频可联系客服了解！

标签： Hadoop 大数据技术大数据计算

上一篇：大数据主要培训哪些内容？学习难度大不大
下一篇：大数据在智慧城市的应用，有哪些场景

相关推荐

大家都在看

热点排行

推荐文章