主页 > 新闻资讯 > 大数据的开发培训之Hadoop平台架构组成

大数据的开发培训之Hadoop平台架构组成

作者:张老师 浏览次数: 2020-06-11 18:14
即使经过了这么多年的发展,大数据领域也一直在不断涌现出新的技术架构,但是Hadoop依然不容忽视。在基础架构的选择上,Hadoop仍然有着不可替代的优势,也能够满足绝大部分的企业需求。今天的大数据的开发培训分享,我们就来讲讲Hadoop平台架构组成。

大数据处理,其实包括数据采集、数据存储、数据计算、数据应用服务、数据可视化都多个环节,这些环节都需要在大数据平台架构当中实现。

大数据的开发培训

Hadoop大数据架构组成

通常来说,企业级的大数据平台,Hadoop运用的组件如下:

(1)Hdfs:分布式文件系统,它其实跟linux的EXT4文件系统类似,差异就是HDFS是分布式的,且能保存多个副本且提供容错机制。

(2)Yarn:资源管理调度系统,将各个资源部分(CPU、内存、带宽等)精心安排给需要的节点。

(3)Hbase:分布式的、面向列的开源分布式的非关系型数据库,关系数据库很难实现横向扩展,纵向扩展的空间也比较有限。相反,HBase和BigTable这些分布式数据库就是为了实现灵活的水平扩展而开发的,能够轻易地通过在集群中增加或者减少硬件数量来实现性能的伸缩。

(4)Zookeeper:是一个分布式、开源的式应用程序协调服务集,是集群的管理者,监视着集群中各个节点的状态根据节点提交的反馈进行下一步合理操作,比如同步、配置管理、集群管理、命名空间。

(5)SPARK:是专为大规模数据处理而设计的快速通用的计算引擎,可用于实时计算,,Spark具有运行速度快、易用性好、通用性强和随处运行等特点。

(6)Spark streaming/Flume/flink/:流式处理框架,处理实时数据,实时数据计算研判等。

(7)ES:ElasticSearch是一个分布式搜索引擎,提供全文搜索和实时分析的结构化和非结构化的数据。

关于大数据的开发培训,Hadoop平台架构组成,以上就为大家做了一个简单的介绍了。企业级的大数据平台,Hadoop能够很好地满足需求,也正是因此,Hadoop才得到广泛应用。加米谷大数据,成都大数据培训机构,Hadoop大数据开发班,本月正在招生中,课程大纲及试学视频可联系客服获取!
热点排行
推荐文章
立即申请>>