主页 > 新闻资讯 > 高级大数据培训班:大数据技术知识点总结

高级大数据培训班:大数据技术知识点总结

作者:张老师 浏览次数: 2020-06-23 14:29
随着大数据受到越来越多的重视,企业基于大数据相关业务的开展,需要引入更多的专业人才,也就带来了大数据相关岗位学的需求上升。当然,大数据岗位是有着技术门槛要求的。今天的高级大数据培训班分享,我们来对大数据技术知识点做一个简单的总结。

行业当中主流运用的大数据技术,围绕大数据存储、实时计算、离线计算等不同场景,有不同的技术解决方案。

高级大数据培训班

1、Hadoop核心

(1)分布式存储基石:HDFS

掌握数据块、NameNode、DataNode、数据写入与读取过程、数据复制、HA方案、文件类型、HDFS常用设置Java API代码演示等知识点。

(2)分布式计算基础:MapReduce

掌握MapReduce简介、编程模型、Java API介绍、编程案例介绍、MapReduce调优等。

(3)Hadoop集群资源管家:YARN

掌握YARN基本架构、资源调度过程、调度算法等。

2、离线计算

(1)离线日志收集利器:Flume

掌握Flum日志收集、适宜场景、常见问题等。

(2)离线批处理必备工具:Hive

掌握Hive总体架构、使用场景、视图函数表的分区、分桶和抽样优化等

(3)速度更快的Hive:Impala

掌握Impala数据处理过程、Impala与Hive的比较常用配置与查错,调优等。

(4)更快更强更好用的MR:Spark

掌握Spark编程、Spark SQL和DataFrame等。

3、实时计算

(1)流数据集成神器:Kafka

掌握Kafka构成及工作原理。

(2)实时计算引擎:Spark Streaming

掌握Spark Streaming工作原理、Streaming程序部署、性能调优等。

(3)海量数据高速存取数据库:HBase

掌握HBase架构及基本组件、HBase Table设计、HBase基本操作等。

4、大数据ETL

(1)ETL神器:Sqoop,Kettle

掌握Kettle和Sqoop常用组件,已经如何在Mysql和Hive之间进行数据传输转换。

(2)任务调度双星:Oozie,Azkaban

掌握ETL与计算任务的统一管理和调度、Oozie和Azkaban调度实操等。

关于高级大数据培训班,大数据技术知识点,以上就为大家做了一个简单的总结了。大数据培训学习是一种快速提升专业技能的方式,但同时也需要学习者自身投入足够的时间和精力去学习。成都加米谷大数据,专业大数据培训机构,大数据开发高级提升班,本月正在招生中,课程大纲及试学视频可联系客服获取!
热点排行
推荐文章
立即申请>>