主页 > 新闻资讯 > 大数据专业技术培训之Lambda架构入门简介

大数据专业技术培训之Lambda架构入门简介

作者:张老师 浏览次数: 2020-06-05 16:05
大数据实现落地应用,其中起到关键性作用的,还是大数据技术的支持,针对于不同场景下的数据需求,需要采取相应的技术解决方案,并且能够将这些解决方案在一个系统平台上实现。当然,这需要进行合理的大数据架构来实现。今天的大数据专业技术培训分享,我们就来聊聊著名的Lambda架构。

Lambda架构最早是来自于Twitter的一位工程师,在基于Twitter平台的分布式数据处理系统当中,有了初步的想法和实践。

大数据专业技术培训

典型的Lambda架构,分为三个层次,分别是批处理层(Batch Layer),速度处理层(Speed Layer),以及服务层(Serving Layer),三个层次分别解决不同的数据处理需求。

批处理层(Batch Layer),主要负责存储管理主数据集和预先批处理计算好的视图。这部分数据对及时性要求不高,会采取批处理的方式同步到主库中,通常以定时任务的形式存在。

速度处理层(Speed Layer),主要负责处理实时数据。由于对数据及时性的要求,这部分数据会通过内存计算出结果,马上提供给使用者,同时对于数据的准确性要求不高。

在速度处理层,数据会通过批处理层入库,然后针对部分数据进行校验,通常以Storm之类的应用的形式出现。

而在服务层(Serving Layer),数据进入到平台以后,会进行存储、同步、计算、分析等过程。服务层负责以服务的方式将数据提供给终端客户,其形式有报表、仪表盘、API接口等。

在企业大数据平台搭建上,基于Lambda架构会有更具体的应用,通常分为数据采集、数据处理和数据输出与展示三个层面。

数据采集层,负责从多个源头收集数据,再将数据同步到大数据系统当中,并且进行基本的数据清洗。这个层面,数据同步可以使用Sqoop,日志同步可以使用Flume,行为数据收集可以使用Kafka。

数据处理层,根据不同的数据处理需求,比如说离线计算和实时计算,选择不同的框架来完成。离线处理可以采用MapReduce、Hive、Spark等;实时计算可以采用Storm、Spark Steaming等。

数据输出与展示层面,一般来说通过应用程序直接访问数据库来完成。

关于大数据专业技术培训,Lambda架构入门,以上就为大家做了一个简单的介绍了。在大数据要实现应用落地,大数据专业技术是最核心的部分,掌握大数据专业技术也是入行发展的关键。加米谷大数据,成都大数据培训机构,大数据专业技术培训班,本月正在招生中,课程大纲及试听课程可联系客服获取!
热点排行
推荐文章
立即申请>>