主页 > 新闻资讯 > 大数据常用框架:大数据处理常用的架构解析

大数据常用框架:大数据处理常用的架构解析

作者:张老师 浏览次数: 2020-01-13 11:55
在大数据问题上,关键性的技术其实就是对于大数据的处理,企业搭建自己的大数据平台,通过对数据的长期性收集和分析处理,实现对数据资产的价值挖掘和变现。目前来说,大数据常用框架有几种,今天我们主要来问大家分享几个大数据处理常用的架构解析。

在大数据处理上,传统的大数据架构,是为了解决传统BI问题而设计的,存在比较大的一个问题就是,当数据分析的量开始增大,系统运行会出现各种各样的问题。这个时期的大数据处理,依然保留的ETL动作,数据主要经过ETL来进入存储。

大数据常用框架

基于传统大数据架构存在的问题,为了满足更大数据量和更好性能的大数据处理,在传统大数据架构的基础上,开始出现流式架构。

流式架构在处理大数据上,直接去掉了批处理,将所有的数据以流的形式进行处理,在数据接入上没有了ETL,而是使用数据通道。流式架构在大数据处理上,因为没有了ETL过程,所有数据的时效性很高。

但是因为流式架构不存在批处理,对于数据的重播和历史统计没有很好的支撑,对于离线数据处理上,存在一定的局限。

在流式架构之后,又开始出现了Lambda架构。Lambda架构在大数据处理上,将数据通道分为两支,实时流和离线。实时流依照流式架构,保障了时效性数据处理,离线数据处理主要通过批处理的方式进行,两者结合,既有实时又有离线,对大部分的数据处理任务都能完成地很好。

既Lambda架构之后,又出现了Kappa架构,Kappa架构又在Lambda架构的基础上进行了优化。Kappa架构,依旧以流处理为主,将实时和流部分进行了合并,将数据通道以消息队列进行替代。

Kappa架构解决了Lambda架构里面的冗余部分,以数据可重播的思路进行了设计,整个架构非常简洁。

以上来说,就是目前大数据常用框架的几个举例,针对目前的企业大数据处理任务,大部分的功能需求都可以通过Hadoop来实现,然后基于实际的数据处理需求,可以在数据处理架构上进行一定的优化和整合。成都加米谷大数据,专业大数据培训机构,大数据技术知识分享,详情可咨询客服获取更多信息!
热点排行
推荐文章
立即申请>>