主页 > 新闻资讯 > 大数据技术培训:大数据技术发展历程和未来趋势

大数据技术培训:大数据技术发展历程和未来趋势

作者:张老师 浏览次数: 2020-04-20 16:54
要实现对海量数据的处理,大数据技术是关键,大数据从概念真正走向落地,其中很大一个原因,是因为大数据技术的成熟。我们学习大数据,市面上的大数据培训课程,其实核心还是对于大数据技术知识的培训学习。今天的大数据技术培训分享,我们来聊聊大数据技术发展历程和未来趋势。

大数据的应用和发展,要论起源,还是在互联网行业,最早开始对大数据有想法的,是Google,基于搜索引擎上的海量数据处理,提出了分布式数据处理的技术体系,以相对来说较低的成本,使得大数据处理成为可能。

大数据技术培训

受谷歌启发,Apache Hadoop实现了自己的分布式文件系统HDFS、分布式计算系统MapReduce和分布式数据库HBase,并将其进行开源,这是大数据技术开源生态体系的起点。

2008年左右,雅虎最早在实际环境中搭建了大规模的Hadoop集群,这是Hadoop在互联网公司使用最早的案例,后来Hadoop生态的技术就渗透到了互联网、电信、金融乃至更多的行业。

2009年UCBerkley大学的AMPLab研发出了Spark,经过5年的发展,正式替换了Hadoop生态中MapReduce的地位,成为了新一代计算引擎,而2013年纯计算的Flink诞生,对Spark发出了挑战。2014年之后大数据技术生态的发展进入了平稳期。

2014年以后,整体大数据的技术栈已经趋于稳定,由于云计算、人工智能等技术发展,还有芯片、内存端的变化,大数据技术也在发生相应的变化。

典型的就是流式架构的更替,最早大数据生态没有办法统一批处理和流计算,只能采用Lambda架构,批的任务用批计算引擎,流式任务采用流计算引擎,比如批处理采用MapReduce,流计算采用Storm。

后来Spark试图从批的角度统一流处理和批处理,Spark Streaming采用了micro-bach的思路来处理流数据。近年来纯流架构的Flink异军突起,由于其架构设计合理,生态健康,近年来发展特别快。而Spark近期也抛弃了自身微批处理的架构,转向了纯流架构Structure Streaming,流计算的未来霸主还未见分晓。

关于大数据技术培训,大数据技术发展历程和未来趋势,以上为大家做了一个简单的介绍,大数据技术为大数据处理提供关键性的支持,并且也随着新的需求有新的技术框架出现,这些也是大数据从业者们需要长期关注的。加米谷大数据,成都大数据培训机构,大数据技术提升班,本月正在招生中,课程详情可联系客服了解!
热点排行
推荐文章
立即申请>>