在大数据的基础学习部分,分布式、微服务的名词,相信大家都听过。大数据处理的核心思想,说到底其实就是分而治之,将大数据处理任务分为小任务进行并行处理,这其中就离不开...
查看详情 >>在大数据技术发展历程当中,Flink框架可以说是新一轮的热点技术框架,主打流批一体的计算模式,成为更适应当下需求的技术框架,因此再也技术领域得到更多的重视。今天的大数据培...
查看详情 >>大数据处理技术,随着大数据时代的发展变化,也在不断迭代更新,到了近几年,实时流计算占据主导趋势,企业级的平台开发任务当中,实时计算数据架构的地位变得愈加重要。今天...
查看详情 >>在Spark的学习当中,RDD、DataFrame、DataSet可以说都是需要着重理解的专业名词概念。尤其是在涉及到数据结构的部分,理解清楚这三者的共性与区别,非常有必要。今天的大数据培训分享...
查看详情 >>众所周知,大数据计算的第一代框架Hadoop,是致力于解决离线计算的问题而产生的,在离线批处理上性能优异,但是在实时流处理上,一直被诟病。Hadoop之后,Spark和Storm在流处理上成为...
查看详情 >>持久化存储是Spark非常重要的一个特性,通过持久化存储,提升Spark应用性能,以更好地满足实际需求。而Spark的持久化存储,根据不同的需求现状,可以选择不同的策略方案。今天的大...
查看详情 >>进入大数据时代,大数据存储的解决方案,往往涉及到数据仓库的选型策略。从传统时期的数据仓库,到大数据环境下的数据仓库,其核心的技术架构是在随着最新技术趋势而变化的。...
查看详情 >>在学习大数据之初,很多人都会对编程语言的学习有疑问,比如说大数据编程主要用什么语言,在实际运用当中,大数据主流编程是Java,但是涉及到Spark、Kafka框架,还需要懂Scala。今天...
查看详情 >>