在大数据生态当中,Kafka框架正在得到越来越多的重用,这是显而易见的,流计算正在大数据开发任务当中,成为越来越普遍的需求。自然,Kafka也成为大家需要重点掌握的框架之一,今...
查看详情 >>紧接上一篇,我们对大数据黄金语言Scala为大家做了概述性的简介,也了解了Scala作为诸多大数据框架的核心代码开发语言,其重要性不言而喻。今天的大数据学习分享,我们来从更具体...
查看详情 >>在大数据的学习当中,关于编程语言选择的部分,是很多人在学习初期非常关注的。在企业大数据平台开发场景下,Java语言是主流选择,其次涉及到Spark部分,就不得不提到Scala语言。今...
查看详情 >>众所周知,在大数据技术生态当中,Sqoop工具主要是为数据迁移服务的,通过Sqoop可以将关系型数据库当中的数据和Hadoop集群当中的数据进行迁移,解决企业传统数据存储到Hadoop的传输难...
查看详情 >>在以Hadoop为核心的大数据技术生态当中,Flume组件在分布式数据采集需求的满足上,确实有着不错的表现,尤其是FlumeNG,Flume内部组件的不断丰富,在开发过程中的便利性也大大提升。今...
查看详情 >>大数据生态系统当中的Flume组件,作为分布式数据采集系统得到重用,基于流式架构,提供高可用高可靠的服务,在实际应用场景下,高性能的表现使得Flume备受青睐。今天的大数据学习...
查看详情 >>大数据技术生态的各个组件,不少都是带着动物Logo的,什么大象(Hadoop)、蜜蜂(Hive)、松鼠(Flink),因此也就有了Hadoop动物园的说法,而要管理好各个组件,自然也就需要一个动物...
查看详情 >>在Hadoop框架当中,Yarn组件是在Hadoop2.0之后的版本开始引入,主要是为了解决资源管理和调度的相关问题,是在大数据平台的实际运用当中,根据实际需求而引入的解决方案。今天的大数...
查看详情 >>Hive作为大数据开发当中常用的一个数据仓库工具,在数据存储模型这一块,是需要大家比较深入地去理解和掌握的,这样才能对于Hive的使用有更加清晰的认知。今天的大数据培训分享,...
查看详情 >>