在大数据处理上,MapReduce可以说是非常具备代表性的一代框架,尤其是在以Hadoop为首的离线批处理框架当中,MapReduce是核心的数据处理引擎,而随后的Spark其实也是在MapReduce基础之上发展...
查看详情 >>作为Hadoop的分布式文件系统的HDFS,是Hadoop框架学习当中的重点内容,HDFS的设计初衷,是致力于存储超大文件,能够通过构建在普通PC设备上的集群环境,以较低成本完成大规模数据存储...
查看详情 >>大数据处理当中,数据储存始终是一个重要的环节,从现阶段的市场现状来说,以Hadoop为首的大数据技术框架,仍然占据主流地位,而Hadoop的HDFS,在数据存储方面,仍然得到重用。今天...
查看详情 >>众所周知,在大数据技术生态当中,Sqoop工具主要是为数据迁移服务的,通过Sqoop可以将关系型数据库当中的数据和Hadoop集群当中的数据进行迁移,解决企业传统数据存储到Hadoop的传输难...
查看详情 >>在以Hadoop为核心的大数据技术生态当中,Flume组件在分布式数据采集需求的满足上,确实有着不错的表现,尤其是FlumeNG,Flume内部组件的不断丰富,在开发过程中的便利性也大大提升。今...
查看详情 >>Hive作为大数据开发当中常用的一个数据仓库工具,在数据存储模型这一块,是需要大家比较深入地去理解和掌握的,这样才能对于Hive的使用有更加清晰的认知。今天的大数据培训分享,...
查看详情 >>Hive是大数据开发培训当中,入门必须掌握的重要基础知识,作为Hadoop体系当中的数据仓库工具,在数据提取、转化、加载的环节当中,起到非常重要的支持作用。今天的大数据培训分享...
查看详情 >>互联网的发展,带来了各种数据的爆发式增长,所以接入互联网的相关操作行为,都化为虚拟的数据被记录了下来。大数据时代的带来,一个明显的变化就是全样本数据分析,面对TB/P...
查看详情 >>