MapReduce作为Hadoop的核心计算引擎,算是学习当中必学的一个部分。虽然发展至今,MapReduce计算框架已经很少直接使用了,但是作为分布式并行计算的代表,还是值得学习。今天的大数据...
查看详情 >>在大数据处理的诸多环节当中,数据的引入是前期的重要一环,尤其是很多传统的数据存储,多以关系型数据库为主,而这些数据要导入到分布式存储体系当中,往往需要用到Sqoop。今天...
查看详情 >>HDFS作为Hadoop生态的分布式文件系统,对于底层存储来说,提供重要的支持,在学习Hadoop框架的前期,基本上都是从HDFS开始学起。今天的大数据学习分享,我们就从HDFS的入门讲起,来看...
查看详情 >>HDFS作为Hadoop的分布式文件系统,对于大批量数据的存储,要做到高效快速且不出错,一旦出错也能快速纠正,这就不得不提到HDFS的容错机制。今天的大数据学习分享,我们就来具体讲讲...
查看详情 >>HDFS作为Hadoop大数据生态下的分布式文件系统,在越来越大规模的数据场景下,HDFS历经考验,其性能也得到肯定。并且HDFS也针对不断变化的形式,推出了HA高可用机制。今天的大数据学习...
查看详情 >>