大数据处理当中,数据储存始终是一个重要的环节,从现阶段的市场现状来说,以Hadoop为首的大数据技术框架,仍然占据主流地位,而Hadoop的HDFS,在数据存储方面,仍然得到重用。今天...
查看详情 >>作为Spark负责流计算的核心组件,Spark Streaming是整个Spark学习流程当中非常重要的一块。对于Spark Streaming,作为Spark流计算的实际承载组件,我们也需要更全面的掌握。今天的大数据培训...
查看详情 >>我们都知道,Spark框架在大数据生态当中,是提供离线批处理,同时也支持准实时流处理的一个框架。这对于企业级的数据平台开发建设来说,是非常切合实际的一种选择,低成本,满足...
查看详情 >>关于Spark框架在大数据生态当中的地位,相信不必多说大家也明白,作为大数据公认的第二代计算引擎,Spark至今仍然占据重要的市场份额,只要提到大数据,那么Spark一定是如影随形的...
查看详情 >>在企业级的大数据平台当中,平台的运行每时每刻都在产生着大量的日志,而要对这些日志进行处理,就需要特定的日志系统。在大数据平台开发当中,日志系统的开发也是重要的一环...
查看详情 >>众所周知,在大数据技术生态当中,Sqoop工具主要是为数据迁移服务的,通过Sqoop可以将关系型数据库当中的数据和Hadoop集群当中的数据进行迁移,解决企业传统数据存储到Hadoop的传输难...
查看详情 >>在以Hadoop为核心的大数据技术生态当中,Flume组件在分布式数据采集需求的满足上,确实有着不错的表现,尤其是FlumeNG,Flume内部组件的不断丰富,在开发过程中的便利性也大大提升。今...
查看详情 >>Hive作为大数据开发当中常用的一个数据仓库工具,在数据存储模型这一块,是需要大家比较深入地去理解和掌握的,这样才能对于Hive的使用有更加清晰的认知。今天的大数据培训分享,...
查看详情 >>