HDFS作为Hadoop的分布式文件系统,其在大数据平台当中的地位是显而易见的。面对越来越大规模的数据存储任务,HDFS的高可靠性和高性能依然值得称赞,这也与HDFS的数据读写机制有关。...
查看详情 >>大数据得以在低成本的硬件设备当中实现应用,很大程度上来说,是得益于分布式架构。基于互联网的发达,大规模的数据不断累积,企业当中实际的大数据应用场景,也越来越多。自...
查看详情 >>针对于不断新增的海量数据资源,企业需要通过及时地数据分析处理,才能从中挖掘出价值线索,反哺业务,实现数据驱动业务发展。而企业级的数据分析场景,多是采用OLAP数据分析引...
查看详情 >>在企业级的数据分析场景当中,实时数据分析需求正在不断上升,与此同时也就对实时数据分析系统提出了要求。在开源的实时OLAP数据分析引擎当中,Druid算得上是一个经典产品。今天...
查看详情 >>在分布式存储技术体系当中,分布式文件存储是其中的分类之一,也是大数据架构当中常常用到的。得益于Hadoop的高人气,Hadoop原生的HDFS分布式文件系统,也广泛为人所知。但是分布式...
查看详情 >>在大数据开发当中,Java和Scala是涉及到的两门重要语言,在学习阶段,掌握相应的语言,为后续的技术深入、源码研读都是非常有必要的。今天的大数据培训分享,我们来对Java和Scala这...
查看详情 >>在大数据基础架构当中,分布式存储可以说是非常重要的一环,而提高分布式存储服务的技术,也花开遍地,闭源、开源的优秀分布式存储技术方案,也不在少数。今天的大数据学习分...
查看详情 >>在 Spark 诞生之初,就有人诟病为什么 AMP 实验室选了一个如此小众的语言 - Scala,很多人还将原因归结为学院派的高冷,但后来事实证明,选择 Scala 是非常正确的,Scala 很多特性与 Spa...
查看详情 >>Kafka在大数据流式处理场景当中,正在受到越来越多的青睐,尤其在实时消息处理领域,kafka的优势是非常明显的。相比于传统的消息中间件,kafka有着更多的潜力空间。今天的大数据学...
查看详情 >>