在企业级的数据分析场景当中,实时数据分析需求正在不断上升,与此同时也就对实时数据分析系统提出了要求。在开源的实时OLAP数据分析引擎当中,Druid算得上是一个经典产品。今天...
查看详情 >>在分布式存储技术体系当中,分布式文件存储是其中的分类之一,也是大数据架构当中常常用到的。得益于Hadoop的高人气,Hadoop原生的HDFS分布式文件系统,也广泛为人所知。但是分布式...
查看详情 >>在大数据开发当中,Java和Scala是涉及到的两门重要语言,在学习阶段,掌握相应的语言,为后续的技术深入、源码研读都是非常有必要的。今天的大数据培训分享,我们来对Java和Scala这...
查看详情 >>在大数据基础架构当中,分布式存储可以说是非常重要的一环,而提高分布式存储服务的技术,也花开遍地,闭源、开源的优秀分布式存储技术方案,也不在少数。今天的大数据学习分...
查看详情 >>在 Spark 诞生之初,就有人诟病为什么 AMP 实验室选了一个如此小众的语言 - Scala,很多人还将原因归结为学院派的高冷,但后来事实证明,选择 Scala 是非常正确的,Scala 很多特性与 Spa...
查看详情 >>Kafka在大数据流式处理场景当中,正在受到越来越多的青睐,尤其在实时消息处理领域,kafka的优势是非常明显的。相比于传统的消息中间件,kafka有着更多的潜力空间。今天的大数据学...
查看详情 >>大数据技术生态当中,NoSQL数据库是数据存储的重要支持,而提到NoSQL数据库,Hbase一定是不可忽视的一个。Hbase源自Google Big Table,与Hadoop生态联系紧密,也是学习当中的重点。今天的大...
查看详情 >>Apache Spark 2.2 以及以上版本提供的三种 API - RDD、DataFrame 和 Dataset,它们都可以实现很多相同的数据处理,它们之间的性能差异如何,在什么情况下该选用哪一种呢? 关于RDD 从一开始 R...
查看详情 >>在Java学习当中,JVM虚拟机是非常重要的一部分,也可以说是难点,而在大数据当中,进行大数据集群环境的搭建和部署,对于JVM的应用也是显而易见的。今天的大数据学习分享,我们就...
查看详情 >>