Kafka作为大数据技术生态的重要组件,尤其是实时流数据处理场景下,作为分布式生产/消费系统,得到广泛的重用。而Kafka在数据生产和消费上,日志是主要的场景。今天的大数据学习分...
查看详情 >>大数据时代下的我们,隐私还存在吗?? 伴随着互联网的快速发展,我们似乎越来越离不开网络了,我们坐地铁会低头玩手机、我们吃饭的时候会玩手机、我们上厕所肯定会玩手机。...
查看详情 >>Spark SQL作为大数据查询的重要组件之一,涉及到诸多的语法,其中一个非常重要的就是Join,在数据库领域,Join的重要性不用多强调也能明白。今天的大数据培训分享,我们就来讲讲Sp...
查看详情 >>Spark SQL工作负载的性能问题,一直都是优化需要考虑的重要问题。在Spark 3.0之后,推出了自适应查询框架,致力于提升和优化查询当中的工作负载带来的性能问题。今天的大数据学习分...
查看详情 >>Spark框架,作为Hadoop之后的第二代主力框架,在大数据生态圈的地位,是得到肯定的。Spark框架在部署运行商,支持三种模式,对于初学者而言,常常搞不明白三种模式的区别。今天的大...
查看详情 >>今天开始我们的新篇章,在大数据开发的学习中hadoop系列知识占比很多,这不今天又来了HBase的简介和基础知识介绍,下面就开始今天的学习。 一、HBase简介 hbase是bigtable的开源java版本。...
查看详情 >>目前的大数据技术生态当中,分布式集群环境的管理,涉及到诸多细节,从安装配置到管理运维,不算是一项轻松的任务,这个时候就需要管理平台来提升工作效率。今天的大数据培训...
查看详情 >>在大数据处理场景下,数据平台的调度系统设计非常关键,而市场上主流的开源产品也非常多,从架构层面来说,对于调度系统设计及主流产品都需要有相应的了解。今天的大数据学习...
查看详情 >>在大数据开发工作当中,我们常常会听到调度这个词,在大规模的数据处理任务面前,为了保证运行效率,以及不同任务之间的优先级问题,就需要调度工具、调度系统,去完成数据调...
查看详情 >>