在Kafka框架当中,主题和分区是两个非常重要的核心概念,在入门之初,对于核心概念一定是要理解透彻,才能在后续的学习当中,水到渠成地去理解其中的运行机制和原理。今天的大数...
查看详情 >>在大数据生态当中,分布式集群当中的一个重要组件,就是Zookeeper,作为集群运行的重要管理者,正如其名字动物园管理员所示,负责集群运行的诸多事宜。今天的大数据学习分享,我...
查看详情 >>Zookeeper作为大数据技术生态当中的一个分布式服务框架,也可以算是Hadoop的一个重要子项目,最初作为MapReduce的协调服务组件而存在,后来独立出来,负责整个集群的协调服务,在大数...
查看详情 >>在Hadoop生态体系当中的Hive,以提供数据仓库服务而闻名,定义基本的数据结构,使得数据查询任务能够通过更便捷的方式去实现,省去了MapReduce直接编程的复杂操作。今天的大数据学习...
查看详情 >>从传统的数据库存储到大数据背景下的数据平台系统存储,不同数据库系统之间的数据迁移,是需要解决的一个重要问题。在大数据技术生态下,Sqoop作为数据迁移工具,应用程度还是比...
查看详情 >>Hive在Hadoop大数据生态体系当中的地位,不用特别强调,相信大家也是知道一二的。Hadoop核心的分布式存储与数据管理,需要HDFS、Hbase、Hive各个组件的密切配合。今天的大数据培训分享,...
查看详情 >>在大数据技术生态当中,Hive和Hbase无疑都是非常重要的两个组件,在实际的大数据处理任务当中,这两者也都不可或缺,尤其是在Hadoop基础架构的支撑下,这两者各自占据着重要地位。...
查看详情 >>在大数据的发展当中,大数据技术生态的组件,也在不断地拓展开来,而其中的Hive组件,作为Hadoop的数据仓库工具,可以实现对Hadoop集群当中的大规模数据进行相应的数据处理。今天我...
查看详情 >>作为Hadoop生态的重要核心组件,Yarn的存在是至关重要的。Hadoop生态下的诸多框架组件,要实现在同一个生态下的集成运行,其中涉及到的任务协调与调度,通通由Yarn来搞定。今天的大数...
查看详情 >>