主页 > 新闻资讯 > 大数据Hadoop是什么?Hadoop体系包括哪些

大数据Hadoop是什么?Hadoop体系包括哪些

作者:张老师 浏览次数: 2020-01-03 16:13
提到大数据,Hadoop似乎总是跟着来,大数据Hadoop两者之间,给人的感觉是联系非常紧密。但是具体到大数据和Hadoop各自的概念上,很多人又常常很糊涂,到底大数据Hadoop是什么?Hadoop体系包括哪些?下面我们来详细了解一下。

首先,我们先说大数据。大数据是一个听起来感觉很空泛的词,实际上,大数据本身指的是无法利用传统计算机技术进行处理的大规模数据集,而大数据概念,现在已经不再仅仅指数据本身,还包括大数据相关的各类工具、技术以及框架等。

大数据Hadoop是什么

这其中,也包括Hadoop。Hadoop是大数据主流的应用框架,通过大数据技术,实现对大数据更高效精确的处理。

大数据Hadoop是什么,我们可以从Hadoop生态体系,按照不同的模块来进行理解。

分布式文件系统-HDFS

HDFS是Hadoop的数据存储模块,也叫做分布式文件系统,通过分布式存储,来解决海量大数据的存储空间、存储稳定性等相关的问题。

分布式计算框架-MapReduce

MapReduce是支持离线的分布式计算框架,通过将大规模数据处理的任务分割成小块进行运算,再将小块的任务计算结果合并,减轻系统处理大规模数据的压力。

分布式开源数据库-Hbase

HBase是分布式数据库,适合于非结构化数据存储,保留数据多个时间段版本。

数据仓库工具-Hive

Hive是基于Hadoop的数据仓库工具,处理结构化SQL查询功能,将SQL语句转换为MapReduce任务进行运行并提交到集群上去执行,适合完成数据仓库的统计分析。

系统协调工具-Zookeeper

Zookeeper的作用是分布式应用程序协调服务,为各个模块提供一致性服务。

数据导入导出框架-Sqoop

Sqoop主要用于在Hadoop(Hive)与传统的数据库(Mysql等)之间进行数据的传递。

关于大数据Hadoop是什么,Hadoop体系包括哪些,以上就是简单的介绍了。需要知道的是,在大数据技术框架当中,Hadoop无疑是不能忽视的重点,在大数据学习当中,要重点掌握大数据Hadoop相关的知识。成都加米谷大数据,专业大数据课程培训,了解课程详情可咨询客服!
热点排行
推荐文章
立即申请>>