主页 > 新闻资讯 > Hadoop基础教程行吗?Hadoop基础入门解析

Hadoop基础教程行吗?Hadoop基础入门解析

作者:张老师 浏览次数: 2020-03-31 14:53
在大数据培训当中,大数据打基础是非常关键的一个阶段,学大数据,只有基础好了才能在后续的技术学习阶段,更好地理解相关概念理论。那么Hadoop基础教程行吗,今天我们就为大家带来Hadoop基础入门解析。

Hadoop是一个适合大数据的分布式存储与计算平台,能够为大批量数据处理提供高效可靠的计算处理解决方案。

Hadoop基础教程行吗

Hadoop的核心组件是HDFS,Mapreduce,YARN,其中HDFS是分布式文件系统,负责完成分布式存储,MapReduce是分布式计算框架,负责完成大数据计算,而Yarn则是后来加入的调度框架,负责系统平台的任务调度工作,保证整体运行的高效率。

HDFS,即Hadoop Distributed File System分布式文件系统,其架构是主从结构:

•主节点,只有一个:namenode

•从节点,有很多个:datanodes

namenode负责管理,接收用户操作请求,可以实现对文件系统的操作(一般的操作方式有两种,命令行方式和Java API方式);维护文件系统的目录结构(用来对文件进行分类管理);管理文件与block之间关系(文件被划分成了Block,Block属于哪个文件,以及Block的顺序好比电影剪辑),block与datanode之间关系。

datanode负责存储,文件被分成block(block一般是以64M来划分,但每个Block块所占用的空间是文件实际的空间)存储在磁盘上,将大数据划分成相对较小的block块,这样可以充分利用磁盘空间,方便管理。为保证数据安全,文件会有多个副本(就好比配钥匙,都是为了预防丢失),这些副本会一块一块复制,分别存储在不同的DataNode上。

而MapReduce架构,同样是主从结构

•主节点,只有一个:JobTracker

•从节点,有很多个:TaskTrackers

JobTracker负责接收客户提交的计算任务;把计算任务分给TaskTrackers执行;监控TaskTracker的执行情况。

TaskTrackers负责,执行JobTracker分配的计算任务。

关于Hadoop基础教程行吗,Hadoop基础入门解析,以上就是简单的内容分享了。在大数据学习当中,Hadoop是非常重要的一部分,在未来的实际工作当中,用到的频率也非常高。成都加米谷大数据,专业大数据培训机构,大数据开发2020春季班正在招生中,课程大纲及学习资料可联系客服领取!
热点排行
推荐文章
立即申请>>