主页 > 新闻资讯 > 大数据存储和计算技术有哪些?

大数据存储和计算技术有哪些?

作者:张老师 浏览次数: 2020-02-03 17:13
大数据处理当中要解决的两大问题,一是存储,一是计算,存储和计算的问题解决了,那么大数据的价值挖掘也就不成问题了。但是面临完全不同于传统数据的“大数据”,在大数据存储和计算上,需要更专业的技术支持。那么大数据存储和计算技术有哪些?下面我们来详细了解一下。

大数据存储和计算技术,目前来说主流的选择就是分布式架构,而在分布式架构系统当中,Hadoop可以说是经过考验的比较成熟且稳定的大数据平台系统,因此很多企业大数据平台,都是基于Hadoop来搭建的。

大数据存储和计算技术有哪些

先来说说大数据存储。在分布式存储当中,大数据存储任务被切分成小块,分配到集群环境当中的各台机器去获得支持。分布式存储分为分布式块存储,分布式对象存储以及分布式文件系统。

Hadoop的分布式存储,主要依赖于分布式文件系统HDFS,将需要存储的数据文件,切分成最小的单元Block,一个文件按照设定的文件大小可以被切分为若干个Block,然后作为存储对象被分配到集群当中的不同位置去存储。

数据存储完成之后,下一步就是基于已经存入数据系统当中的数据,进行分析处理,实现大数据价值的挖掘。

大数据分布式计算,其实也是同样的道理,将大规模的数据处理任务进行分解,以若干个小任务进行并行计算,计算完成之后再进行结果的整合,将完成的计算结果输出并写入数据库存储。这些经过处理的计算结果,还可以作为数据源来进行进一步的分析处理。

Hadoop的分布式计算,主要依赖于分布式计算框架MapReduce,map阶段,将大规模数据处理任务切分成小任务进行计算,reduce计算,则是将计算完成的结果,进行规约。

大数据存储和计算技术有哪些,这里我们以Hadoop框架为例,为大家做了一个简单的介绍。当然,大数据存储和计算框架不止是Hadoop一家,但是按目前的发展态势来说,Hadoop无疑是典型的代表之一。成都加米谷大数据,专业大数据培训机构,大数据开发2020春季班正在招生中,详情可联系客服了解!
热点排行
推荐文章
立即申请>>