主页 > 新闻资讯 > 大数据存储用什么数据库?大数据数据库如何选择

大数据存储用什么数据库?大数据数据库如何选择

作者:张老师 浏览次数: 2020-01-17 11:53
大数据实现处理的前提,是先要将这些数据实现存储整合,将大批量、多格式的复杂数据,存储到统一系统框架下,再进行进一步的价值分析和挖掘。而为了解决大数据存储的问题上,涉及到很关键的一点就是数据库的选择。那么大数据存储用什么数据库?大数据数据库如何选择?今天我们就来好好聊一聊。

目前来说,企业在搭建大数据平台的选择时,为了节约成本,开源的项目是优先选择,比如说整体框架平台的技术,大都是基于Hadoop来做的,而基于Hadoop,可以很灵活地加入各个模块,来实现各种大数据存储需求。

大数据存储用什么数据库

HBase

作为Hadoop框架下的非关系型数据存储仓库,HBASE是Hadoop框架下的基础选择,基于Hadoop自身的分布式文件系统HDFS,HBASE也同样能够实现高性能的数据存储,具有高扩展性、支持高效的数据吞吐。

Hive

说了HBASE,那么也得说说Hive,作为Hadoop的数据仓库,在大数据即时查询和分析上有一定的优势,通过HiveQL的类似SQL的语言来实现操作转换。

Cassandra

Cassandra现在也是属于Apache旗下,也是分布式NoSQL数据库系统,国内外的很多大企业都在用,包括网飞(Netflix)、Twitter、Urban Airship、Constant Contact、Reddit等。

MongoDB

MongoDB算是比较大型的NoSQL数据库选择,在大数据存储上,面向文档的存储、支持完全索引、复制,也算是高可用性数据库的代表。

Neo4j

Neo4j是图形数据库的典型代表,在大数据时代,如果是以图片为主的数据存储和分析任务上,Neo4j还是比较擅长的。

CouchDB

CouchDB,也是Apache旗下的开源项目,在数据存储上,主要是面向文档,这一点跟MongoDB是差不多的。CouchDB将数据存储在JSON文档中,可以使用JavaScript来查询,具有分布式扩展功能和高容错机制。

关于大数据存储用什么数据库,大数据数据库如何选择,以上就是简单的介绍了。在大数据处理的各个环节当中,大数据存储是非常关键的一环,也是起到基础支持的一环,所以重要性不言而喻。成都加米谷大数据,大数据技术知识分享,大数据开发培训班2020春季班正在招生中,详情可联系客服了解!
热点排行
推荐文章
立即申请>>