大数据涉及到的海量数据,需要数据库来进行存储,有了数据库的存在,才能收集和处理大数据,数据库的重要性不言而喻。那么大数据常用哪些数据库,大数据存储用什么数据库,下面就为大家分享几个。
大数据本质上来说,就是对海量数据进行处理,提取其中有需要有价值的信息出来,然后进入相关场景的应用。所谓数据库,就是用来承载大数据的容器,方便我们从中筛选和调取相关信息。
目前大数据常用的数据库包括MongoDB、Redis、Elasticsearch、Hbase、Hive等——
①MongoDB
MongoDB数据库,表结构灵活可变,字段类型可以随时修改,多表查询、复杂事务操作不便,适用于表结构经常改变、数据的逻辑结构没有那么复杂、不需要多表查询、数据量又比较大的场景。
②Redis
Redis数据库,采用key-value存储,高性能,数据持久化,支持list、set等多种数据结构,支持主从复制备份,但复杂查询不便,适用于对读写性能要求极高、数据表结构简单(key-value、list、set之类)、查询条件也同样简单的场景。
③Elasticsearch
Elasticsearch数据库,支持全文搜索,自动为所有字段建立索引,支持复杂聚合查询,字段类型无法修改,写入性能较低,高硬件资源消耗,适用于构建搜索引擎和用来做数据分析。
④HBase
HBase数据库,支持海量数据,具有极强的横向(存储容量)扩展能力,在涉及多个列项,或无法获取查询数据的key时,查询效率低下,适用于数据量极大、查询条件简单、列与列之间联系不大的轻查询应用场景。
⑤Hive
Hive数据库,作为Hadoop的数据仓库,易于汇总数据,并易于对大数据执行即席查询及其他分析。至于查询,使用HiveQL的语言,类似于SQL,操作简便。
关于大数据常用哪些数据库,大数据存储用什么数据库,以上就是今天为大家分享的几点内容了。在大数据工作当中,需要根据数据的不同特征来选择适合的数据库进行存储,这样也利于后续的数据处理与分析。