主页 > 新闻资讯 > Hbase教程菜鸟教程:Hadoop Hbase入门简介

Hbase教程菜鸟教程:Hadoop Hbase入门简介

作者:张老师 浏览次数: 2020-02-12 17:13
在Hadoop系统框架当中,大家所熟知的HDFS是分布式文件系统,而Hbase才是数据存储的数据库,这两者之间的联系是非常紧密的,Hbase使用HDFS作为分布式数据存储。关于分布式存储,Hbase的重要性不言而喻,那么今天我们就来为大家分享Hbase教程菜鸟教程。

传统数据的数据处理,主要是关系型数据库,这样的数据库在面对大规模的数据存储任务时,就出现了明显的不足,大数据时代的数据,规模大、新增快、格式多样,因此传统的关系型数据库已经不能适应新的需求。

Hbase教程菜鸟教程

在这样的背景下,非关系型数据库开始成为主流的选择,而为了更大地拓展数据存储潜力,Google首先研发了BigTable,这也是Hbase的原型。

Hbase是一个面向列的非关系型数据库,弱化了传统的表结构,而是采取Column Family(常译为列族/列簇)来对数据进行分类。一个列族包含多个列,一个列族的多个列之间通常也具有某种关系,比如相似或同种类别。所以列族可以看作是某种分类(归类)。

每个类别里都会有具体的信息,它们就相当于一个个标识符(变量名),在Hbase中叫做Column Qualifier(列修饰符)。列修饰符位于列族里面用来标识一条条数据。

在Hbase中一个列族(Column Family)和一个列修饰符(Column Qualifier)组合起来才叫一个列(Column),使用冒号(:)分割,列族:列修饰符。

在传统数据库中每一行的唯一标识符叫做主键,在Hbase中叫做row key(行键)。数据在进入Hbase时都会被打上一个时间戳,这个时间戳可以作为版本号来使用。

一个行键、列族、列修饰符、数据和时间戳组合起来叫做一个单元格(Cell)。这里的行键、列族、列修饰符和时间戳其实可以看作是定位属性(类似坐标),最终确定了一个数据。

今天的Hbase教程菜鸟教程,主要是对于Hbase的数据存储结构方面的简介,Hbase与HDFS联合起来,是Hadoop实现分布式存储的基石,在整个Hadoop生态系统当中的重要性非同一般。成都加米谷大数据,大数据技术分享,大数据培训班每月开班中,课程大纲可联系客服获取!
热点排行
推荐文章
立即申请>>