hbase是hadoop旗下的一个组件,是一个数据库。实现快速读写

HBASE的特性:

数据的最终持久化存储是基于:HDFS->存储容量可以随时在线扩容

HBASE的数据增删改查功能模块是:分布式系统->hbase是一个分布式数据库系统

而hive查询很慢,不能修改数据。hive读hdfs数据。

hbase部署之前需要先启动zookeeper和hdfs。这里我准备了3台机器。

三台机器如下:

 ubuntu1
 ubuntu2
 ubuntu3 

下载地址:http://archive.apache.org/dist/hbase

软件包:hbase-2.2.4-bin.tar.gz

解压hbase安装包

修改conf/hbase-env.sh

 export JAVA_HOME=/app/jdk1.8.0_171
 export HBASE_MANAGES_ZK=false 

修改conf/hbase-site.xml

    <configuration>
          <!-- 指定hbase在HDFS上存储的路径 -->
         <property>
                 <name>hbase.rootdir</name>
                 <value>hdfs://ubuntu1:9000/hbase</value>
         </property>
         <!-- 指定hbase是分布式的 -->
         <property>
                 <name>hbase.cluster.distributed</name>
                 <value>true</value>
         </property>
         <!-- 指定zk的地址,多个用“,”分割 -->
         <property>
                 <name>hbase.zookeeper.quorum</name>
                 <value>ubuntu1:2181,ubuntu2:2181,ubuntu3:2181</value>
         </property>
   </configuration> 

修改 conf/regionservers

  ubuntu1
  ubuntu2
  ubuntu3 

启动hbase集群:

 bin/start-hbase.sh 

启动完后,还可以在集群中找任意一台机器启动一个备用的master

  bin/hbase-daemon.sh start master 

新启的这个master会处于backup状态

启动后访问:

http://ubuntu1:16010/master-status

启动hbase的命令行客户端

 bin/hbase shell
 Hbase> list     // 查看表
 Hbase> status   // 查看集群状态
 Hbase> version  // 查看集群版本 

发表评论

电子邮件地址不会被公开。 必填项已用*标注