HBase - 创建数据

使用HBase Shell插入数据

本章演示如何在HBase表中创建数据.要在HBase表中创建数据,请使用以下命令和方法:

  • put 命令,

  • add() Put 类的方法,

  • put() HTable 类的方法.

例如,我们将在HBase中创建下表.

HBase表

使用 put 命令,可以将行插入表中.它的语法如下:

put ’<table name>’,’row1’,’<colfamily:colname>’,’<value>’

插入第一行

让我们将第一行值插入到emp表中如下所示.

hbase(main):005:0> put 'emp','1','personal data:name','raju'
0 row(s) in 0.6600 seconds
hbase(main):006:0> put 'emp','1','personal data:city','hyderabad'
0 row(s) in 0.0410 seconds
hbase(main):007:0> put 'emp','1','professional
data:designation','manager'
0 row(s) in 0.0240 seconds
hbase(main):007:0> put 'emp','1','professional data:salary','50000'
0 row(s) in 0.0240 seconds

插入其余的行以相同的方式使用put命令.如果插入整个表,您将得到以下输出.

hbase(main):022:0> scan 'emp'

   ROW                        COLUMN+CELL
1 column=personal data:city, timestamp=1417524216501, value=hyderabad

1 column=personal data:name, timestamp=1417524185058, value=ramu

1 column=professional data:designation, timestamp=1417524232601,

 value=manager
 
1 column=professional data:salary, timestamp=1417524244109, value=50000

2 column=personal data:city, timestamp=1417524574905, value=chennai

2 column=personal data:name, timestamp=1417524556125, value=ravi

2 column=professional data:designation, timestamp=1417524592204,

 value=sr:engg
 
2 column=professional data:salary, timestamp=1417524604221, value=30000

3 column=personal data:city, timestamp=1417524681780, value=delhi

3 column=personal data:name, timestamp=1417524672067, value=rajesh

3 column=professional data:designation, timestamp=1417524693187,

value=jr:engg
3 column=professional data:salary, timestamp=1417524702514,

value=25000

使用Java插入数据API

您可以使用 Put 类的 add()方法将数据插入Hbase.您可以使用 HTable 类的 put()方法保存它.这些类属于 org.apache.hadoop.hbase.client 包.下面给出了在HBase表中创建数据的步骤.

步骤1:实例化配置类

配置 class将HBase配置文件添加到其对象.您可以使用 HbaseConfiguration 类的 create()方法创建配置对象,如下所示.

Configuration conf = HbaseConfiguration.create();

第2步:实例化HTable类

你有一个名为 HTable 的类, HBase中Table的实现.此类用于与单个HBase表进行通信.在实例化此类时,它接受配置对象和表名作为参数.你可以实例化HTable类,如下所示.

HTable hTable = new HTable(conf, tableName);

第3步:实例化PutClass

要将数据插入HBase表, add() 方法及其变体被使用.此方法属于 Put ,因此实例化put类.此类需要以字符串格式插入数据的行名称.您可以实例化 Put 类,如下所示.

Put p = new Put(Bytes.toBytes("row1"));

第4步:插入数据

add()方法Put 类用于插入数据.它需要3个字节的数组,分别表示列族,列限定符(列名)和要插入的值.使用add()方法将数据插入HBase表,如下所示.

p.add(Bytes.toBytes("coloumn family "), Bytes.toBytes("column
name"),Bytes.toBytes("value"));

步骤5:将数据保存在表中

插入所需行后,通过添加put来保存更改实例到HTable类的 put()方法,如下所示.

hTable.put(p);

步骤6:关闭HTable实例

在HBase表中创建数据后,关闭 HTable 使用 close()方法的实例,如下所示.

hTable.close();

以下是在HBase表中创建数据的完整程序.

import java.io.IOException;

import org.apache.hadoop.conf.Configuration;

import org.apache.hadoop.hbase.HBaseConfiguration;
import org.apache.hadoop.hbase.client.HTable;
import org.apache.hadoop.hbase.client.Put;
import org.apache.hadoop.hbase.util.Bytes;

public class InsertData{

   public static void main(String[] args) throws IOException {

      // Instantiating Configuration class
      Configuration config = HBaseConfiguration.create();

      // Instantiating HTable class
      HTable hTable = new HTable(config, "emp");

      // Instantiating Put class
      // accepts a row name.
      Put p = new Put(Bytes.toBytes("row1")); 

      // adding values using add() method
      // accepts column family name, qualifier/row name ,value
      p.add(Bytes.toBytes("personal"),
      Bytes.toBytes("name"),Bytes.toBytes("raju"));

      p.add(Bytes.toBytes("personal"),
      Bytes.toBytes("city"),Bytes.toBytes("hyderabad"));

      p.add(Bytes.toBytes("professional"),Bytes.toBytes("designation"),
      Bytes.toBytes("manager"));

      p.add(Bytes.toBytes("professional"),Bytes.toBytes("salary"),
      Bytes.toBytes("50000"));
      
      // Saving the put Instance to the HTable.
      hTable.put(p);
      System.out.println("data inserted");
      
      // closing HTable
      hTable.close();
   }
}

编译并执行上述程序,如下所示.

 $ javac InsertData.java 
 $ java InsertData

以下应该是输出:

data inserted