如何使用Java API操作Hbase
1个回答
2016-08-10 · 百度知道合伙人官方认证企业
育知同创教育
1【专注:Python+人工智能|Java大数据|HTML5培训】 2【免费提供名师直播课堂、公开课及视频教程】 3【地址:北京市昌平区三旗百汇物美大卖场2层,微信公众号:yuzhitc】
向TA提问
关注
展开全部
使用Java API操作Hbase的方法:
1.Configuration
在使用Java API时,Client端需要知道HBase的配置环境,如存储地址,zookeeper等信息。这些信息通过Configuration对象来封装,可通过如下代码构建该对象
Configuration config=HBaseConfiguration.create();
在调用HBaseConfiguration.create()方法时,HBase首先会在classpath下查找hbase-site.xml文件,将里面的信息解析出来封装到Configuration对象中,如果hbase-site.xml文件不存在,则使用默认的hbase-core.xml文件。
除了将hbase-site.xml放到classpath下,开发人员还可通过config.set(name, value)方法来手工构建Configuration对象。
Configuration.set(String name, String value)
2.HBaseAdmin
HBaseAdmin用于创建数据库表格,并管理表格的元数据信息,通过如下方法构建
HBaseAdmin admin=new HBaseAdmin(config);
常用方法:
addColumn(tableName,column):为表格添加栏位
deleteColumn(tableName,column):删除指定栏位
balanceSwitch(boolean):是否启用负载均衡
createTable(HTableDescriptor desc):创建表格
deleteTable(tableName):删除表格
tableExists(tableName):判断表格是否存在
示例:创建test表格,并为其指定columnFamily为cf
HBaseAdmin admin=new HBaseAdmin(config);
If(!admin.tableExists(“test”)){
HTableDescriptor tableDesc=new HTableDescriptor(“test”);
HColumnDescriptor cf=new HColumnDescriptor(“cf”);
tableDesc.addFamily(cf);
admin.createTable(tableDesc);
}
3.HTable
在HBase中,HTable封装表格对象,对表格的增删改查操作主要通过它来完成,构造方法如下:
HTable table=new HTable(config,tableName);
在构建多个HTable对象时,HBase推荐所有的HTable使用同一个Configuration。这样,HTable之间便可共享HConnection对象、zookeeper信息以及Region地址的缓存信息。
示例1:Get操作
Get get=new Get(rowKey);
Result res=table.get(get);
示例2:Put操作
Put put=new Put(rowKey);
put.add(columnFamily,column,value);
table.put(put);
注:在HBase中,实体的新增和更新都是通过Put操作来实现。
示例3:Delete操作
Delete delete=new Delete();
table.delete(delete);
示例4:Scan操作
Scan scan=new Scan( );
scan.addColumn(columnFamily,column);//指定查询要返回的column
SingleColumnValueFilter filter=new SingleColumnValueFilter(
columnFamily,column,//指定要过滤的column
CompareOp.EQUAL,value//指定过滤条件
);
//更多的过滤器信息请查看org.apache.hadoop.hbase.filter包
scan.setFilter(filter);//为查询指定过滤器
ResultScanner scanner=table.getScanner(scan);//执行扫描查找
Iterator<Result> res=scanner.iterator( );//返回查询遍历器
HBase提供了java api来对HBase进行一系列的管理涉及到对表的管理、数据的操作等。常用的API操作有:
1、对表的创建、删除、显示以及修改等,可以用HBaseAdmin,一旦创建了表,那么可以通过HTable的实例来访问表,每次可以往表里增加数据。
2、 插入数据
创建一个Put对象,在这个Put对象里可以指定要给哪个列增加数据,以及当前的时间戳等值,然后通过调用HTable.put(Put)来提交操作,子猴在这里提请注意的是:在创建Put对象的时候,你必须指定一个行(Row)值,在构造Put对象的时候作为参数传入。
3、 获取数据
要获取数据,使用Get对象,Get对象同Put对象一样有好几个构造函数,通常在构造的时候传入行值,表示取第几行的数据,通过HTable.get(Get)来调用。
4、浏览每一行
通过Scan可以对表中的行进行浏览,得到每一行的信息,比如列名,时间戳等,Scan相当于一个游标,通过next()来浏览下一个,通过调用HTable.getScanner(Scan)来返回一个ResultScanner对象。HTable.get(Get)和HTable.getScanner(Scan)都是返回一个Result。Result是一个
KeyValue的链表。
5、 删除
使用Delete来删除记录,通过调用HTable.delete(Delete)来执行删除操作。(注:删除这里有些特别,也就是删除并不是马上将数据从表中删除。)
6、锁
新增、获取、删除在操作过程中会对所操作的行加一个锁,而浏览却不会。
7、簇的访问
客户端代码通过ZooKeeper来访问找到簇,也就是说ZooKeeper quorum将被使用,那么相关的类(包)应该在客户端的类(classes)目录下,即客户端一定要找到文件hbase-site.xml。
1.Configuration
在使用Java API时,Client端需要知道HBase的配置环境,如存储地址,zookeeper等信息。这些信息通过Configuration对象来封装,可通过如下代码构建该对象
Configuration config=HBaseConfiguration.create();
在调用HBaseConfiguration.create()方法时,HBase首先会在classpath下查找hbase-site.xml文件,将里面的信息解析出来封装到Configuration对象中,如果hbase-site.xml文件不存在,则使用默认的hbase-core.xml文件。
除了将hbase-site.xml放到classpath下,开发人员还可通过config.set(name, value)方法来手工构建Configuration对象。
Configuration.set(String name, String value)
2.HBaseAdmin
HBaseAdmin用于创建数据库表格,并管理表格的元数据信息,通过如下方法构建
HBaseAdmin admin=new HBaseAdmin(config);
常用方法:
addColumn(tableName,column):为表格添加栏位
deleteColumn(tableName,column):删除指定栏位
balanceSwitch(boolean):是否启用负载均衡
createTable(HTableDescriptor desc):创建表格
deleteTable(tableName):删除表格
tableExists(tableName):判断表格是否存在
示例:创建test表格,并为其指定columnFamily为cf
HBaseAdmin admin=new HBaseAdmin(config);
If(!admin.tableExists(“test”)){
HTableDescriptor tableDesc=new HTableDescriptor(“test”);
HColumnDescriptor cf=new HColumnDescriptor(“cf”);
tableDesc.addFamily(cf);
admin.createTable(tableDesc);
}
3.HTable
在HBase中,HTable封装表格对象,对表格的增删改查操作主要通过它来完成,构造方法如下:
HTable table=new HTable(config,tableName);
在构建多个HTable对象时,HBase推荐所有的HTable使用同一个Configuration。这样,HTable之间便可共享HConnection对象、zookeeper信息以及Region地址的缓存信息。
示例1:Get操作
Get get=new Get(rowKey);
Result res=table.get(get);
示例2:Put操作
Put put=new Put(rowKey);
put.add(columnFamily,column,value);
table.put(put);
注:在HBase中,实体的新增和更新都是通过Put操作来实现。
示例3:Delete操作
Delete delete=new Delete();
table.delete(delete);
示例4:Scan操作
Scan scan=new Scan( );
scan.addColumn(columnFamily,column);//指定查询要返回的column
SingleColumnValueFilter filter=new SingleColumnValueFilter(
columnFamily,column,//指定要过滤的column
CompareOp.EQUAL,value//指定过滤条件
);
//更多的过滤器信息请查看org.apache.hadoop.hbase.filter包
scan.setFilter(filter);//为查询指定过滤器
ResultScanner scanner=table.getScanner(scan);//执行扫描查找
Iterator<Result> res=scanner.iterator( );//返回查询遍历器
HBase提供了java api来对HBase进行一系列的管理涉及到对表的管理、数据的操作等。常用的API操作有:
1、对表的创建、删除、显示以及修改等,可以用HBaseAdmin,一旦创建了表,那么可以通过HTable的实例来访问表,每次可以往表里增加数据。
2、 插入数据
创建一个Put对象,在这个Put对象里可以指定要给哪个列增加数据,以及当前的时间戳等值,然后通过调用HTable.put(Put)来提交操作,子猴在这里提请注意的是:在创建Put对象的时候,你必须指定一个行(Row)值,在构造Put对象的时候作为参数传入。
3、 获取数据
要获取数据,使用Get对象,Get对象同Put对象一样有好几个构造函数,通常在构造的时候传入行值,表示取第几行的数据,通过HTable.get(Get)来调用。
4、浏览每一行
通过Scan可以对表中的行进行浏览,得到每一行的信息,比如列名,时间戳等,Scan相当于一个游标,通过next()来浏览下一个,通过调用HTable.getScanner(Scan)来返回一个ResultScanner对象。HTable.get(Get)和HTable.getScanner(Scan)都是返回一个Result。Result是一个
KeyValue的链表。
5、 删除
使用Delete来删除记录,通过调用HTable.delete(Delete)来执行删除操作。(注:删除这里有些特别,也就是删除并不是马上将数据从表中删除。)
6、锁
新增、获取、删除在操作过程中会对所操作的行加一个锁,而浏览却不会。
7、簇的访问
客户端代码通过ZooKeeper来访问找到簇,也就是说ZooKeeper quorum将被使用,那么相关的类(包)应该在客户端的类(classes)目录下,即客户端一定要找到文件hbase-site.xml。
推荐律师服务:
若未解决您的问题,请您详细描述您的问题,通过百度律临进行免费专业咨询