如果有几百亿条数据,如何在hbase表中存放？

 我来答

2个回答

#热议# 上班途中天气原因受伤算工伤吗？

罐头l桃子
2015-07-20 · TA获得超过167个赞

知道小有建树答主

回答量：204

采纳率：0%

帮助的人：150万

我也去答题访问个人页

关注

展开全部

1、首先你有没有那么多台服务器的集群，如果只是几台，你要想够不够，你的hbase 有几百亿，那么你hdfs上的数据可能要有两个备份，你这几百亿条是如何生成的，肯定是mapreduce跑出来导入到hbase中把，那么原始数据你要不要留，如果留，加上备份就要三份，所以节点的多少要确定。
2、几百亿其实挺多的，hbase 的设计一定要跟你的业务相关，hbase他不能完全像关系型数据库那样去随意查询，到达一定量级，如果设计的不好也是非常之慢的，甚至将hbase搞到崩溃。所以你先去网上看看rowkey的设计原则，比如长度原则等等，然后根据自己业务，哪些查询经常用到，哪些不会用到，想要用hbase实现那种非常灵活的类似关系数据库的查询是不理智的。
3、楼上的兄弟说得对，还有region热点的问题，如果你的hbase数据不是那种每天增量的数据，建议跑个mapreduce对你的数据进行各评判，看看如何能将数据尽可能均匀的分配到每个region中，当然这需要预先分配region
4、几百亿条数据，如果对rowkey进行模糊过滤一定非常非常之慢，所以可以考虑二级索引或者协处理器

已赞过 已踩过<

评论收起

霜龙龙
2015-07-20 · TA获得超过115个赞

知道小有建树答主

回答量：295

采纳率：0%

帮助的人：181万

我也去答题访问个人页

关注

展开全部

好好设计RowKey，避免region热点

已赞过 已踩过<

评论收起

推荐律师服务：若未解决您的问题，请您详细描述您的问题，通过百度律临进行免费专业咨询

如果有几百亿条数据,如何在hbase表中存放？

其他类似问题

为你推荐：