hadoop mr 36亿的数据量和3亿多的数据量如何关联处理才能更快
1个回答
2017-08-11
展开全部
这个一定要看场景,每种方法都有适用的阶段和瓶颈。我经历过的分析方法: awk等脚本,优点:开发快,通用。缺点:单CPU。 MySQL,优点:简单,性能好。缺点:单服务器IO瓶颈。 Java/Python/C++等高级语言,优点:性能好,灵活。缺点:修改不够敏捷。 Hadoop,优点:性能随机器数扩展。缺点:重写分析逻辑。 我们大概是在每天处理1PB左右数据的时候,开始使用H
已赞过
已踩过<
评论
收起
你对这个回答的评价是?
推荐律师服务:
若未解决您的问题,请您详细描述您的问题,通过百度律临进行免费专业咨询