hadoop mr 36亿的数据量和3亿多的数据量如何关联处理才能更快

 我来答
匿名用户
2017-08-11
展开全部
这个一定要看场景,每种方法都有适用的阶段和瓶颈。我经历过的分析方法: awk等脚本,优点:开发快,通用。缺点:单CPU。 MySQL,优点:简单,性能好。缺点:单服务器IO瓶颈。 Java/Python/C++等高级语言,优点:性能好,灵活。缺点:修改不够敏捷。 Hadoop,优点:性能随机器数扩展。缺点:重写分析逻辑。 我们大概是在每天处理1PB左右数据的时候,开始使用H
已赞过 已踩过<
你对这个回答的评价是?
评论 收起
推荐律师服务: 若未解决您的问题,请您详细描述您的问题,通过百度律临进行免费专业咨询

为你推荐:

下载百度知道APP,抢鲜体验
使用百度知道APP,立即抢鲜体验。你的手机镜头里或许有别人想知道的答案。
扫描二维码下载
×

类别

我们会通过消息、邮箱等方式尽快将举报结果通知您。

说明

0/200

提交
取消

辅 助

模 式