R 语言怎样进行分布式计算

 我来答
呆萌小咖77
2016-11-04 · TA获得超过797个赞
知道小有建树答主
回答量:813
采纳率:96%
帮助的人:154万
展开全部
这个可能比较麻烦,需要对R程序的底层API和package都要进行重构以适应分布式运算和分布式文件存储,现在好像没有什么好办法,因为现在很多包如果放到分布式上面可能都不能运行。有程序方面的原因,也有可能很多统计算法并不适合分布式计算

简单说就是R语言和Spark的一个接口,可以通过R语言调用Spark的计算能力,把计算任务分配到Spark的节点上来做。

亮点:
1、近乎完整的dplyr语法!用过dplyr的同学一定知道这套语法是多么的人性化…
2、可以直接调用Spark的机器学习能力!再也不用纠结pull到R里面的数据不够...
3、不要钱……
弱点:
1、如果不是Spark包自带的算法的话还是要自己Call Spark API写…要懂一点分布式开发
2、仔细一想这就是给Spark做了个壳...不能说是用R在做分布式运算orz

至于Microsoft...现在有Microsoft R Server, 提供了很多R原生函数的High Performance Analysis版本,可以实现并行运算...
推荐律师服务: 若未解决您的问题,请您详细描述您的问题,通过百度律临进行免费专业咨询

为你推荐:

下载百度知道APP,抢鲜体验
使用百度知道APP,立即抢鲜体验。你的手机镜头里或许有别人想知道的答案。
扫描二维码下载
×

类别

我们会通过消息、邮箱等方式尽快将举报结果通知您。

说明

0/200

提交
取消

辅 助

模 式