SparkSQL对于重复的计算怎么优化

 我来答
凌雲dP
2017-01-17 · TA获得超过786个赞
知道小有建树答主
回答量:835
采纳率:0%
帮助的人:542万
展开全部
  1. Spark sql是为了处理结构化数据的一个spark 模块。

  2. 不同于spark rdd的基本API,spark sql接口更多关于数据结构本身与执行计划等更多信息。

  3. 在spark内部,sql sql利用这些信息去更好地进行优化。

  4. 有如下几种方式执行spark sql:SQL,DataFramesAPI与Datasets API。当相同的计算引擎被用来执行一个计算时,有不同的API和语言种类可供选择。

  5. 这种统一性意味着开发人员可以来回轻松切换各种最熟悉的API来完成同一个计算工作。

推荐律师服务: 若未解决您的问题,请您详细描述您的问题,通过百度律临进行免费专业咨询

为你推荐:

下载百度知道APP,抢鲜体验
使用百度知道APP,立即抢鲜体验。你的手机镜头里或许有别人想知道的答案。
扫描二维码下载
×

类别

我们会通过消息、邮箱等方式尽快将举报结果通知您。

说明

0/200

提交
取消

辅 助

模 式