SparkSQL对于重复的计算怎么优化

 我来答

1个回答

凌雲dP
2017-01-17 · TA获得超过786个赞

知道小有建树答主

回答量：835

采纳率：0%

帮助的人：542万

关注

展开全部

Spark sql是为了处理结构化数据的一个spark 模块。
不同于spark rdd的基本API，spark sql接口更多关于数据结构本身与执行计划等更多信息。
在spark内部，sql sql利用这些信息去更好地进行优化。
有如下几种方式执行spark sql：SQL，DataFramesAPI与Datasets API。当相同的计算引擎被用来执行一个计算时，有不同的API和语言种类可供选择。
这种统一性意味着开发人员可以来回轻松切换各种最熟悉的API来完成同一个计算工作。

本回答由提问者推荐

已赞过 已踩过<

评论收起

推荐律师服务：若未解决您的问题，请您详细描述您的问题，通过百度律临进行免费专业咨询

其他类似问题