如何解决spark写hive慢的问题

 我来答

1个回答

#热议# 在购买新能源车时，要注意哪些？

du旧颜
2016-07-31 · TA获得超过1867个赞

知道小有建树答主

回答量：500

采纳率：0%

帮助的人：470万

我也去答题访问个人页

关注

展开全部

dataframe.registerTempTable("result")
sql(s"""INSERT OVERWRITE Table $outputTable PARTITION (dt ='$outputDate') select * from result""")
而整个结果数据的产生只需要4分钟左右的时间，比如以下方式：将结果以textfile存入hdfs：
result.rdd.saveAsTextFile(output_tmp_dir)
由此可见，对hive的写入操作耗用了大量的时间。
 
对此现象的优化可以是，将文件存为符合hive table文件的格式，然后使用hive load将产生的结果文件直接move到指定目录下。代码如下：
result.rdd.map { r => r.mkString("\001") }.repartition(partitions).saveAsTextFile(output_tmp_dir)
sql(s"""load data inpath '$output_tmp_dir' overwrite into table $output partition (dt='$dt')""")

本回答被提问者采纳

已赞过已踩过<

你对这个回答的评价是？
评论收起

TapTap发现好游戏

广告2024-12-23

星火编辑器是一款面向普通用户的游戏创作工具，致力于让个人开发者也能轻松做游戏。点击了解，如何从0开始掌握星火编辑器。

sce.taptap.cn

推荐律师服务：若未解决您的问题，请您详细描述您的问题，通过百度律临进行免费专业咨询

您可能关注的内容

版权音乐-曲多多版权音乐-150W+项目音乐授权-全球商用

版权音乐「曲多多版权音乐」汇集国内外百万正版高品质音乐，满足您广告、自媒体、宣传片、专题片、游戏、公播、APP等商用音乐需求，联系我们可享受定制方案。

www.hifiveai.com广告

星火编辑器-与千万TapTap用户，分享你的作品

星火编辑器是一款面向普通用户的游戏创作工具，致力于让个人开发者也能轻松做游戏。点击了解，如何从0开始掌握星火编辑器。

sce.taptap.cn广告

spark和hadoop的区别项目实战—慕课网

coding.imooc.com

如何解决spark写hive慢的问题

您可能关注的内容

其他类似问题

为你推荐：