如何解决spark写hive慢的问题

 我来答

1个回答

#热议# 为什么说不要把裤子提到肚脐眼？

llzzcc66
2017-06-06 · 知道合伙人数码行家

llzzcc66
知道合伙人数码行家

采纳数：81385 获赞数：171491

公司运维员工

向TA提问私信TA

关注

展开全部

dataframe.registerTempTable("result")
sql(s"""INSERT OVERWRITE Table $outputTable PARTITION (dt ='$outputDate') select * from result""")
而整个结果数据的产生只需要4分钟左右的时间，比如以下方式：将结果以textfile存入hdfs：
result.rdd.saveAsTextFile(output_tmp_dir)
由此可见，对hive的写入操作耗用了大量的时间。

对此现象的优化可以是，将文件存为符合hive table文件的格式，然后使用hive load将产生的结果文件直接move到指定目录下。代码如下：
result.rdd.map { r => r.mkString("\001") }.repartition(partitions).saveAsTextFile(output_tmp_dir)
sql(s"""load data inpath '$output_tmp_dir' overwrite into table $output partition (dt='$dt')""")

已赞过 已踩过<

评论收起

TapTap发现好游戏

广告2024-12-22

星火编辑器是一款面向普通用户的游戏创作工具，致力于让个人开发者也能轻松做游戏。点击了解，如何从0开始掌握星火编辑器。

推荐律师服务：若未解决您的问题，请您详细描述您的问题，通过百度律临进行免费专业咨询

您可能关注的内容

版权音乐-曲多多版权音乐-150W+项目音乐授权-全球商用

版权音乐「曲多多版权音乐」汇集国内外百万正版高品质音乐，满足您广告、自媒体、宣传片、专题片、游戏、公播、APP等商用音乐需求，联系我们可享受定制方案。

www.hifiveai.com广告

通用人工智能网:征文奖励500元，hadoop千字科技原创文章

www.opensnn.com

星火编辑器-与千万TapTap用户，分享你的作品

星火编辑器是一款面向普通用户的游戏创作工具，致力于让个人开发者也能轻松做游戏。点击了解，如何从0开始掌握星火编辑器。

sce.taptap.cn广告

为你推荐：

下载百度知道APP，抢鲜体验

使用百度知道APP，立即抢鲜体验。你的手机镜头里或许有别人想知道的答案。

扫描二维码下载

×

个人、企业类侵权投诉
违法有害信息,请在下方选择后提交

类别

色情低俗
涉嫌违法犯罪
时政信息不实
垃圾广告
低质灌水

我们会通过消息、邮箱等方式尽快将举报结果通知您。

说明

0/200

提交

取消

辅助

模式