老师,insert overwrite 底层原理是怎么实现的?

老师,insert overwrite 底层原理是怎么实现的?

老师,是不是 insert overwrite 会把之前落盘的数据使用 map reduce 重新读取并且和当前的数据集做一个去重,然后把之前的数据删除掉,把当前去重的结果集存到原来的位置,那这样的话如果 overwrite 的性能就会非常之慢了,如果没有做分区的话如果之前表里面数据量很大的话,就更慢了?


而 insert  into 就只是在文件末尾追加


不知道我的理解对不对?

正在回答

登陆购买课程后可参与讨论,去登陆

1回答

insert overwrite是直接覆盖之前的数据。

insert into是将数据追加到表中文件的末尾。

  • ischand 提问者 #1

    insert overwrite 是全量覆盖的意思是吗?

    2022-03-10 18:09:40
  • 普通表全量覆盖,分区表覆盖指定分区
    2022-03-10 18:12:00
  • ischand 提问者 回复 徐老师 #3

    手敲了个例子,终于理解了,之前一直以为 overwrite 是覆盖相同字段的记录,现在知道是覆盖全表了,谢谢老师解答~ 

    2022-03-10 18:57:34
问题已解决,确定采纳
还有疑问,暂不采纳

恭喜解决一个难题,获得1积分~

来为老师/同学的回答评分吧

0 星
请稍等 ...
意见反馈 帮助中心 APP下载
官方微信

在线咨询

领取优惠

免费试听

领取大纲

扫描二维码,添加
你的专属老师