老师,insert overwrite 底层原理是怎么实现的?
老师,是不是 insert overwrite 会把之前落盘的数据使用 map reduce 重新读取并且和当前的数据集做一个去重,然后把之前的数据删除掉,把当前去重的结果集存到原来的位置,那这样的话如果 overwrite 的性能就会非常之慢了,如果没有做分区的话如果之前表里面数据量很大的话,就更慢了?
而 insert into 就只是在文件末尾追加
不知道我的理解对不对?
4
收起
正在回答
1回答
insert overwrite是直接覆盖之前的数据。
insert into是将数据追加到表中文件的末尾。
恭喜解决一个难题,获得1积分~
来为老师/同学的回答评分吧
0 星