老师,insert overwrite 底层原理是怎么实现的?
老师,是不是 insert overwrite 会把之前落盘的数据使用 map reduce 重新读取并且和当前的数据集做一个去重,然后把之前的数据删除掉,把当前去重的结果集存到原来的位置,那这样的话如果 overwrite 的性能就会非常之慢了,如果没有做分区的话如果之前表里面数据量很大的话,就更慢了?
而 insert into 就只是在文件末尾追加
不知道我的理解对不对?
4
收起
正在回答
1回答
insert overwrite是直接覆盖之前的数据。
insert into是将数据追加到表中文件的末尾。
大数据工程师 2024 版
- 参与学习 1151 人
- 提交作业 5960 份
- 解答问题 1144 个
不用Java初级内容充数!不用与大数据岗位无关内容占课时!我们做的就是“精华版”大数据课程
了解课程
恭喜解决一个难题,获得1积分~
来为老师/同学的回答评分吧
0 星