关于shuffle疑问
map reduce产生shuffle是在map阶段结束执行reduce时候发生,spark产生shuffle操作是在有宽依赖的时刻产生的么?产生shuffle这个过程是否对整个程序执行产生开销?主要是哪些性能的消耗?
14
收起
正在回答
1回答
spark产生shuffle操作是在有宽依赖的时刻产生的么?
是的,只要算子产生了宽依赖,那么就会产生shuffle操作
产生shuffle这个过程是否对整个程序执行产生开销?
会产生开销,因为shuffle过程会涉及到数据跨节点传输
主要是哪些性能的消耗?
主要是节点之间数据传输的性能消耗,如果内存中数据存不下,还会涉及磁盘读写的性能开销。
恭喜解决一个难题,获得1积分~
来为老师/同学的回答评分吧
0 星