数据倾斜问题

数据倾斜问题

实际工作中大致如何具体去推测有数据倾斜的数据?能不能给些思路

正在回答

登陆购买课程后可参与讨论,去登陆

1回答

实际工作中一般是遇到一些任务执行非常耗时,此时我们才会去排查是不是遇到了数据倾斜,任务异常耗时是数据倾斜最直观的信号

  • GRdreamflying 提问者 #1
    就是如何去定位对应哪个字段有问题。?
    2020-09-04 08:26:37
  • 徐老师 回复 提问者 GRdreamflying #2
    在排查具体哪个字段有数据倾斜问题的时候,一般就是看你的代码里面是根据哪些字段进行了group by,肯定是这些进行了分组的字段出现了数据倾斜,可以通过具体的业务来推理一下这个字段出现倾斜的原因,有时候通过业务能分析出来到底这个字段中的哪个值出现了倾斜,如果通过业务推理不出来,那么就取出来一部分数据看一下,或者就等这个异常耗时的任务执行结束之后看下结果就能看出来是哪个值出现了倾斜,然后就根据我们讲的这个思路吧倾斜的key打散即可
    2020-09-04 08:33:56
  • codesci 回复 徐老师 #3

    课程中提到,

    • 不知道数据大致分布情况,可进行抽样

    这个抽样具体是怎么操作的呢?

    2021-11-04 16:11:10
问题已解决,确定采纳
还有疑问,暂不采纳

恭喜解决一个难题,获得1积分~

来为老师/同学的回答评分吧

0 星
请稍等 ...
意见反馈 帮助中心 APP下载
官方微信

在线咨询

领取优惠

免费试听

领取大纲

扫描二维码,添加
你的专属老师