这种方法和broadcast的区别

这种方法和broadcast的区别

假设针对调用数据库连接

broadcast是将数据库连接复制到每个task

map partition也是针对每个分区调用一次数据库连接

那这两种有什么区别的或者说实际工作中更倾向于用哪种

正在回答 回答被采纳积分+1

登陆购买课程后可参与讨论,去登陆

1回答
徐老师 2022-01-23 16:37:16

数据库连接无法序列化,无法广播到多个task。
在处理数据时需要和数据库交互,没有使用broadcast功能的,都是使用mappartition。

  • 提问者 DavidTC #1

    那假如广播和mappartition都可行的情况下是优先用广播吗

    2022-01-23 16:40:25
  • 徐老师 回复 提问者 DavidTC #2

    broadcast是为了广播数据。

    mappartition的应用场景主要就是为了在处理的时候能够一次性获取一个分区的数据进行处理。

    这两个功能是不一样的。


    2022-01-23 16:46:32
  • 提问者 DavidTC 回复 徐老师 #3

    清楚了 谢谢老师

    2022-01-23 16:52:52
问题已解决,确定采纳
还有疑问,暂不采纳

恭喜解决一个难题,获得1积分~

来为老师/同学的回答评分吧

0 星
请稍等 ...
意见反馈 帮助中心 APP下载
官方微信

在线咨询

领取优惠

免费试听

领取大纲

扫描二维码,添加
你的专属老师