老师,您视频里说数据是100条100条的的写入的,为什么我这里好像是实时的呀?

老师,您视频里说数据是100条100条的的写入的,为什么我这里好像是实时的呀?

正在回答 回答被采纳积分+1

登陆购买课程后可参与讨论,去登陆

1回答
提问者 蒋昌魁 2023-07-19 16:48:13

我自己尝试了下,在配置文件中加入hdfs.batchSize的值,但是依然是实时的,感觉这个参数似乎失效了一样

  • 我在视频里面说的是avrosink是每次输出100条数据,不够的话不输出。没有说hdfssink。


    hdfs中的batchsize其实控制的是hdfssink每次向hdfs中写数据时的最大数据条数,也就是说每次向hdfs文件中写数据,最多是batchsize条数,如果实际数据条数小于batchsize,则按照实际的数据条数写数据。



    2023-07-19 20:47:46
  • 提问者 蒋昌魁 回复 徐老师 #2

    哦,avrosink我在配置中也没有设置batchsize,但是我这里结果输出的时候似乎是实时的,并没有每次只输

    出100条数据,老师您看下为什么是实时输出呢?

    https://img1.sycdn.imooc.com//climg/64b889fd08e978d107640619.jpg




    2023-07-20 09:25:06
  • 提问者 蒋昌魁 回复 徐老师 #3

    两个不同的配置文件,具体内容分别如下:

    https://img1.sycdn.imooc.com//climg/64b88e2a0909cc3f05010671.jpg

    https://img1.sycdn.imooc.com//climg/64b88def097ea3c804720728.jpg

    2023-07-20 09:30:37
问题已解决,确定采纳
还有疑问,暂不采纳

恭喜解决一个难题,获得1积分~

来为老师/同学的回答评分吧

0 星
请稍等 ...
意见反馈 帮助中心 APP下载
官方微信

在线咨询

领取优惠

免费试听

领取大纲

扫描二维码,添加
你的专属老师