登陆购买课程后可参与讨论,去登陆吧
我自己尝试了下,在配置文件中加入hdfs.batchSize的值,但是依然是实时的,感觉这个参数似乎失效了一样
我在视频里面说的是avrosink是每次输出100条数据,不够的话不输出。没有说hdfssink。
hdfs中的batchsize其实控制的是hdfssink每次向hdfs中写数据时的最大数据条数,也就是说每次向hdfs文件中写数据,最多是batchsize条数,如果实际数据条数小于batchsize,则按照实际的数据条数写数据。
哦,avrosink我在配置中也没有设置batchsize,但是我这里结果输出的时候似乎是实时的,并没有每次只输
出100条数据,老师您看下为什么是实时输出呢?
两个不同的配置文件,具体内容分别如下:
恭喜解决一个难题,获得1积分~
来为老师/同学的回答评分吧
登录后可查看更多问答,登录/注册
不用Java初级内容充数!不用与大数据岗位无关内容占课时!我们做的就是“精华版”大数据课程
54 2
31 1
78 5
29 9
17 20
在线咨询
领取优惠
免费试听
领取大纲
恭喜解决一个难题,获得1积分~
来为老师/同学的回答评分吧
0 星