有点搞不清Spark和Scala的关系了

有点搞不清Spark和Scala的关系了

老师,请问一下:


  1. Scala是门语言,Spark是个计算框架,感觉可以类比java和Spring的关系吗?

  2. Spark有flatMap,Scala也有这个函数,这个又觉得前面的类比不太对,这两个flatMap有什么关系吗?

正在回答

登陆购买课程后可参与讨论,去登陆

1回答

Spark计算框架是使用scala语言实现的。可以认为是java和spring之间的关系。


scala中的flatmap函数是只会在一台机器上执行的,spark中的flatmap算子是可以并行在多台机器中执行的。

虽然名字是一样的,但是运行机制是不一样的。


二者的名字一样主要是为了方便理解,他们都是可以将一条数据转化成多条数据返回的。


  • 幕布斯5216845 提问者 #1

    比如统计word的个数这个案例里,比如txt的数据很多。

    那么生成的RDD是只有一个吗?还是说不管数据多少都只有一个RDD呢?

    我感觉是只有一个RDD,但是一个RDD里面有多个分片,每个分片对应一个工作节点(一个docker)?

    https://img1.sycdn.imooc.com//climg/614dd52f096c2a9a06310190.jpg

    2021-09-24 21:42:27
  • 徐老师 回复 提问者 幕布斯5216845 #2
    linerdd只有一个,不管读取的文件有多大
    2021-09-24 21:44:02
  • 幕布斯5216845 提问者 回复 徐老师 #3

    那如果1g的txt,一次性放一个对象里吗?还是会对这个txt分多次读取呢?

    2021-09-24 21:46:01
问题已解决,确定采纳
还有疑问,暂不采纳

恭喜解决一个难题,获得1积分~

来为老师/同学的回答评分吧

0 星
请稍等 ...
微信客服

购课补贴
联系客服咨询优惠详情

帮助反馈 APP下载

慕课网APP
您的移动学习伙伴

公众号

扫描二维码
关注慕课网微信公众号

在线咨询

领取优惠

免费试听

领取大纲

扫描二维码,添加
你的专属老师