Spark原理疑问

Spark原理疑问

http://img1.sycdn.imooc.com//climg/5fcce6da09ea7e8a12490715.jpg


这里Spark集群是怎么回事???    

1-2中说的  StandAlone集群部署,Spark启动计算的时候数据都是从哪里来的???

1-3 中说  Spark On YARN ,,数据是从 HDFS中来,没问题,但引出了2-1的问题


2-1   这里又说  Spark是 StandAlone集群的,又说是基于 HDFS为数据源,这到底怎么回事啊???这里的部署架构是什么啊???完全没头没尾的

正在回答

登陆购买课程后可参与讨论,去登陆

1回答

不管spark是standalone集群还是onyarn集群,在计算的时候都可以读取hdfs中的数据

在第一节视频快速了解spark中介绍了spark和hadoop是可以结合到一起使用的,spark只是一个计算框架,计算用到的数据是来源于hdfs的,不限于spark集群用哪种架构

  • 在这里以standalone集群举例子是因为这种架构比较好理解,这两种架构的唯一区别就是standalone集群是spark部署独立集群,自己管理自己使用的资源,onyarn集群是公用yarn集群(hadoop)中的资源
    2020-12-07 06:49:55
  • py_builder 提问者 回复 徐老师 #2

    我明白了,正好听了公司某大佬的演讲, 我们使用  spark on YARN  希望的是通过YARN进行资源调度管理,图中的是  standAlone与 Hadoop结合使用的场景。 

    2020-12-07 23:49:13
问题已解决,确定采纳
还有疑问,暂不采纳

恭喜解决一个难题,获得1积分~

来为老师/同学的回答评分吧

0 星
请稍等 ...
意见反馈 帮助中心 APP下载
官方微信

在线咨询

领取优惠

免费试听

领取大纲

扫描二维码,添加
你的专属老师