启动spark

1.启动hdfs

2.启动yarn

3.启动spark

4.启动后各节点的正常情况

5.编辑spark-defaults.conf  和   spark-env.sh

6.重启master和workers

stop-workers.sh
stop-master.sh
start-master.sh
start-workers.sh

7.在UI界面里面添加目录spark-logs

8.进入到spark下

9.spark的运行架构

(1)按照主从模式进行部署

主节点:master---资源管理调度和任务的分配(类似yarn)

从节点:worker---执行具体的计算任务

(2)整体运行架构

用户编写spark应用程序

用户将应用程序提交给spark集群

驱动器会创建对应的编程入口(SparkContext/SparkSession)

主节点复制资源管理调度和任务分配

从节点执行计算任务(多个计算任务:每个计算任务会分配一个执行器)

从节点会将任务的结果返回到主节点,主节点再继续做相应的操作

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值