Spark安装教程：Standalone、HA模式与YARN集成

PDF文件

300KB | 更新于2024-08-30 | 7 浏览量 | 举报 1 收藏

立即下载

Spark是一款开源的大数据处理框架，本文主要介绍了如何在不同的模式下安装Spark，包括Standalone模式、高可用模式以及基于YARN的模式。以下是各部分的主要知识点： 1. Spark的Standalone模式安装： - 安装流程分为几个步骤：首先，从官方网站下载spark-2.2.0-bin-hadoop2.7.tgz文件并将其上传至`/usr/local/spark/`，然后解压。接着，进入conf目录，确保配置文件名称添加`.sh`后缀以实现脚本执行。接下来，编辑`spark-env.sh`文件，配置master和slave节点信息，如slaves列表。将配置文件复制到其他虚拟机，并在`etc/profile`中添加环境变量。在sbin目录下修改启动命令，最后启动Spark服务，并通过检查JPS命令确认进程数量。 2. 检测安装成功： - 在浏览器访问Spark的WebUI（默认8080端口），确保无误。同时注意避免与Tomcat端口冲突。执行Spark程序，比如PI计算，来验证Spark是否正常运行。 3. Spark高可用模式安装： - 高可用模式需先停用Standalone模式，然后在配置文件中添加高可用相关设置，如指定worker节点。在主节点(node1)上修改slaves配置，并将配置文件复制到其他节点。启动master和worker节点分别使用`sbin/start-all.sh`和`sbin/start-master.sh`脚本。 4. Spark高可用启动及任务提交： - 在高可用模式下，启动Zookeeper以支持集群管理。通过提交任务到Spark集群，可以使用`spark-shell –master yarn-client`或`yarn-cluster`模式来测试YARN集成。运行pi计算示例，验证集群功能。 5. Spark基于YARN模式安装： - 安装流程涉及配置Hadoop环境变量，尤其是YARN-site.xml中的相关参数。通过运行jar包并在Spark Shell中使用`yarn-client`或`yarn-cluster`模式测试YARN集成。执行pi计算以确认安装正确。 6. Shell界面操作： - 不论何种模式，都能通过Spark的shell界面操作，如提交作业、查看日志和执行SQL等，这是Spark交互式开发的核心。总结，本文详细介绍了Spark在Standalone、高可用和YARN模式下的安装过程、配置要点以及测试方法，对于理解和部署Spark集群具有实际指导价值。

Spark的安装（的安装（Standalone模式，高可用模式，基于模式，高可用模式，基于Yarn模式）模式）

spark的Standalone模式安装

一、安装流程

1、将spark-2.2.0-bin-hadoop2.7.tgz 上传到 /usr/local/spark/ 下，然后解压

2、进入到conf中修改名字改为 .sh 结尾的

3、编辑 spark-env.sh

4、修改slaves 的名字并且编辑他

5、发送到其他两台虚拟机上

6、修改ect/proflie下面的配置环境

7、到spark的sbin目录下修改启动命令

8、启动之后的jps数目

二、检测是否安装成功

1、进谷歌浏览器看看（端口号是8080 和tomcat端口号是一样的，注意后期一块启动的冲突问题）

2、按装完之后执行Spark程序进行迭代计算Spark上的PI示例

三、进入spark的shell界面操作算子

Spark高可用（先启动zookeeper再启动spark）

一、安装流程

二、高可用安装注意事项

1、先把Standalone模式注释掉

2、在后面添加配置注意其中的间隔

3. 在node1节点上修改slaves配置文件内容指定worker节点

4.把配置好的spark 拷贝到其他节点

5.在node1上执行sbin/start-all.sh脚本，然后在node2上执行sbin/start-master.sh启动第二个Master。

三、spark高可用启动

四、高可用模式提交任务：

Spark基于yarn调度的模式 Spark on yarn

一、Yarn集群模式安装流程：

1、需要的配置项三台都需要配

2、配置好hadoop环境变量

3.在hadoop的yarn-site中添加如下配置三台都需要配

二、通过往spark集群上运行jar包，测试安装效果，看是否安装成功

2.1、spark-shell –master yarn-client 进yarn spark shell界面的

2.2、测试基于yarn模式能否在集群上计算π

2.3、基于yarn的两种模式（client模式和cluster模式）

三、进入shell界面操作算子

spark的的Standalone模式安装模式安装

一、一、安装流程安装流程

1、将、将spark-2.2.0-bin-hadoop2.7.tgz 上传到上传到 /usr/local/spark/ 下，然后解压下，然后解压

-C 是用大写C解压到指定目录

2、进入到、进入到conf中修改名字中修改名字改为改为 .sh 结尾的结尾的

下载后可阅读完整内容，剩余4页未读，立即下载

weixin_38635449

粉丝: 5

Spark安装教程：Standalone、HA模式与YARN集成

spark高可用集群（自动切换方式）搭建手册

spark三种模式部署安装（基于Anaconda3实现spark编程）

spark1.2.1常用模式部署运行

spark基础,关于spark的安装和几种模式的部署

Spark执行模式详解：local, Standalone client模式

SparkCore分布式部署解析：Standalone、YARN、Mesos

Spark集群镜像教程：基于Zookeeper实现高可用性

Spark Standalone集群部署与工作流程详解

Spark集群模式安装指南与实践

全面解析Spark集群安装部署：开发测试至生产Ha高可用

最新资源