安装部署 Spark Standalone 集群详细流程

SmallerFL

已于 2024-03-27 15:16:23 修改

阅读量1.3k

点赞数 15

CC 4.0 BY-SA版权

分类专栏：新领域文章标签： spark 大数据分布式

于 2024-03-27 15:13:16 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_36803941/article/details/137076181

文章目录

0. 引言
1. Spark安装包下载
2. 下载 Java
3. 修改Hosts文件
4. 新增环境变量
5. 修改Spark配置文件
6. 配置worker节点
7. 启动 Spark 集群
8. 启动一个程序
9. 参考

0. 引言

本文主要介绍在 Linux 下安装 Spark Standalone 集群的详细流程。

1. Spark安装包下载

点击链接的页面下载
在这里插入图片描述
将 .tgz 安装包解压，我这里是解压到 /root 目录下:

tar -zxf spark-3.5.1-bin-hadoop3.tgz

可选，建议把解压后的文件夹重新命名

mv spark-3.5.1-bin-hadoop3 spark

2. 下载 Java

由于 Spark 底层是 Java 运行的，因此依赖 Java 的 JVM。在 Linux 下载 Java 如下：

apt update
apt install -y openjdk-8-jdk

3. 修改Hosts文件

为了方便直接用域名访问 worker 节点，建议配置好 Hosts 文件。

在 /etc/hosts 将域名和 IP 绑定，准备好几个节点就填几个。例如准备了1个主节点和2个 worker 节点，那么在 /etc/hosts 中：

最低0.47元/天解锁文章

200万优质内容无限畅学

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

SmallerFL 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。