极简Spark 3.3.0 安装

Spark 官网提供了附有 Hadoop 和 Scala 的预编译包,大大简化了安装过程。

避坑:Spark里附有的Hadoop据我观察并不是Hadoop完整本体,而只是包括了HDFS、Hbase等Spark依赖的文件管理组件,如果你同时有使用完整Hadoop功能的需求,是要分开安装Hadoop和Spark的,这篇教程不适合你

下面我将用一台全新的 Linux 虚拟机进行安装:

虚拟机软件:VMware® Workstation 16 Pro

系统:ubuntu-22.04.1-desktop-amd64

安装Java

注意这里 JAVA 版本要和你的 Spark 支持的版本一致,这里我使用 Java 17

官网:Overview - Spark 3.3.0 Documentation

Spark runs on Java 8/11/17, Scala 2.12/2.13, Python 3.7+ and R 3.5+. Java 8 prior to version 8u201 support is deprecated as of Spark 3.2.0. For the Scala API, Spark 3.3.0 uses Scala 2.12. You will need to use a compatible Scala version (2.12.x).

在环境变量里一定要写JAVA_HOME,具体java怎么装不赘述了,网上随便找了个教程链接 

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值