spark单机安装

spark下载地址:http://spark.apache.org/downloads.html

 

#解压:   

tar -xzvf spark-2.4.0-bin-hadoop2.6.tgz

cd  spark-2.4.0-bin-hadoop2.6

#执行命名  进入控制台
./bin/spark-shell

var lines = sc.textFile("README.md")

lines.count()

lines.first()

lines.take(1)

val linesWithApache = lines.filter(line => line.contains("Apache"))


#退出
:quit

 

cp spark-env.sh.template  spark-env.sh

 


#spark-env.sh

export JAVA_HOME=/usr/java/jdk1.8.0_151
export SPARK_MASTER_IP=localhost
export SPARK_LOCAL_IP=localhost
export SPARK_MASTER_PORT=7077
export SPARK_WORKER_CORES=1
export SPARK_WORKER_INSTANCES=1
export SPARK_WORKER_MEMORY=1g


 

 

 

Spark是一个开源的大数据处理框架,可以在单机模式下进行安装和使用。以下是Spark单机模式的安装步骤: 1. 首先,确保你的机器上已经安装了Java环境。你可以通过在终端中输入`java -version`来检查Java是否已经安装。 2. 下载Spark安装包。你可以从Spark官方网站(https://spark.apache.org/downloads.html)下载最新版本的Spark。 3. 解压Spark安装包。将下载的Spark压缩包解压到你想要安装的目录下,例如`/opt/spark`。 4. 配置环境变量。打开终端,编辑`~/.bashrc`文件(或者`~/.bash_profile`),添加以下内容: ``` export SPARK_HOME=/opt/spark export PATH=$PATH:$SPARK_HOME/bin ``` 保存文件后,执行`source ~/.bashrc`(或者`source ~/.bash_profile`)使环境变量生效。 5. 配置Spark。进入Spark安装目录,复制一份`spark-env.sh.template`文件并重命名为`spark-env.sh`: ``` cd /opt/spark/conf cp spark-env.sh.template spark-env.sh ``` 编辑`spark-env.sh`文件,设置以下环境变量: ``` export SPARK_MASTER_HOST=localhost export SPARK_MASTER_PORT=7077 export SPARK_LOCAL_IP=localhost ``` 保存文件后,关闭编辑器。 6. 启动Spark。在终端中执行以下命令启动Spark: ``` cd /opt/spark ./sbin/start-master.sh ``` 这将启动Spark的主节点。 7. 访问Spark Web界面。打开浏览器,访问`http://localhost:8080`,你将看到Spark的Web界面,其中包含有关Spark集群的信息。 至此,你已经成功安装并启动了Spark单机模式。你可以使用Spark提供的命令行工具或编写Spark应用程序来进行数据处理和分析。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值