windows下配置pyspark的方法
1. 拷贝hadoop-2.6.0目录到某一个目录下
D:\Program Files\hadoop-2.6.0\bin
配置环境变量:
HADOOP_HOME=D:\Program Files\hadoop-2.6.0
path = D:\Program Files\hadoop-2.6.0\bin
2. 配置pycharm
拷贝 spark-2.3.0-bin-2.6.0-cdh5.7.0 到一个目录下
(1) 选择edit configurations, New一个configuration,
配置 environment variables,
SPARK_HOME = E:\centos_sys\spark-2.3.0-bin-2.6.0-cdh5.7.0
PYTHONPATH = E:\centos_sys\spark-2.3.0-bin-2.6.0-cdh5.7.0\python
3. 设置 ---》project structure
+add content root
选择 E:\centos_sys\spark-2.3.0-bin-2.6.0-cdh5.7.0\python\lib\py4j-0.10.6-src.zip
E:\centos_sys\spark-2.3.0-bin-2.6.0-cdh5.7.0\python\lib\pyspark.zip
配置完毕!
linux(centos)下spark环境配置:
1. 配置SPARK_HOME和PYTHONPATH
= /home/hadoop/app/spark-2.3.0-bin-2.6.0-.7.0
PYTHONPATH = /home/hadoop/app/spark-2.3.0-bin-2.6.0-cdh5.7.0/python/lib/py4j-0.10.6-src.zip
2. spark代码和windows一致,不用修改
运行方式:
方式1:采用spark-submit提交job
spark-submit ./spark-submit --master local[2] --name spark0401 /home/hadoop/python_submit/spark0401.py
方式2:采用python直接运行
python spark0401.py


AI_DL_CODE
- 粉丝: 5613
最新资源
- 通信工程设计概述.ppt
- 公务员信息化与电子政务考试培训PPT课件.ppt
- 大众点评网网络推广方案.ppt
- 如何做好医疗企业网络营销策划.doc
- 华中科技大学计算机网络课件习题讲解.doc
- 基于51单片机的数字电压表设计.doc
- (源码)基于C语言的嵌入式文件管理与查看系统.zip
- 2023年浙江省计算机二级考试办公自动化高级应用中Excel考试题常用函数.doc
- 网络科技公司创业计划书通用6篇.docx
- 精华版国家开放大学电大《网络系统管理与维护》机考2套真题题库及答案2.pdf
- 外贸企业营销型网站建设技巧-.doc
- (源码)基于Swift框架的iOS自定义模板项目.zip
- (源码)基于Android和ZXing库的二维码条形码扫描系统.zip
- (源码)基于JavaSpring Boot框架的快速开发系统.zip
- 大三上Python大作业,关于AC小说网的网络爬虫,爬取了首页小说的内容等相关信息 网址:https://m.acxsw.com/
- (源码)基于MicroPython的ESP32外设控制项目.zip
资源上传下载、课程学习等过程中有任何疑问或建议,欢迎提出宝贵意见哦~我们会及时处理!
点击此处反馈


