Tutorial Spark

O documento é um tutorial sobre como configurar o Apache Spark, incluindo pré-requisitos como Java JDK, Python e Scala. Ele detalha o processo de instalação do Java, download do Apache Spark, configuração de variáveis de ambiente e teste da instalação. Além disso, fornece um exemplo de execução de um script PySpark.

Enviado por

mbs38

Direitos autorais

Levamos muito a sério os direitos de conteúdo. Se você suspeita que este conteúdo é seu, reivindique-o aqui.

Formatos disponíveis

Baixe no formato PDF, TXT ou leia on-line no Scribd

0% acharam este documento útil (0 voto)

16 visualizações2 páginas

Tutorial Spark

Enviado por

mbs38

Direitos autorais

Levamos muito a sério os direitos de conteúdo. Se você suspeita que este conteúdo é seu, reivindique-o aqui.

Formatos disponíveis

Baixe no formato PDF, TXT ou leia on-line no Scribd

Você está na página 1/ 2

Tutorial de Configuração do Apache Spark

1. PRÉ-REQUISITOS
- Java JDK 8 ou superior
- Python 3 (opcional, se fores usar PySpark)
- Scala (opcional, se fores usar Spark com Scala)
- Hadoop (opcional)
- Ambiente UNIX-like (Linux/macOS/WSL no Windows)

2. INSTALAR O JAVA
Verifica se tens o Java instalado:
java -version
Se não tiveres, instala-o (Ubuntu):
sudo apt update
sudo apt install openjdk-11-jdk

3. DOWNLOAD DO APACHE SPARK

1. Vai a: https://spark.apache.org/downloads.html
2. Escolhe a versão estável.
3. Exemplo de download:
wget https://dlcdn.apache.org/spark/spark-3.5.0/spark-3.5.0-bin-hadoop3.tgz
tar -xvzf spark-3.5.0-bin-hadoop3.tgz
mv spark-3.5.0-bin-hadoop3 ~/spark

4. CONFIGURAÇÃO DAS VARIÁVEIS DE AMBIENTE

Adiciona ao ficheiro ~/.bashrc ou ~/.zshrc:
export SPARK_HOME=~/spark
export PATH=$SPARK_HOME/bin:$PATH
export JAVA_HOME=/usr/lib/jvm/java-11-openjdk-amd64
Depois aplica:
source ~/.bashrc
5. TESTAR A INSTALAÇÃO
spark-shell # Para Scala
pyspark # Para Python

6. EXECUTAR UM EXEMPLO COM PYSPARK

Cria um ficheiro exemplo.py:
from pyspark.sql import SparkSession

spark = SparkSession.builder.appName("Exemplo").getOrCreate()
dados = spark.range(1, 100).toDF("número")
dados.show()

Corre com:
spark-submit exemplo.py

Para mais informações: https://gptonline.ai/

Você também pode gostar

Configuração Do PysPark
Ainda não há avaliações
Configuração Do PysPark
6 páginas
Instalação Do Apache Spark
Ainda não há avaliações
Instalação Do Apache Spark
2 páginas
Curso Pyspark Pipeline
Ainda não há avaliações
Curso Pyspark Pipeline
44 páginas
Ativar Módulos No Apache
Ainda não há avaliações
Ativar Módulos No Apache
5 páginas
Principios de Desenvolvimento de Spark Com Python
Ainda não há avaliações
Principios de Desenvolvimento de Spark Com Python
55 páginas
Modulo 41 Aula
Ainda não há avaliações
Modulo 41 Aula
9 páginas
Guia PySpark
Ainda não há avaliações
Guia PySpark
15 páginas
Configurar Apache para Spark
Ainda não há avaliações
Configurar Apache para Spark
2 páginas
Tutorial Spark
Ainda não há avaliações
Tutorial Spark
14 páginas
FDSG
Ainda não há avaliações
FDSG
23 páginas
Guia Spark
Ainda não há avaliações
Guia Spark
13 páginas
06 Slides Modulo 6 PDF
Ainda não há avaliações
06 Slides Modulo 6 PDF
133 páginas
Instalação JDK 11
Ainda não há avaliações
Instalação JDK 11
3 páginas
Curso Databricks Pipeline
Ainda não há avaliações
Curso Databricks Pipeline
12 páginas
LearningSpark2.0 (001 224) PT BR
100% (1)
LearningSpark2.0 (001 224) PT BR
224 páginas
Aula 1 - Big Data para Iniciantes
Ainda não há avaliações
Aula 1 - Big Data para Iniciantes
13 páginas
Princípios de Desenvolvimento de Spark Com Python
Ainda não há avaliações
Princípios de Desenvolvimento de Spark Com Python
101 páginas
Install Spark
Ainda não há avaliações
Install Spark
1 página
Capítulo 07 Instalação Do Ecossistema Hadoop
Ainda não há avaliações
Capítulo 07 Instalação Do Ecossistema Hadoop
15 páginas
Itsr Workbook Ambiente Março 2024
Ainda não há avaliações
Itsr Workbook Ambiente Março 2024
35 páginas
01.07.1 Instalando Anaconda Python No Linux Ubuntu 16.04 LTS PDF
Ainda não há avaliações
01.07.1 Instalando Anaconda Python No Linux Ubuntu 16.04 LTS PDF
17 páginas
Instalação e Configuração Do Ambiente de Desenvolvimento
Ainda não há avaliações
Instalação e Configuração Do Ambiente de Desenvolvimento
19 páginas
3 - Princípios de Desenvolvimento de Spark Com Python
Ainda não há avaliações
3 - Princípios de Desenvolvimento de Spark Com Python
99 páginas
4 - Spark
Ainda não há avaliações
4 - Spark
15 páginas
Guia Adicional
Ainda não há avaliações
Guia Adicional
10 páginas
2.introdução Ao Spark
Ainda não há avaliações
2.introdução Ao Spark
10 páginas
? Passo A Passo Configuração Spark
Ainda não há avaliações
? Passo A Passo Configuração Spark
6 páginas
Para Integrar o PostgreSQL Com Apache Spark
Ainda não há avaliações
Para Integrar o PostgreSQL Com Apache Spark
2 páginas
Guia Apache MySQL Detalhado
Ainda não há avaliações
Guia Apache MySQL Detalhado
2 páginas
Spark2 GuiaReferencia
Ainda não há avaliações
Spark2 GuiaReferencia
5 páginas
Hadoop e Spark - Visão Geral
Ainda não há avaliações
Hadoop e Spark - Visão Geral
5 páginas
Semana 2 - Guia-Pratico - Instalação e Configuração Do Ambiente de Desenvolvimento Web - Parte2 - Linux - Desenvolvimento Web - COM320 - Rev
Ainda não há avaliações
Semana 2 - Guia-Pratico - Instalação e Configuração Do Ambiente de Desenvolvimento Web - Parte2 - Linux - Desenvolvimento Web - COM320 - Rev
11 páginas
01.07.1 Instalando Anaconda Python No Windows
Ainda não há avaliações
01.07.1 Instalando Anaconda Python No Windows
15 páginas
Oficina de Python - Configurando o Ambiente
Ainda não há avaliações
Oficina de Python - Configurando o Ambiente
2 páginas
Princípios de Desenvolvimento de Spark Com Python
Ainda não há avaliações
Princípios de Desenvolvimento de Spark Com Python
40 páginas
Avançado: Análise Com Pyspark
Ainda não há avaliações
Avançado: Análise Com Pyspark
236 páginas
Apresentação Elyonann 4
Ainda não há avaliações
Apresentação Elyonann 4
5 páginas
Tutorial para A Instalacao Do Anaconda
Ainda não há avaliações
Tutorial para A Instalacao Do Anaconda
7 páginas
Guia Completo de PySpark: Conceitos e Aplicações
Ainda não há avaliações
Guia Completo de PySpark: Conceitos e Aplicações
28 páginas
Guia do Curso Mergulho Spring REST
Ainda não há avaliações
Guia do Curso Mergulho Spring REST
40 páginas
Guia Completo: Linux, Ubuntu e Servidores Web
Ainda não há avaliações
Guia Completo: Linux, Ubuntu e Servidores Web
26 páginas
Primeiros Passos em Big Data1
Ainda não há avaliações
Primeiros Passos em Big Data1
50 páginas
(Extra) Configurações Básicas No Apache2 - Artigo Revista Infra Magazine 1
Ainda não há avaliações
(Extra) Configurações Básicas No Apache2 - Artigo Revista Infra Magazine 1
14 páginas
Instalar o Anaconda
Ainda não há avaliações
Instalar o Anaconda
8 páginas
BigData Aula 03
Ainda não há avaliações
BigData Aula 03
76 páginas
Roteiro Teste Depuracao Databricks
Ainda não há avaliações
Roteiro Teste Depuracao Databricks
8 páginas
Princípios de Desenvolvimento de Spark Com Python
Ainda não há avaliações
Princípios de Desenvolvimento de Spark Com Python
80 páginas
07.10 Instalando MySQL No Windows PDF
Ainda não há avaliações
07.10 Instalando MySQL No Windows PDF
22 páginas
Resumo Apache MySQL
Ainda não há avaliações
Resumo Apache MySQL
1 página
Zab 1
Ainda não há avaliações
Zab 1
16 páginas
PySpark Turma2 Spark Aula3 ConfiguraçãoSpark v2.3.3
Ainda não há avaliações
PySpark Turma2 Spark Aula3 ConfiguraçãoSpark v2.3.3
92 páginas
Manual Completo do Spark: Instalação e Uso
Ainda não há avaliações
Manual Completo do Spark: Instalação e Uso
14 páginas
Guia Configuração Ambiente Curso Básico Python
Ainda não há avaliações
Guia Configuração Ambiente Curso Básico Python
7 páginas
DS - Data Science I
Ainda não há avaliações
DS - Data Science I
36 páginas
Instruções de Preparação
Ainda não há avaliações
Instruções de Preparação
4 páginas
SQL For Data Analysis Traduzido
88% (8)
SQL For Data Analysis Traduzido
334 páginas
Web Scraping Com Python
100% (10)
Web Scraping Com Python
325 páginas
SQL para Análise de Dados
100% (10)
SQL para Análise de Dados
435 páginas
Apostila SQL Impressionador
100% (5)
Apostila SQL Impressionador
285 páginas
Resumo Aprendendo SQL Alan Beaulieu
27% (11)
Resumo Aprendendo SQL Alan Beaulieu
3 páginas
Engenharia+de+Dados+Com+Databricks+ +Eron+e+Garcia
100% (1)
Engenharia+de+Dados+Com+Databricks+ +Eron+e+Garcia
222 páginas
O Guia Do Mochileiro Python (Kenneth Reitz Tanya Schlusser)
100% (11)
O Guia Do Mochileiro Python (Kenneth Reitz Tanya Schlusser)
405 páginas
Referencia Dax PDF
100% (1)
Referencia Dax PDF
694 páginas
Python Programming For Data Analysis Traduzido
Ainda não há avaliações
Python Programming For Data Analysis Traduzido
264 páginas
Edicao 23
Ainda não há avaliações
Edicao 23
93 páginas
Passo A Passo para Instalar o AutoCAD
Ainda não há avaliações
Passo A Passo para Instalar o AutoCAD
3 páginas
Instalar e Configurar WebProxi
Ainda não há avaliações
Instalar e Configurar WebProxi
2 páginas
Permissão de Administrador A Um Usuário No Windows Server
Ainda não há avaliações
Permissão de Administrador A Um Usuário No Windows Server
2 páginas
O WhatsApp Corporativo
Ainda não há avaliações
O WhatsApp Corporativo
2 páginas
05 - Tutorial de Reparo de Placa Mãe
Ainda não há avaliações
05 - Tutorial de Reparo de Placa Mãe
5 páginas
Como Criar Produtos em Resina
Ainda não há avaliações
Como Criar Produtos em Resina
1 página
01 - Manual de Personalização de Canecas
Ainda não há avaliações
01 - Manual de Personalização de Canecas
4 páginas
Guia de Recarga de Cartuchos de Tinta
Ainda não há avaliações
Guia de Recarga de Cartuchos de Tinta
3 páginas
03 - Manual de Orientação A Objetos
Ainda não há avaliações
03 - Manual de Orientação A Objetos
7 páginas
02 - Manual de Instalação Do Java
Ainda não há avaliações
02 - Manual de Instalação Do Java
5 páginas