0% encontró este documento útil (0 votos)
81 vistas11 páginas

Introducción a Programación en Python

Este documento presenta una introducción a la librería Pandas en Python. Pandas es una librería de código abierto para el manejo y análisis de datos estructurados. Explica las estructuras de datos principales como Series y DataFrame, y cómo crear y manipular objetos Pandas, incluyendo la lectura y escritura de archivos.
Derechos de autor
© © All Rights Reserved
Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.
Formatos disponibles
Descarga como PDF, TXT o lee en línea desde Scribd
0% encontró este documento útil (0 votos)
81 vistas11 páginas

Introducción a Programación en Python

Este documento presenta una introducción a la librería Pandas en Python. Pandas es una librería de código abierto para el manejo y análisis de datos estructurados. Explica las estructuras de datos principales como Series y DataFrame, y cómo crear y manipular objetos Pandas, incluyendo la lectura y escritura de archivos.
Derechos de autor
© © All Rights Reserved
Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.
Formatos disponibles
Descarga como PDF, TXT o lee en línea desde Scribd

Introducción a la Programación en Python

INTRODUCCION A LA
PROGRAMACIÓN EN PYTHON

Facultad de Estudios Ambientales y Rurales


Departamento de Ecología y Territorio
[Link]@[Link]

12 de Agosto de 2014

John Alexander Chavarro Díaz Facultad de Estudios Ambientales y Rurales

Modelación Dinámica
Introducción a la Programación en Python

CONTENIDO - PANDAS

1 Definición

2 Instalación

3 Generalidades

4 Estructuras de Datos

5 Creación de Objetos
6 Viendo Datos

7 Rebanado de DataFrame
8 Lectura/Escritura de archivos

John Alexander Chavarro Díaz Facultad de Estudios Ambientales y Rurales

Modelación Dinámica
Introducción a la Programación en Python

Python Data Analysis Library

Definición

Pandas es una librería de código abierto (al igual que todo en pyhton), de alto
rendimiento para el fácil manejo de datos estructurados y análisis de datos en
Python.

El mejor tutorial en [Link]

John Alexander Chavarro Díaz Facultad de Estudios Ambientales y Rurales

Modelación Dinámica
Introducción a la Programación en Python

Python Data Analysis Library

Instalación

Instalación:

Para MS-Windows ir al command

Tecla +R

cmd + ejecutar

Buscar directorio de instalación de Python


• Anaconda
• Ir a la raíz, normalmente queda instalado en C:\Anaconda
• conda install pandas

John Alexander Chavarro Díaz Facultad de Estudios Ambientales y Rurales

Modelación Dinámica
Introducción a la Programación en Python

Python Data Analysis Library

Instalación

Tomado de [Link]

John Alexander Chavarro Díaz Facultad de Estudios Ambientales y Rurales

Modelación Dinámica
Introducción a la Programación en Python

Python Data Analysis Library

Generalidades

• PANDAS consiste en una matriz de datos estructurados y etiquetados, principalmente


series de tiempo y DataFrame.

• Al igual que Numpy, los objetos son indexados esta vez no por su posición (aunque
también se puede) sino por etiqueta(s) INDICE(S) [MULTI-INDEXADO].

• Generación de rangos de fechas (date_range)

• Herramientas de lectura /escritura: desde y hacia archivos planos tabulados (CSV,


delimitados, Excel) y objetos de PANDAS [Pytables/HDF5].

• Manejo eficiente de datos

• Estadísticas dinámicas
John Alexander Chavarro Díaz Facultad de Estudios Ambientales y Rurales

Modelación Dinámica
Introducción a la Programación en Python

Python Data Analysis Library

Estructuras de Datos

Dimensión Tipo Descripción


1 Series Etiquetado 1D – Tipo Array
1 Serie de Tiempo Serie con indexado en el tiempo
2 DataFrame Etiquetado 2D, multi-indexado, estructura
tabular con tipo de columnas
heterogéneas
3 Panel Etiquetado 3D con matrices de diferentes
tamaños.

John Alexander Chavarro Díaz Facultad de Estudios Ambientales y Rurales

Modelación Dinámica
Introducción a la Programación en Python

Python Data Analysis Library

Introducción – Creación de Objetos

import pandas as pd
import numpy as np
import [Link] as plt

# Creacion de objetos [Series]

s = [Link]([1,3,5,[Link],6,8])

# Creacion de objetos [DataFrame]

dates = pd.date_range(‘20130101’,periods=6)
print dates
df = [Link]([Link](6, 4), index=dates, columns=list('ABCD'))
print df

John Alexander Chavarro Díaz Facultad de Estudios Ambientales y Rurales

Modelación Dinámica
Introducción a la Programación en Python

Python Data Analysis Library

Introducción – Viendo los datos

# Creando un DataFrame desde un diccionario

df2 = [Link]({ ’A’:1.,


’B’: [Link](’20130102’),
’C’: [Link](1, index=list(range(4)), dtype=’float32’),
’D’: [Link]([3] * 4, dtype=‘int32’)
’E’:’foo’})
print df2
[Link]

# Viendo datos

[Link]()
[Link](2)
[Link]()
[Link]()
[Link]()
[Link]()

John Alexander Chavarro Díaz Facultad de Estudios Ambientales y Rurales

Modelación Dinámica
Introducción a la Programación en Python

Python Data Analysis Library

Introducción – Rebanado de datos

# Seleccionando una columna del DataFrame, lo cual produce una Serie

df[‘A’]
type(df)
type(df[‘A’])

# Al igual que en Numpy

df[0:3]
df[‘20130102’:’20130104’]

# Por su etiqueta, funciones loc/iloc

[Link][dates[0]]
[Link][:, [’A’,’B’]]
[Link]['20130102':'20130104', ['A','B']]
[Link][dates[0],'A']

John Alexander Chavarro Díaz Facultad de Estudios Ambientales y Rurales

Modelación Dinámica
Introducción a la Programación en Python

Python Data Analysis Library

Introducción – Lectura/Escritura

# Guardando el DataFrame en un archivo CSV

df.to_csv('[Link]')

# leyendo el DataFrame desde un archivo CSV

pd.read_csv('[Link]')

# Guardando el DataFrame en un archivo Excel

df.to_excel('[Link]', sheet_name='datos')

# leyendo el DataFrame desde un archivo Excel


# cambiemos los valores de algunas celdas del archivo guardado por -99999

pd.read_excel('[Link]', 'datos', index_col=None, na_values=['-99999'])

John Alexander Chavarro Díaz Facultad de Estudios Ambientales y Rurales

Modelación Dinámica

También podría gustarte