Introducción a la Programación en Python
INTRODUCCION A LA
PROGRAMACIÓN EN PYTHON
Facultad de Estudios Ambientales y Rurales
Departamento de Ecología y Territorio
[Link]@[Link]
12 de Agosto de 2014
John Alexander Chavarro Díaz Facultad de Estudios Ambientales y Rurales
Modelación Dinámica
Introducción a la Programación en Python
CONTENIDO - PANDAS
1 Definición
2 Instalación
3 Generalidades
4 Estructuras de Datos
5 Creación de Objetos
6 Viendo Datos
7 Rebanado de DataFrame
8 Lectura/Escritura de archivos
John Alexander Chavarro Díaz Facultad de Estudios Ambientales y Rurales
Modelación Dinámica
Introducción a la Programación en Python
Python Data Analysis Library
Definición
Pandas es una librería de código abierto (al igual que todo en pyhton), de alto
rendimiento para el fácil manejo de datos estructurados y análisis de datos en
Python.
El mejor tutorial en [Link]
John Alexander Chavarro Díaz Facultad de Estudios Ambientales y Rurales
Modelación Dinámica
Introducción a la Programación en Python
Python Data Analysis Library
Instalación
Instalación:
Para MS-Windows ir al command
Tecla +R
cmd + ejecutar
Buscar directorio de instalación de Python
• Anaconda
• Ir a la raíz, normalmente queda instalado en C:\Anaconda
• conda install pandas
John Alexander Chavarro Díaz Facultad de Estudios Ambientales y Rurales
Modelación Dinámica
Introducción a la Programación en Python
Python Data Analysis Library
Instalación
Tomado de [Link]
John Alexander Chavarro Díaz Facultad de Estudios Ambientales y Rurales
Modelación Dinámica
Introducción a la Programación en Python
Python Data Analysis Library
Generalidades
• PANDAS consiste en una matriz de datos estructurados y etiquetados, principalmente
series de tiempo y DataFrame.
• Al igual que Numpy, los objetos son indexados esta vez no por su posición (aunque
también se puede) sino por etiqueta(s) INDICE(S) [MULTI-INDEXADO].
• Generación de rangos de fechas (date_range)
• Herramientas de lectura /escritura: desde y hacia archivos planos tabulados (CSV,
delimitados, Excel) y objetos de PANDAS [Pytables/HDF5].
• Manejo eficiente de datos
• Estadísticas dinámicas
John Alexander Chavarro Díaz Facultad de Estudios Ambientales y Rurales
Modelación Dinámica
Introducción a la Programación en Python
Python Data Analysis Library
Estructuras de Datos
Dimensión Tipo Descripción
1 Series Etiquetado 1D – Tipo Array
1 Serie de Tiempo Serie con indexado en el tiempo
2 DataFrame Etiquetado 2D, multi-indexado, estructura
tabular con tipo de columnas
heterogéneas
3 Panel Etiquetado 3D con matrices de diferentes
tamaños.
John Alexander Chavarro Díaz Facultad de Estudios Ambientales y Rurales
Modelación Dinámica
Introducción a la Programación en Python
Python Data Analysis Library
Introducción – Creación de Objetos
import pandas as pd
import numpy as np
import [Link] as plt
# Creacion de objetos [Series]
s = [Link]([1,3,5,[Link],6,8])
# Creacion de objetos [DataFrame]
dates = pd.date_range(‘20130101’,periods=6)
print dates
df = [Link]([Link](6, 4), index=dates, columns=list('ABCD'))
print df
John Alexander Chavarro Díaz Facultad de Estudios Ambientales y Rurales
Modelación Dinámica
Introducción a la Programación en Python
Python Data Analysis Library
Introducción – Viendo los datos
# Creando un DataFrame desde un diccionario
df2 = [Link]({ ’A’:1.,
’B’: [Link](’20130102’),
’C’: [Link](1, index=list(range(4)), dtype=’float32’),
’D’: [Link]([3] * 4, dtype=‘int32’)
’E’:’foo’})
print df2
[Link]
# Viendo datos
[Link]()
[Link](2)
[Link]()
[Link]()
[Link]()
[Link]()
John Alexander Chavarro Díaz Facultad de Estudios Ambientales y Rurales
Modelación Dinámica
Introducción a la Programación en Python
Python Data Analysis Library
Introducción – Rebanado de datos
# Seleccionando una columna del DataFrame, lo cual produce una Serie
df[‘A’]
type(df)
type(df[‘A’])
# Al igual que en Numpy
df[0:3]
df[‘20130102’:’20130104’]
# Por su etiqueta, funciones loc/iloc
[Link][dates[0]]
[Link][:, [’A’,’B’]]
[Link]['20130102':'20130104', ['A','B']]
[Link][dates[0],'A']
John Alexander Chavarro Díaz Facultad de Estudios Ambientales y Rurales
Modelación Dinámica
Introducción a la Programación en Python
Python Data Analysis Library
Introducción – Lectura/Escritura
# Guardando el DataFrame en un archivo CSV
df.to_csv('[Link]')
# leyendo el DataFrame desde un archivo CSV
pd.read_csv('[Link]')
# Guardando el DataFrame en un archivo Excel
df.to_excel('[Link]', sheet_name='datos')
# leyendo el DataFrame desde un archivo Excel
# cambiemos los valores de algunas celdas del archivo guardado por -99999
pd.read_excel('[Link]', 'datos', index_col=None, na_values=['-99999'])
John Alexander Chavarro Díaz Facultad de Estudios Ambientales y Rurales
Modelación Dinámica