0% encontró este documento útil (0 votos)

357 vistas53 páginas

Pandas

Este documento introduce Pandas, una biblioteca de Python para el análisis y manipulación de datos. Explica que Pandas proporciona estructuras de datos flexibles como DataFrames para trabajar con datos etiquetados. Describe las características clave de Pandas como indexación, agrupación de datos, E/S de archivos y funcionalidad de series temporales. Finalmente, presenta ejemplos de uso básico de Pandas como creación de DataFrames, operaciones y lectura de datos externos.

Cargado por

Jerónimo Fernández

Derechos de autor

Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.

Formatos disponibles

Descarga como PDF, TXT o lee en línea desde Scribd

0% encontró este documento útil (0 votos)

357 vistas53 páginas

Pandas

Cargado por

Jerónimo Fernández

Derechos de autor

Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.

Formatos disponibles

Descarga como PDF, TXT o lee en línea desde Scribd

Está en la página 1/ 53

Pensamiento Computacional

Pandas
Introducción

Equipo docente
Universidad de San Andrés
Buenos Aires
Mayo 2022
Introducción
¿Qué es Pandas?

¿Qué es?
Una biblioteca de análisis y manipulación de datos para Python

Es un paquete de Python que proporciona estructuras de datos

rápidas, flexibles y expresivas diseñadas para que trabajar con
datos "relacionales" o "etiquetados" sea fácil e intuitivo. Su
objetivo es ser el bloque de construcción fundamental de alto
nivel para realizar análisis de datos prácticos (del mundo real)
en Python. Es un sistema de datos de código abierto.

1 43
Características de Pandas

DataFrame es la estructura de datos fundamental. Son

tablas de dos o más dimensiones, de tamaño variable que
permiten tener datos heterogéneos.
Mutabilidad de tamaño: las columnas se pueden insertar y
eliminar desde DataFrame y objetos de mayor dimensión.
Los datos se pueden alinear automáticamente o
manualmente usando un conjunto de etiquetas hechas para
este fin.
Permite agrupar los datos para realizar operaciones por
grupos o combinación en conjuntos de datos.
Facilita la conversión de estructuras de datos de Python y
NumPy a objetos del tipo DataFrame.

2 43
Características de Pandas

Manejo de datos basado en etiquetas, incluyendo la

indexación y la creación de subconjuntos.
Transformación y rotación de conjuntos de datos.
Herramientas robustas de E/S para cargar datos desde
archivos planos (CSV y delimitados), archivos de Excel, bases
de datos, etc.
Funcionalidad específica de series temporales: generación
de rango de fechas y conversión de frecuencia, estadísticas
de ventanas móviles, cambio de fecha y retraso.

3 43
Características de Pandas

Paquete Python: Python 3.

Instalación: pip install pandas
Cheatsheet: Enlace

Referencia: https://pandas.pydata.org/

4 43
Primeros pasos. En consola

In [1]: import pandas as pd

In [2]: pd.__version__
Out[3]: '1.4.2'
In [4]: pdoc pd
Class docstring:
pandas - a powerful data analysis
and manipulation library for Python
===================================

pandas is a Python package ...

5 43
DATAFRAMES

Contenedores de datos de Pandas:

I Lineal: Series. Es el único caso especial de una dimensión
(1D) de Dataframe.
I Multi Dimensión: DataFrame. Usamos DataFrame como para
casos más generales.

6 43
Dataframes
DATAFRAMES

Para mostrar las caracteríscas de los DataFrame , mostremos

un ejemplo, pero ¿desde donde podemos obtener los datos?

I Desde listas, diccionarioss, objetos numpy.

I Desde archivos CSV, HDF5, JSON, Excel, HTML, etc.
I Desde datos propios de Pandas.
I Desde el portapapeles.
I Etc. ;)

7 43
Ejemplo

In [5]: edades = [41, 56, 56, 57, 39, 59, 43, 56, 38, 60]
In [6]: pd.DataFrame(edades)
In [7]:

0
0 41
1 56
2 56
3 57
4 39
5 59
6 43
7 56
8 38
9 60

8 43
Ejemplo

In [8]: df_edades = pd.DataFrame(edades)

df_edades.head(3)
In [9]:

0
0 41
1 56
2 56

9 43
Ejemplo
In [10]: data = { "Nombre": ["Liu", "Rowland", "Rivers",
"Waters", "Rice", "Fields",
"Kerr", "Romero", "Davis", "Hall"],
"Edad": edades }

In [11]: print(data)

Out [12]:
{'Nombre': ['Liu', 'Rowland', 'Rivers', 'Waters', 'Rice', 'Fields',
'Kerr', 'Romero', 'Davis', 'Hall'], 'Edad': [41, 56, 56, 57, 39, 59,
43, 56, 38, 60]}

In [13]: df_ejemplo = pd.DataFrame(data)

df_ejemplo.head(4)
Nombre Edad
0 Liu 41
1 Rowland 56
2 Rivers 56
3 Waters 57

10 43
Dataframes

Automáticamente crea las columnas desde el diccionario.

Ahora se tienen dos columnas: una para los nombres, y otra
para las edades.
La primera columna es el índice.
DataFrame siempre tiene índices, ya sean auto-generados o
personalizados.

11 43
Operaciones
Operaciones, con df_ejemplo

In [14]: df_ejemplo.index
Out[15]: RangeIndex(start=0, stop=10, step=1)

Para hacer que el Nombre sea el índice se usa

.set_index()
inplace=True modificará el frame padre (algo extraño,
no?)
In [16]: df_ejemplo.set_index("Nombre", inplace=True)
df_ejemplo

12 43
Más operaciones

Edad
Nombre
Liu 41
Rowland 56
Rivers 56
Waters 57
Rice 39
Fields 59
Kerr 43
Romero 56
David 38
Hall 60

13 43
Más operaciones

In [14]: df_ejemplo.describe()
Out[15]:

Edad
count 10.000000
mean 50.500000
std 9.009255
min 38.000000
25% 41.500000
50% 56.000000
75% 56.750000
max 60.000000

14 43
Más operaciones

In [14]: df_ejemplo.T
Out[15]:

Nombre Liu Rowland Rivers Waters Rice Fields Kerr Romero Davis Hall
Edad 41 56 56 57 39 59 43 56 38 60

15 43
Operaciones aritméticas
In [14]: df_ejemplo.multiply(2).head(3)
Out[15]:
Edad
Nombre
Liu 82
Rowland 112
Rivers 112

In [14]: (df_ejemplo / 2).head(3)

Out[15]:
Edad
Nombre
Liu 20.5
Rowland 28.0
Rivers 28.0

16 43
Operaciones lógicas
In [14]: df_ejemplo > 40
Out[15]:
Edad
Nombre
Liu True
Rowland True
Rivers True
Waters True
Rice False
Fields True
Kerr True
Romero True
David False
Hall True

17 43
Otro ejemplo, más interesante

df_demo = pd.DataFrame({
"A": 1.2,
"B": pd.Timestamp('20220528'),
"C": [(-1)**i * np.sqrt(i) + np.e * (-1)**(i-1) for i in range(5)],
"D": pd.Categorical(["Esta", "columna", "tiene", "datos", "raros"]),
"E": "Igual"
})
df_demo

A B C D E
0 1.2 2022-05-28 -2.718282 Esta Igual
1 1.2 2022-05-28 1.718282 columna Igual
2 1.2 2022-05-28 -1.304068 tiene Igual
3 1.2 2022-05-28 0.986231 datos Igual
4 1.2 2022-05-28 -0.718282 raros Igual

18 43
Ordenamiento con el ejemplo df_demo

In [34]: df_demo.sort_values("C")

A B C D E
0 1.2 2022-05-28 -2.718282 Esta Igual
2 1.2 2022-05-28 -1.304068 tiene Igual
4 1.2 2022-05-28 -0.718282 raros Igual
3 1.2 2022-05-28 0.986231 datos Igual
1 1.2 2022-05-28 1.718282 columna Igual

19 43
Leyendo datos desde archivos
Leyendos datos externos

.read_json()
.read_csv()
.read_hdf5()
.read_excel()
Los anteriores son enlaces, al hacer click te llevan a la
documentación respectiva.

20 43
Leyendos datos externos. Ejemplo
{
"Personaje": ["Sawyer", "...", "Walt"],
"Actor": ["Josh Holloway", "...", "Malcolm David Kelley"],
"Principal": [true, "...", false]
}
In [38]: pd.read_json("datos.json").set_index("Personaje").sort_index()

Actor Principal
Personaje
Hurley Jorge Garcia True
Jack Matthew Fox True
Kate Evangeline Lilly True
Locke Terry OQuinn True
Sawyer Josh Holloway True
Walt Malcolm David Kelley False

21 43
Leyendos datos externos. Opciones para leer
CSV

Para ver toda la documentación: Enlace

Parámetros importantes:
sep: Configura el separador (por ejemplo para usar : en lugar de ,).
header: Especifica información sobre los headers de columnas, también
para múltiples índices de columnas.
names: Alternativa al header – provee la forma de dar títulos diferentes a
las columnas.
usecols: Descarta e incluye columnas, trabaja como cualquier lista (
range(0:20:2) ).
skiprows: Descarte filas.
na_values: Indica que cadenas o string(s) se reconocerán como valores N/A
(los cuales son ignorados en la operaciones del data frame).
parse_dates: Intenta analizar las fechas en CVS; dando diferentes
comportamientos en cuanto a su estructura de datos;
opcionalmente se utiliza junto con date_parser.
compression: Tratar el archivo de entrada como un archivo comprimido
("inferir", "gzip", "zip", ...).
decimal: Divisor de punto decimal.

22 43
Slicing
Slicing de Dataframes

Slicing: Permite seleccionar un sub-rango/sub-conjunto de

todo el dataframe.
Documentación: larga y detallada o corta
Slicing rápidos:
I Se usan operadores de corchetes para dividir el data frame
rápidamente: [].
I Se usa el nombre de la columna para seleccionarla y solo
mostrar sus datos.
I Se utiliza un valor numérico para seleccionar una fila.

23 43
Ejemplo: seleccione solo la columna C de
df_demo
In [41]: df_demo.head(3)

A B C D E
0 1.2 2022-05-28 -2.718282 Esta Igual
1 1.2 2022-05-28 1.718282 columna Igual
2 1.2 2022-05-28 -1.304068 tiene Igual

In [42]: df_demo['C'] # o df_demo.C también funciona.

C
0 -2.718282
1 1.718282
2 -1.304068
3 0.986231
4 -0.718282

24 43
Seleccionar más de una columna dando una lista
al operador []

Ejemplo: Seleccionar una lista con las columnas A y C , [’A’, ’C’]

desde df_demo
In [44]: my_slice = ['A', 'C']
In [45]: df_demo[my_slice]
Out [46]:

A C
0 1.2 -2.718282
1 1.2 1.718282
2 1.2 -1.304068
3 1.2 0.986231
4 1.2 -0.718282

25 43
Seleccionar más de una ﬁla usando rangos

Se usan valores numéricos en corchetes [] para hacer slicing

sobre filas.
Se usan rangos como en las listas de Python.
In [45]: df_demo[1:3]

A B C D E
1 1.2 2022-05-28 1.718282 columna Igual
2 1.2 2022-05-28 -1.304068 tiene Igual

In [46]: df_demo[1:6:2]

A B C D E
1 1.2 2022-05-28 1.718282 columna Igual
3 1.2 2022-05-28 0.986231 datos Igual

26 43
Slicing lógico
Se pueden usar arreglos de booleanos.
In [54]: df_demo[df_demo["C"] > 0]
Out [54]:

A B C D E
1 1.2 2022-05-28 1.718282 columna Igual
3 1.2 2022-05-28 0.986231 datos Igual

In [55]: df_demo["C"] > 0

0 False
1 True
2 False
3 True
4 False

In [56]: df_demo[(df_demo["C"] < 0) and (df_demo["D"] == "raros")]

A B C D E
4 1.2 2022-05-28 -0.718282 raros Igual

27 43
Agregando datos a los
Dataframes
Agregando datos a Dataframes existentes

Para agregar nuevas columnas se usa

frame["nueva col"] = algo o .insert().
Para agregar nuevas filas se usa concat().
Para combinar data frames:
Concat: Combina varios data frames sobre una axisa.
Merge: Combina data frames sobre columnas comunes.
(Join) Adjuntar data frames.
Documentación Enlace

28 43
Agregar una columna a Dataframe

In [58]: df_demo["F"] = df_demo["C"] - df_demo["A"]

In [59]: df_demo.head(3)

A B C D E F
0 1.2 2022-05-28 -2.718282 Esta Igual -3.918282
1 1.2 2022-05-28 1.718282 columna Igual 0.518282
2 1.2 2022-05-28 -1.304068 tiene Igual -2.504068

29 43
Agregar una columna a un Dataframe

.insert() permite especificar la posición de la inserción.

.shape provee una tupla con el tamaño del data frame, (n°
filas, n° columnas).
In [59]: df_demo.insert(df_demo.shape[1] - 1, "E2", df_demo["C"] ** 2)
In [59]: df_demo.head(3)

A B C D E E2 F
0 1.2 2022-05-28 -2.718282 Esta Igual 7.389056 -3.918282
1 1.2 2022-05-28 1.718282 columna Igual 2.952492 0.518282
2 1.2 2022-05-28 -1.304068 tiene Igual 1.700594 -2.504068

30 43
Agregar una ﬁla a un Dataframe

pd.concat(
[
df_demo,
pd.DataFrame({"A": 1.3, "B": pd.Timestamp("2018-02-27"), "C": -0.777,
"D": "los tiene?", "E": "Igual", "E2": NaN, "F": 23}, index=[0])
], ignore_index=True
)

A B C D E E2 F
0 1.2 2022-05-28 -2.718282 Esta Igual 7.389056 -3.918282
1 1.2 2022-05-28 1.718282 columna Igual 2.952492 0.518282
2 1.2 2022-05-28 -1.304068 tiene Igual 1.700594 -2.504068
3 1.2 2018-02-26 0.986231 datos Igual 0.972652 -0.213769
4 1.2 2018-02-26 -0.718282 raros Igual 0.515929 -1.918282
5 1.3 2018-02-27 -0.777000 los tiene? Igual NaN 23.000000

31 43
Concat y Merge en Dataframes

Primero, creamos dos data frames para poder mostrar cómo

funciona .concat() and .merge().
In [64]: df_1 = pd.DataFrame({"Clave": ["Primero", "Segundo"], "Valor": [1, 1]})
In [65]: df_1

Clave Valor
0 Primero 1
1 Segundo 1

In [66]: df_2 = pd.DataFrame({"Clave": ["Primero", "Segundo"], "Valor": [2, 2]})

In [67]: df_2

Clave Valor
0 Primero 2
1 Segundo 2

32 43
Concat y Merge en Dataframes
Concatenemos una lista de data frames verticalmente ( axisa=0 ).
In [66]: pd.concat([df_1, df_2])
Clave Valor
0 Primero 1
1 Segundo 1
0 Primero 2
1 Segundo 2

Lo mismo, pero reindexnado.

In [67]: pd.concat([df_1, df_2], ignore_index=True)
Clave Valor
0 Primero 1
1 Segundo 1
2 Primero 2
3 Segundo 2

33 43
Concat y Merge en Dataframes

Concatenar, pero horizontalmente.

In [68]: pd.concat([df_1, df_2], axis=1)

Clave Valor Clave Valor

0 Primero 1 Primero 2
1 Segundo 1 Segundo 2

Mezclar sobre una columna común.

In [69]: pd.merge(df_1, df_2, on="Clave")

Clave Valor_x Valor_y

0 Primero 1 2
1 Segundo 1 2

34 43
Graﬁcando SIN Pandas
Matplotlib

Matplotlib: es el estándar de-facto para la graficación en

Python.
Interface principal: pyplot.
Es mejor utilizar una API orientada a objetos como Figure y
Axis.
https://matplotlib.org/

In [72]: import matplotlib.pyplot as plt

35 43
Matplotlib
import numpy as np
import matplotlib.pyplot as plt
x = np.linspace(0, 2*np.pi, 400)
y = np.sin(x**2)
fig, ax = plt.subplots()
ax.plot(x, y)
ax.set_title('Usar algo así')
ax.set_xlabel("Números");
ax.set_ylabel("$\sqrt{x}$");

36 43
Matplotlib
Grafica múltiples líneas dentro de un mismo contenedor o
canvas.
Se hace llamando a ax.plot() varias veces.
y2 = y/np.exp(y*1.5)
fig, ax = plt.subplots()
ax.plot(x, y, label="y")
ax.plot(x, y2, label="y2")
ax.legend()
ax.set_title("Este gráfico no tiene sentido");

37 43
Matplotlib

Matplotlib puede también graficar datos de una DataFrame

data
Esto se debe a que sus datos son vistos como un arreglo.
fig, ax = plt.subplots()
ax.plot(df_demo.index, df_demo["C"], label="C")
ax.legend()
ax.set_title("No! no tiene sentido para nada");

38 43
Graﬁcando CON Pandas
Graﬁcando con Pandas

Cada frame tiene una función .plot() (ver la API )

Haces gráficos con Matplotlib.
Opciones importantes:
kind: ’line’ (por defecto), ’bar[h]’ , ’hist’ , ’box’ , ’kde’ ,
’scatter’ , ’hexbin’.
subplots: Fabrica una sub-plot por cada columna
(conviene usarlos con sharex y sharey).
figsize
grid: Agrega una grilla al gráfico (usa optiones de
Matplotlib).
style: Estilo de línea por columna (accepta listas o
diccionarios).
logx, logy, loglog: Gráficos Logarítmicos.
xticks, yticks: Usa valores para ticks (valores usados para
mostrar puntos específicos sobre las axisas).
39 43
Graﬁcando con Pandas

Opciones importantes:
xlim, ylim: Límites de las axisas.
yerr, xerr: Agrega incertidumbre a los puntos de datos.
stacked: Apila un gráfico de barras
secondary_y: Usa una axisa y secundaria para el gráfico.
Labeling: title: Agrega un título al gráfico (Usa una
lista de cadenas o strings si
subplots=True )
legend: Agrega una leyenda.
table: Si se configura true, agrega una
tabla debajo del gráfico.
**kwds: Palabra clave pasada a los métodos Matplotlib.

40 43
Graﬁcando con Pandas

Con slicing.
In [80]: df_demo["C"].plot(figsize=(10, 2));

Con selección o filtrado dentro del plot.

In [81]: df_demo.plot(y="C", figsize=(10, 2));

41 43
Graﬁcando con Pandas

Usando el parámetro kind para modificar el tipo de gráfico.

Hay pseudo-subfunciones para cada tipo (kind) de gráfico.
In [81]: df_demo["C"].plot(kind="bar"); # o df_demo["C"].plot.bar();

42 43
Graﬁcando con Pandas

In [82]: df_demo["C"].plot(kind="bar", legend=True, figsize=(12, 4),

ylim=(-1, 3), title="Esto es un gráfico de C");

43 / 43
¡Gracias! ¿Preguntas?

También podría gustarte

Unidad 2 Manipulación de Datos Con Pandas
Aún no hay calificaciones
Unidad 2 Manipulación de Datos Con Pandas
34 páginas
Pandas
100% (5)
Pandas
172 páginas
Examen - (ACDB1-20%) (SUP1) Actividad Suplementaria - Aplicación de Las Medidas de Tendencia Central
100% (2)
Examen - (ACDB1-20%) (SUP1) Actividad Suplementaria - Aplicación de Las Medidas de Tendencia Central
7 páginas
Machine Learning en Power Bi Con R y Python Compress
Aún no hay calificaciones
Machine Learning en Power Bi Con R y Python Compress
11 páginas
Sistema de Localización de Deportes Universitarios - Diagrama de Clases de Análisis
100% (1)
Sistema de Localización de Deportes Universitarios - Diagrama de Clases de Análisis
1 página
Diseño Web PDF
Aún no hay calificaciones
Diseño Web PDF
36 páginas
Taller - Reconocimiento de Imágenes
0% (1)
Taller - Reconocimiento de Imágenes
35 páginas
Algoritmos y Diagramas de Flujo
Aún no hay calificaciones
Algoritmos y Diagramas de Flujo
42 páginas
FP104 OGCE Esp Trabajo
Aún no hay calificaciones
FP104 OGCE Esp Trabajo
4 páginas
Diferencia Entre La Tabla de Dimensiones y La Tabla de Hechos
Aún no hay calificaciones
Diferencia Entre La Tabla de Dimensiones y La Tabla de Hechos
8 páginas
Fundamentos de minería de datos
De Everand
Fundamentos de minería de datos
Jorge Enrique Rodríguez Rodríguez
Aún no hay calificaciones
Modelos de Las Bases de Datos
Aún no hay calificaciones
Modelos de Las Bases de Datos
6 páginas
Manejo de Programacion
Aún no hay calificaciones
Manejo de Programacion
250 páginas
Curso de Python Comprehensions Funciones y Manejo de Errores
Aún no hay calificaciones
Curso de Python Comprehensions Funciones y Manejo de Errores
37 páginas
Usando SQLite y Python
Aún no hay calificaciones
Usando SQLite y Python
18 páginas
Python Básico - Hoja de Referencia
Aún no hay calificaciones
Python Básico - Hoja de Referencia
1 página
Big Data Con Python 2 18
Aún no hay calificaciones
Big Data Con Python 2 18
1 página
01 Introduccion
Aún no hay calificaciones
01 Introduccion
16 páginas
Estadística para Investigadores Con Matlab
Aún no hay calificaciones
Estadística para Investigadores Con Matlab
112 páginas
Ye Manual de Minitab 2020 - 2-2-64 PDF
Aún no hay calificaciones
Ye Manual de Minitab 2020 - 2-2-64 PDF
63 páginas
Libro BI Competir Con Información
100% (9)
Libro BI Competir Con Información
393 páginas
Plan de Estudios Big Data - CAC 4.0 2022
Aún no hay calificaciones
Plan de Estudios Big Data - CAC 4.0 2022
2 páginas
Intro A Python
Aún no hay calificaciones
Intro A Python
2 páginas
Trabajo Final - Informática Básica
Aún no hay calificaciones
Trabajo Final - Informática Básica
16 páginas
3 Calculadoras en Lenguaje Python
Aún no hay calificaciones
3 Calculadoras en Lenguaje Python
12 páginas
Módulo 6: Copia de Seguridad de Bases de Datos: Contenido
Aún no hay calificaciones
Módulo 6: Copia de Seguridad de Bases de Datos: Contenido
76 páginas
Random Forest Python
Aún no hay calificaciones
Random Forest Python
72 páginas
Proyecto Programacion Orientada A Objetos
Aún no hay calificaciones
Proyecto Programacion Orientada A Objetos
35 páginas
Programacion Orientada A Objetos
Aún no hay calificaciones
Programacion Orientada A Objetos
4 páginas
MachineLearning Python V02
Aún no hay calificaciones
MachineLearning Python V02
71 páginas
Taller de Programacion A - B
Aún no hay calificaciones
Taller de Programacion A - B
7 páginas
Deep Learning Una Introducción Práctica
50% (2)
Deep Learning Una Introducción Práctica
4 páginas
Actividad 2 Power Point
Aún no hay calificaciones
Actividad 2 Power Point
7 páginas
Python 3 para Impacientes - Gráficos en IPython
Aún no hay calificaciones
Python 3 para Impacientes - Gráficos en IPython
8 páginas
Administracion de Base de Datos
Aún no hay calificaciones
Administracion de Base de Datos
6 páginas
EIDOS POO Introducción
Aún no hay calificaciones
EIDOS POO Introducción
49 páginas
Guia Tkinter
Aún no hay calificaciones
Guia Tkinter
87 páginas
Programación Paralela en Fortran
Aún no hay calificaciones
Programación Paralela en Fortran
6 páginas
SQL Principiantes Paso A Paso
Aún no hay calificaciones
SQL Principiantes Paso A Paso
21 páginas
Foro Tematico Fr1
Aún no hay calificaciones
Foro Tematico Fr1
2 páginas
ZFS
Aún no hay calificaciones
ZFS
18 páginas
R para Data Science
Aún no hay calificaciones
R para Data Science
12 páginas
Guía No1 - Herramientas de Análisis de Datos PDF
Aún no hay calificaciones
Guía No1 - Herramientas de Análisis de Datos PDF
8 páginas
Ingenieria de Mantenimiento Clase 5
100% (1)
Ingenieria de Mantenimiento Clase 5
17 páginas
Folleto EDA
100% (1)
Folleto EDA
2 páginas
EJEMPLO PRÁCTICO CON POWER PIVOT y POWER BIEN EXCEL
Aún no hay calificaciones
EJEMPLO PRÁCTICO CON POWER PIVOT y POWER BIEN EXCEL
30 páginas
Ciencia de Datos en Python Vs SPSS
100% (1)
Ciencia de Datos en Python Vs SPSS
28 páginas
Notación Científica
Aún no hay calificaciones
Notación Científica
8 páginas
Antología Ejercicios de La Unidad Ii Ejercicios Operativos: Sección 1. Ángulos. Contesta Los Siguientes Ejercicios
Aún no hay calificaciones
Antología Ejercicios de La Unidad Ii Ejercicios Operativos: Sección 1. Ángulos. Contesta Los Siguientes Ejercicios
22 páginas
La Guía Definitiva Para Desarrolladores De Software: Trucos Y Conseños
De Everand
La Guía Definitiva Para Desarrolladores De Software: Trucos Y Conseños
Carolina Meli
1/5 (1)
UML. Arquitectura de aplicaciones en Java, C++ y Python (2ª Edición)
De Everand
UML. Arquitectura de aplicaciones en Java, C++ y Python (2ª Edición)
Carlos Jiménez
Aún no hay calificaciones
Unidad 2 Py
Aún no hay calificaciones
Unidad 2 Py
10 páginas
Prac 01
Aún no hay calificaciones
Prac 01
17 páginas
M3 Analisis de Datos - Obtención y Preparación de Datos. (AE2)
Aún no hay calificaciones
M3 Analisis de Datos - Obtención y Preparación de Datos. (AE2)
55 páginas
Analyzing Data With Python 2
Aún no hay calificaciones
Analyzing Data With Python 2
64 páginas
Pandas y Python
100% (1)
Pandas y Python
24 páginas
FP Unidad 08 v4 20170417
Aún no hay calificaciones
FP Unidad 08 v4 20170417
45 páginas
Limpieza de Datos
Aún no hay calificaciones
Limpieza de Datos
9 páginas
Inteligencia Artificial y Ciencia de Datos - Data - Base
Aún no hay calificaciones
Inteligencia Artificial y Ciencia de Datos - Data - Base
21 páginas
Prog - Orien - M - Datos Modulo 8
Aún no hay calificaciones
Prog - Orien - M - Datos Modulo 8
41 páginas
Actividad 1
Aún no hay calificaciones
Actividad 1
12 páginas
S5-Tarea 2
Aún no hay calificaciones
S5-Tarea 2
9 páginas
Mat Plot Lib
Aún no hay calificaciones
Mat Plot Lib
19 páginas
Numpy
Aún no hay calificaciones
Numpy
28 páginas
Federici
Aún no hay calificaciones
Federici
18 páginas
Elias
Aún no hay calificaciones
Elias
22 páginas
Taula Resumen - Fem Barri - Batucada
Aún no hay calificaciones
Taula Resumen - Fem Barri - Batucada
1 página
L Proceso de Información Frente A La Comunicación
Aún no hay calificaciones
L Proceso de Información Frente A La Comunicación
1 página
Eda 8 Sem 1 Canje de Monedas y Billetes
Aún no hay calificaciones
Eda 8 Sem 1 Canje de Monedas y Billetes
9 páginas
Ejercicios de Oraciones Eliminadas
67% (3)
Ejercicios de Oraciones Eliminadas
2 páginas
Equipo 2 - EV3 - BioPers
Aún no hay calificaciones
Equipo 2 - EV3 - BioPers
2 páginas
Tarea 2
Aún no hay calificaciones
Tarea 2
5 páginas
Informe Tecnicas de Estudio
100% (2)
Informe Tecnicas de Estudio
5 páginas
Star Players 1 Loe
Aún no hay calificaciones
Star Players 1 Loe
128 páginas
Cuidado Del Alma Sócrates
Aún no hay calificaciones
Cuidado Del Alma Sócrates
3 páginas
PLAN DE ACTIVIDADESS - S33 y S34 - TV139
Aún no hay calificaciones
PLAN DE ACTIVIDADESS - S33 y S34 - TV139
45 páginas
Bellas Artes 11
Aún no hay calificaciones
Bellas Artes 11
41 páginas
Artistica Libro 5°
Aún no hay calificaciones
Artistica Libro 5°
13 páginas
Resumen Métodos y Técnicas Psicoterapéuticas
Aún no hay calificaciones
Resumen Métodos y Técnicas Psicoterapéuticas
41 páginas
PROPUESTA TÉCNICA y ECONÓMICA - Diseno de Programa Formativo NNJ
Aún no hay calificaciones
PROPUESTA TÉCNICA y ECONÓMICA - Diseno de Programa Formativo NNJ
5 páginas
Cuadro Preliminar - Secudaria 2025
Aún no hay calificaciones
Cuadro Preliminar - Secudaria 2025
60 páginas
Influencia de La Música en El Desarrollo Del Coeficiente Intelectual
Aún no hay calificaciones
Influencia de La Música en El Desarrollo Del Coeficiente Intelectual
4 páginas
CIEES Ingeniería
100% (1)
CIEES Ingeniería
29 páginas
Desarrollo de Una Escala para Evaluar El Estrés Académico: Un Informe Preliminar
Aún no hay calificaciones
Desarrollo de Una Escala para Evaluar El Estrés Académico: Un Informe Preliminar
12 páginas
Parcial 2 Psicopatologia Ii
Aún no hay calificaciones
Parcial 2 Psicopatologia Ii
2 páginas
Procedimiento de Selección y Evalucion Del Equipo Auditor de SST No
Aún no hay calificaciones
Procedimiento de Selección y Evalucion Del Equipo Auditor de SST No
18 páginas
PLAN DE BLOQUE No. 2 SEXTO - KIKO
Aún no hay calificaciones
PLAN DE BLOQUE No. 2 SEXTO - KIKO
20 páginas
Matematica Números Ordinales Hasta El Décimo
Aún no hay calificaciones
Matematica Números Ordinales Hasta El Décimo
7 páginas
La Música en La Educación
Aún no hay calificaciones
La Música en La Educación
3 páginas
Paula Vázquez Sampedro - TFG Versión Última
Aún no hay calificaciones
Paula Vázquez Sampedro - TFG Versión Última
48 páginas
DIARIO (David Nárdiz)
Aún no hay calificaciones
DIARIO (David Nárdiz)
4 páginas
Encuesta de Tutoría
Aún no hay calificaciones
Encuesta de Tutoría
8 páginas
Nota Informativa Diaria 03 de Marzo
Aún no hay calificaciones
Nota Informativa Diaria 03 de Marzo
1 página
Becas Deportivas UPAEP Franco Sesion 5
Aún no hay calificaciones
Becas Deportivas UPAEP Franco Sesion 5
5 páginas

Pandas

Cargado por

Pandas

Cargado por

Pensamiento Computacional

Es un paquete de Python que proporciona estructuras de datos

DataFrame es la estructura de datos fundamental. Son

Manejo de datos basado en etiquetas, incluyendo la

Paquete Python: Python 3.

In [1]: import pandas as pd

**pandas** is a Python package ...

Contenedores de datos de Pandas:

Para mostrar las caracteríscas de los DataFrame , mostremos

I Desde listas, diccionarioss, objetos numpy.

In [8]: df_edades = pd.DataFrame(edades)

In [13]: df_ejemplo = pd.DataFrame(data)

Automáticamente crea las columnas desde el diccionario.

Para hacer que el Nombre sea el índice se usa

In [14]: (df_ejemplo / 2).head(3)

Para ver toda la documentación: Enlace

Slicing: Permite seleccionar un sub-rango/sub-conjunto de

In [42]: df_demo['C'] # o df_demo.C también funciona.

Ejemplo: Seleccionar una lista con las columnas A y C , [’A’, ’C’]

Se usan valores numéricos en corchetes [] para hacer slicing

In [55]: df_demo["C"] > 0

In [56]: df_demo[(df_demo["C"] < 0) and (df_demo["D"] == "raros")]

Para agregar nuevas columnas se usa

In [58]: df_demo["F"] = df_demo["C"] - df_demo["A"]

.insert() permite especificar la posición de la inserción.

Primero, creamos dos data frames para poder mostrar cómo

In [66]: df_2 = pd.DataFrame({"Clave": ["Primero", "Segundo"], "Valor": [2, 2]})

Lo mismo, pero reindexnado.

Concatenar, pero horizontalmente.

Clave Valor Clave Valor

Mezclar sobre una columna común.

Clave Valor_x Valor_y

Matplotlib: es el estándar de-facto para la graficación en

In [72]: import matplotlib.pyplot as plt

Matplotlib puede también graficar datos de una DataFrame

Cada frame tiene una función .plot() (ver la API )

Con selección o filtrado dentro del plot.

Usando el parámetro kind para modificar el tipo de gráfico.

In [82]: df_demo["C"].plot(kind="bar", legend=True, figsize=(12, 4),

También podría gustarte

pandas is a Python package ...