Guía de Referencia de Pandas

Este documento proporciona una guía de referencia sobre la librería Pandas en Python. Introduce las estructuras de datos fundamentales de Pandas como Series y DataFrames, y describe métodos comunes para la manipulación, análisis y visualización de datos, incluyendo la importación y exportación de datos, selección, agrupación, y resumen de datos. Además, explica conceptos clave como índices, operaciones de combinación y unión de datos, y funciones de agregación.

Cargado por

Anthony Guzman Lopez

Derechos de autor

Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.

Formatos disponibles

Descarga como PDF, TXT o lee en línea desde Scribd

0% encontró este documento útil (0 votos)

178 vistas2 páginas

Guía de Referencia de Pandas

Cargado por

Anthony Guzman Lopez

Derechos de autor

Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.

Formatos disponibles

Descarga como PDF, TXT o lee en línea desde Scribd

Está en la página 1/ 2

Facultad de

Programa de formación Machine Learning and Data Science MLDS

Librería de análisis
Con arreglos
de datos: Pandas pd.DataFrame([[1, 2], [3, 4]], columns= [‘a’, ‘b’])
pd.merge(df_a, df_b, on = ‘col’, how = _ )

how = outer how = inner

Pandas - Guía de referencia Con diccionarios
pd.DataFrame({ ‘a’ : [1, 3], ‘b’ : [2, 4] })
Importar la librería a b ... ... ... ... ... ...
0 1 2 ... ... ... ... ... ...
import pandas as pd 1 3 4 ... ... ...
... ...
Series ... ... ... - ...
Combinación de datos ... ...
Índice Valores ... ... how = left how = right
pd.concat([df_a, df_b])
... ... Las Series son una estructura ... ...
de datos de 1 dimensión con ... ... ... ...
... ... índice asociado basado en ... ...
... ... etiquetas. ... ... ... ... ... ... ... ... ... ...
... ... ... ... ... ... ... ... ... ...
s = pd.Series(data, index, dtype, name, ...) ... ... ... ... ... ... - ... - ...
... ... ... ...
index= Valores tomados como índice de la serie. ... ...
dtype= Tipo de dato de la serie.
name= Nombre de la serie. pd.concat([df_a, df_b ], axis = 1) Agrupar datos
... ... df.groupby(‘A’).agg(‘B’: function , ‘C’: function, ...)
data= Contenido de la serie creada.
... ... ... ... ... ...
Con listas
... ... ... ... ... ... ... ... ... ... ... ...
... ... ... ... ... ... ... ... ... ...
pd.Series([1, 2, 3], index = [‘a’, ‘b’, ‘c’])
... ... ... ... ... ...
... ...
... ... ...
Con diccionarios
pd.Series({‘a’ : 1, ‘b’ : 2, ‘c’: 3 })
... ... ... ... ... ...
... ... ... ... ...
a 1 ... ... ... ... ... ...
b 2 pd.join(df_a, df_b, how = ___ )
c 3 dtype: int64 ... ... ...
how = outer how = inner ... ... ...
DataFrame
... ... ...
Columnas ... ... ...
Los DataFrame son una ... ... ... ...
Filas ... ... ... estructura de datos de ... ... ... ...
... ... ... ... 2 dimensión con índices ... ... -
... ... ... ... asociados a filas y df.groupby(‘A’).*
columnas basado en ... - ...
... ... ... ... etiquetas. ... Funciones de .first()
... how = left how = right agregación .last()
df = pd.DataFrame(data, index, columns, ...)
... predefinidas. .sum()
index= Valores tomados como índice de las filas. ... .prod()
columns= Valores tomados como índice ... ... ... ... .size()
de las columnas. ... ... ... ... .mean()
... - - ...
data= Contenido del DataFrame creado.

The pandas development team. (2020, 17 de Marzo). Pandas API reference (Versión 1.03) [software].
Consultado el 26 de mayo de 2020. https://pandas.pydata.org/docs/reference/index.html
Facultad de
Programa de formación Machine Learning and Data Science MLDS

Importar datos Selección por posición Describir datos

pd.read* df.iloc[0] Fila en la posición 0. df[‘col’].min( ) Valor mínimo
df[‘col’].max( ) Valor máximo
pd.read_csv(ruta, ...)
df.iloc[0 : 5] Elementos en las filas df[‘col’].mean( ) Media aritmética
pd.read_excel(ruta, ...)
entre 0 y 10. df[‘col’].mode( ) Moda
pd.read_table(ruta, ...)
df[‘col’].median( ) Mediana
pd.read_json(ruta, ...)
df.iloc[[0, 1]] Elementos en las fila 0 y 1. df[‘col’].std( ) Desviación estándar
pd.read_sql(query, conector, ...)
df[‘col’].var( ) Varianza
...
df[‘col’].quantile(q) Cuantil en posición q
Exportar datos df.iloc[0, 3] Elemento en la fila df[‘col’].skew() Asimetría
0 y columna 3. df[‘col’].kurt() Curtosis
df.to_* df[‘col’].corr() Correlación
df.iloc[:, 2] Elementos en columna 2. df.pivot_table(...) Tablas de pivote
df.to_csv(...) pd.crosstab(...) Tabla de contingencia
df.to_excel(...)
df.at[1, 2] Elemento en la celda
df.to_latex(...) Operaciones en objetos
df.to_json(...) (1 , 2).
df[‘col’] = 0 Asignar valores escalares
df.to_clipboard(...)
Selección condicional df[‘c’] = df[‘a’] + df[‘b’] Operadores entre objetos
...
df[‘col’] *= 1000 Asignación con operación
Selección por etiquetas Series (<, >, >=, <=, ==, !=) valor
Arreglo de booleanos usado para indexar. df.loc[‘max’] = df.max() Asignación de filas
df.loc[‘id’] Fila con etiqueta ‘id’. df.iloc[0:5, 0:5] = 3.5 Asignación de rangos
df[ df[‘col’] > 0 ] df[ df[‘a’] < 0 ] = 0 Asignación condicional
df.loc[‘a’ : ‘f’] Elementos en las filas Selección de filas que cumplan una condición df.at[0,0] = np.NaN Asignación de celdas
entre a y f.
df[ (df[‘col’] > 0) & (df[‘col’] < 100) ] Limpieza de datos
df.loc[[‘a’, ‘c’]] Elementos en las fila Operaciones a nivel de bits (&, |, ~, ^)
a y c. df.replace(...) Reemplazar valores
df.drop_duplicates() Eliminar filas repetidas
df.where( df < 0, -df ) df.dropna() Eliminar valores faltantes
df.loc[‘i, ‘col’] Elemento en la fila i
y columna col. Reemplazar filas que cumplan la condición df.fillna(valor) Imputar valores faltantes
con el valor de la celda de otro DataFrame. df.isna() Filas con valores faltantes
df.loc[:, ‘col’] Elementos en columna ‘col. df.notna() Filas sin valores faltantes
df.mask( df > 0, -df ) df[‘col’].unique() Valores únicos de la fila
df.at[‘x’, ‘y’] Elemento en la celda Reemplazar filas que NO cumplan la df[‘col’].value_counts() Conteo de valores por
condición con el valor de la celda de columna
(x, y).
otro DataFrame.
Utilidades generales
Visualizar datos df.query('(a < b) & (b < c )')
df[‘col].idxmin() Etiqueta del valor mínimo
Selección condicional con una sintaxis df[‘col].idxmax() Etiqueta del valor máximo
df.plot.* especial basada en nombres de columnas. df.set_index(index) Asignar un nuevo índice
df.plot.line(...) Gráfica de líneas df.reset_index() Reiniciar el índice
df.plot.bar(...) Gráfica de barras Selección de filas df.astype(dtype) Modificar tipo de dato
df.plot.pie(...) Gráfica circular df.sort_values(by = “col”) Reordenar por valores de
df.plot.hist(...) Histograma df.head(n) Selecciona las primeras n filas columna
df.plot.box(...) Diagrama de cajas df.tail(n) Selecciona las últimas n filas
df.plot.scatter(...) Diagrama de dispersión df.sample(n) Selecciona n filas aleatorias
df.plot.area(...) Gráfica de áreas df.nsmallest(n, ‘col’) Selecciona las n filas menores.
df.plot.hexbin(...) Gráfica hexagonal df.nlargest(n, ‘col’) Selecciona las n filas mayores.

También podría gustarte

05 Analisis de Datos Con Pandas
Aún no hay calificaciones
05 Analisis de Datos Con Pandas
32 páginas
Exploratory Data Analysis en Python
Aún no hay calificaciones
Exploratory Data Analysis en Python
21 páginas
VLKQ
Aún no hay calificaciones
VLKQ
11 páginas
02 Hojas de Referencia de Python Básico de Udemy
Aún no hay calificaciones
02 Hojas de Referencia de Python Básico de Udemy
5 páginas
Tesis Imputacion de Datos
Aún no hay calificaciones
Tesis Imputacion de Datos
23 páginas
Unidad 4 Uso Libreria NumPY
Aún no hay calificaciones
Unidad 4 Uso Libreria NumPY
31 páginas
Taller Big Data
100% (1)
Taller Big Data
6 páginas
Curso Python: Aplicaciones Prácticas
100% (1)
Curso Python: Aplicaciones Prácticas
5 páginas
Machine Learning - Sesión 1
Aún no hay calificaciones
Machine Learning - Sesión 1
40 páginas
Python
Aún no hay calificaciones
Python
29 páginas
Imputación de Datos
Aún no hay calificaciones
Imputación de Datos
4 páginas
01 - Introducción A Matlab
Aún no hay calificaciones
01 - Introducción A Matlab
37 páginas
Pandas: Análisis de Datos en Python
Aún no hay calificaciones
Pandas: Análisis de Datos en Python
5 páginas
Tema 2
Aún no hay calificaciones
Tema 2
28 páginas
Introducción A Pandas para Análisis de Series Temporales
Aún no hay calificaciones
Introducción A Pandas para Análisis de Series Temporales
46 páginas
Clase 4 - Controladores de Flujo I
Aún no hay calificaciones
Clase 4 - Controladores de Flujo I
44 páginas
PLADECO FINALv4
Aún no hay calificaciones
PLADECO FINALv4
109 páginas
Practica 6 NUmpy
Aún no hay calificaciones
Practica 6 NUmpy
3 páginas
Machine Learning
100% (1)
Machine Learning
2 páginas
Guía Rápida NumPy
Aún no hay calificaciones
Guía Rápida NumPy
107 páginas
12 Python Interprete de Comandos
Aún no hay calificaciones
12 Python Interprete de Comandos
51 páginas
Modelado K-Means en Rapidminer
Aún no hay calificaciones
Modelado K-Means en Rapidminer
72 páginas
CD - M5 Examen
Aún no hay calificaciones
CD - M5 Examen
4 páginas
Mexmiart 04 T 9 Lab
Aún no hay calificaciones
Mexmiart 04 T 9 Lab
4 páginas
Machine Learning con Apache Spark
Aún no hay calificaciones
Machine Learning con Apache Spark
22 páginas
Data Science
Aún no hay calificaciones
Data Science
8 páginas
Visa 04 Act 2
Aún no hay calificaciones
Visa 04 Act 2
11 páginas
M CienciasComputacionales MX
Aún no hay calificaciones
M CienciasComputacionales MX
9 páginas
Python Basico
Aún no hay calificaciones
Python Basico
8 páginas
Taller Mongo DB
Aún no hay calificaciones
Taller Mongo DB
25 páginas
Guía de Python para Principiantes
Aún no hay calificaciones
Guía de Python para Principiantes
15 páginas
11 Matrices
Aún no hay calificaciones
11 Matrices
30 páginas
Manual de Prácticas - Apache Camel - Exponiendo Un Servicio SOAP
Aún no hay calificaciones
Manual de Prácticas - Apache Camel - Exponiendo Un Servicio SOAP
35 páginas
Dosier Excel Avanzado SEGONA PART
100% (1)
Dosier Excel Avanzado SEGONA PART
46 páginas
06 - SQLite Con Python
Aún no hay calificaciones
06 - SQLite Con Python
11 páginas
2b Busqueda Informada y Exploracion (Es)
Aún no hay calificaciones
2b Busqueda Informada y Exploracion (Es)
45 páginas
Clase 5 - Control de Flujo II
Aún no hay calificaciones
Clase 5 - Control de Flujo II
65 páginas
Taller Matplotlib - Jupyter Notebook
Aún no hay calificaciones
Taller Matplotlib - Jupyter Notebook
12 páginas
Clase - Librería Numpy
Aún no hay calificaciones
Clase - Librería Numpy
41 páginas
4estructura de Datos
Aún no hay calificaciones
4estructura de Datos
13 páginas
Big Data y Python para Principiantes
Aún no hay calificaciones
Big Data y Python para Principiantes
72 páginas
Tablas y Gráficos
Aún no hay calificaciones
Tablas y Gráficos
12 páginas
Backup Diferenciales y Parciales
Aún no hay calificaciones
Backup Diferenciales y Parciales
5 páginas
Optimización en Programación Lineal
Aún no hay calificaciones
Optimización en Programación Lineal
32 páginas
Act 1 S2 Ia
Aún no hay calificaciones
Act 1 S2 Ia
8 páginas
Folium Final
Aún no hay calificaciones
Folium Final
34 páginas
Practica2 PREDA 17 18
Aún no hay calificaciones
Practica2 PREDA 17 18
8 páginas
Práctica 2 Regresión Lineal Multivariable 6M
Aún no hay calificaciones
Práctica 2 Regresión Lineal Multivariable 6M
6 páginas
Sistemas de Recomendación IA
Aún no hay calificaciones
Sistemas de Recomendación IA
15 páginas
Presentación - K-Means.13775252 PDF
Aún no hay calificaciones
Presentación - K-Means.13775252 PDF
67 páginas
Evaluación de Planificadores STRIPS/PDDL
Aún no hay calificaciones
Evaluación de Planificadores STRIPS/PDDL
10 páginas
Guía Introductoria al Machine Learning
Aún no hay calificaciones
Guía Introductoria al Machine Learning
26 páginas
Sqlite - Sentencias
100% (1)
Sqlite - Sentencias
5 páginas
Ejercicio Con Lenguaje R
100% (1)
Ejercicio Con Lenguaje R
10 páginas
Curso Python para Análisis de Datos
Aún no hay calificaciones
Curso Python para Análisis de Datos
47 páginas
Dashboard Ventas en Power BI en 30 Minutos
Aún no hay calificaciones
Dashboard Ventas en Power BI en 30 Minutos
13 páginas
Práctica de Laboratorio 2524 Cómo Trabajar Con Python y SQLite
Aún no hay calificaciones
Práctica de Laboratorio 2524 Cómo Trabajar Con Python y SQLite
10 páginas
Python: Comprehensions y Funciones
Aún no hay calificaciones
Python: Comprehensions y Funciones
37 páginas
Clase - Python 6 (24 - II)
Aún no hay calificaciones
Clase - Python 6 (24 - II)
29 páginas
M3 Analisis de Datos - Obtención y Preparación de Datos. (AE2)
Aún no hay calificaciones
M3 Analisis de Datos - Obtención y Preparación de Datos. (AE2)
55 páginas
Guía de Scikit-learn para MLDS
Aún no hay calificaciones
Guía de Scikit-learn para MLDS
1 página
Guía Rápida de Python 3.8
Aún no hay calificaciones
Guía Rápida de Python 3.8
2 páginas
MUIA Razonamiento y Planificacion Resolucion Actividad 1
100% (1)
MUIA Razonamiento y Planificacion Resolucion Actividad 1
15 páginas
Stats Thinking 21
Aún no hay calificaciones
Stats Thinking 21
307 páginas
Plantilla de Estimacion
Aún no hay calificaciones
Plantilla de Estimacion
17 páginas
Tarea 1
Aún no hay calificaciones
Tarea 1
5 páginas
Pruebas de Hipótesis para Varianzas
Aún no hay calificaciones
Pruebas de Hipótesis para Varianzas
9 páginas
ESTADiSTICA DESCRIPTIVA
100% (1)
ESTADiSTICA DESCRIPTIVA
154 páginas
Tabla 4. Psicometria
Aún no hay calificaciones
Tabla 4. Psicometria
3 páginas
Examen 3 t3 Estadistica Inferencial II Cmgs PDF
Aún no hay calificaciones
Examen 3 t3 Estadistica Inferencial II Cmgs PDF
8 páginas
Evaluacion Final - Escenario 8 - Primer Bloque-Ciencias Basicas - Virtual - Estadística Inferencial - (Grupo b05)
Aún no hay calificaciones
Evaluacion Final - Escenario 8 - Primer Bloque-Ciencias Basicas - Virtual - Estadística Inferencial - (Grupo b05)
10 páginas
Tarea de M Ejercicios 2 y 4
Aún no hay calificaciones
Tarea de M Ejercicios 2 y 4
10 páginas
Cosas Por Corregir
50% (2)
Cosas Por Corregir
19 páginas
P2Valor P Bilateral Unilateral
Aún no hay calificaciones
P2Valor P Bilateral Unilateral
22 páginas
Muestreo Sistemático y Conglomerado
Aún no hay calificaciones
Muestreo Sistemático y Conglomerado
36 páginas
Grupo 2 Caso Harbor Dunes
Aún no hay calificaciones
Grupo 2 Caso Harbor Dunes
9 páginas
LABORATORIO 12 Medidas de Tendencia Central
Aún no hay calificaciones
LABORATORIO 12 Medidas de Tendencia Central
4 páginas
Muestreo Por Conglomerados
Aún no hay calificaciones
Muestreo Por Conglomerados
7 páginas
UNIDAD IV 1era CLASE
Aún no hay calificaciones
UNIDAD IV 1era CLASE
8 páginas
Informe 09 (Ta-543)
Aún no hay calificaciones
Informe 09 (Ta-543)
12 páginas
Coeficientes de Asimetría y Curtosis
Aún no hay calificaciones
Coeficientes de Asimetría y Curtosis
15 páginas
Ortes Dany U2T1a4
Aún no hay calificaciones
Ortes Dany U2T1a4
7 páginas
Una Planta Química Ha Producido Un Promedio Diario de 880 Toneladas de Un Producto Químico Durante Los Últimos Años
Aún no hay calificaciones
Una Planta Química Ha Producido Un Promedio Diario de 880 Toneladas de Un Producto Químico Durante Los Últimos Años
6 páginas
Estadística Abel
Aún no hay calificaciones
Estadística Abel
22 páginas
Practica #6
100% (2)
Practica #6
9 páginas
Apuntes Estadistica
Aún no hay calificaciones
Apuntes Estadistica
92 páginas
4hipotesis de Una y Dos Muestras
Aún no hay calificaciones
4hipotesis de Una y Dos Muestras
41 páginas
Tarea 1 Análisis Estadístico y Geoestadistico de Datos Oficial.
Aún no hay calificaciones
Tarea 1 Análisis Estadístico y Geoestadistico de Datos Oficial.
15 páginas
Roberto Durán Tarea 3
Aún no hay calificaciones
Roberto Durán Tarea 3
14 páginas
Actividad 2 Ejercicios Regresion Lineal
Aún no hay calificaciones
Actividad 2 Ejercicios Regresion Lineal
29 páginas
Pruebas Paramétricas
100% (3)
Pruebas Paramétricas
20 páginas
Act 12-Karla Vera-E
Aún no hay calificaciones
Act 12-Karla Vera-E
6 páginas
Entregable 02 Calidad Total - DiegoAlejandroVeraNinancuro
Aún no hay calificaciones
Entregable 02 Calidad Total - DiegoAlejandroVeraNinancuro
13 páginas
Extra Unidad Dos
Aún no hay calificaciones
Extra Unidad Dos
4 páginas