0% encontró este documento útil (0 votos)
82 vistas95 páginas

Análisis Exploratorio de Datos y Análisis Descriptivo

Este documento trata sobre el análisis exploratorio de datos y el análisis descriptivo. Explica conceptos como el análisis descriptivo, la estadística descriptiva y gráficos útiles para resumir y explorar datos.

Cargado por

Gabitons
Derechos de autor
© © All Rights Reserved
Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.
Formatos disponibles
Descarga como PDF, TXT o lee en línea desde Scribd
0% encontró este documento útil (0 votos)
82 vistas95 páginas

Análisis Exploratorio de Datos y Análisis Descriptivo

Este documento trata sobre el análisis exploratorio de datos y el análisis descriptivo. Explica conceptos como el análisis descriptivo, la estadística descriptiva y gráficos útiles para resumir y explorar datos.

Cargado por

Gabitons
Derechos de autor
© © All Rights Reserved
Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.
Formatos disponibles
Descarga como PDF, TXT o lee en línea desde Scribd
Está en la página 1/ 95

Análisis exploratorio de datos y Análisis descriptivo

Resultados de aprendizaje para


Análisis exploratorio de datos y Análisis
descriptivo
En este tema, nos centraremos en el uso del
Análisis descriptivo y cómo puede ayudarnos a
realizar un análisis exploratorio de datos y
obtener una primera comprensión de nuestros
datos. Adoptaremos un enfoque práctico, para
ilustrar los conceptos. Aprenderás sobre:
• Análisis exploratorio de datos
- Estadística descriptiva Básica
- Gráficos y tablas útiles
Herramientas
Proceso: Análisis de datos

Requisitos de Recogida de Procesamiento Excel


datos datos de datos

Zotero
Análisis
Limpieza de Modelado y
exploratorio de
datos algoritmos
datos
Trello

Comunicación

Técnicas

Consideraciones Analítica descriptiva


Métodos
Análisis diagnóstico

Ética Análisis predictivo


Kanban
Analítica prescriptiva
Analítica descriptiva
Contenido

1. Análisis exploratorio de datos mediante


Análisis descriptivo
2. Estadística descriptiva
3. Gráficos y tablas útiles
Algunas consideraciones
• El análisis exploratorio de datos (EDA-
Exploratory Data Analysis) es un paso en el
proceso de análisis de datos.

• La analítica descriptiva es una técnica con la


que realizar este paso.

• Podemos utilizar diferentes herramientas para


realizar Analítica Descriptiva.
• Aprenderás cómo usar Excel para ello en la
segunda parte del curso.
Nos centraremos en la analítica descriptiva porque
1. ¡Es lo más sencillo con diferencia!
2. ¡Nos ayudará con el Análisis exploratorio de datos!
¿Es fácil el
Análisis
descriptivo?
¿De verdad?
Bueno... ¡digamos que no es tan difícil como los demás!
Bueno... ¡digamos que no es tan difícil
como los demás!

• Todo esto lo conocerás más a


fondo a lo largo de tus estudios
en CUNEF.
• Nos centraremos en lo básico.
• Pero sí que podrás “probar” lo
que se siente al trabajar con
datos.
Análisis exploratorio de datos

• El análisis exploratorio de datos


(EDA) es el proceso de explorar
los datos e investigar su
estructura para descubrir
patrones y detectar anomalías a
partir de dichos patrones.
• El EDA consistirá entonces en
resumir los datos con el uso de
métodos estadísticos y de
visualización para detectar
patrones de todo tipo.
Análisis exploratorio de datos
• Lo ideal sería que la EDA sacara a
relucir ideas y realizaciones a
partir de los datos que no pueden
obtenerse mediante la
modelización formal y la
comprobación de hipótesis.
• Cuando se hace correctamente,
EDA puede simplificar o impulsar
drásticamente el problema de
ciencia de datos e ¡incluso
resolverlo!
Objetivos del proceso EDA
(EDA: Análisis exploratorio de datos)

1. Cuestionar los datos y


determinar si hay problemas
inherentes al conjunto de
datos.
2. Determinar si los datos de que
se dispone son suficientes para
responder a una determinada
pregunta de investigación o si
se requiere más técnicas.
Objetivos del proceso EDA
(EDA: Análisis exploratorio de datos)

3. Desarrollar un marco para


responder a la pregunta de
estudio.
4. Afinar las preguntas y/o el
problema de estudio
basándose en lo que has
aprendido de los datos.
Naturaleza iterativa del EDA
• A diferencia de lo que la
mayoría de la gente piensa, el
EDA no es un “proceso
formal”.
• Todo lo que lleva la palabra
"exploratorio" no se rige por
normas estrictas y, por tanto,
no es formal.
Naturaleza iterativa del EDA
• Más bien, el EDA es de tipo
libre.
• Es en esta etapa cuando
empiezas a seguir las ideas que
puedas tener y a ver cuáles te
llevan a alguna parte.
Naturaleza iterativa del EDA
• Algunas de estas ideas no
tienen por qué funcionar y,
por tanto, puedes empezar
a buscar o derivar en otras
ideas viables.
¡Esto me
recuerda a
Agile!

En efecto, lo es.
Agile y análisis de datos, ¡de nuevo!
• Como puedes ver,
tanto la naturaleza
exploratoria como Desarrollo de sistemas complejos y
la iterativa de EDA productos con características dinámicas,
no deterministas y no lineales.
hacen que Agile
sea el candidato Situaciones en las que los requisitos y el
diseño se consideran emergentes.
perfecto para ello.
Análisis exploratorio de datos
• El análisis exploratorio de datos
nos permite comprender los datos
que manejamos mediante la
descripción y el resumen de las
principales características del
conjunto de datos, a menudo por
medio de métodos visuales como
los gráficos de barras y de tarta,
los histogramas, los diagramas de
caja, los gráficos de dispersión o
los mapas de calor, entre otros.
Análisis exploratorio de datos
• A alto nivel, el Análisis
Exploratorio de Datos (AED) es
la práctica de utilizar métodos
visuales y cuantitativos para
comprender y resumir un
conjunto de datos sin hacer
ninguna suposición sobre su
contenido, un paso crucial que
hay que dar antes de
adentrarse en el aprendizaje
automático o el modelado
estadístico.
Análisis exploratorio de datos
nos permite …
• Maximizar el conocimiento del conjunto
de datos (ser capaz de escuchar los
datos)
• Descubrir la estructura/patrones
subyacentes
• Detectar valores atípicos y anomalías
• Extraer y seleccionar las variables
importantes
• Comprobar los supuestos subyacentes
(por ejemplo, la intuición empresarial)
How can we get to know our data
better? ¿Por
¿Por
qué?
qué?
¿Por
qué?
• Sakichi Toyoda, conocido en ¿Por
Japón como el "rey de los qué?
inventores japoneses" y fundador
de Toyota Motors, creó la técnica
de los "5 porqués": En pocas ¿Por
palabras, se pregunta el “por qué?
qué” de un problema que se ha
identificado, y luego se sigue
preguntando el “por qué” de
cada respuesta o explicación
dada.
¿Cómo podemos conocer mejor
nuestros datos?
• Andy Cotgreave, experto en
análisis visual de Tableau,
recomienda abrazar a tu niño
interior cuando analices los
datos: pregúntale a los datos
"por qué", en lugar de "qué".
(probablemente conocía a
Sakichi Toyoda)
Análisis exploratorio de datos
• Para ser capaces de explorar y explicar las características del conjunto
de datos con todos sus atributos, obteniendo conocimientos y
resúmenes numéricos eficientes de los datos, necesitamos la ayuda
de ...
¡La estadística!
• No te preocupes, no
vamos a entrar en la
teoría que hay
detrás de las
medidas estadísticas
descriptivas, ¡está
fuera del alcance de
este curso!
Analítica descriptiva
Contenido

1. Análisis exploratorio de datos mediante


Análisis descriptivo
2. Estadística descriptiva
3. Gráficos y tablas útiles
Estadística

• Estadística descriptiva: Nos centraremos en esto


describe y resume los datos
• Estadística inferencial:
métodos para utilizar
muestras de datos para
sacar conclusiones
generales (inferencias)
sobre poblaciones.
Resúmenes numéricos de datos
(estadística descriptiva)
• También se denomina análisis
univariante (análisis de una
característica cada vez).
• Permite describir y comprender
las características de un
conjunto de datos concreto,
ofreciendo breves resúmenes
numéricos sobre la muestra y
las medidas de los datos.
Resúmenes numéricos de datos
(estadística descriptiva)
• La estadística descriptiva es
una mera exploración, ya
que no nos permite sacar
conclusiones más allá de los
datos que hemos analizado
ni llegar a conclusiones
sobre las hipótesis que
hayamos podido formular.
Resúmenes numéricos de datos
(estadística descriptiva)
• Las variables numéricas
(cuantitativas) y
categóricas
(cualitativas), como
veremos más adelante,
tienen enfoques
estadísticos
descriptivos diferentes.
¿No
hablamos
de los tipos
de datos en
el Tema 3?

¡Efectivamente!
Puedes repasar,
el tema “Tipos
de datos”.
Resúmenes numéricos de datos
(estadística descriptiva)
1. Medidas de tendencia
central.
2. Medidas de variación o
variabilidad.
3. Medidas de posición
relativa.
Resúmenes numéricos de datos
(estadística descriptiva)

1. Medidas de tendencia
central: Se calculan para dar
un centro alrededor del cual
se distribuyen las medidas en
los datos.
Resúmenes numéricos de datos
(estadística descriptiva)

2. Medidas de variación o
variabilidad: Describen la
dispersión de los datos, o
lo lejos que están las
mediciones del centro.
Resúmenes numéricos de datos
(estadística descriptiva)

3. Medidas de posición relativa:


Describen la posición relativa
de medidas específicas en los
datos
1. Medidas de tendencia central
1. Media (promedio)
2. Mediana (valor central)
3. Moda (más común)
1. Medidas de tendencia central -
Media
Media (promedio): La suma total Ejemplo: la media de los valores 1,
de valores dividida por el total de 2, 2, 3, 4, 5 es:
observaciones. La media es muy 1+2+2+3+4+6= 18
sensible a los valores atípicos. Total de observaciones= 6

18/6=3

De donde, la media es 3
1. Medidas de tendencia central -
Mediana
Mediana (valor central): El Ejemplo: la mediana de los valores 2, 7,
3, 5, 4, 1, 6 es:
número central; se encuentra
Primero, los ordenamos:
ordenando todos los puntos de 1, 2, 3, 4, 5, 6, 7
datos y eligiendo el que está en el Entonces localizamos el valor medio:
centro (o si hay dos números hay 7 valores por lo que el medio es el
centrales, tomando la media de que está en la posición número 4.
esos dos números). 1, 2, 3, 4, 5, 6, 7

La mediana es 4
1. Medidas de tendencia central -
Moda
Moda (más común): Los valores Ejemplo: la moda de los valores
más frecuentemente observados. 1, 2, 2, 3, 4, 5 es el número más
Puede haber más de un valor de frecuente, es decir, el número
que aparece el mayor número
moda en la misma variable. de veces.

La moda es 2
Un apunte sobre los valores atípicos
• En estadística, un valor atípico es
un dato que difiere
significativamente de otras
observaciones.
• Puede deberse a la variabilidad
de la medición, o puede indicar
un error experimental; estos
últimos a veces se excluyen del
conjunto de datos.
• Un valor atípico puede provocar
graves problemas en el análisis
estadístico.
2. Medidas de variación o variabilidad

1. Desviación estándar
2. Asimetría
3. Mínimo
4. Máximo
2. Medidas de variación o variabilidad
1. Desviación estándar: medida de la
distancia media entre los valores de
los datos del conjunto y la media.
2. Se trata de un estadístico muy útil
porque proporciona una medida
práctica de la dispersión de los
valores en la distribución.
3. Cuando se combinan, la media y la
desviación estándar proporcionan
una imagen bastante buena de cómo
es la distribución de los valores.
2. Medidas de variación o variabilidad

2. Asimetría: mide
la simetría de la
distribución.
2. Medidas de variación o variabilidad
3. Mínimo: El valor más Ejemplo: con los valores 2, 7, 3, 5, 4,
pequeño o más bajo. 1, 6:
4. Máximo: El valor mayor o más El mínimo es 1 y el máximo es 7.
alto.
3. Medidas de posición relativas
• Percentiles: medida que indica
el valor por debajo del cual cae
un determinado porcentaje de
observaciones en un grupo de
observaciones.
• Por ejemplo, el percentil 20 es
el valor (o puntuación) por
debajo del cual se encuentra el
20% de las observaciones.
3. Medidas de posición relativas

• Cuartiles: El percentil 25
también se conoce como
primer cuartil (Q1), el
percentil 50 como mediana o
segundo cuartil (Q2), y el
percentil 75 como tercer
cuartil (Q3).
Algunos problemas potenciales de
estas medidas
• A veces, pueden dar una idea
equivocada de los datos.
• Por eso el análisis exploratorio
de datos siempre incorpora
gráficos además de medidas
numéricas.
• A veces, para obtener la imagen
completa se necesitan ambos.
No ha estado
tan mal.
¿Cómo
calculamos
todo esto?
Déjame mostrarte un ejemplo

• Supongamos que tenemos 4


conjuntos de datos (I a IV)
• Para cada uno tenemos 11
medidas de las variables X e Y.
• Bájate el archivo “Anscombe's
quartet.xls” de Canvas

Ascombe's
quartet
Calculemos algunos estadísticos
descriptivos para cada conjunto de datos

Propiedad Valores Precisión

Media de X 9 Exacto

Media de Y 7.50 Exacto

Varianza simple de X 11 Exacto

Varianza simple de Y 4.125 Exacto

Correlación entre X e Y 0.816 Hasta 3 cifras decimales

Línea de regresión lineal y = 3.00 + 0.500x de 2 a 3 cifras decimales,


respectivamente
Así que, los conjuntos de
datos probablemente son
muy semejantes,
¿verdad?
Propiedad Valores Precisión
Media de X 9 Exact
Media de Y 7.50 Exact
Varianza simple de X 11 Exact
Varianza simple de Y 4.125 Exact
Correlación entre X e Y 0.816 Hasta 3 cifras
decimales
Línea de regresión lineal y = 3.00 + 0.500x de 2 a 3 cifras
decimales,
respectivamente
Suena a
pregunta
trampa
¡Efectivamente!
Los cuatro conjuntos son idénticos cuando se examinan mediante
estadísticos resumidos simples, pero varían considerablemente
cuando se representan gráficamente

Vamos a crear un gráfico para cada


conjunto de datos en Excel
Ascombe's
quartet
¡Efectivamente!
Los cuatro conjuntos son idénticos cuando se examinan mediante
estadísticos resumidos simples, pero varían considerablemente
cuando se representan gráficamente
El cuarteto de Anscombe
• Este ejemplo, conocido como el
cuarteto de Anscombe, fue
formulado en 1973 por el
estadístico inglés Francis
Anscombe.
• Lo hizo para demostrar tanto la
importancia de representar
gráficamente los datos antes de
analizarlos como el efecto de los
valores atípicos y otras
observaciones que influyen en las
propiedades estadísticas.
Veamos lo mismo con el dataset ¨Datasaurus
dozen¨. Bájatelo de Canvas

Matejka, J., & Fitzmaurice, G. (2017). Same Stats, Different Graphs: Generating Datasets with Varied Appearance and Identical Statistics through Simulated Annealing. In Proceedings of the 2017 CHI Conference on Human Factors in Computing Systems (pp. 1290–1294). Association for Computing Machinery.
https://doi.org/10.1145/3025453.3025912
¡¡¡Estos conjuntos de datos también tienen los
mismos estadísticos descriptivos!!!

Matejka, J., & Fitzmaurice, G. (2017). Same Stats, Different Graphs: Generating Datasets with Varied Appearance and Identical Statistics through Simulated Annealing. In Proceedings of the 2017 CHI Conference on Human Factors in Computing Systems (pp. 1290–1294). Association for Computing Machinery.
https://doi.org/10.1145/3025453.3025912
¡¡¡Estos conjuntos de datos también tienen los
mismos estadísticos descriptivos!!!

Matejka, J., & Fitzmaurice, G. (2017). Same Stats, Different Graphs: Generating Datasets with Varied Appearance and Identical Statistics through Simulated Annealing. In Proceedings of the 2017 CHI Conference on Human Factors in Computing Systems (pp. 1290–1294). Association for Computing Machinery.
https://doi.org/10.1145/3025453.3025912
¡Este también!

Matejka, J., & Fitzmaurice, G. (2017). Same Stats, Different Graphs: Generating Datasets with Varied Appearance and Identical Statistics through Simulated Annealing. In Proceedings of the 2017 CHI Conference on Human Factors in Computing Systems (pp. 1290–1294). Association for Computing Machinery.
https://doi.org/10.1145/3025453.3025912
Veamos otro ejemplo de por qué vale la
pena explorar los datos para conocerlos
• A menudo, estamos
presionados por el tiempo y
confiamos en nuestras
primeras impresiones.
• Tener algunos números que
confirmen nuestra primera
impresión ¡puede llevarnos a
una conclusión errónea!.
El ejemplo se refiere a un estudio sobre el sesgo de género en las admisiones a
las escuelas de posgrado de la Universidad de California, Berkeley.
Las cifras de admisión para el otoño de 1973 mostraban que los hombres que
solicitaban plaza tenían más probabilidades de ser admitidos que las mujeres, y la
diferencia era tan grande que era poco probable que se debiera al azar.
Veamos los datos

• Los datos parecen estar sesgados hacia los


hombres que han sido admitidos con más
frecuencia que las mujeres.
• Si nos basamos únicamente en esta información,
podríamos estar actuando de forma equivocada.
• Al examinar cada uno de los departamentos, se observa que seis de los 85
departamentos presentan un sesgo significativo en contra de los hombres,
mientras que cuatro presentan un sesgo significativo en contra de las mujeres.
Finalmente, los datos agrupados y corregidos mostraron un sesgo pequeño,
pero estadísticamente significativo a favor de las mujeres.
• A continuación, se muestran los datos de los seis departamentos más
importantes.
Un trabajo de investigación de Bickel et al. concluyó que las mujeres
tendían a solicitar departamentos más competitivos con tasas de
admisión más bajas, incluso entre los solicitantes cualificados (como
en el departamento de inglés), mientras que los hombres tendían a
solicitar departamentos menos competitivos con tasas de admisión
más altas (como en el departamento de ingeniería)
Bickel, P. J., Hammel, E. A., & O’Connell, J. W. (1975). Sex Bias in Graduate Admissions: Data from Berkeley. Science, 187(4175), 398–404.
https://doi.org/10.1126/science.187.4175.398
Veamos estos datos en Excel
Bájate el Archivo “Berkeley.xls” de
Canvas
Este fenómeno se llama "La Paradoja de
Simpson"
La "Paradoja de Simpson" Aparece una tendencia positiva para dos
es un fenómeno en grupos separados (azul y rojo), mientras que
probabilidad y estadística aparece una tendencia negativa (negro,
en el que una tendencia punteado) cuando se combinan los grupos.
aparece en varios grupos
de datos, pero desaparece
o se invierte cuando se
combinan los grupos. Este
resultado es frecuente en
las estadísticas de las
ciencias sociales y médicas.
Se le ha llamado "La Paradoja de Simpson"
Mismo efecto, pero con un gráfico más sofisticado.

By Pace~svwiki - Own work, CC BY-SA 4.0, https://commons.wikimedia.org/w/index.php?curid=62007681


Veámoslo con un set de datos real

• Bájate el Archivo “pinguinos - simpson” de Canvas


¿Y qué otros
tipos de gráficos
podemos utilizar
para explorar
nuestros datos?
Analítica descriptiva
Contenido

1. Análisis exploratorio de datos mediante


Análisis descriptivo
2. Estadística descriptiva
3. Gráficos y tablas útiles
Gráficos y tablas útiles

1.Diagrama de cajas
2.Gráficos de barras
3.Histogramas
4.Series temporales
5.Diagrama de dispersión
6.Gráfico circular
7.Geospacial
Gráficos y tablas útiles

Tipos de
gráficos
que Excel
puede
manejar
Pinguinos
Graficos

Diagrama de Cajas
• Un diagrama de caja
Boxplot es un método para
representar gráficamente
grupos de datos numéricos
a través de sus cuartiles.
• También representa los
valores mínimo y máximo.
Max

Gráficos
de cajas 3rd Quartile

Median

1st Quartile

Min
Pinguinos
Graficos

Diagrama de Caja–
Usos
• Cuando se desea visualizar la
distribución de valores
cuantitativos en un campo.
• Cuando desee comparar
entre diferentes variables
categóricas.
• Cuando se quiere identificar
valores atípicos.
spain salary by
comunidad
Gráfico de Barras/
Columnas
• Un diagrama de barras o
gráfico de barras es un gráfico
que representa datos
categóricos con barras
rectangulares con alturas o
longitudes proporcionales a
los valores que representan.
• Las barras pueden
representarse vertical u
horizontalmente.
spain salary by
comunidad

Gráfico de barras
• Los gráficos de barras
proporcionan una
representación visual de los
datos categóricos.
• Los datos categóricos son una
agrupación de datos en grupos
discretos, como los meses del
año, el grupo de edad, las tallas
de zapatos y los animales.
videogame
sales

Gráfico de barras
• Estas categorías suelen ser
cualitativas.
• En un gráfico de barras de
columna (vertical), las
categorías aparecen a lo
largo del eje horizontal y la
altura de la barra
corresponde al valor de cada
categoría.
videogame
sales

Gráfico de Barras/Columnas. Usos


• Cuando necesite comparar varias
categorías diferentes.
• Cuando necesite mostrar una
comparación entre diferentes
valores.
• Cuando quiera destacar la
diferencia entre valores.
• Cuando quiera destacar las cifras
totales en lugar de las
tendencias.
Pinguinos
Graficos

Histogramas
• Un histograma es una
representación aproximada de la
distribución de datos numéricos..
• Para construir un histograma, el
primer paso conocer el rango de
valores—es decir, dividir todo el
rango de valores en una serie de
intervalos y luego contar cuántos
valores caen en cada intervalo.
Pinguinos
Graficos

Histogramas – Usos
• Los histogramas a veces se
confunden con los gráficos de
barras.
• Un histograma se utiliza para
datos continuos, donde los
contenedores representan rangos
de datos, mientras que un gráfico
de barras es una gráfica de
variables categóricas.
• Algunos autores recomiendan
que los gráficos de barras tengan
espacios entre los rectángulos
para aclarar la distinción.

Pinguinos
Graficos

Histogramas
• Los intervalos se suelen
especificar como intervalos
consecutivos y no
superpuestos de una variable.
• Los intervalos deben ser
adyacentes y suelen ser
(aunque no es obligatorio) de
igual tamaño.
Archivo
Utilizaremos la función HISTORIALCOTIZACIONES para obtener datos
cotizaciones
para este gráfico
bolsa

Series Temporales
• Una serie temporal es una serie
de puntos de datos graficados
en orden temporal.
• Más comúnmente, una serie de
tiempo es una secuencia tomada
en puntos sucesivos igualmente
espaciados en el tiempo.
• Por ejemplo: el valor de cierre
diario del Promedio Industrial
Dow Jones, o las ventas
mensuales de una empresa.
Archivo
cotizaciones
bolsa

Series Temporales– Usos


• Cuando desees mostrar
tendencias.
• Cuando deseas representar
tendencias para diferentes
categorías durante el mismo
período de tiempo y, por lo
tanto, mostrar la comparación.
pinguinos -
simpson

Gráfico de dispersión – Uso

• Cuando se necesita
observar y mostrar
relaciones entre dos
variables numéricas.
Datasaurus
dozen

Diagrama de
Dispersión
• Tipo de trazado que utiliza
coordenadas cartesianas para
mostrar valores para dos
variables típicamente para un
conjunto de datos.
• Si los puntos están codificados
(color/forma/tamaño), se
puede mostrar una variable
adicional.
Pinguinos
Graficos

Diagrama De Dispersión – Uso

• Cuando necesite observar


y mostrar relaciones
entre dos variables
numéricas.
videogame
sales

Diagrama Circular
• Un gráfico circular es un
gráfico circular que utiliza
"sectores circulares" para
mostrar tamaños
relativos
videogame
sales

Diagrama Circular-
• Cuando se quiere
representar la parte que
cada valor tiene del
conjunto.
• Cuando quieras mostrar
cómo un grupo se divide
en pedazos más
pequeños.
spain salary by comunidad

Gráfico circular
• Es difícil comparar
diferentes secciones de
un gráfico circular
determinado, o comparar
datos entre diferentes
gráficos circulares.
Pie Charts – cuándo usarlos

• Un gráfico circular es una


buena opción para visualizar
porcentajes porque muestra
cada elemento como parte de
un todo.
• Todo el pastel representa el
100 por ciento de un todo.
Las rebanadas de pastel
representan porciones del
todo.
spain salary by comunidad

Geospacial

• Uso de mapas
reales para
representar la
información de
países u otras
divisiones
geográficas.
bebidas por pais

Geospacial- 3D

• Uso de mapas
3D para
representar la
información
de países u
otras
divisiones
geográficas.
https://www.youtube.com/watch?v=P--qP4mfxEg
Conclusiones del tema
Análisis descriptivo
• EDA es exploratorio por su nombre y naturaleza.
• La Estadística Descriptiva puede ayudar en el EDA.
• Los estadísticos descriptivos nos ayudan a comprender
y comparar la distribución subyacente de las variables.
• Los gráficos y diagramas contribuyen a nuestra
comprensión de los conjuntos de datos.
• Los datos deben explorarse a fondo antes de poder
comprenderlos y utilizarlos para el análisis.
• Es necesario utilizar diferentes gráficos para diferentes
tipos de datos.
95

También podría gustarte