ADMINISTRACIÓN
Y NEGOCIOS
Estadística
Primera Unidad: Análisis Descriptivo De Datos Univariados
NOMBRE: Rayen Carrasco, Sandro Pardo, Matías Quezada, Belén Reyes
CARRERA: Ingeniería en Administración de empresas
ASIGNATURA: Estadística
PROFESOR: Erwin Gamaliel Belmar Torres
FECHA: 24 de abril del 2023.
Contenido
Estadística...............................................................................................................................................1
Primera Unidad: Análisis Descriptivo De Datos Univariados....................................................1
1 Introducción...........................................................................................................................................3
2 Esquema de una Variable.......................................................................................................................4
3 Sumatorias y sus Propiedades................................................................................................................4
4 Análisis Unidimensional para pocos datos (n≤30)..................................................................................5
1 Introducción
El análisis univariante es una de las formas más sencillas de analizar datos. “UNI” significa uno,
esto que quiere decir, sus datos sólo tienen una variable. No se ocupa de las causas ni de las
relaciones y su principal objetivo es describir; toma los datos, los resume y encuentra patrones
en ellos.
Se puede pensar en la variable como una categoría en la que entran los datos. Un ejemplo de
variable en el análisis univariante podría ser la «edad». Otro podría ser la «altura». El análisis
univariante no examinaría estas dos variables al mismo tiempo, ni examinaría la relación entre
ellas.
Algunas formas de describir los patrones encontrados en los datos univariados incluyen la
observación de la media, la moda, la mediana, el rango, la varianza, el máximo, el mínimo, los
cuartiles y la desviación estándar. Además, algunas formas de mostrar los datos univariantes son
las tablas de distribución de frecuencias, los gráficos de barras, los histogramas, los polígonos de
frecuencias y los gráficos circulares
En el presente informe daremos a conocer los pasos a seguir para resolver ejercicios
relacionados a los análisis univariantes. Con sus respectivos pasos a seguir, los gráficos que nos
ayudaran a entender mejor los resultados de estos. Toda la información que será planteada en el
informe fue únicamente presentada por el profesor, clase por clase.
2 Esquema de una Variable
VARIABLE DATOS FÓRMULA O RESULTADO
ESTADÍGRAFO
CONCLUSIÓN
CUALITATIVA CUANTITATIVA MEDIA O
PROMEDIO
TOMA DE DECISIÓN
DISCRETAS CONTINUAS
NOMINALES ORDINALES
3 Sumatorias y sus Propiedades
S(xi-X̅)^2/n = Sxi^2/n - X̅ = (Sxi)^2/n^2
Propiedad de sumatoria
1. Paso 1: Factorizar por 1/n
1/n S (xi - X̅)^2
2. Paso 2: Desarrollar el cuadro
1/n S (xi^2 – 2xiX̅ + X̅^2)
3. Paso 3: Multiplicar S por cada término del trinomio
1/n [Sxi^2 - S2xiX̅ + SX̅^2]
4. Paso 4: Aplicar propiedad de S Scx = cSx Sc = nc
1/n [Sxi^2 - 2X̅Sxi + nX̅^2]
5. Paso 5: Transformar X̅ a su fórmula Sxi/n
1/n [Sxi^2 – 2 (Sxi/n) Sxi + n (Sxi)^2/n^2]
6. Paso 6: Multiplicar y dividir potencias de igual base
1/n [Sxi^2 – 2 (Sxi)^2/n + (Sxi)^2/n]
7. Paso 7: Reducir términos semejantes
1/n [Sxi^2 - (Sxi)^2/n]
8. Paso 8: Multiplicar 1/n por el binomio
[Sxi^2/n - (Sxi)^2/n^2]
9. Paso 9: Transformar (Sxi)^2/n^2 en términos de X̅
Sxi^2/n - X̅^2 L.Q.Q.D
4 Análisis Unidimensional para pocos datos (n≤30)
Estadígrafos de centralización medidas de tendencia central: (La media – La moda – La mediana)
La media o promedio aritmético:
X̅ : En la muestra
M (x): En la Población
X̅: S x/n
Ejemplo: 6 9 12
X̅: S x/n = 6+9+12/3 = 27/3
X̅= 9
La moda, Mo(x) : Es el valor que más se repite en un conjunto de datos
Ejemplo: X: 3 7 8
Mo(x): No hay.
X: 4 6 1 2 1
Mo(x)= 1.
X: 3 4 7 3 2 4
Mo(x): 3 y 4.
La mediana, Me(x): Indica que hay un 50% de datos menores a ella y un 50% de datos superiores
a ella. Los datos se ordenan de < a >.
Si n es par: Me(x)= (X n/2 + X n/2+1)/2
Si n es impar: Me(x)= X(n+1/2)
Ejemplo: 3 6 9 7 2 1 8 3 10 9 (Desordenado)
1 2 3 3 6 7 8 9 9 10 (Ordenado)
Me (x): X (n/2) + X (n/2+1)/2= X5 +X6/2= 6+7/2= 13/2= 6,5
5 Análisis Unidimensional para muchos datos (n > 30)
5.1 Caso 1: Cuando la variable es categórica
Ejemplo: X= Es la cantidad de funcionarios por deptos. En una empresa. Se sabe que:
Ventas: 30
Producción: 70
Comp: 6
Adq: 10
LAB: 4
Estos datos podemos resumirlos en una trola de frecuencias y en forma gráfica
Tabla de frecuencia
Categorías Frecuencia Frecuencia
X absoluta relativa
Fa(xi) Fi(xi)
Ventas 30 0.25
PROD 70 0.583
COMP 6 0.05
ADQ 10 0.083
LAB 4 0.033
Total 120 1
Interpretación: Hay 30 funcionarios en el departamento de ventas y representa el 25% del total de
funcionarios de la empresa.
5.2 Caso 2: Cuando la variable es discreta pero debido a los datos debe
considerarse como categórica.
Ejemplo: Cantidad de funcionarios de las distintas sucursales de una gran empresa.
30 50 30 35 40 50 40 50 30 50
40 40 30 30 30 30 30 30 35 40
35 35 35 30 35 35 30 40 30 40
50 30 50 30 50 40 35 40 35 35
Categorías Frecuencia Frecuencia
X absoluta relativa
fa(xi) fr(xi)
30 14 0.35
35 10 0.25
40 9 0.225
50 7 0.175
40 1
5.2.1 Promedio o media aritmética para datos tabulados:
X̅ = Sxi * fa (xi)/n o X̅ = Sxi * fr(xi)
X̅ = 30 * 14 + 35 * 10 + 40 * 9 + 50 * 7 / 40 = 37
X̅ = 30 * 0.35 + 35 * 0.25 + 40 * 0.225 + 50 * 0.175 = 37
5.2.2 Varianza
F^2 (X) = Sxi^2 * fa (xi)/n - X̅^2
Desviación Estándar: Mide cuanto se aleja los datos del promedio.
C.V (X) = (Desviación Estándar / Promedio * 100)
(7,053/37 * 100)% = 19%
Si :
0% ≤ C.V (X) < 30% Los datos son homogéneos
30% ≤ C.V (X) < 70% Los datos son heterogéneos
C.V (X) ≥ 70% Los datos son Homo – Hete.
5.3 Caso 3: Cuando la variable es cuantitativa discreta o continua o con
muchos datos.
Ejemplo: Una empresa quiere conocer la distribución de la cantidad de funcionarios en sus diferentes
sucursales a lo largo del país. Los datos son:
35 37 50 41 37 33 42 39 50 44
50 41 48 44 42 36 41 38 31 47
31 43 38 39 49 35 46 33 41 45
38 50 46 36 50 43 42 45 36 46
Estos datos podemos resumirlos en una trola de frecuencias y en forma gráfica. (Histograma y Polígono de
frecuencias).
5.3.1 Tabla de frecuencias
Paso 1: Ordenar datos de menor a mayor. R(X) = MAX – MIN. RN(X) = (MAX+1) - (MIN-1).
Paso 2: Determinar la cantidad de intervalos que resume los datos analizados. NI = 1 + 3,3 log 10 n.
Si el resultado es 6,2 o 6,9 indica que la cantidad de intervalos será 6.
Paso 3: Amplitud de los intervalos (c). C = RN(X)/NI
Paso 4: Comenzar a construir los intervalos.
Intervalo o Marcas de Fa (xi) fr (xi) Faa(xi) Fra(xi)
clases clase
x
[30 31.75 4 0.1 4 0.1
33,5[
[33,5 35.25 5 0.125 9 0.225
37[
[37 38.75 8 0.2 17 0.425
40,5[
[40,5 42.25 9 0.225 26 0.650
44[
[44 45.75 8 0.2 34 0.850
47,5[
[47,5 49.25 6 0.15 40 1
51[
TOTAL 40 1
Paso 1:
MAX= 50 R(X) = MAX – MIN = 50 – 31 = 19
MIN= 31 RN (X) = 51 – 30 = 21
Paso 2:
NI= 1 + 3,3 log 10 40 = 6,28 = 6.
Paso 3:
C = RN (X) / NI = 21 / 6 = 3,5.
Cuando queremos obtener el Ls (límite superior) y el Li (límite inferior), es necesario estas fórmulas:
Li = x – c/2
Ls = x + c/2
Ingresamos los datos del caso N°3, notamos que tenemos un sistema de ecuaciones, así que debemos
obtener cualquiera de las dos incógnitas con el método de reducción.
(Li + Ls)/2 = 31,75
Ls – Li = 3,5
Li + Ls = 31,75 x 2
Ls – Li = 3,5
Li + Ls = 63,5
- Li + Ls = 3,5
(los Li son eliminados por el método de reducción)
2 Ls = 67
Ls = 67/2
Ls = 33,5
Ahora, para obtener el promedio o media aritmética para datos tabulados del caso N°3, es necesario la
siguiente formula:
X̅ = [Sxi * fa(xi)] / n
X̅ = [ (31,75*4)+(35,25*7)+(38,75*6)+(42,25*11)+(45,75*6)+(49,25*6) ] /40
X̅ = 41,375
Para obtener la Varianza del caso N°3, es necesario la siguiente formula:
F2 = [Sxi2 * fa(xi)] - X̅2
n
2
F = 28, 634375
Para obtener la desviación estándar del caso N°3, es necesario la siguiente formula:
F(x) = √F2(x)
F(x) = √28, 634375
F(x) = 5,351109698
Para obtener el Coeficiente de Variación (C.V) del caso N°3, es necesario la siguiente formula:
C.V(x) = (desviación estándar x 100)%
promedio
C.V(x) = (5,351109698 x 100)
41,375
C.V(x) = 12,93319564%
0% ≤ C.V (X) < 30% Los datos son homogéneos
30% ≤ C.V (X) < 70% Los datos son heterogéneos
C.V (X) ≥ 70% Los datos son Homo – Hete.
Para obtener la Moda/Mo(x) del caso N°3, usamos la siguiente formula:
Mo(x) = Ls + C x fa (xi )
fa(xi-1) + fa(xi+1)
Mo(x) = 40,5 + 3,5 x (8/14)
Mo(x) = 25,14285714
Para obtener la mediana/Me(x) del caso N°3, usamos la siguiente formula:
Me(x) = Li + C x (n/2 - faa(xi – 1))
fa(xi)
Me(x) = 37 + 3,5 x (40/2 - 9)
15
Me(x) = 29,7
En este caso, asimetría es POSITIVA
Mo < Me < X̅ Mo = Me = X̅ X̅ < Me < Mo
Los Percentiles P(k)
Estos estadígrafos dividen una serie de datos en 100 partes iguales, el subíndice de “k” es el porcentaje de
datos que está bajo un valor especifico de la variable. Para obtener el P40, necesitamos la siguiente
fórmula:
P(k) = Li + C ((n*k/100) - Faa(xi-1))
fa(xi)
P(k) = 37 + 3,5 ((40*40/100) - 9)
8
P(k) = 40,0625
6 Conclusión
Las estadísticas descriptivas pueden proporcionar información valiosa que puede informar la toma de
decisiones en una variedad de campos, incluidos los negocios, la atención médica y las ciencias sociales.
Sin embargo, es importante tener en cuenta que también se pueden necesitar otras técnicas estadísticas
para comprender y analizar completamente conjuntos de datos complejos. Por ejemplo, el análisis
multivariante nos permite examinar las relaciones entre múltiples variables y puede proporcionar una
comprensión más matizada de datos complejos.
En resumen, el análisis de datos descriptivos univariados sirve como una herramienta crítica en estadística
para identificar y resumir las características clave de una sola variable en un conjunto de datos.
Proporciona información valiosa que puede informar la toma de decisiones y conducir a una comprensión
más profunda de los datos, pero debe usarse junto con otras técnicas estadísticas para un análisis integral
de conjuntos de datos complejos.