ESTADISTICA APLICADA
II CICLO - UNAM
DISTRIBUCION BINOMIAL
Mgr. CARLOS CENTURION YAÑEZ
Distribución de Probabilidad
Una distribución o densidad de probabilidad de una
variable aleatoria x es la función de distribución de la
probabilidad de dicha variable
Área de curva entre 2 puntos representa la probabilidad de que
ocurra un suceso entre esos dos puntos.
Distribuciones probabilidad pueden ser discretas o
continuas, de acuerdo al tipo de.
Hay infinidad distribuciones probabilidad, (1 c/población),
pero hay ciertas distribuciones “modelo”:
Normal
Binomial
Ji-cuadrado
"t" de Student,
F de Fisher
-1 0 +1
Distribución binominal
Describe la probabilidad de una variable dicotómica
independiente.
Distribución Binominal de un hombre en un grupo de 10
Probabilidad
0.3
0.25
0.2
0.15
0.1
0.05
0
0 1 2 3 4 5 6 7 8 9 10
Número de hombres en un grupo de 10
Utilidad
Se utiliza en situaciones cuya solución tiene dos
posibles resultados.
Al nacer un/a bebé puede ser varón o hembra.
En el deporte un equipo puede ganar o perder.
Un tratamiento médico puede ser efectivo o inefectivo.
Vivo / muerto; enfermo / sano; verdadero / falso
Prueba múltiple 4 alternativas: correcta o incorrecta.
Algo puede considerarse como Éxito o Fracaso
“Experimentos de Bernoulli”
Usos:
Estimación de proporciones
Pruebas de hipotesis de proporciones
Propiedades de un
experimento de Bernoulli
1. En cada prueba del experimento sólo hay dos
posibles resultados: Éxitos o Fracasos.
2. El resultado obtenido en cada prueba es
independiente de los resultados obtenidos en
pruebas anteriores.
3. La probabilidad de un suceso (p) es constante y no
varía de una prueba a otra.
4. La probabilidad del complemento (1- p) es q .
Si repetimos el experimento n veces podemos obtener
datos para armar una distribución binomial.
La Distribución Binomial
Ejemplo distribución probabilidad discreta.
Formada por serie experimentos Bernoulli.
Resultados de cada experimento son
mutuamente excluyentes.
Para construirla necesitamos:
1. La cantidad de pruebas n
2. La probabilidad de éxitos p
3. Utilizar la función matemática P(x=k).
La función P(x=k)
Función de la distribución de Bernoulli:
k = número de aciertos.
n = número de experimentos.
p = probabilidad de éxito, como por ejemplo, que salga "cara" al
lanzar la moneda.
1-p = “q”
Excel =DISTR.BINOM(k , n, p, acumulado)
Acumulado = falso : solo para x=k
Acumulado = Verdadero : para x≤k
Ejercicio03 - DistribucionBinomial.xlsx
Ejemplo 1
¿Probabilidad de obtener 6 caras al lanzar una
moneda 10 veces?
El número de aciertos k es 6. Esto es x=6
El número de experimentos n son 10
La probabilidad de éxito p = 0.50
La fórmula quedaría:
P (k = 6) = 0.205
Es decir, que la probabilidad de obtener 6 caras
al lanzar 10 veces una moneda es de 20.5% .
Ejemplo 2
¿Probabilidad de obtener cuatro veces el
número 3 al lanzar un dado ocho veces?
El número de aciertos k es 4. Esto es x=4
El número de experimentos n son 8
Probabilidad de éxito p = 1/6 ( 0.1666)
La fórmula queda:
P (k = 4) = 0.026
Es decir, probabilidad de obtener cuatro veces el
números 3 al tirar un dado 8 veces es de 2.6%.
Tabla o Excel?
Media, Varianza, y Desviación
Estandar en Distribución Binomial
n p
n pq
2
n pq
Ejemplo
Al adivinar al azar un examen de 100
preguntas multiples, cada una con 4
posibles respuestas:
100 1 4 25
100 1 4 3 4 18.8
2
100 1 4 3 4 4.3
En resumen
La distribución binomial se forma de una
serie de experimentos de Bernoulli
La media (μ) en la distribución binomial se
obtiene con el producto de n x p
La varianza (σ2 ) en la distribución binomial
se obtiene del producto de n x p x q.
El valor de q es el complemento de p y se
obtiene con 1 – p.
Distribución Normal
Descubierta en 1733 por el francés Moiure,
descrita también por Laplace y Gauss (sinónimo
de la forma gráfica de esta distribución).
Importancia práctica de esta distribución teórica:
Muchos fenómenos distribuidos suficientemente
Normal que distribución es la base de gran parte de la
teoría estadística usada por los biólogos.
Distribución de promedios.
Distribución de errores.
Características D. Normal
Área bajo la curva entre 2 puntos representa probabilidad que ocurra
un hecho entre esos dos puntos
Su dominio va de menos infinito a más infinito;
Es simétrica con respecto a su media;
Tiene dos colas y es asintótica al eje x por ambos lados;
El valor del área debajo de toda la curva es igual a 1;
El centro de la curva está representado por la media poblacional ().
Para cualquier curva normal, el área de - a + es igual a 0.6827; de
-2 a +2 de 0,9545 y de -3 a +3 de 0,9973;
Distribución muestreal de varios estadísticos, como `x es normal e
independiente de distribución de la población.
D. Normal Tipificada (estandarizada)
Distribución especial que representa a todas las variables aleatorias
normales y que es la distribución de otra variable normal llamada Z:
x -
Z=
=NORMALIZACION(x;media;desv_estándar)
Z se la conoce como variable aleatoria estandarizada.
Esta función se caracteriza por tener media igual a cero y desviación
tipificada igual a uno : N(0,1)
Representa a todas las distribuciones Normales. Igual densidad de
probabilidad, si medimos desviaciones de media en base a .
Valores obtenidos de tabla Normal válidos para todas las
distribuciones Normal de media = y varianza =2.
Densidad de Probabilidad
N (0,1) y N( ,2)
Probabilidad Acumulada
N (0,1) y N( ,2)
Tabla Distribución Z
=DISTR.NORM.ESTAND(Z)
Uso de Tabla Distribución Z
Para determinar la probabilidad de ocurrencia de un
suceso entre 2 puntos debemos determinar el área bajo la
curva entre dichos puntos.
Depende tipo de tabla. Usaremos tabla de - a X, ya que
da la probabilidad acumulada al igual que Excel.
Existen otros tipos de tabla
0 a X, X a , etc.
Debemos razonar siempre como determinar el área.
En nuestra tabla, para determinar P(- a X) o P(Z ≤ X):
1. Buscamos en la columna izquierda de la tabla el valor del entero y
primer decimal
2. Buscamos en la fila superior el valor del segundo decimal,
3. Interceptamos ambos valores obteniendo el valor de P.
4. Interpretamos este valor
Probabilidad Normal Excel
=DISTR.NORM.ESTAND(Z)
Devuelve la función de distribución normal estándar
acumulativa. La distribución tiene una media de 0 (cero)
y una desviación estándar de uno. Use esta función en
lugar de una tabla estándar de áreas de curvas normales
Ejercicio 03 - DistribucionNormal.xlsx
Uso Tabla Normal Estándar (a)
Obtenga la probabilidad de que Z obtenga los siguientes
valores:
P (Z 1.17)
Buscamos en la columna izquierda de la tabla el valor
1.1, y en la primera fila el valor 0.07, interceptamos
ambos valores obteniendo el valor de 0.8790, que es
el valor que buscábamos:
P(Z 1.17) = 0.879
Uso Tabla Normal Estándar (b)
P(0 Z 1.17)
Esto lo podemos escribir de la siguiente forma también:
P(Z ≤1.17) - P(Z 0)
El primer término lo conocemos, por que lo resolvimos en el
literal a.
Para el segundo término sabemos que la distribución normal es
simétrica y que su área total es igual a 1, por lo tanto el área que
hay de - a 0 (P(Z 0)) es igual a 1/2 = 0.5.
Por lo que el valor que buscábamos estará dado por:
P(0≤ Z 1.17) = 0.879 - 0.5 = 0.379
Uso Tabla Normal Estándar (c)
P(Z 1.17)
Sabiendo que el área total bajo toda la curva Normal de - a +
es igual a 1, y conociendo el valor del área de - a 1.17, el valor
del área de 1.17 a + será:
1 - P(Z 1.17) = 1 - 0.879 = 0.121
Uso Tabla Normal Estándar (d)
P(Z -1.17)
Como estamos tratando con una curva simétrica, este valor
será el mismo que el del literal c:
P(Z -1.17) = P(Z 1.17) = 0.121
Uso Tabla Normal Estándar (e)
P(0.42 Z 1.17)
Al igual que en el literal b, esto lo podemos escribir como:
P(Z ≤1.17) - P(Z 0.42).
El primer valor lo conocemos, el segundo lo encontramos en la tabla de la
misma forma:
P( Z 1.17) – P(Z 0.42)= 0.879-0.6628= 0.2162
Uso Tabla Normal Estándar (f)
h) P(|Z| 1.17)
Determinar el área de - a -1.17 y de 1.17 a +. Como la curva es simétrica,
simplemente multiplicamos el valor de P(Z 1.17) del literal c por 2:
P(|Z| 1.17) = 2 x P(Z 1.17) = 2 x 0.121 = 0.242
Uso Tabla Normal Estándar (g)
i) P(|Z| 1.17)
Área dada por 1 menos valor literal h, ya que el valor total del área es igual a 1:
P(Z 1.17) = 1- P(Z 1.17) = 1 - 0.242 = 0.758
Tabla Distribución Z Inversa
Otro caso diferente para el cual podemos utilizar la tabla es
para encontrar el valor de Z después del cual se encuentra
un x 100 % del área de la curva.
Esto equivale a decir buscar el valor de Z cuya
probabilidad de ser mayor sea 100 x %, o en su defecto
que su probabilidad de ser menor sea de (1-)x100 %
Inverso Normal Excel
=DISTR.NORM.ESTAND.INV(probabilidad)
Devuelve el inverso de la distribución normal estándar
acumulativa. Calcula el valor de Z en donde el área de la
curva a su izquierda es igual a la probabilidad buscada.
Se calcula con base en iteraciones, y el grado de
precisión puede variar.
Inverso Tabla Normal(0,1) (a)
Hallar el valor de Z antes del cual se encuentra el
0.879 del área de la curva
Buscamos en el cuerpo de la tabla el valor
correspondiente a 0.8790. Vemos en la columna que
corresponde al valor 1.1, y en la primera fila el valor a
0.07, lo que nos da
Z(1-0.879)=1.17
Inverso Tabla Normal(0,1) (b)
Hallar el valor de Z después del cual se encuentra el
5% del área de la curva:
Esto corresponde a un valor de = 0.05
Esto equivale a decir buscar el valor de Z tal que:
P(Z x) = 0.05
Buscamos en la tabla el valor de 1 - 0.05 = 0.95
Este se encontraría en la fila correspondiente a 1.6, entre
los valores de las columnas 4 (0.9495) y 5 (0.9505),
interpolamos 4.5, y Z sería igual a 1.645.
Z(0.05) = 1.645
Inverso Tabla Normal(0,1) (c)
Hallar el valor de Z tal que el área sobre el mas el
área bajo -Z sea igual a 0.05:
Esto equivale a decir buscar el valor de Z tal que:
P(|Z| x) = 0.05
Como es una curva simétrica: /2 = 0.05/2=0.025
Buscamos en la tabla el valor de 1 - 0.025 = 0.95
Z(0.025) = 1.96
Inverso Tabla Normal(0,1)
(d) Hallar el valor de Z después del cual se
encuentra el 1% del área de la curva:
Esto corresponde a un valor de = 0.01
En Excel =DISTR.NORM.ESTAND.INV(0.99)
Z(0.01) = 2.326
(e) Hallar el valor de Z tal que el área sobre el mas el
área bajo -Z sea igual a 0.01:
Como es una curva simétrica: /2 = 0.01/2=0.005
En Excel =DISTR.NORM.ESTAND.INV(0.995)
Z(0.005) = 2.576
Buscar en la tabla para comprobar
Distribución Normal (, )
Esto Ok! para curva N (0,1) pero y si queremos
usarlo en población natural con 0 y 1?
No hay problema! Tipificamos valor de x en
nuestra distribución Normal con fórmula:
x -
Z=
Y procedemos a buscar la probabilidad para este
valor determinado.
Z no es más que el número de desviaciones
estándares a la que se encuentra x de .
Tipificar en Excel
= NORMALIZACION(x,,)
Valor normalizado de distribución caracterizada por
los argumentos media y desv_estándar : Z =(`x-)/
=DISTR.NORM(x,,, Verdadero)
Calcula probabilidad de que un valor se encuentre
bajo x en una distribución N(,): P(Z ≤ x)
DISTR.NORM.INV(P, ,)
Devuelve el valor x abajo del cual se encuentra el
Px100% del área de la curva para una distribución
N(,).
Ejercicio
a) Encontrar la probabilidad que al muestrear una
piscina con una población Normal con peso
=5g y 2=4 encontremos un valor > 7.78g.
Como 2=4, entonces = 2.
Calculamos el valor de Z:
7.78 - 5
Z= = 1.39
2
Y luego calculamos la probabilidad de que Z sea mayor
a este valor en la tabla:
P(Z 1.39) = 1-0.9177=0.0823
En Excel lo podemos hacer directo o por pasos
b) En la misma piscina calcular entre que valores
de peso se encuentra el 95% de la población