Estadística Industrial
Estimación por intervalos
Estadística Descriptiva e Inferencial. Manuel
Córdova. (2003). 5ta ed.
Capítulo 9
danielmavila@[Link] 2018-2
Doodle Google por el Día del Trabajo
Estimación por intervalos de confianza, estima de
intervalo del parámetro, límites de confianza,
tolerancia, límites fiduciales
En este caso, en lugar de indicar simplemente un único valor
como estimación del parámetro poblacional , lo que haremos
es ofrecer un intervalo de valores en el que se tiene cierta
probabilidad (confianza) de que se encuentre el verdadero
valor de .
ˆ e ˆ e
Intervalo de confianza: Es el intervalo de las estimaciones
(probables) sobre el parámetro.
Límites de los intervalos de confianza: Son los dos valores
extremos del intervalo de confianza. Amplitud del intervalo o
margen de error.
¿Cuán grande debe de ser el intervalo de confianza?
Evidentemente, si decimos que el intervalo de confianza va
de menos infinito a más infinito, seguro que acertamos... pero
eso no es muy útil. El caso extremo contrario es la estimación
puntual, donde la amplitud del intervalo es nula.
La idea es crear unos intervalos de confianza de manera que
sepamos en qué porcentaje de casos el valor del parámetro
poblacional estará dentro del intervalo crítico.
Es decir, dar una medida de bondad de la estimación, la
probabilidad de que el valor real se encuentre dentro del
intervalo. Coeficiente
(grado, nivel)
P(ˆ e ˆ e) 1 de Confianza
(importancia).
Nivel de significación, Error aleatorio.
¿Y cómo se fija tal probabilidad?
En estadística, un resultado es estadísticamente significativo cuando no es
probable que haya sido debido al azar. Una "diferencia estadísticamente
significativa" solamente significa que hay evidencias estadísticas de que
hay una diferencia; no significa que la diferencia sea grande, importante, o
significativa en el sentido estricto de la palabra.
Usualmente para el NC se asume un porcentaje del 95%. Al calcular un
intervalo de confianza al 95%, ello quiere decir que el 95% de las veces que
repitamos el proceso de muestreo (y calculemos el estadístico), el valor del
parámetro poblacional estará dentro de tal intervalo. A ese usual nivel de
significación se le denomina confianza casi significativa.
Por ejemplo: Suponiendo que α = 5%, el intervalo contendrá a µ con un
95% de confiabilidad (no es probabilidad). El 95% significa que de cada
100 intervalos que se calcule, solo cinco como máximo no contendrán al
parámetro µ.
Otros casos usuales son:
a) confianza significativa: 99%.
b) confianza muy significativa: 99,5%
Intervalos de confianza para la media poblacional
(Población infinita)
Supongamos que la población sigue una distribución de probabilidad
normal, con cierta media y cierta desviación típica . Utilizaremos
como estimador puntual, para la media poblacional, la media muestral x
Sabemos que:
(a) La media de la distribución muestral de medias es la media
poblacional .
(b) La varianza de la distribución muestral de medias es 2/n. O lo
que es lo mismo, la desviación típica de la distribución muestral
de medias (Error estándar de la media) es /n.
Tabla de fórmulas para determinar los intervalos de confianza
para la media poblacional
TAMAñO DE LA SE CONOCE SE DESCONOCE
POBLACIÓN
MUESTRA
Grande (n>30)
Con distribución X z X zs
x x
de probabilidad Pequeña (n<=30)
Normal X z X ts
x x
Grande (n>30)
Sin distribución X z X zs
x x
de probabilidad
Se utilizan procedimientos no
Normal Pequeña (n<=30)
paramétricos basados en la mediana
Cálculo de intervalos de confianza para la media
poblacional
(1) La población es normal y conocemos :
1 n
x
n
x i x N , / n
i1
Sabemos como se distribuye la v. a. muestral y a partir de esa
distribución podemos determinar el intervalo de confianza.
x N 0,1
Tipificamos la variable: z
/ n
Supongamos que deseamos tener un nivel de significación :
N 0,1
/2 100(1-)%
/2
-z/2 0 z/2
P z x 1
/2 z / 2
/ n
P x z / 2 x z / 2 1
n n
Donde:
X = Media muestral de la variable
Nivel de Confianza: es la probabilidad de que la estimación
efectuada se ajuste a la realidad, es decir que caiga dentro de un
intervalo determinado basado en el estimador y que capte el
valor verdadero del parámetro a medir.
Z = Depende del nivel de confianza asumido. Valores críticos
(Zc).
X = Error estándar (error típico) de la media muestral. Es la
desviación estándar de la distribución muestral de la media.
e = Error probable de la media, error al estimar la media
poblacional (Tolerancia), error de la estima, error muestral, error
asociado a la estimación. Siempre se comete, ya que existe una
pérdida de representatividad al momento de escoger los
elementos de la muestra. Es la distancia o separación entre un
extremo del intervalo y el centro del mismo:
e= Z X
Tabla de distribución normal (Observa el gráfico)
Ejemplo
a) Determinar el área bajo la curva de menos infinito a Z = - 1.
P(Z<= -1) = 0.1587
b) Determinar el área bajo la curva de menos infinito a Z = - 2.
P(Z<= - 2) = 0.0228
c) Determinar el área bajo la curva entre Z >= -2. hasta Z <= -1
P(- 2 <= Z<= -1) = 0.1259
Ejemplo 1.
En un estudio de mercado efectuado en Chongos
Bajos, se realizó una encuesta a una muestra
compuesta por 410 familias para calcular el
gasto poblacional promedio anual en calzados.
Se encontró en la muestra un promedio de gasto
en calzado de S/740 por familia. La desviación
estándar poblacional es de S/400. Construir e
interpretar un intervalo de confianza al 0,95 de
la estimación del gasto medio anual en zapatos
por familia en el indicado distrito.
Px Z x Z0 1
0
n n
400 400
P740 (1,96) 740 (1,96)0,95
410 410
P700,80 779,20 0,95
(700,80;779, 20)
Interpretación:
Hay 95% de seguridad que el intervalo hallado se
encuentre dentro del grupo de intervalos que contienen a
la verdadera media poblacional (
Con una certeza del 95% el gasto medio anual en
zapatos de las familias de Chongos Bajos estará entre
S/700,80 y S/779,20
Ls
LI
muestra
1 2 3 4 5 6 7 8 …
Ejemplo 2
El gerente de la empresa Barras Bravas toma una muestra de 45
barras de acero que tiene una tracción media de 6342 kg/cm² y
una desviación estándar poblacional de 10,8 kg/cm². Halla el
intervalo de confianza para la media con un nivel de significan-
cia de 0,05.
Propuesta de solución
Como el tamaño de la muestra es grande vamos a utilizar Z
Ejemplo 3
Un informe de la empresa A Vuelo de Pájaro indica que el precio
medio del billete de avión entre Jaen y Quicacha es, como
máximo, de S/120 con una desviación típica de S/40, dado que
operan en la modalidad de low cost. Se toma una muestra de 100
viajeros y se obtiene que la media de los precios de sus pasajes
es de S/130.
Elabora el intervalo de confianza y contesta ¿Se puede aceptar
con un nivel de significación igual a 0,10 la afirmación del
informe de la citada empresa?
Para α = 0,10 le corresponde un valor crítico unilateral: zα = 1,28.
Determinamos el intervalo de confianza:
40
−∞; 130 + 1,28 ∗ = (−∞; 135)
100
No se acepta la hipótesis (<= 120) con un nivel de significación
del 10%.
Ejercicio 1
La empresa Oh Margot produce anillos para los pistones de
un motor de automóvil. Se sabe que el diámetro del anillo
está distribuido aproximadamente de manera normal, y que
tiene una desviación estándar de 0,001 mm. Una muestra
aleatoria de 15 anillos tiene un diámetro promedio de 74,036
mm.
a) Construye un IC bilateral del (84 + UD)% para el
diámetro promedio del anillo.
b) Construye un límite inferior de confianza del (86 +
UD)% para el diámetro promedio del anillo.
Ejercicio 2.
El control de recepción de las partidas de hilado que llegan a la
tejeduría Tres Al Hilo se efectúa a través de una muestra de 10
ovillos midiéndose en cada uno de ellos la resistencia del hilado,
cuyo valor medio para toda la partida debe ser de 25 kg por lo
menos. El proveedor acepta un riesgo máximo del 5% de recibir de
vuelta una partida buena. Se sabe que la resistencia a la rotura de
este hilado es una variable Normal con un desvío de 2,2 kg ¿Cuál
es la resistencia media muestral mínima para aceptar una partida?
Distribución de probabilidad t de Student
Condiciones:
• Se utiliza en muestras pequeñas de 30 o menos
elementos.
• La desviación estándar de la población no se
conoce.
• Se usa en teoría de pequeñas muestras o teoría
exacta del muestreo.
Características:
• La distribución t-Student es menor en la media y
más alta en los extremos que una distribución
normal.
• Tiene mayor parte de su área en los extremos que
la distribución normal.
Comparación entre Normal y T Student
Distribución Distribución Normal
Normal
Distribución t
Student
Distribución t Student
Media
Grados de Libertad
• Existe una distribución t para cada tamaño
de la muestra, por lo que “Existe una
distribución para cada uno de los grados de
libertad”.
• Los grados de libertad son el número de
valores elegidos libremente.
Grados de libertad…
• Para un conjunto de datos de una muestra, con
distribución t-Student los grados de libertad se
calculan de la siguiente manera:
GL = n – 1
Ejemplo:
• Se tiene una muestra de 7 elementos con una
media de 16.
Media = a + b + c + d + e + f + g =16
7
GL= n – 1 = 7 – 1 = 6
Tabla t Student
¿Cómo usar las tablas t de Student?
1. Determina los grados de libertad (ʋ) tal que ʋ = n - 1.
2. Calcula el valor de t = (x - )/(s/(n).
3. Localiza en tablas el valor de la probabilidad asociada a los
valores de t y de ʋ. Los valores de t pueden ser negativos o
positivos. Contrario a la tabla de la distribución normal aquí
los valores de t están dentro de la tabla y los valores de
probabilidad en la parte superior de la misma. En algunos
casos puede ser necesario interpolar para encontrar el valor
buscado, de lo contrario se escoge el que más se aproxime.
TABLA DE LA DISTRIBUCION tStudent
, y donde T tiene distribución t-Student con r grados de libertad..
La tabla da áreas 1 y valores
, donde,
c t1, r
P[T c] 1 1-a
r 0.75 0.80 0.85 0.90 0.95 0.975 0.99 0.995
1 1.000 1.376 1.963 3.078 6.314 12.706 31.821 63.657
2 0.816 1.061 1.386 1.886 2.920 4.303 6.965 9.925
3 0.765 0.978 1.250 1.638 2.353 3.182 4.541 5.841
4 0.741 0.941 1.190 1.533 2.132 2.776 3.747 4.604
5 0.727 0.920 1.156 1.476 2.015 2.571 3.365 4.032
6 0.718 0.906 1.134 1.440 1.943 2.447 3.143 3.707
7 0.711 0.896 1.119 1.415 1.895 2.365 2.998 3.499
8 0.706 0.889 1.108 1.397 1.860 2.306 2.896 3.355
9 0.703 0.883 1.100 1.383 1.833 2.262 2.821 3.250
10 0.700 0.879 1.093 1.372 1.812 2.228 2.764 3.169
11 0.697 0.876 1.088 1.363 1.796 2.201 2.718 3.106
12 0.695 0.873 1.083 1.356 1.782 2.179 2.681 3.055
13 0.694 0.870 1.079 1.350 1.771 2.160 2.650 3.012
14 0.692 0.868 1.076 1.345 1.761 2.145 2.624 2.977
15 0.691 0.866 1.074 1.341 1.753 2.131 2.602 2.947
16 0.690 0.865 1.071 1.337 1.746 2.120 2.583 2.921
17 0.689 0.863 1.069 1.333 1.740 2.110 2.567 2.898
18 0.688 0.862 1.067 1.330 1.734 2.101 2.552 2.878
19 0.688 0.861 1.066 1.328 1.729 2.093 2.539 2.861
20 0.687 0.860 1.064 1.325 1.725 2.086 2.528 2.845
21 0.686 0.859 1.063 1.323 1.721 2.080 2.518 2.831
22 0.686 0.858 1.061 1.321 1.717 2.074 2.508 2.819
23 0.685 0.858 1.060 1.319 1.714 2.069 2.500 2.807
24 0.685 0.857 1.059 1.318 1.711 2.064 2.492 2.797
25 0.684 0.856 1.058 1.316 1.708 2.060 2.485 2.787
26 0.684 0.856 1.058 1.315 1.706 2.056 2.479 2.779
27 0.684 0.855 1.057 1.314 1.703 2.052 2.473 2.771
28 0.683 0.855 1.056 1.313 1.701 2.048 2.467 2.763
29 0.683 0.854 1.055 1.311 1.699 2.045 2.462 2.756
30 0.683 0.854 1.055 1.310 1.697 2.042 2.457 2.750
40 0.681 0.851 1.050 1.303 1.684 2.021 2.423 2.704
60 0.679 0.848 1.046 1.296 1.671 2.000 2.390 2.660
120 0.677 0.845 1.041 1.289 1.658 1.980 2.358 2.617
¥ 0.674 0.842 1.036 1.282 1.645 1.960 2.326 2.576
EJEMPLO 1
La empresa Silencio Sonoro especifica que el peso medio de
uno de sus productos debe ser de 2 kg. Sabiendo que la
desviación estándar de una muestra de 17 unidades es 0,10.
a. ¿Cuál es la probabilidad de que la media sea:
• menos de 1,9666 kg?
• más de 2,0646 kg?
• entre 1,9935 y 2,053 kg?
b. ¿Qué valor de t promedio genera una probabilidad de 0,15 a
su izquierda?
Propuesta de solución
= 2 kg s/ʋ = 0,1/16 = 0,025 kg con 15 grados de libertad
a. P(x 1,9666) = ?
P(x 1,9666) T 1,9666 2 T (1,366) 0,1
0,025
La probabilidad de que la media sea menor a 1,9666 kg es 10%.
En Excel:
INSERTAR/Elegir la función estadística DISTR.T.N
P(x 1,9666) se introduce el valor de t que es 1,336 positivo, el
número de grados de libertad que es 15 y se indica que es una cola.
Excel retorna el valor de la probabilidad que es 0,10 que es el mismo
valor a la izquierda de -1,336 por la simetría.
EJEMPLO 2
• Se desea obtener un intervalo de
confianza al 99% para el tiempo medio
requerido para desarrollar un examen de
Matemática II.
Para ello se elige una muestra aleatoria
de 16 estudiantes, la que produce una
media de 13 y una desviación estándar
de 5,6 minutos.
Encontrando t
• Confianza al 99% con (n-1) grados de libertad.
• GL = 16 – 1 = 15
α = 1% = 0,01
0,005
2
α1=0,005 α2=0,005
99 %
Cálculo de los valores extremos del intervalo
tS
xvaloresextremos X
n
• n = 16
• X =13 minutos
• S = 5,6 minutos
• tcrítico = 2,947 (valor que se obtiene de la tabla,
para GL = 15)
(2,947 )(5,6) 16,50
Xvaloresextremos 13 xi 13 xi 13 4,12
16 4
Tiempo medio requerido para
x1 8,88 x2 17,12 desarrollar la prueba de Matemática
II será entre 8,88 y 17,12 minutos
I = [8,88 ; 17,12] con una certeza del 99%.
Ejercicio:
El Consejo Universitario de la Universidad quiere determinar el
tiempo promedio de estudio que dedican los estudiantes, de
primer año, a sus materias. Se extrae una muestra aleatoria de 61
alumnos de primer año y les pregunta cuántas horas a la semana
estudian. La media de los datos resultantes es de 20 horas, y la
desviación estándar es de 6,5 horas.
a) Construye un intervalo de confianza del 95% para la media
poblacional.
b) Construye un intervalo de confianza del 99% para la media
poblacional.
Ejercicio.
Imagina que el alumno Serapio quiere determinar el IQ promedio
de los profesores que laboran en la Universidad. Como es muy
costoso hacer una prueba a todos los maestros, se extrae una
muestra aleatoria de 20 docentes de toda la población. Cada
profesor recibe un examen diseñado para medir el IQ; los
resultados proporcionan una media muestral de 135 y una
desviación estándar de 8.
a) Construye el intervalo de confianza del 95% para la media
poblacional.
b) ¿Qué significa que el intervalo de confianza del 95% es igual
a cierto rango?
Cálculo de intervalos de confianza para la media
poblacional...
(2) Población normal y desconocemos
Cuando el tamaño de la muestra es < 30 y la población no
es distribución normal, la distribución muestral del estadís-
tico: x
t
s/ n
no es una distribución normal, sino una distribución t de
(n – 1) grados de libertad.
Student con
P t x 1
/2 t / 2
s/ n
s s
P x t / 2 x t / 2 1
n n
En definitiva, para la media (cuando conocemos la varianza
poblacional), tenemos:
x z / 2 x z / 2
n n
Pero si no conocemos la varianza poblacional (el caso realista),
tenemos como intervalo:
s s
x t / 2 x t / 2
n n
Grados de libertad es un estimador del número de categorías
independientes en una prueba particular o experimento
estadístico. Se encuentran mediante la fórmula n − r, donde n =
número de sujetos en la muestra (también pueden ser
representados por k − r, donde k = número de grupos, cuando se
realizan operaciones con grupos y no con sujetos individuales) y
r es el número de sujetos o grupos estadísticamente dependientes.
Intervalo para la media poblacional (Varianza
desconocida)
Si no se conoce la varianza 2 de la población, una posibilidad es
utilizar la varianza muestral S2 en las ecuaciones obtenidas para
estimar intervalos en el caso de varianza conocida
Este procedimiento funciona para muestras grandes (n > 30), por
ello los intervalos de confianza anteriores se les suele llamar
intervalos de confianza para muestras grandes.
Ejercicio
La prueba de corte sesgado es el procedimiento más
aceptado para evaluar la calidad de una unión entre
un material de reparación y su sustrato de concreto.
La Constructora El Último Cuartucho realizó una
investigación del material que utiliza y obtuvo una
resistencia promedio de 17,17 N/mm2, en una
muestra de 48 observaciones de resistencia al corte,
con una desviación estándar muestral de 3,28
N/mm2. Encuentra el límite de confianza inferior
para la resistencia al corte promedio real con un
nivel de confianza de 95%.
Rpta
Cálculo de intervalos de confianza...
(3) Distribución de población desconocida y n > 30
Si n es grande la distribución del estadístico:
x
z
s/ n
será prácticamente una distribución normal N(0;1).
El intervalo de confianza será:
x z / 2 x z / 2
n n
Nota: Para n > 30 la distribución t de Student es prácticamente
una normal.
Tamaño de la muestra (n) para una distribución muestral de medias
(población infinita)
Depende de:
[Link] magnitud del máximo error permisible (e),
precisión, error de muestreo o semiamplitud
((Límite superior - límite inferior) / 2), margen
de error, % de error que se pretende aceptar al
momento de la generalización (para el caso de
proporciones) y
2. El nivel de confianza (100*(1 - )%) de que el
error en la estimación no exceda del
máximo error permisible. Porcentaje de
confianza con el cual se quiere generalizar los
datos desde la muestra hacia la población total.
Se obtiene a partir de la distribución normal
estándar: Z
MARGEN DE ERROR (e) PARA DETERMINAR EL
TAMAÑO DE LA MUESTRA
X ZX X Z X
X
Existe una probabilidad de (1 – α) de que una media muestral sea
errónea por menos de e o Z X
En el (1 – α) % de las muestras el error máximo que se
encontrará (diferencia con la media poblacional) será Z X
Tamaño de la muestra para estimar la media
poblacional (Población infinita)
P{x Z x Z } 1
n n
e = Error e
Z
e
n
Z 2 . 2
n
e2
Z puede hallarse mediante la función del Excel
[Link]()
Ejemplo
A fin de conocer el gasto mensual en bebidas
espirituosas por familia, el gerente de la vitivinícola
Santiago Querido SA desea determinar el tamaño de la
muestra que le proporcione un nivel de confianza de
0,95. Se conoce por estudios anteriores que la población
en estudio tiene un desvío estándar poblacional de S/30.
El gerente busca un tamaño de muestra que le permita
estimar el nivel de gasto con un error de estimación de
S/10.
Solución
Datos:
1 - = 0,95
Z 2
2
n =
Z = 1,96 e2
= S/30
e = S/10
1 , 96 2 30 2
n =
10 2
n = 35
Distribución muestral de Proporciones (población
infinita)
Existen ocasiones en las cuales no estamos interesados en la media de la
muestra, sino que queremos investigar la proporción poblacional () de
artículos defectuosos o la proporción (P) de alumnos desaprobados a partir
de la muestra. En suma para muestreo de variables cualitativas.
La distribución muestral de proporciones es la adecuada para dar
respuesta a estas situaciones; tiene los siguientes parámetros:
π =p y
p
p = 𝑝∗𝑞
(Error estándar)
𝑛
Ejercicio. El 11% de los alumnos de la Facultad cumplen con
entregar sus tareas en el plazo establecido por el docente.
¿Cuál es la distribución muestral de la proporción (πen
muestras de 46 alumnos?
Distribución muestral de Proporciones...
Esta distribución se genera de igual manera
que la distribución muestral de medias, a
excepción de que al extraer las muestras de la
población se calcula el estadístico proporción
𝑃 = x/n (donde x es el número de éxitos u
observaciones de interés y n el tamaño de la
muestra) en lugar del estadístico media
aritmética.
Distribución muestral de Proporciones...
Existen ocasiones en las cuales se tiene una idea del
comportamiento de la proporción de la población (π) y ese
valor se puede sustituir en la fórmula, pero si no se sabe nada
referente a esa proporción entonces se tienen dos opciones:
a) Tomar una muestra preliminar mayor o igual a 30 para
proporcionar una estimación de P. Después con el uso de
la fórmula se podría determinar de forma aproximada
cuántas observaciones se necesitan para proporcionar el
grado de precisión que se desea.
b) Tomar el valor de P como 0,50 ya que sustituyendo este en
la fórmula se obtiene el tamaño de muestra mayor posible.
Caso b)…
Tamaño de muestra para distintos valores de p (proporción de
p éxito) n
0.10 3.84
0.20 6.82
0.30 8.96
0.40 10.24
0.50 10.67
0.60 10.24
0.70 8.96
0.80 6.82
0.90 3.84
El tamaño de n alcanza su máximo cuando p = 0,5
Intervalos de confianza para la proporción
poblacional
Pero :
p
Z
p
-Z Z donde
p(1 p)
p
n
p
P{Z Z} 1
̀p
P{p Zp p Zp} 1
Ejemplo 1
Ajos & Cebollas es fabricante de reproductores de
discos compactos y realiza un conjunto de pruebas
amplias para evaluar la función eléctrica de su
producto. Todos los reproductores de discos
compactos deben pasar todas las pruebas antes de
venderse. Una muestra aleatoria de 500 reproduc-
tores tiene como resultado que 15 de éstos fallan
en una o más pruebas. Encuentra un intervalo de
confianza de 90% para la proporción de los
reproductores de discos compactos de la
producción que no pasan todas las pruebas.
Propuesta de solución:
n = 500
p = 15/500 = 0,03
z(0,90) = 1,645
P{0,03-1,645( 0,03(1 0.03)
500
) < π< 0,03 +1,645( 0,03(1 0.03)
500
) }= 0,90
0,0237 < π < 0,0376
Respuesta: Se sabe con un nivel de confianza del
90% que la proporción de discos defectuosos que no
pasan la prueba en esa población está entre 2,37% y
3,76%
Ejercicio. Para estimar la proporción de habitantes del distrito de
Huata – Puno, que poseen lap top se toma una muestra de tamaño
n. Calcula el valor mínimo de n para garantizar, con un nivel de
confianza del 95 %, que el error de estimación no supera el 2 %.
Ejemplo 2
Supón que 1600 de 2000 trabajadores sindica-
lizados que se muestrearon de la constructora
Techamos de Menos SA dijeron que planean
votar para unirse a la Federación de
Construcción Civil. Si se utiliza un nivel de
confianza de 0,95 ¿cuál es la estimación de
intervalo para la proporción de la población de
trabajadores sindicalizados que planean votar
por federarse?
Solución:
1600 (0,80)(1 0,80)
p 0.80 p
2000 2000
Z 1,96 p 0,00894
P{0,80-1,96(0,00894) < < 0,80 +1,96(0,00894) }= 0,95
P{0,782 < < 0,818} = 0,95
Interpretación:
Hay 95% de confianza de que el intervalo
calculado pertenece al grupo de intervalos que
contienen a la verdadera proporción poblacio-
nal.
Ejemplo 3
Calcula un intervalo de confianza al nivel α = 0,05 para la
probabilidad p de la resistencia del concreto 210 kg/cm2 al
agregarle un nuevo aditivo si en una muestra de tamaño 123 se
han obtenido 67 testigos que poseen la resistencia esperada.
Solución
El intervalo de confianza al nivel α = 0,05 viene dado por:
Donde:
=123
Ejemplo 4.
El sociólogo Tiburcio Popjordanova ha pronosticado, que en el
Distrito de Quicacha el nivel de abstención en las próximas eleccio-
nes será del 40% como mínimo. Se elige al azar una muestra
aleatoria de 200 individuos, con derecho a voto, 75 de los cuales
estarían dispuestos a votar. Determina con un nivel de significación
del 1%, si se puede admitir el pronóstico.
Propuesta de solución:
Para α = 0,01, le corresponde un valor crítico: zα = 2,33.
Determinamos el intervalo de confianza:
P = 75/200 = 0,375
2 0,375 ∗ 0,625
0,375 − 2,33 ∗ , ∞ = (29,525, ∞)
200
Podemos afirmar, con un nivel de significación del 1%, que la
abstención pronosticada por Tibu estadísticamente es posible que el
mínimo será 40%.
Tamaño de la muestra para estimar la proporción
poblacional (Población infinita)
donde:
Z: Valor tabular para un nivel
de confianza 100(1 - α)%
p: Probabilidad de éxito de la
2
Z p(1-p) muestra
n= p(1- p): Variancia
2
e e: error muestral, margen de
error (%) expresado en tanto
por uno
Tamaño de la muestra para estimar la proporción
poblacional...
La variabilidad (p) es la probabilidad (o porcentaje) con el que
se aceptó y se rechazó la hipótesis que se quiere investigar en
alguna investigación anterior o en un ensayo previo a la
investigación actual. El porcentaje con que se aceptó tal
hipótesis se denomina variabilidad positiva y se denota por p, y
el porcentaje con el que se rechazó la hipótesis es la
variabilidad negativa, denotada por q.
Hay que considerar que p y q son complementarios, es decir, que
su suma es igual a la unidad: p + q = 1. Además, cuando se habla
de la máxima variabilidad, en el caso de no existir antecedentes
sobre la investigación (no hay otras o no se pudo aplicar una
prueba previa), entonces los valores son p = q = 0,5.
Ejemplo
La excongresista Susy Díaz desea determinar su
popularidad en el Coño Norte. Susy establece
que la proporción de electores que la apoyarán
debe calcularse dentro del ± 2% de la proporción
de la población de dicho sector, además, desea
tener un grado de confianza de 0,95.
Se sabe que en las elecciones congresales del
año 2011 recibió 40% de los votos en el
indicado sector, se duda que este porcentaje
haya variado significativamente ¿De cuántos
electores debe ser la muestra?
Solución
Datos:
(1,96)2 (0,40)(0,60)
1 - = 0,95 n
(0,02)2
Z = 1,96
p = 0,40
e = 0,02 n 2305
Ficha técnica de una encuesta realizada por la
encuestadora El Logo Feroz
• Muestra: 1515 personas
• Margen de error +/- 2,79%
• Nivel de confianza: 95%
• Nivel de cobertura: 118 distritos de 36 pro-
vincias pertenecientes a 9 departamentos.
• Representatividad: 94%
• Fecha de aplicación: Entre el 25 y 30 de
junio.
• Supervisión: 30% de entrevistas
• Financiamiento: PUCP
Clases estadísticas de población
1) Población finita cuando en el momento del
estudio podemos determinar exactamente los
elementos de la población. El muestreo es sin
reemplazo.
2) Población infinita cuando en el momento del
estudio no podemos determinar sus elementos ya
que aún no existen. No se puede tomar la
cantidad límite con precisión, ejemplos: las
estrellas, hojas en un bosque, población de
moscas.
Ajuste del error estándar para la media poblacional
de una población finita (Factor de corrección)
El error estándar de la estimación sufre un
ajuste, cuando se trata de una población finita.
Si se quiere calcular el error estándar de la
media para población finita, se multiplica por
el factor de corrección:
Nn
X .
n N 1
N es el tamaño de la población.
Si la proporción n/N es menor a 0,05 (5%) se
omite el ajuste.
Ejemplo 1
Hay 250 familias en el caserío de Cháparra. Una
encuesta a 40 familias reveló que la contribución
media anual a obras comunitarias es de S/450, con
una desviación estándar de S/75. Establece un
intervalo de confianza de 0,95 para determinar la
contribución media anual del total de familias.
Como la muestra es mayor a 5% de N procede el ajuste.
N n N n
P{ x Z x Z
1
n N 1 n N 1
75 250 40 75 250 40
P{ 450 1,96 450 1,96 } 0,95
40 250 1 40 250 1
P{ 428,66 471,34} 0,95
INTERPRETACIÓN: Hay 95% de confianza que el intervalo elaborado
pertenezca al grupo de intervalos que contienen a la verdadera media
poblacional.
Tamaño de muestra para una distribución de medias
muestrales (población finita)
𝑁𝑍2 2
𝑛= 2
𝑒 𝑁 − 1 + 𝑍 2 2
Ajuste del error estándar para la proporción
poblacional de una población finita (Factor de
corrección)
Si se desea calcular el error estándar de la
proporción muestral se multiplica por el factor de
corrección para poblaciones finitas:
p(1 p) . N n
p
n N 1
Si la proporción n/N es menor a 0,05 se omite el
ajuste.
Tamaño de muestra para encontrar la proporción de
población finita
𝑁 ∗ 𝑍2∗ 𝑝 ∗ 𝑞
𝑛=
𝑒2 𝑁 − 1 + 𝑍 2 ∗ 𝑝 ∗ 𝑞
Ejercicio 1: Para realizar una encuesta de satisfacción a clientes de un modelo de
auto de alta gama del que se ha vendido 10 000 unidades (N), se quiere una
confianza del 95,5%, se desea un error muestral del 5% (e) y considerando que
estarán satisfechos el 50% (p), se necesitaría una muestra de:
(a) 385 clientes (b) 280 clientes
Ejercicio 2: Contrasta el porcentaje de personas del País del Nunca Jamás que ven
EEG. Si la población del país es de 40 millones de personas, estimamos que lo ve
el 20% de la población, se establece una confianza del 95,5% y se esta dispuesto a
asumir un error muestral del 5%, se requiere una muestra de:
(a) 256 personas (b) 300 personas
Ejemplo 2
Hay 300 trabajadores en la empresa periodística La
Hora de la Beldad. Una muestra de 50 trabajadores
reveló que 18 cuentan con una experiencia previa en
otra empresa similar. Establece un intervalo de
confianza al 0,95 para la proporción de trabajadores
con experiencia en otra empresa.
Solución:
Como la muestra es mayor a 5%, procede el ajuste .
p(1 p) . N n
p
n N 1
(036)(1 0,36)
18 p
p 0,36 50
50
p 0,06788
N n) N n)
P{p Zo p p Zo } 1
N 1
p
N 1
300 50
P{0,36 (1,96)(0,06788)
300 1
300 50
... 0,36(1,96)(0,06788) } 0,95
300 1
P{0,23835 0,48165} 0,95
INTERPRETACIÓN: Hay 0,95 de confianza que el intervalo
construido pertenezca al grupo de intervalos que contienen a la
verdadera proporción poblacional.
Estimación de la diferencia entre dos medias
poblacionales
Si se tienen dos poblaciones con medias µ1 y µ2 y
varianzas heterogéneas σ12 y σ22, respectivamente,
un estimador puntual de la diferencia entre µ1 y µ2
está dado por el estadístico .
Por lo tanto, para obtener una estimación por
intervalo de µ1 - µ2 , se seleccionan dos muestras
aleatorias independientes, una de cada población, de
tamaño n1 y n2, y se calcula la diferencia ,
de las medias muestrales.
Distribución muestral de diferencia de medias
Despejando:
Distribución muestral de diferencia de medias...
En el caso en que se desconozcan las varianzas de la pobla-
ción y los tamaños de muestra sean mayores a 30 se podrá
utilizar la varianza de la muestra como una estimación
puntual.
Si los límites del intervalo son ambos positivos se puede
concluir que µ1 > µ2; si ambos son negativos µ2 > µ1
Si los límites del intervalo contienen al cero, significa que con
la información disponible cabe la posibilidad de que la
diferencia µ1 = µ2 sea positiva, negativa o nula; en otras
palabras, la muestra no contiene información suficiente para
diferenciar claramente entre las medias de ambos tipos de
poblaciones. Por tanto no se ha detectado diferencias claras
entre ambos promedios, así que la decisión más prudente es
aceptar que ninguna de las medias poblacionales ha
demostrado ser superior a la otra.
Ejemplo
Se lleva a cabo un experimento en que se
comparan dos tipos de motores, A y B. Se mide el
rendimiento en km por galón de gasolina. Se
realizan 50 experimentos con el motor tipo A y 75
con el motor tipo B. La gasolina que se utiliza y
las demás condiciones se mantienen constantes. El
rendimiento promedio de gasolina para el motor A
es de 36 km por galón y el promedio para el motor
B es 42 km por galón. Encuentra un intervalo de
confianza de 96% sobre la diferencia promedio
real para los motores A y B. Supón que las
desviaciones estándar poblacionales son 6 y 8 para
los motores A y B respectivamente.
Propuesta de solución:
Es deseable que la diferencia de medias sea positiva
por lo que se recomienda restar la media mayor
menos la media menor. En este caso será la media
del motor B menos la media del motor A.
El valor de z para un nivel de confianza del 96% es
de 2,05.
3,43 < µB - µA< 8,57
Respuesta.
Con un nivel de confianza del 96% la
diferencia del rendimiento promedio está
entre 3,43 y 8,57 km por galón a favor del
motor B. Esto quiere decir que el motor B da
mejor rendimiento promedio que el motor A,
debido a que los dos valores del intervalo son
positivos (µB - µA siempre es mayor que cero)
Tamaño de la muestra para estimar la diferencia de medias
poblacionales
El error está dado por:
2
2
Z
n
e 1 2
n 1 2
Tamaño de la muestra para estimar la diferencia de medias
poblacionales…
a) Los tamaños de muestra son iguales.
Se eleva al cuadrado la ecuación y se despeja
n ya que n1 es igual a n2.
z ( ) 2 2
n
2
1 2
2
e
b) Los tamaños de muestra son diferentes
En éste caso se pondrá una n en función de la otra. Se
utiliza cuando las poblaciones son de diferente tamaño
y se sabe que una población es K veces mayor que la
otra, n1 = kn2.
z ( k )
2 2 2
n
2
1
2
2
ke
Ejemplo
El gerente de Joo Lee Loo SA quiere comparar la
efectividad de dos métodos de entrenamiento para
sus trabajadores a fin de efectuar cierta operación
de montaje.
Se divide el número de operarios en dos grupos
iguales: el primero recibe el método de
entrenamiento 1, y el segundo, el método 2. Cada
grupo realizará la operación de montaje y se
registrará el tiempo de trabajo.
Se espera que las mediciones para ambos grupos
tengan una desviación estándar aproximada de dos
minutos.
Se desea que la estimación de la diferencia en
tiempo medio de montaje sea correcta hasta por un
minuto, con una probabilidad igual a 0,95
¿cuántos trabajadores se tienen que incluir en cada
grupo de entrenamiento?
Solución
Cada grupo debe tener mínimo 31 personas.
Distribución muestral de diferencia de proporciones
Muchas aplicaciones involucran poblaciones de
datos cualitativos que deben compararse utilizando
proporciones o porcentajes. Ejemplos:
• Administración.- ¿Hay diferencia entre los
porcentajes de hombres y mujeres en posiciones
gerenciales?.
• Ingeniería.- ¿Existe diferencia entre la proporción
de artículos defectuosos que genera la máquina A
de los que genera la máquina B?
Distribución muestral de diferencia de proporciones...
Cuando el muestreo procede de dos
poblaciones binomiales y se trabaja con dos
proporciones muestrales, la distribución
muestral de diferencia de proporciones es
aproximadamente normal para tamaños de
muestra grande (n1p1 > 5, n1q1 > 5, n2p2 > 5
y n2q2 > 5). Entonces p1 y p2 tienen
distribuciones muestrales aproximadamente
normales, así que su diferencia p1 - p2
también tiene una distribución muestral
aproximadamente normal.
Estimación de la diferencia de dos proporciones
poblacionales
( p1 p2 ) ( P1 P2 )
z
p1 * q1 p2 * q2
n1 n2
Ejemplo
Se considera cierto cambio en un proceso de
fabricación de partes componentes. Se toman
muestras del procedimiento vigente y del nuevo
para determinar si éste tiene como resultado una
mejoría. Si se encuentra que 75 de 1500 artículos
del procedimiento actual son defectuosos y 80 de
2000 artículos del procedimiento nuevo también lo
son, encuentra un intervalo de confianza de 90%
para la diferencia real en la fracción de
defectuosos entre el proceso actual y el nuevo.
Propuesta de solución:
Sean P1 y P2 las proporciones reales de
defectuosos para los procesos actual y nuevo,
respectivamente.
p1 = 75/1500 = 0,05 y p2 = 80/2000 = 0,04
Z para un nivel de confianza del 90% es de
1,645.
.
- 0,0017 < P1 - P2 < 0,0217
Respuesta:
Como el intervalo contiene el valor de cero, no hay
razón para creer que el nuevo procedimiento producirá
una disminución significativa en la proporción de
artículos defectuosos comparado con el método
existente. (P1 - P2 puede ser mayor o menor que cero)
Tamaño de muestra para diferencia de proporciones
La compañía de productos alimenticios La Buena
Muerte contrató a una empresa de investigación de
mercadotecnia para muestrear dos mercados, I y
II, a fin de comparar las proporciones de
consumidores que prefieren la comida congelada
de la compañía con los productos de sus
competidores.
No hay información previa acerca de la magnitud
de las proporciones P1 y P2. Se quiere estimar la
diferencia con un error máximo de 0,04; con una
probabilidad de 0,95 ¿cuántos consumidores habrá
que muestrear en cada mercado?
Solución:
Se tendrá que realizar encuestas a 1201
consumidores de cada mercado para tener una
estimación con una confianza del 95% y un
error máximo de 0,04.
Intervalo de confianza para la varianza
Población N ( , )
21 n 2
Estimador : s*
n
1 i1 ( xi x )
(n 1)s2 2
Sesabe *
2
n1
Intervalo de confianza:
(n 1)s 2
(n 1)s 2
*
2 *
2
n1; / 2
2
n1;1 / 2
Ejemplo. El número de ventas realizadas durante
10 días del vendedor Zacarías presenta una
varianza de 9. Establece un intervalo de confianza
para la varianza poblacional al 0,90.
Datos: 9(9) 9(9)
P 2 0.90
S2 =9 16,919 3,325
n = 10
= 0,10
P4.7875 2 24,3609 0.90
INTERPRETACION: Hay 0,90 de confianza que el
intervalo hallado se encuentre dentro del grupo de
intervalos que contienen a la verdadera varianza
poblacional.
Ejemplo. Supón que se toma una muestra de 27 focos de luz y
que S2 = 98 horas. Si se supone que la duración de esos focos
sigue una distribución normal, establecer un intervalo con el
90% de confianza para la desviación estándar poblacional de
la duración de esos focos.
Reemplazando en la ecuación:
Intervalo de confianza para la razón de dos varianzas
(Poblaciones normales)
Ejemplo. El fabricante de automóviles You Too pone a prueba dos
nuevos métodos de ensamblaje de motores respecto al tiempo en
minutos. Los resultados se muestran en la tabla siguiente:
Método 1 Método 2
n1 = 31 n2 = 25
s1 2 = 50 s2 2 = 24
2 2
Construye un intervalo de confianza del 90% para 1 / 2 .
Propuesta de solución:
Por la recomendación de que la varianza muestral mayor va en el
numerador se tiene la siguiente fórmula:
al despejar:
F toma dos valores dependiendo del nivel de confianza y de los
grados de libertad. En este caso los grados de libertad uno valen 30 y
los grados de libertad dos 24.
La interpretación podría ser:
Con un nivel de confianza del 90% se sabe que la relación de
2 2
varianzas 1 / 2 está entre 1,07 y 3,93. Esto supondría que la
varianza de la población 1 es mayor a la varianza de la población 2
entre 1,07 y 3,93.