UNIVERSIDAD SANTO TOMAS
ASIGNATURA: ESTADÍSTICA APLICADA A LAS CIENCIAS DE LA SALUD
CONTENIDO: INTERVALOS DE CONFIANZA, LA MEDIA Y LA
PROPORCIÓN.
PROFESOR: CARLOS FLORES CARVAJAL.
Estimación
La estimación de parámetros tiene por finalidad asignar valores a los parámetros
poblacionales a partir de los estadísticos obtenidos en las muestras. Dicho de otra manera,
la finalidad de la estimación de parámetros es caracterizar las poblaciones a partir de la
información de las muestras (por ejemplo, inferir el valor de la Media de la población a
partir de los datos de la muestra).
Estimación Puntual
La estimación puntual consiste en atribuir un valor (la estimación) al parámetro
poblacional. Si la muestra es representativa de la población, podemos esperar que los
estadísticos calculados en las muestras tengan valores semejantes a los parámetros
poblacionales, y la estimación consiste en asignar los valores de los estadísticos muestrales
a los parámetros poblacionales. Los estadísticos con que obtenemos las estimaciones se
denominan estimadores.
Estimación por intervalos
La estimación por intervalos consiste en establecer el intervalo de valores donde es más
probable se encuentre el parámetro. La obtención del intervalo se basa en las siguientes
consideraciones:
a) Si conocemos la distribución muestral del estimador podemos obtener las probabilidades
de ocurrencia de los estadísticos muestrales.
b) Si conociéramos el valor del parámetro poblacional, podríamos establecer la
probabilidad de que el estimador se halle dentro de los intervalos de la distribución
muestral.
c) El problema es que el parámetro poblacional es desconocido, y por ello el intervalo se
establece alrededor del estimador. Si repetimos el muestreo un gran número de veces y
definimos un intervalo alrededor de cada valor del estadístico muestral, el parámetro se
sitúa dentro de cada intervalo en un porcentaje conocido de ocasiones. Este intervalo es
denominado "intervalo de confianza".
Concepto de Intervalo de Confianza.
Conceptos claves
1. Un intervalo de confianza aporta más información que un estimador puntual cuando se
quiere hacer inferencias sobre parámetros poblacionales.
2. Existen intervalos de confianza, bilaterales y unilaterales.
3. La amplitud de un intervalo de confianza está determinado por: el nivel de confianza
establecido; la variabilidad de los datos; el tamaño de la muestra.
4. En un estudio Caso-Control o uno de Cohorte, es posible (y frecuentemente deseable)
construir intervalos de confianza para Odds Ratios y Riesgos Relativos.
5. Un intervalo de confianza permite verificar hipótesis planteadas acerca de parámetros
poblacionales.
En el contexto de estimar un parámetro poblacional, un intervalo de confianza es un rango
de valores (calculado en una muestra) en el cual se encuentra el verdadero valor del
parámetro, con una probabilidad determinada. La probabilidad de que el verdadero valor
del parámetro se encuentre en el intervalo construido se denomina nivel de confianza, y se
denota 1- α. La probabilidad de equivocarnos se llama nivel de significancia y se simboliza.
α Generalmente se construyen intervalos con confianza 1- α =95% (o significancia =5%).
Menos frecuentes son los intervalos con =10% o =1%.
INTERVALOS DE CONFIANZA PARA MEDIA UTILIZANDO LA
DISTRIBUCIÓN NORMAL.
FORMULA:
x σ
± Z σX Con desviación estándar poblacional X=
σ
√n
Error estándar.
σ
X=
σ
√
√ n N −1
N −n
Error estándar con factor de corrección.
x s
± Z sX Con desviación estándar muestral X=
s
√n
Error estándar
s s N−n Error estándar con factor de corrección
X= √
√n N−1
NOTA: Se utiliza cuando:
1.- Cuando el tamaño de la muestra es mayor o igual a 30.
2.- Cuando el tamaño de la muestra es menor que 30 y me dan la desviación estándar
poblacional.
Ejemplo.
En una semana determinada, se elige al azar una muestra de 300 trabajadores de un número
muy grande de ellos que trabajan en una empresa manufacturera. Los trabajadores realizan
una labor mecánica y se encuentra que el promedio de pago por pieza es de x= U$ 1800,
con una desviación estándar muestral de s = U$ 140. Se estima que el pago promedio para
todos los empleados de la empresa, con una estimación por intervalo que permita tener una
confianza del 95% de que este intervalo incluya el valor de la media poblacional es:
Solución
n = 300 x = 1800 promedio s = 140 α= 95% = 1,96
s 140
X=
s
= = 8.0829
√n √300
x ± Z s X = 1800 ± 1.96 * 8.0829
1800 - 1.96 * 8.0829 = 1784,16
1800 + 1.96 * 8.0829 = 1815,84
Intervalo {1784,16 ≤ µ ≤ 1815,84}.
Puede afirmarse que el pago promedio para todos los empleados se encuentra entre
U$1784,16 y U$1815,84 con un grado de confianza del 95% en esa estimación.
Con factor de corrección.
En una semana determinada, se elige al azar una muestra de 300 empleados de un número
de 700 que trabajan en una empresa manufacturera. Los trabajadores realizan una labor
mecánica y se encuentra que el promedio de pago por pieza es de x= U$ 1800, con una
desviación estándar muestral de s = U$ 140. Se estima que el pago promedio para todos los
empleados de la empresa, con una estimación por intervalo que permita tener una confianza
del 95% de que este intervalo incluya el valor de la media poblacional es:
Solución
n= 300 N= 700 x = 1800 promedio S = 140 300/700 = 0,43 * 100 = 43%
s
X=
s
√
√n N−1
N−n
=
140
√300 √
700−
300
700
−1 √
700−300
700−1
400
=√ 699 =√ 0 , 57=0 ,75
x ± Z s X = 1800 ± 1.96 *8,0829 * 0,75
1800 - 1.96 * 6,11 = 1788,02
1800 + 1.96 * 6,11 = 1811,97
Intervalo {1788,02 ≤ µ ≤ 1811,45}.
Puede afirmarse que el pago promedio para todos los empleados se encuentra entre
U$1788,02 y U$1811,45 con un grado de confianza del 95% en esa estimación
INTERVALOS DE CONFIANZA PARA MEDIA UTILIZANDO LA t DE STUDENT
FORMULA:
x ± t gl s X s s
Con desviación estándar muestral X=
√n
Error estándar
s s N−n Error estándar con factor de corrección
X= √
√n N−1
Cuando se muestrea a partir de una población finita, se debe incluir un factor de corrección
por población finita. Como regla general, la operación es despreciable y puede omitirse
cuando n ≤ 0,05, es decir cuando el tamaño de la muestra es menos del 5% del tamaño de la
población
NOTA: Se utiliza cuando el tamaño de la muestra es menor que 30 y me dan la desviación
estándar muestral.
EJEMPLO.
Construir un intervalo de confianza del 95% para estimar la vida útil de una marca
especifica de microscopios, suponiendo que la vida útil de todos los microscopios tiene
distribución aproximadamente normal y con una desviación estándar de la muestra de 500
horas y suponiendo una muestra de n=15, con una media muestral de 8900 horas,
Solución
α= 95% S = 500 horas n = 15 Uso de Tabla
x ± t gl s X s s
X=
√n
1 – α = 1 – 0.95 = 0,05 GL = n -1= 15 – 1 = 14
500
8900 ± 2.145 *
√15
8900± 2,145* 129,09
8900 – 276,89 = 8623
8900 + 276.89 = 9177.
Intervalo {8623 ≤ µ ≤9177}.
Puede afirmarse que la vida útil de una marca específica de microscopios se encuentra entre
8623 y 9177 horas, con un grado de confianza del 95% en esa estimación
INTERVALOS DE CONFIANZA PARA LA PROPORCIÓN UTILIZANDO LA
DISTRIBUCIÓN NORMAL
En este caso, interesa construir un intervalo de confianza para una proporción o un
porcentaje poblacional (por ejemplo, el porcentaje de personas con hipertensión,
fumadoras, etc.) Si el tamaño muestral n es grande, el Teorema Central del Límite nos
asegura que:
FORMULA:
s N −n
P ± Z Sp p=√
p (1− p) Error estándar Factor de corrección √
n N −1
Cuando se muestrea a partir de una población finita, se debe incluir un factor de corrección
por población finita. Como regla general, la operación es despreciable y puede omitirse
cuando n ≤ 0,05, es decir cuando el tamaño de la muestra es menos del 5% del tamaño de la
población
NOTA: Se utiliza para tamaño de muestras grandes mayores de 30.
EJEMPLO.
Una empresa de investigación de mercado entrevista a una muestra aleatoria de 100
mujeres de una comuna grande y encuentra que una proporción muestral de 0,40 de ellas
prefieren los bluyines fabricados por la empresa cliente de los investigadores y no de las
demás marcas. El intervalo de confianza del 95% para la proporción de todas las mujeres de
esa comuna que prefieren los bluyines, de la marca cliente de los investigadores se
determina de la siguiente manera.
Datos: n = 100 p = 0,40 α= 95% = 1.96
s = √(0.40)(0.60)/100 = 0,05
P ± Z Sp p=√
p (1− p)
n
0.40± 1,96 (0,05)
0.40 – 0.098 = 0.302 0.40 + 0.098 = 0.498
Intervalo {0.302 ≤ π ≤ 0.498}.
Por lo tanto, puede estimarse con una confianza del 95% que la proporción de
mujeres de esa comuna que prefieren los bluyines de la empresa está ente 0.302 y
0,498.