Epidemiología y Bioestadística
Tamaño de muestra y elementos de muestreo
Rodrigo Villegas, MSc PhD
Programa de Bioestadística
Escuela de Salud Pública
Universidad de Chile
Cálculo del
tamaño muestral
Al diseñar un estudio usualmente nos enfrentamos a la pregunta
siguiente:
¿Cuántos individuos (n) debo elegir para estimar un parámetro de
interés (media, proporción o varianza)?
Cálculo del
tamaño muestral
Anteriormente se mostró como construir intervalos de confianza para
parámetros como una media o proporción.
Por ejemplo, un intervalo de confianza del 95% para estimar la media
poblacional µ, viene dado por:
Luego, usando la expresión anterior se puede derivar una expresión
para conocer cuantos individuos se deben elegir para estimar una
media poblacional µ.
Tamaño de muestra para estimar
la media de una población
Luego, el tamaño de muestra para estimar una media es,
Ejemplo: ¿Cuántos individuos se necesitan para estimar la edad
promedio de una población cuya desviación estándar es de 10 años,
presumiendo un error máximo (e) de 1 año y una confianza del 95%?
Tamaño de muestra para estimar
la media de una población
Ejemplo: Se requiere estudiar los niveles de hemoglobina en sangre en
una población. Se desea estimar el valor promedio de esta variable con
un nivel de confianza de 95% y un error de estimación no mayor a 0,5.
Como se desconoce la desviación estándar de la población, se tomó una
muestra piloto de 10 personas y se obtuvo s = 2,65 g/dl.
Nivel de confianza 95% = 0,05 1 - /2 = 0,975 z0.975 = 1,96
d = 0,5
s = 2,65
Solución:
Tamaño de muestra para estimar
la proporción de una población
El tamaño de muestra para estimar una proporción (P) es,
Ejemplo: ¿Cuántos individuos se necesitan para estimar la proporción
de personas con diabetes desde una población de 10.000 personas? Un
estudio piloto estimó que esta proporción es de 20%. Si el error máximo
es de 0,05 y la confianza de 95%, el n necesario es:
∗ , ∗ , ∗( , )
personas
∗ , , ∗ , ∗( , )
Tamaño de muestra para estimar
la proporción de una población
Si en la expresión anterior se desconoce el tamaño
de la población (N), entonces, la fórmula se resume
a,
Tamaño de muestra para estimar
la proporción de una población
Ejemplo: Se desea estimar la proporción o porcentaje de sujetos
portadores del virus de la hepatitis A en una determinada
población que estuvo expuesta a ese virus. Determinar el tamaño
de muestra necesario para estimar dicha proporción con un nivel
de confianza de 95% y una precisión de 0,05, si se sabe que la
proporción es aproximadamente 0,3.
p = 0,3 1- p = 0,7
Nivel de confianza 95% = 0,05 1 - /2 = 0,975 z0.975 =
1,96
e = 0,05
Solución:
Factores que afectan el
tamaño muestral
• El tamaño muestral aumenta a medida que
aumenta .
• El tamaño muestral aumenta a medida que el
nivel de significación disminuye.
• El tamaño muestral aumenta a medida que la
potencia se hace mayor.
Elementos de muestreo
Introducción
Las razones que limitan la medición en todos los
sujetos de la población podría deberse:
• Severas limitaciones de recursos económicos y de
tiempo
• Escaso recurso humano calificado para realizar las
observaciones u obtención de las mediciones
• Dificultades geográficas y logísticas.
Población o Universo
Población: conjunto de individuos que guardan
similitud entre sí en los aspectos que son relevantes
para los objetivos de la investigación.
Ejemplo: En un estudio sobre diabetes mellitus tipo 2,
la población es el conjunto de sujetos diabéticos que
tienen las características comunes que definen a este
tipo de enfermedad en relación con la edad y forma de
presentación.
Muestra
La muestra es un subconjunto de la población o
conjunto de unidades de análisis, que permite inferir,
estimar o extrapolar los resultados de la observación y
medición a la población total.
El elemento básico de estudio es la unidad de análisis
que es aquella unidad para la cual se desea obtener la
información.
Ejemplo: personas, hospitales, etc.
Muestreo
El muestreo es una herramienta de la investigación
científica, cuya función básica es determinar que parte
de una población debe examinarse, con la finalidad de
hacer inferencias sobre dicha población:
estimador parámetro
Ej.
Estimador y parámetro
Un estimador es una cantidad numérica calculada sobre una
muestra y que esperamos que sea una buena aproximación de
cierta cantidad con el mismo significado en la población
(parámetro).
Representatividad
La muestra debe lograr una representación adecuada
de la población, en la que se reproduzca de la mejor
manera los rasgos esenciales de dicha población que
son importantes para la investigación.
Representatividad
La representatividad de una muestra, permite
extrapolar y por ende generalizar los resultados
observados en ésta, a la población accesible (conjunto
de sujetos que pertenecen a la población objetivo, que
están disponibles para la investigación); y a partir de
ésta, a la población objetivo.
Errores comunes
Los errores más comunes que se pueden cometer:
• Error de muestreo: hacer conclusiones muy
generales a partir de la observación de sólo una
parte de la Población.
• Error de inferencia: hacer conclusiones hacia una
Población mucho más grande de la que
originalmente se tomó la muestra.
Técnicas de muestro
Una muestra se puede obtener de 2 formas: probabilística y no
probabilística.
1. Las técnicas de muestreo probabilísticas, permiten conocer la
probabilidad de que cada individuo a estudiar sea incluido en
la muestra a través de una selección al azar.
2. En cambio, en las técnicas de muestreo de tipo no
probabilísticas, la selección de los sujetos a estudio
dependerá de ciertas características, criterios, etc. que los
investigadores consideren en ese momento.
Muestra probabilística vs. no
probabilística
En el muestreo de tipo probabilístico se conoce de
antemano la probabilidad de cada elemento de la
muestra y existe una seleccioón aleatoria.
Tipos de muestreo
probabilísticos
En el muestreo probabilístico se identifican los
siguientes tipos o diseños:
1) Muestreo Aleatorio Simple
2) Muestreo Estratificado
3) Muestreo Conglomerados
Muestro aleatorio
simple
Aleatorio simple:
Se elige al azar un número determinado de individuos
desde un marco muestral (listado).
La selección al azar se puede hacer por sorteo
(lotería) o usando una tabla de número aleatorios.
Muestreo
Estratificado
Se determinan los estratos que conforman la
población para seleccionar y extraer de ellos la
muestra (los estratos son subgrupos de unidades de
análisis que difieren en las características que van a
ser analizadas).
aleatorio simple
Muestreo por
conglomerados
Consiste en elegir de forma aleatoria ciertos barrios o conglomerados
dentro de una región, ciudad, comuna, etc., para luego elegir unidades
más pequeñas como cuadras, calles, etc. y finalmente otras más
pequeñas, como escuelas, consultorios, hogares (una vez elegido esta
unidad, se aplica el instrumento de medición a todos sus integrantes).
Muestreo no
probabilístico
1. Intencional
Permite seleccionar casos característicos de una
población limitando la muestra sólo a estos casos. Se
utiliza en escenarios en las que la población es muy
variable y por consiguiente la muestra es muy
pequeña.
Muestreo
no probabilístico
2. Por conveniencia
Permite seleccionar aquellos casos accesibles que
acepten ser incluidos. Esto, fundamentado en la
conveniente accesibilidad y proximidad de los sujetos
para el investigador.
Ventajas y desventajas
de cada diseño
Muestreo Aleatorio Simple
Ventajas
• Sencillo y de fácil comprensión.
• Cálculo rápido de medias y varianzas.
• Se basa en la teoría estadística.
Desventajas
• Requiere listado completo de toda la población.
• Al trabajar con muestras pequeñas puede no
representar de forma adecuada a la población.
Ventajas y desventajas
de cada técnica
Muestreo Aleatorio Estratificado
Ventajas
• Tiende a asegurar que la muestra represente adecuadamente
a la población en función de variables seleccionadas.
• Se obtienen estimaciones más precisas.
• Su objetivo es conseguir una muestra lo más semejante a la
población en relación a las variables estratificadoras.
Desventaja
Se ha de conocer la distribución en la población de las variables
utilizadas para la estratificación.
Ventajas y desventajas
de cada técnica
Muestreo Aleatorio por Conglomerados
Ventajas
• Eficiente en poblaciones grandes y dispersas.
• Es preciso tener un listado de las unidades primarias de
muestreo.
Desventajas
• El error estándar es mayor que en otros tipos de muestreo.
• El cálculo del error estándar es complejo.
Ventajas en general
Reducción de costos
Los costos de un estudio serán menores si los datos
de interés se pueden obtener a partir de una muestra
de la población objetivo.
Por ejemplo, cuando se realizan estudios de
prevalencia de un evento de interés, es más
económico medir una muestra representativa de 1500
sujetos de la población objetivo, que a los 250.000
individuos que la componen.
Bibliografía:
• Capítulo 7 del texto “Bioestadística Amigable”