Bioest 01-2011
Bioest 01-2011
INTRODUCCION Y
CONCEPTOS GENERALES
DEFINICION
DEFINICION
ESTADÍSTICA
- Recolección de datos.
- Organización datos.
- Procesamiento información.
- Interpretar
Cuando se registran
características
(medición, observación,
conteo).
¿Cuándo se ORGANIZAN datos ?
30 - 34 6
35 - 39 12
40 - 44 8
45 - 49 2
Diagrama Circular
¿ Cuándo se ANALIZAN datos ?
Cuando se calculan
promedios y medidas
de variabilidad y
cuando se establecen
relaciones entre ellas
(regresión y correlación).
¿ Cuándo se INTERPRETAN datos ?
Cuando se le otorga un
sentido práctico a los
resultados obtenidos en el
análisis
TIPOS DE ESTADISTICA
METODOS DEL CONOCIMIENTO
DEDUCCIO
N
INDUCCION
INFERENCIA
DEFINICIONES
2. POBLACION: Es el conjunto total de características de interés del estudio de todos los individuos del
marco poblacional.
10. CLASES: conjunto de variables (intervalos) en el que se verifica que cada modalidad (variable) pertenece
a una y sólo una de las clases.
MARCO
POBLACIONAL POBLACION VALORES
04 edades 04 valores
04 individuos
Enfer.
Característica Edad Peso Anteriores Estado Civil
Característica
Registro
POBLACIÓN
POBLACIÓN POBLACIÓN POBLACIÓN
de la
carac-
terística.
P1 P2 P3 ... Pn
Muestr
a
• Registro de una característica en todos los
elementos del marco muestral.
muestral.
Edad Peso Enf. Ant. Estado civil MUESTRA MUESTRA MUESTRA MUESTRA
m1 m2 m3 mn
75 datos
Registro
POBLACIÓN
POBLACIÓN POBLACIÓN POBLACIÓN
de la
carac-
terística.
P1 P2 P3 ... Pn
Parámetro y Estimador
(Estadístico)
Parámetro: Valor representativo de una
población. Se simboliza por letras griegas.
Sólo hay un parámetro en cada población.
Media poblacional
2 Varianza poblacional
Desviación estándar poblacional
Proporción poblacional
Estimador (Estadístico): Valor
representativo de una muestra. Se
simboliza por letras latinas.
s2 Varianza muestra.
p Proporción muestral.
n1
x1
n2 x2
POBLACIÓN
n3
x3
. .
. .
nm
xm
PARÁMETRO ESTIMADOR
Ejemplo:
CONSTANTE: Si el registro de la
característica toma un sólo valor en
todas las unidades elementales.
Ejemplo:
Ejemplo:
Ejemplo:
CONTÍNUAS
NUMÉRICAS
cuantitativas
DISCRETAS
VARIABLES
DICOTOMICAS
CATEGORICAS ORDINALES
cualitativas
NOMINALES
ESCALAS DE MEDIDA O MEDICION:
DEFINICION
Ejemplo
Ejemplo:
Ejemplo:
Año 0
Hora 00:00
Temperatura 0ºC
d) Escala de coeficientes o Razones:
Ejemplo:
Ingreso mensual : S/.00.
Nº de hijos : 0
Procesos deficientes : 0
Ejercicio Aplicativo 1
En un programa para la detección de hipertensión en una muestra de 30
hombres en edades entre 30 y 40 años, la distribución de la presión
diastólica (mínima) en mm Hg fue la siguiente:
70 85 85 75 65 90 110 95 90 70
60 75 80 120 85 95 90 70 100 65
80 90 95 90 95 110 100 85 80 75
Un dato registrado : 32
PRESENTACION DE
DATOS
EFECTUADA LA RECOLECCION DE DATOS, ESTOS DEBEN
SEGUIR LOS SIGUIENTES PASOS:
1) DESCRIPCION
2) ANALISIS
3) GENERALIZACION
• TABULAR
• GRAFICA
• RESUMEN NUMERICO
PARTES DE UNA TABLA
TITULO
TALON
CUERPO
NOTAS EXPLICATIVAS
TITULO
TALON
CUERPO
NOTAS EXPLICATIVAS
TABLAS ESTADISTICAS
80 80 85 85 85 85 90 90 90 90
En este caso , entonces, la tabla de frecuencias tendrá aprox. 6 clases de amplitud 10 unidades
en cada clase.
TABLA DE FRECUENCIAS
70 - 79 6 0.2 9 0.3
80 - 89 7 0.23 16 0.53
90 - 99 9 0.3 25 0.83
total 30 1.0
TIPOS DE
GRÁFICOS
PARTES DE UN GRAFICO
TITULO
ESCALAS
GRAFICO PROPIAMENTE DICHO
NOTAS EXPLICATIVAS
GRAFICO PROPIAMENTE
DICHO
NOTAS EXPLICATIVAS
Gráficos de barra
CARGO
Se utilizan para representar OPERARIO GENERAL
variables de tipo
OPERADOR DE MAQUINA
AUTOMATICA
DESPACHADOR DE PRODUCTO
cualitativa, por lo general TERMINADO LOCAL
OPERADOR DE DOBLE FILO
de nivel nominal. OPERARIO GENERAL
OPERADOR DE DOBLE FILO
CARGO Frec
10
haberse resumido previamente en AUTOMATICA
DESPACHADOR DE PRODUCTO
una tabla de frecuencias... TERMINADO LOCAL
8
160
145
140
120
Núm ero de operarios
100
80
60
40
20 10 12
8 5
4 1
0
OP ERARIO GENERAL OP ERADOR DE MAQUINA DES P ACHADOR DE OP ERADOR DE DOBLE OP ERADOR DE MAQUINA OP ERADOR DE S ERVICIOS OP ERADOR GRAL.
AUTOMATICA P RODUCTO TERMINADO FILO ST GENERALES ALMACEN MATERIA
LOCAL P RIMA YP RODUCTOS
TERMINADOS
Tipo de operario
160
145
140
100
frecuencia hacia la
80
izquierda y los de
60
menor frecuencia a
40 la derecha
20 12 10 8 5 4 1
0
OP ERARIO GENERAL OP ERADOR DE MAQUINA OP ERADOR DE MAQUINA DES P ACHADOR DE OP ERADOR GRAL. OP ERADOR DE DOBLE OP ERADOR DE S ERVICIOS
ST AUTOMATICA P RODUCTO TERMINADO ALMACEN MATERIA FILO GENERALES
LOCAL P RIMA YP RODUCTOS
TERMINADOS
Tipo de operario
Gráficos circulares
1%
2%
3%
4%
OPERARIO GENERAL
5%
OPERADOR DE MAQUINA ST
6%
OPERADOR DE MAQUINA AUTOMATICA
Pictogramas
Fáciles de entender.
Cada modalidad debe
ser proporcional a la
frecuencia.
Gráficos para variables cuantitativas
DISCRETAS Ejemplo de variable
discreta
GRAFICO DE GRAFICO INTEGRAL
BARRAS Se lanzan tres monedas al aire
en 8 ocasiones y se contabiliza el
número de caras, X,
obteniéndose los siguientes
resultados:
2,1,0,1,3,2,1,2
Representar gráficamente el
resultado.
máximo 16,61
mínimo 10,92
rango 5,69
épsilon 0,0569 % 1
n 203 Resultado Evaluación
k 8,67 Sturges 9
h 0,64 70
60
Frecuencia
50
Operadores
10,89
40
11,53 1
30
12,17 8
12,81 13 20
13,45 37 10
14,08 53 0
14,72 46 10,89 11,55 12,22 12,88 13,54 14,21 14,87 15,53 16,20
15,36 24
Salarios en miles de Bs.
16,00 17
16,64 4
Polígonos de frecuencia
40
30
20
10
0
11,21 11,85 12,49 13,13 13,77 14,40 15,04 15,68 16,32
No es un gráfico muy difundido
Salarios en miles de Bs. a pesar de sus ventajas sobre
el histograma.
Ojiva
Resultado Evaluación
1,2
1
Operadores
0,8
0,6
0,4
0,2
0
11,53 12,17 12,81 13,45 14,08 14,72 15,36 16,00 16,64
Salarios en miles de Bs.
Cuartil 1 Cuartil 3
máximo
mínimo
mediana
• Si la mediana está muy cerca del Q1, se dice que existe un sesgo
positivo.
• Si la mediana está muy cerca del Q3, se dice que existe un sesgo
negativo
Q1 Q2 Q3 Q1 Q2 Q3 Q1 Q2 Q3
(M) (M) (M)
- +
Distintos diagramas de
dispersión
Diagrama de Tallos y Hojas
8.000
7.500
7.000
GWh
6.500
6.000
5.500
5.000
1 3 5 7 9 11 13 15 17 19 21 23 25 27 29 31 33 35
Meses
.
. . . .
. .. . . .
. . . . . . .
. . . . .
. .. . . .. . .
. . . . . . .. .
MTC . . .. .
.. . . . . .
.. .
.. . .
(A) Las medidas de tendencia central
Aritmética
Media Geométrica
Medidas de Mediana Armónica
tendencia central Moda
1. LA MEDIA
La media aritmética ( x )
x = 10 reclamos
C) Simbología:
Tamaño Media aritmética
Muestra n
x
Población N (mu)
MEDIA ARITMETICA DE SERIES AGRUPADAS
Ejemplo:
La distribución de frecuencias siguiente, representa los
puntajes obtenidos en una evaluación del desempeño,
aplicado al personal técnico de una clínica. El puntaje máximo
en la prueba es 50. Calcule e interprete su media.
Desempeño Número de
(puntos) técnicos
12 - 16 4
17 - 21 8
22 - 26 15
27 - 31 23
32 - 36 10
TOTAL 60
Primero se calcularán las marcas de clase ( X ); es decir, el valor
intermedio de cada clase. i
Marca de Frecuencia
clase clase ( x ) absoluta (fi)
i
12 - 16 14 4
17 - 21 19 8
22 - 26 24 15
27 - 31 29 23
32 - 36 34 10
Total 60
14(4) + 19 (8) + 24 (15) + 29 (23) + 34 (10)
x 4 + 8 + 15 + 23 + 10
x 1575
60 x 26,25
Interpretación: si se elige al azar a un técnico, se espera que tenga
un puntaje de 26,25 en su evaluación de desempeño.
La media aritmética ponderada ( xp )
n
wi Xi donde:
i 1
xp n
wi wi = factor de
i 1
ponderación
Xi
= datos
Ejemplo: El Hospital del Callao atiende 2,800 consultas diarias, cobrando
tres tipos de tarifas: social, diferenciada y por convenio. El número de
pacientes y el valor de cada nivel tarifario se muestra a continuación.
Calcule e interprete la tarifa media por consulta.
x p 11,5 S / .11,50
1,0
Ventajas y desventajas de la media aritmética
Ventajas:
Concepto familiar para muchas personas
Es única para cada conjunto de datos
Es posible comparar medias de diferentes muestras
Desventajas
Se ve afectada por los datos extremos
Si la muestra es grande y los datos no están
xg n X1 X 2 X3 ... Xn
Otra aplicación de la media geométrica es determinar el porcentaje
promedio del incremento en ventas, producción u otros negocios
o series económicas de un periodo a otro, es decir, en los casos en los que
se supone que la variable presenta variaciones acumulativas.
b) Ventajas e inconvenientes:
- Es única.
Ejemplo:
Pacientes A B C D
Tiempo (minutos) 45 38 52 40
4 4
xh 1 1 1 1
1976 2340 1710 2223
45 38 52 40 88920
4 88920
xh 8249 43,117953 minutos
xh 43 minutos 7 segundos
b) Interpretación:
Si se selecciona al azar a uno de los cuatro
pacientes, se espera que realice la consulta con su
médico en 43 minutos aproximadamente.
Es la medida que divide en dos subconjuntos
iguales a datos, de tal manera que 50% de los
datos es menor a la mediana y el otro 50% es
mayor a la mediana.
mediana
b) Interpretación: Durante 5 días se atendieron a menos de 11
pacientes, y durante 5 días se atendieron a más de 11
pacientes.
c) Reglas
1º Si la serie es impar, la mediana ocupa el lugar central de la
serie previamente ordenada.
Ejemplo:
8, 10, 14, 18, 23, 24, 32, 34
18 23
mediana 20,5
2
n 1
3º Sea la serie par o impar, la mediana ocupa el lugar,
2
de la serie previamente ordenada.
d) Ventajas y desventajas de la mediana
Ventajas:
media aritmética.
Desventajas:
Como valor central, se debe ordenar primero la serie de datos.
Para una serie amplia de datos no agrupados, el proceso de
ordenamiento de los datos demanda tiempo y usualmente provoca
equivocaciones.
La moda es el valor que más se repite dentro de un conjunto de
datos.
a) Obtención: se obtiene organizando la serie de datos y
seleccionando el o los datos que más se repiten.
Ejemplo:
4, 5, 7, 8, 8 , 10, 12, 15
Kn
F 1 donde:
P L
100
c
P
K : percentil
K i f K : el percentil por calcular
P
K n : número de datos
F : frecuencia acumulativa
hasta la clase anterior a la
Experiencia Personal
(años) Médico
0-3 18
4-7 42
8 - 11 68
12 - 15 120
16 - 19 40
20 - 23 34
24 - 27 12
Total 334
¿Sobre cuántos años se ubica el 25% de los médicos de mayor
experiencia?
75 % 25 %
P75
Menor Mayor
Experiencia Experiencia
K = 75
Kn 75(334)
Lugar del P75 250,5 (de los números ordenados)
100 100
p80
1500 gr 4500 gr
3000 gr
ESTADISTICA DESCRIPTIVA II
ESTADISTICA SUMARIA O DE RESUMEN
(C) Medidas de Dispersión
donde:
R = (Ls - Li ) + 1
: Limite superior de la
L clase
última
s
: Limite inferior de la
L
primera clase
i
RANGO EN SERIE DE DATOS AGRUPADOS
Ejemplo:
La distribución de frecuencias siguiente representa el tiempo
que demora un paciente en obtener una cita en un hospital.
Calcule e interprete el rango
Ventajas
fácil de calcular
fácil de entender e interpretar
Desventajas
sólo considera los valores extremos
no toma en cuenta ni el número de datos ni el valor de
éstos
no es posible de calcular en tablas con extremos
abiertos.
2. EL RANGO INTERCUARTIL O ALCANCE INTERCUARTIL
RI Q3 Q1
Ejemplo:
Q1 Q3
Rango
Intercuartílico
25(334)
Lugar Q1 P25 83,5 se ubica en la 3ra clase
100
75(334)
Lugar Q3 P75 250,5o se ubica en la 5ta clase
100
A cada dato se le resta la Media Aritmética sin hacer caso de los signos
negativos (valor absoluto), y se divide luego por el número total de términos.
DM =
(Xi – X)
-----------
n
2
(X x ) i
para una muestra S i 1
n 1
N 2
(X )
para un población 2
i
i 1
N
Ejemplo:
La siguiente información se refiere al número de quejas recibidas en un
Centro Médico durante una semana. Calcule la varianza de 8, 10, 5, 12, 10,
15.
Elaboramos un cuadro de la forma siguiente
x Xi x X i x
2
8 8 - 10 = - 2 4
0 60
10 10 - 10 = 0
x
5 5 - 10 = - 5 25 6
12 12 - 10 = 2 4
10 10 - 10 = 0 0
15 15 - 10 = 5 25 x 10
X i x 0 Xi x 58
2
X 60
X i x 58
2
(X i x )
2
2
2 58
S n 1 S 11,6 quejas 2
6 1
5. La desviación estándar
Es la raíz cuadrada de la varianza, sea poblacional o muestral.
Para la muestra n 2
(X i x)
i 1
S s2
n 1
Para la población
N
(X i )
2
2 i 1
N
Ejemplo:
S 11,6 quejas 2
S 3,4 quejas
6. El coeficiente de variación ( de Pearson)
CV
s
100
Para la muestra: x
CV 100
Para la población:
Ejemplo:
40,70,60,48,52,65,58 70,35,150,140,82,110,140,120
x Xi x Xi x 2
40 -16,14 260,50
70 13,86 192,10
60 3,86 14,90
48 -8,14 66,26
52 -4,14 17,14
65 8,86 78,50
58 1,86 3,46
X 393 Xi x 0 Xi x
2
632,86
Si Xi x 632,86
2
n
2
( Xi x )
i 1 632,86
S 10,27
n 1 7 1
S
CV 100
x
10,27
CV 100 18,29
56,14
Farmacia II
n
Xi
i 1 847
x 105,87
n 8
x Xi x Xi x 2
70 -35,87 1286,6569
35 -70,87 5022,5569
150 44,13 1947,4569
140 34,13 1164,8569
82 -23,87 569,7769
110 4,13 17,0569
140 34,13 1164,8569
120 14,13 199,6569
S 40,30
CV 100 CV 100 30,06
x 105,87
140
300
200
120
200
100
100
80
100
Frecuencia
Frecuencia
Frecuencia
60
0 0
27 37 45 53 61 69 77 85 93 3 27 37 47 57 67 77 87 97 108
40
45 48 51 54 57 60 63 66 69 72 75 78 81 84 32 41 49 57 65 73 81 89 99 16 32 42 52 62 72 82 92 102 138
ESTADISTICA INFERENCIAL I:
TEORIA DE
PROBABILIDADES
CONCEPTOS PREVIOS
El concepto de probabilidad
nace con el deseo del
hombre de conocer con
certeza los eventos.
CLASICA o a priori
OBJETIVA
FRECUENCIA RELATIVA
PROBABILIDADES o a posteriori
SUBJETIVA o personalistica
CONCEPTOS BASICOS
(A) Experimento: Ejecución voluntaria de un fenómeno.
Se caracteriza por:
– Esta constituido por repeticiones independientes (Pruebas)
– tener varios resultados posibles
– existir incertidumbre sobre el resultado.
Ejemplos:
a) Lanzar una moneda
b) Seleccionar un frasco de un lote de medicamentos
c) Extraer una muestra de sangre a una persona
(B) Espacio Muestral: conjunto de todos los
resultados posibles de un experimento. Se simboliza
por (omega).
Ejemplos:
Ejemplos:
0 1
poco muy
verosímil verosímil
(1º) P() = 1
(2º) P( ) = 0
E E
Unión A B Intersección A B
(A o B) (A y B)
CUATRO TIPOS DE PROBABILIDAD
Compuesta o Conjunta
131
P( X ) P( X Y ) P( X Y ) P( X | Y )
La probabilidad La probabilidad La probabilidad La probabilidad
de que ocurra de que ocurra de que ocurra de que ocurra
X XoY XeY X sabiendo que
ha ocurrido Y
X X Y X Y
Y
A B
A B
a g
b c e h
f i
d
U
(A B)
6 5
U 11 = 9
P(AUB) = P(A) + P(B) - P (A B)
Ejemplo:
P(A) = 0,60 U
P(AUD) = P(A) + P(D)(A- P D)
P(D) = 0,50
U P(AUD) = 0,60 + 0,50 - 0,30
P(AUD) = 0,80
P (A D) = 0,30
(B) Regla de la Adición para eventos excluyentes
Por ejemplo:
(A B) =
U
Si :
Por lo tanto : U
P(A B) = 0
Ejemplo:
P(C) = 0,2
P(R) = 0,3 P(CUR) = P(C) + P(R)
= 0,2 0,3
P(CUR) = 0,5
(C) Regla de Multiplicación para procesos dependientes
(probabilidad condicional)
El evento A y el evento B son dependientes, es decir, la Probabilidad que
ocurra A esta relacionado a que “se de” el evento B o visceversa.
Evento esperado
P(A B)
A partir de P( A )
B P(B)
“dado que” condición
Se despeja
4
P(V1 )
50
P(V1 V2 ) P(V1 ) P(V2 )
V1
V2 3
P( )
V1 49
4 3 12
=
50 49 2450
(D) Regla de Multiplicación para procesos independientes
P (V1 ) 0,5
P (V2 ) 0,5
P (V1 V2 ) P (V1 ) P (V2 )
= (0,5) (0,5)
P (V1 V2 ) 0,25
Ejemplos de Probabilidad Condicional
comprobando:
12
P( R ) = 50
V 30
50
12
P( R )= 040
V 30
Aplicación:
P(TM TL )
P(TL ) = 0,50 P(TM ) =
TL P(TL )
P(TL TM ) = 0,20
0,20
= = 0,40
0,50
ESCOGIDA AL AZAR SEA UN AS
SABIENDO QUE ES ROJA?
Color
Palo Rojo Negro Total
As 2 2 4
No-As 24 24 48
Total 26 26 52
Espacio restringido
P ( As Rojo) 2 / 52 2
P ( As | Rojo)
P ( Rojo) 26 / 52 26
REGLA CASERA PARA RESOLVER
PROBLEMAS DE PROBABILIDAD
1. Identificar en el problema “la pregunta” para saber sobre que tipo de probabilidad se trata.
Si A 1, A 2 ,... , An son:
- Sucesos incompatibles 2 a 2.
- Y cuya unión es el espacio muestral (A1 U A2 U ... U An = E).
- Y B es otro suceso.
Resulta que:
148
…si ocurre B, podemos calcular la
probabilidad (a posteriori) de
B ocurrencia de cada Ai, (i = 1, 2, ... , n):
P(B Ai )
P(Ai|B)
A3 A4 P(B)
donde P(B) se puede calcular usando el teorema de la probabilidad
total: n
P ( B ) P ( B Ai )
i 1
RESÚMEN -¿Qué probabilidad
tengo de estar
enfermo?
• Al llegar un individuo a la consulta
tenemos una idea a priori sobre la - En principio un 20%.
Le haremos unas
probabilidad de que tenga una pruebas.
enfermedad.
- Distribución binomial
- Distribución de Poisson
- Distribución normal
- Distribución normal estándar o Z
- Distribución t
- Distribución Ji-cuadrada 2
- Distribución F
A. DISTRIBUCIONES DISCRETAS DE
PROBABILIDAD
(A) La distribución binomial (de Bernoulli)
Se utiliza para describir variables discretas que solo pueden tener dos
posibles
resultados (si/no, positivo/negativo).
a) Características:
• El experimento consiste en una serie de ensayos repetidos.
• Cada ensayo sólo tiene dos resultados posibles: éxito y fracaso.
• La probabilidad de éxito, designado por p es la misma para cada
ensayo, la probabilidad de fracaso q (igual a 1-p) es también constante.
• Los ensayos sucesivos son independientes.
• La información de la muestra se obtiene con reposición de una
población finita.
(B) Distribución de Poisson:
La distribución normal de
probabilidad es simétrica con
respecto a una línea vertical que
pase por la media
x
Z
Distribución
normal estándar
0
1
Aplicaciones: la clínica Santa Teresita de Cañete,
P(X>500)=0.5
Solución:
En la figura, podemos ver que la mitad del área
bajo la curva está localizada a ambos lados de la
media de 500 horas. Por lo tanto podemos deducir
que la probabilidad de que la variable aleatoria
tenga un valor mayor a 500 es el área sombreada,
es decir, 0,5.
Pregunta 2:¿Cuál es la probabilidad de que un participante elegido al azar
se tome entre 500 y 650 horas para completar el programa de
entrenamiento.
P(500 X Solución:
650)=0.4332 La gráfica muestra la respuesta como zona
sombreada, representada por el área entre la
media (500 horas) y el valor de X en el cual
estamos interesados (650 horas).
Estandarizando la variable tenemos un valor
para Z
x
Z
650 500
Z 1,50
100
Solución:
Estamos interesados en el área a la derecha de 700.
Estandarizamos
x
Z P(X >700)= 0,0228
700 500
Z 2
100
Por lo tanto hay un poco más de 2 oportunidades en 100 de que un participante elegido
al azar se lleve más de 700 horas en completar el curso.
Pregunta 4:Suponga que el director del programa desea saber la probabilidad de
que un participante escogido al azar requiera entre 550 y 650 horas para completar
el trabajo requerido en el programa.
x
Z
650 500 P(550 X
Z 1,5 650)
100
/ n
2. Una rata es colocada en una caja con tres pulsadores de colores rojo, azul y blanco. Si
pulsa dos veces las palancas al azar:
a)¿Cuál es la probabilidad de que las dos veces pulse la roja?
b)¿Cuál es la probabilidad de que pulse la primera vez o la segunda o ambas la tecla azul?
3. En una asignatura se ha decidido aprobar a aquellos que superen uno de los dos
parciales. Con este criterio aprobó el 80%, sabiendo que el primer parcial lo superó el 60%
y el segundo el 50%. ¿Cuál hubiese sido el porcentaje de aprobados, si se hubiese exigido
superar ambos parciales?
4. Un paciente ingresa a un Hospital. La probabilidad de que se atienda en odontologia es
30%, en medicina es de 40%, en ambos servicios es de 20% ¿Cuál es la probabilidad de que
se atienda en odontología o en medicina?
5. La probabilidad que un paciente tenga el grupo sanguineo AB es de 30% y
que tenga el grupo sanguineo O es 40% y que tenga el grupo sanguineo A es
50% ¿Cuál es la probabilidad de que un paciente cualquiera tenga grupo
sanguineo AB o A?
6. Se sabe que un grupo de 60 niños, hay 10 que no han cumplido con hacer
sus tareas, si se escojen al azar 02 niños, uno a continuación del otro (SIN
REEMPLAZO) ¿Cuál es la probabilidad que ambos no hayan hecho su tarea?.
Cultivo + Cultivo -
Ex. Clinico + 27 35 62
Ex. Clínico - 10 77 87
37 112
BIOESTADISTICA 6
TEORIA DE MUESTREO
TEORIA DEL MUESTREO
Diseño muestral es el
procedimiento especificado, antes
de colectar los datos, para obtener
una muestra de una población
dada.
Al diseñar una muestra, tener
presente:
• Representatividad
• Confiabilidad
• Costos
• Sesgos
Pasos:
2 2 donde:
Z
z : Valor tabular para un nivel de confianza
n
= e
2
: Varianza
e : error esperado
Aplicación
ALEATORIO SIMPLE
SISTEMÁTICO
PROBABILISTÍCO
ESTRATIFICADO
POR CONGLOMERADO
POLIETAPICO
MUESTREO
DE JUICIO
NO PROBABILÍSTICO DE CUOTAS
BOLA DE NIEVE
MUESTREO PROBABILISTICO
Por ejemplo, para un estudio de opinión, puede resultar interesante estudiar por
separado las opiniones de hombres y mujeres pues se estima que, dentro de cada
uno de estos grupos, puede haber cierta homogeneidad. Así, si la población está
compuesta de un 55% de mujeres y un 45% de hombres, se tomaría una muestra
que contenga también esa misma proporción.
ESTRATOS Homogéneos en su interior;
diferentes entre sí en propiedades y
tamaño
Comuna B
Comuna A
Comuna C
Comuna D
No se cumple la aleatoridad
Grupo 1A
Grupo 5C
Grupo 2A
Grupo 3B
Imprecisión Invalidez
ERRORES DE LA MEDICIÓN
Aumenta con:
Muestras pequeñas
Afectan la precisión
ERROR ALEATORIO O ERROR ESTANDAR
s1 s2
s4
s3
ERRORES DE LA MEDICIÓN
Sesgos o errores sistemáticos
Afectan la validez
Sesgo
•Sesgo de Selección
•Sesgo de Información
Tipos de sesgo de selección
• Sesgo Berksoniano – Puede haber una asociación
espuria entre enfermedades o entre una característica y
una enfermedad debido a las diferentes probabilidades de
admisión a un hospital para aquellos con la enfermedad,
sin la enfermedad pero con la característica de interés
PRUEBA DE HIPOTESIS
(CONTRASTE DE HIPOTESIS)
Bioestadistica 7
¿Qué es la prueba de hipotesis?
Es un
procedimiento
estadístico, una
herramienta de
análisis de datos
que permite
ACEPTAR o
RECHAZAR la
Hipótesis
estadística.
1. Establecer la hipótesis nula
• de investigación (generales o
específicas), las cuales
pueden responder en forma
amplia a las interrogantes
planteadas en el Marco
Teórico respecto al problema
en estudio;
Error de tipo I
La Prueba de El tratamiento no tiene
Hipotesis: efecto pero se decide que
sí.
Rechazo H0 Correcto
Probabilidad α
(aceptación de la H1)
ERROR DE TIPO I -
Es rechazar una hipótesis nula siendo verdadera
(GRAVE).
/2 /2
-z/2 z/2 Z
ERROR DE TIPO II - β
(1-)
La meta de las pruebas estadísticas es rechazar la
hipótesis nula.
si P<, H0 se rechaza.
No se rechaza
H0: =70
H0: =70
X 72
Significación: p
•Es la probabilidad que tendría una región crítica (alfa) que comenzase exactamente
en el valor del estadístico obtenido de la muestra.
•Es la probabilidad de tener una muestra que discrepe aún más que la nuestra de H 0.
•Es la probabilidad de que por puro azar obtengamos una muestra “más extraña” que
la obtenida.
•p es conocido después de realizar el experimento aleatorio
•El contraste es no significativo cuando p>alfa.
P
No se rechaza
H0: =70
P
X 72
Significación : p
X 85
Significación : p
El contraste es estadísticamente significativo cuando p<
Es decir, si el resultado experimental discrepa más de “lo tolerado” a priori.
P
X 85
Resumen: , p y criterio de rechazo
• Sobre • Sobre p
– Es número pequeño, – Es conocido tras
preelegido al diseñar realizar el experimento
el experimento
PRUEBAS DE
SIGNIFICACION
ESTADISTICA
TIPOS DE PRUEBAS DE SIGNIFICACION
ESTADISTICA
Las paramétricas
Las no paramétricas
Técnicas Paramétricas
Son más potentes que las no paramétricas y por consiguiente las
inferencias que se realizan son más fiables.
Técnicas No Paramétricas
Son fáciles de utilizar y no son tan potentes como las paramétricas.
1. Test de la t de Student.
2. ANOVA
3. t de Student apareada.
4. Correlación de Pearson.
5. Test de Friedman.
PRUEBAS NO PARAMETRICAS
• Chi cuadrado
• Test de Wilcoxon o del Rango con signo.
• Test de la U de Mann-Whitney.
• Test de Kruskal-Wallis.
• Coeficiente de correlación de spearman
• Test de Mc Nemar
¿Qué es la prueba “t” ?
• Definición:
Es una prueba estadística para evaluar si dos
grupos difieren entre sí de manera significativa
respecto a su medias.
Se simboliza por “ t ”
Hipótesis a probar:
De diferencia entre dos grupos. La hipóteisis de
investigación propone que los grupos difieren
significativamente entre sí y la hipótesis nula no
difiere significativamente
Tipos de pruebas t
• Prueba t para una muestra: prueba si la media de
la muestra de una variable difiere significativamente
de la media conocida de la población
Coeficiente de determinación: r 2.
Hipótesis a probar:
Correlacionalmente, del tipo : “A mayor X, mayor Y”;
”A mayor X, menor Y”, “Altos valores en X están asociados
con altos valores en Y”, “Altos valores en X se asocian con
bajos valores de Y”
Correlación
• Denota fuerza de relación entre variables
¿Qué es la regresión lineal?
• Definición.-
Es un modelo matemático para estimar el
efecto (predecir) de una variable sobre otra.
Está asociado con el coeficiente de Pearson r
de Pearson
• Hipótesis a probar:
Correlacionales y causales
ANALISIS MULTIVARIADO
Definición
Es una prueba estadística para analizar si más de dos
grupos difieren significativamente entre sí en cuanto a sus
medias y varianzas .
La prueba “ t “ es utilizada para dos grupos y el análisis de
varianza unidereccional se usa para tres, cuatro o más
grupos
Hipótesis a probar:
De diferencia entre más de dos grupos, se propone que los
grupos difieren significativamente entre si y la nula propone
que no difieren
Test de Friedman
245
Test de Wilcoxon o del Rango
con signo.
Cuantitativas ANOVA
Rango Friedman
Cuantitativas Regresión
Comparando variables (diferencias)
Kruskal wallis
Ordinal
Mann-Whitney Wilcoxon (indep)
Friedman (dep)
nominal
chi-cuadrada* McNemar (2) chi-cuadrada
Q de Cochrane (>2) (indep)
FLUXOGRAMA PARA SELECCIONAR PRUEBA
ESTADISTICA
TIPO DE HIPOTESIS
ENTRE VERAIBLES PARAMETRICAS
•Correlación de pearson
RELACION O •Regresión Lineal
COMPARACION DE ASOCIACION
VARIABLES ENTRE VARIABLES
•Regresión logística
NO PARAMETRICAS
Tipo de variable
•Correlación de spearman
CUANTITATIVA CUALITATIVA
(PARAMETRICA) (NO PARAMETRICA)
Nº DE GRUPOS
ORDINAL NOMINAL
(Proporción, %) (Proporción, %)
T DE STUDENT
U MANN WITHNEY
INDEPENDIENTE
NO
APAREADOS
ANOVA
CHI CUADRADO
KRUSKALL WALLIS
T DE STUDENT WILCOXON MC
APAREADOS APAREADO NEMAR
EJERCICIOS
1. La posible relación entre dos variables cuantitativas se puede estudiar con: