Mg.
Ananí Basaldúa Galarza
Epidemiólogo
Aparece de manera natural:
Errores de medida.
Distancia de frenado.
Altura, peso, propensión al crimen…
Distribuciones binomiales con n grande (n>30) y ‘p ni
pequeño’ (np>5) ‘ni grande’ (nq>5).
Está caracterizada por dos parámetros: La
media, μ, y la desviación típica, σ.
2
1 x
1
Su función de densidad es: f ( x) e 2
2
2
Puedes interpretar
la media como un
factor de traslación.
Y la desviación
típica como un
factor de escala,
grado de
dispersión,…
3
Entre la media y
una desviación
típica tenemos
siempre la misma
probabilidad:
aprox. 68%
Entre la media y
dos desviaciones
típicas aprox. 95%
4
La función de densidad es simétrica, mesocúrtica y unimodal.
Media, mediana y moda coinciden.
Los puntos de inflexión de la fun. de densidad están a distancia σ
de μ.
Si tomamos intervalos centrados en μ, y cuyos extremos están…
a distancia σ, tenemos probabilidad 68%
a distancia 2 σ, tenemos probabilidad 95%
a distancia 2’5 σ tenemos probabilidad 99%
No es posible calcular la probabilidad de un intervalo
simplemente usando la primitiva de la función de densidad, ya
que no tiene primitiva expresable en términos de funciones
‘comunes’.
Todas las distribuciones normales N(μ, σ), pueden ponerse
mediante una traslación μ, y un cambio de escala σ, como N(0,1).
Esta distribución especial se llama normal tipificada.
Justifica la técnica de tipificación, cuando intentamos comparar individuos
diferentes obtenidos de sendas poblaciones normales.
5
Dada una variable de media μ y desviación típica σ, se
denomina valor tipificado, z, de una observación x, a la
distancia (con signo) con respecto a la media, medido en
desviaciones típicas, es decir
x
z
En el caso de variable X normal, la interpretación es clara:
Asigna a todo valor de N(μ, σ), un valor de N(0,1) que deja
exáctamente la misma probabilidad por debajo.
Nos permite así comparar entre dos valores de dos
distribuciones normales diferentes, para saber cuál de los dos
es más extremo.
6
Z es normal tipificada.
Calcular P[Z<1,85]
Solución: 0,968 = 96,8%
7
Z es normal tipificada.
Calcular P[Z<-0,54]
Solución: 1-0,705 = 0,295
Bioestadística. U. Málaga. 8
Z es normal tipificada.
Calcular P[-0,54<Z<1,85]
Solución: 0,968-0,295= 0,673
9
El colesterol en la población tiene
distribución normal, con media 200 y
desviación 10.
¿Qué porcentaje de individuos tiene
colesterol inferior a 210?
Qué valor del colesterol sólo es superado
por el 10% de los individuos.
10
Todas las distribuciones normales son similares salvo traslación y
cambio de escala: Tipifiquemos.
x 210 200
z 1
10
P[Z 1,00] (ver tabla ) 0,841
11
El valor del colesterol que sólo supera el 10% de los individuos es el percentil 90.
Calculemos el percentil 90 de la N(0,1) y deshacemos la tipificación.
x
z
x 200
1,28
10
x 200 10 1,28 212,8
Bioestadí
Tema 5: Modelos stica. U.
probabilísticos 12 Málaga.
Se quiere dar una beca a uno de dos estudiantes
de sistemas educativos diferentes. Se asignará
al que tenga mejor expediente académico.
El estudiante A tiene una calificación de 8 en un
sistema donde la calificación de los alumnos se
comporta como N(6,1).
El estudiante B tiene una calificación de 80 en un
sistema donde la calificación de los alumnos se
comporta como N(70,10).
Solución
No podemos comparar directamente 8 puntos de A
frente a los 80 de B, pero como ambas poblaciones se
comportan de modo normal, podemos tipificar y
observar las puntuaciones sobre una distribución de
referencia N(0,1)
13
xA A 8 6
zA 2
A 1
xB B 80 70
zB 1
B 10
Como ZA>ZB, podemos decir que
el porcentaje de compañeros del
mismo sistema de estudios que ha
superado en calificación el
estudiante A es mayor que el que
ha superado B.
Podríamos pensar en principio
que A es mejor candidato para la
14 beca.
Las propiedades que tiene la distribución normal
son interesantes, pero todavía no hemos hablado
de por qué es una distribución especialmente
importante.
La razón es que aunque una v.a. no posea
distribución normal, ciertos
estadísticos/estimadores calculados sobre
muestras elegidas al azar sí que poseen una
distribución normal.
Es decir, tengan las distribución que tengan
nuestros datos, los ‘objetos’ que resumen la
información de una muestra, posiblemente tengan
distribución normal (o asociada).
15
Como ilustración
mostramos una variable
que presenta valores
distribuidos de forma
muy asimétrica.
Claramente no normal.
Saquemos muestras de
diferentes tamaños, y
usemos la media de
cada muestra para
estimar la media de la
población.
16
Cada muestra ofrece un
resultado diferente: La
media muestral es variable
aleatoria.
Su distribución es más
parecida a la normal que la
original.
También está menos
dispersa. A su dispersión
(‘desv. típica del estimador
media muestral’… ¿os
gusta el nombre largo?) se
le suele denominar error
típico.
17
Al aumentar el
tamaño, n, de la
muestra:
La normalidad de
las estimaciones
mejora
El error típico
disminuye.
18
Puedo ‘garantizar’
medias muestrales tan
cercanas como quiera
a la verdadera media,
sin más que tomar ‘n
bastante grande’
Se utiliza esta
propiedad para
dimensionar el
tamaño de una
muestra antes de
empezar una
investigación.
19
Dada una v.a. cualquiera, si extraemos muestras de
tamaño n, y calculamos los promedios muestrales, entonces:
dichos promedios tienen distribución
aproximadamente normal;
La media de los promedios muestrales
es la misma que la de la variable original.
La desviación típica de los promedios disminuye en un factor “raíz de
n” (error estándar).
Las aproximaciones anteriores se hacen exactas cuando n tiende a
infinito.
Este teorema justifica la importancia de la distribución
normal.
Sea lo que sea lo que midamos, cuando se promedie sobre una
muestra grande (n>30) nos va a aparecer de manera natural la
distribución normal.
20
Cuando queramos hacer inferencia estadística hemos visto que la
distribución normal aparece de forma casi inevitable.
Dependiendo del problema, podemos encontrar otras (asociadas):
X2 (chi cuadrado)
t- student
F-Snedecor
Estas distribuciones resultan directamente de operar con
distribuciones normales. Típicamente aparecen como
distribuciones de ciertos estadísticos.
Veamos algunas propiedades que tienen (superficialmente). Para
más detalles consultad el manual.
Sobre todo nos interesa saber qué valores de dichas distribuciones
son “atípicos”.
Significación, p-valores,…
21
Tiene un sólo parámetro
denominado grados de
libertad.
La función de densidad es
asimétrica positiva. Sólo tienen
densidad los valores positivos.
La función de densidad se
hace más simétrica incluso casi
gausiana cuando aumenta el
número de grados de libertad.
Normalmente consideraremos
anómalos aquellos valores de
la variable de la “cola de la
derecha”.
22
Tiene un parámetro denominado
grados de libertad.
Cuando aumentan los grados de
libertad, más se acerca a N(0,1).
Es simétrica con respecto al cero.
Se consideran valores anómalos
los que se alejan de cero
(positivos o negativos).
23
Tiene dos parámetros
denominados grados de
libertad.
Sólo toma valores
positivos. Es asimétrica.
Normalmente se
consideran valores
anómalos los de la cola
de la derecha.
24
En v.a. hay conceptos equivalentes a los de temas
anteriores
Función de probabilidad Frec. Relativa.
Función de densidad histograma
Función de distribución diagr. Integral.
Valor esperado media, …
Hay modelos de v.a. de especial importancia:
Bernoulli
Binomial
Poisson
Normal
Propiedades geométricas
Tipificación
Aparece tanto en problemas con variables cualitativas
(dicotómicas, Bernoulli) como numéricas
Distribuciones asociadas
T-student
X2
F de Snedecor
25
Considere una variable aleatoria X, que
representa la presión sanguínea sistólica, para
una población de hombres con edades entre 18
y 74 años. La distribución de esta variable es
aproximadamente normal con media
129mm/Hg. y desviación estándar 19.8
mm/Hg.
x x 129
La variable tipificada será z
19.8
Calcule la probabilidad de que un individuo de
esta población tenga una presión sanguínea
sistólica de 167.8 mm/Hg o menos (x≤167.8).
Para poder obtener la probabilidad debe
estandarizar el valor.
( x 129) (167.8 129)
z 1.959595 1.96
19.8 19.8
Busque en la tabla Normal y obtendrá la
probabilidad deseada
z ( Z 1,96) 0.975