0% encontró este documento útil (0 votos)
85 vistas28 páginas

10 Distribución Normal PDF

Este documento describe las propiedades de la distribución normal, incluyendo que se caracteriza por dos parámetros (media y desviación estándar), cómo se interpreta cada parámetro, y que aparece de forma natural en muchos fenómenos. También explica que aunque los datos no sigan una distribución normal, estadísticos calculados sobre muestras a menudo sí siguen una distribución normal.
Derechos de autor
© © All Rights Reserved
Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.
Formatos disponibles
Descarga como PDF, TXT o lee en línea desde Scribd
0% encontró este documento útil (0 votos)
85 vistas28 páginas

10 Distribución Normal PDF

Este documento describe las propiedades de la distribución normal, incluyendo que se caracteriza por dos parámetros (media y desviación estándar), cómo se interpreta cada parámetro, y que aparece de forma natural en muchos fenómenos. También explica que aunque los datos no sigan una distribución normal, estadísticos calculados sobre muestras a menudo sí siguen una distribución normal.
Derechos de autor
© © All Rights Reserved
Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.
Formatos disponibles
Descarga como PDF, TXT o lee en línea desde Scribd
Está en la página 1/ 28

Mg.

Ananí Basaldúa Galarza


Epidemiólogo
 Aparece de manera natural:
 Errores de medida.
 Distancia de frenado.
 Altura, peso, propensión al crimen…
 Distribuciones binomiales con n grande (n>30) y ‘p ni
pequeño’ (np>5) ‘ni grande’ (nq>5).

 Está caracterizada por dos parámetros: La


media, μ, y la desviación típica, σ.
2
1  x 
1   
 Su función de densidad es: f ( x)  e 2  

 2
2
 Puedes interpretar
la media como un
factor de traslación.

 Y la desviación
típica como un
factor de escala,
grado de
dispersión,…

3
 Entre la media y
una desviación
típica tenemos
siempre la misma
probabilidad:
aprox. 68%

 Entre la media y
dos desviaciones
típicas aprox. 95%

4
 La función de densidad es simétrica, mesocúrtica y unimodal.
 Media, mediana y moda coinciden.

 Los puntos de inflexión de la fun. de densidad están a distancia σ


de μ.

 Si tomamos intervalos centrados en μ, y cuyos extremos están…


 a distancia σ,  tenemos probabilidad 68%
 a distancia 2 σ,  tenemos probabilidad 95%
 a distancia 2’5 σ  tenemos probabilidad 99%

 No es posible calcular la probabilidad de un intervalo


simplemente usando la primitiva de la función de densidad, ya
que no tiene primitiva expresable en términos de funciones
‘comunes’.

 Todas las distribuciones normales N(μ, σ), pueden ponerse


mediante una traslación μ, y un cambio de escala σ, como N(0,1).
Esta distribución especial se llama normal tipificada.
 Justifica la técnica de tipificación, cuando intentamos comparar individuos
diferentes obtenidos de sendas poblaciones normales.

5
 Dada una variable de media μ y desviación típica σ, se
denomina valor tipificado, z, de una observación x, a la
distancia (con signo) con respecto a la media, medido en
desviaciones típicas, es decir

x
z

 En el caso de variable X normal, la interpretación es clara:
Asigna a todo valor de N(μ, σ), un valor de N(0,1) que deja
exáctamente la misma probabilidad por debajo.

 Nos permite así comparar entre dos valores de dos


distribuciones normales diferentes, para saber cuál de los dos
es más extremo.

6
Z es normal tipificada.

Calcular P[Z<1,85]

Solución: 0,968 = 96,8%

7
Z es normal tipificada.

Calcular P[Z<-0,54]

Solución: 1-0,705 = 0,295


Bioestadística. U. Málaga. 8
Z es normal tipificada.

Calcular P[-0,54<Z<1,85]

Solución: 0,968-0,295= 0,673

9
 El colesterol en la población tiene
distribución normal, con media 200 y
desviación 10.

 ¿Qué porcentaje de individuos tiene


colesterol inferior a 210?

 Qué valor del colesterol sólo es superado


por el 10% de los individuos.
10
 Todas las distribuciones normales son similares salvo traslación y
cambio de escala: Tipifiquemos.
x 210  200
z   1
 10

P[Z  1,00]  (ver tabla )  0,841


11
 El valor del colesterol que sólo supera el 10% de los individuos es el percentil 90.
Calculemos el percentil 90 de la N(0,1) y deshacemos la tipificación.

x
z 

x  200
1,28 
10
x  200  10 1,28  212,8

Bioestadí
Tema 5: Modelos stica. U.
probabilísticos 12 Málaga.
 Se quiere dar una beca a uno de dos estudiantes
de sistemas educativos diferentes. Se asignará
al que tenga mejor expediente académico.
 El estudiante A tiene una calificación de 8 en un
sistema donde la calificación de los alumnos se
comporta como N(6,1).
 El estudiante B tiene una calificación de 80 en un
sistema donde la calificación de los alumnos se
comporta como N(70,10).
 Solución
 No podemos comparar directamente 8 puntos de A
frente a los 80 de B, pero como ambas poblaciones se
comportan de modo normal, podemos tipificar y
observar las puntuaciones sobre una distribución de
referencia N(0,1)

13
xA   A 8  6
zA   2
A 1
xB   B 80  70
zB   1
B 10
Como ZA>ZB, podemos decir que
el porcentaje de compañeros del
mismo sistema de estudios que ha
superado en calificación el
estudiante A es mayor que el que
ha superado B.
Podríamos pensar en principio
que A es mejor candidato para la
14 beca.
 Las propiedades que tiene la distribución normal
son interesantes, pero todavía no hemos hablado
de por qué es una distribución especialmente
importante.

 La razón es que aunque una v.a. no posea


distribución normal, ciertos
estadísticos/estimadores calculados sobre
muestras elegidas al azar sí que poseen una
distribución normal.

 Es decir, tengan las distribución que tengan


nuestros datos, los ‘objetos’ que resumen la
información de una muestra, posiblemente tengan
distribución normal (o asociada).

15
 Como ilustración
mostramos una variable
que presenta valores
distribuidos de forma
muy asimétrica.
Claramente no normal.

 Saquemos muestras de
diferentes tamaños, y
usemos la media de
cada muestra para
estimar la media de la
población.

16
 Cada muestra ofrece un
resultado diferente: La
media muestral es variable
aleatoria.

 Su distribución es más
parecida a la normal que la
original.

 También está menos


dispersa. A su dispersión
(‘desv. típica del estimador
media muestral’… ¿os
gusta el nombre largo?) se
le suele denominar error
típico.

17
 Al aumentar el
tamaño, n, de la
muestra:

 La normalidad de
las estimaciones
mejora

 El error típico
disminuye.

18
 Puedo ‘garantizar’
medias muestrales tan
cercanas como quiera
a la verdadera media,
sin más que tomar ‘n
bastante grande’

 Se utiliza esta
propiedad para
dimensionar el
tamaño de una
muestra antes de
empezar una
investigación.

19
 Dada una v.a. cualquiera, si extraemos muestras de
tamaño n, y calculamos los promedios muestrales, entonces:

 dichos promedios tienen distribución


aproximadamente normal;

 La media de los promedios muestrales


es la misma que la de la variable original.

 La desviación típica de los promedios disminuye en un factor “raíz de


n” (error estándar).

 Las aproximaciones anteriores se hacen exactas cuando n tiende a


infinito.

 Este teorema justifica la importancia de la distribución


normal.
 Sea lo que sea lo que midamos, cuando se promedie sobre una
muestra grande (n>30) nos va a aparecer de manera natural la
distribución normal.
20
 Cuando queramos hacer inferencia estadística hemos visto que la
distribución normal aparece de forma casi inevitable.

 Dependiendo del problema, podemos encontrar otras (asociadas):


 X2 (chi cuadrado)
 t- student
 F-Snedecor

 Estas distribuciones resultan directamente de operar con


distribuciones normales. Típicamente aparecen como
distribuciones de ciertos estadísticos.

 Veamos algunas propiedades que tienen (superficialmente). Para


más detalles consultad el manual.

 Sobre todo nos interesa saber qué valores de dichas distribuciones


son “atípicos”.
 Significación, p-valores,…

21
 Tiene un sólo parámetro
denominado grados de
libertad.

 La función de densidad es
asimétrica positiva. Sólo tienen
densidad los valores positivos.

 La función de densidad se
hace más simétrica incluso casi
gausiana cuando aumenta el
número de grados de libertad.

 Normalmente consideraremos
anómalos aquellos valores de
la variable de la “cola de la
derecha”.

22
 Tiene un parámetro denominado
grados de libertad.

 Cuando aumentan los grados de


libertad, más se acerca a N(0,1).

 Es simétrica con respecto al cero.

 Se consideran valores anómalos


los que se alejan de cero
(positivos o negativos).

23
 Tiene dos parámetros
denominados grados de
libertad.

 Sólo toma valores


positivos. Es asimétrica.

 Normalmente se
consideran valores
anómalos los de la cola
de la derecha.

24
 En v.a. hay conceptos equivalentes a los de temas
anteriores
 Función de probabilidad  Frec. Relativa.
 Función de densidad  histograma
 Función de distribución  diagr. Integral.
 Valor esperado  media, …
 Hay modelos de v.a. de especial importancia:
 Bernoulli
 Binomial
 Poisson
 Normal
 Propiedades geométricas
 Tipificación
 Aparece tanto en problemas con variables cualitativas
(dicotómicas, Bernoulli) como numéricas
 Distribuciones asociadas
 T-student
 X2
 F de Snedecor
25
 Considere una variable aleatoria X, que
representa la presión sanguínea sistólica, para
una población de hombres con edades entre 18
y 74 años. La distribución de esta variable es
aproximadamente normal con media
129mm/Hg. y desviación estándar 19.8
mm/Hg.
x x  129
 La variable tipificada será z   
 19.8
 Calcule la probabilidad de que un individuo de
esta población tenga una presión sanguínea
sistólica de 167.8 mm/Hg o menos (x≤167.8).
 Para poder obtener la probabilidad debe
estandarizar el valor.

( x  129) (167.8  129)


z    1.959595  1.96
19.8 19.8

 Busque en la tabla Normal y obtendrá la


probabilidad deseada

z  ( Z  1,96)  0.975

También podría gustarte