0% encontró este documento útil (1 voto)
488 vistas40 páginas

Pruebas de Hipótesis en Estadística

Este documento describe diferentes pruebas de hipótesis paramétricas utilizando la distribución t de Student. Explica la distribución t-student, cómo aplicarla para probar hipótesis sobre la diferencia de medias entre dos poblaciones cuando las desviaciones estándar son desconocidas y los tamaños de muestra son pequeños. También cubre pruebas de hipótesis para una sola media cuando la desviación estándar es desconocida y el tamaño de muestra es pequeño. Finalmente, incluye información sobre la tabla de distrib

Cargado por

Paulina
Derechos de autor
© © All Rights Reserved
Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.
Formatos disponibles
Descarga como DOCX, PDF, TXT o lee en línea desde Scribd
0% encontró este documento útil (1 voto)
488 vistas40 páginas

Pruebas de Hipótesis en Estadística

Este documento describe diferentes pruebas de hipótesis paramétricas utilizando la distribución t de Student. Explica la distribución t-student, cómo aplicarla para probar hipótesis sobre la diferencia de medias entre dos poblaciones cuando las desviaciones estándar son desconocidas y los tamaños de muestra son pequeños. También cubre pruebas de hipótesis para una sola media cuando la desviación estándar es desconocida y el tamaño de muestra es pequeño. Finalmente, incluye información sobre la tabla de distrib

Cargado por

Paulina
Derechos de autor
© © All Rights Reserved
Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.
Formatos disponibles
Descarga como DOCX, PDF, TXT o lee en línea desde Scribd

PRUEBAS DE HIPÓTESIS.

ACEVEDO BRACAMONTE ISABEL


FLÓREZ VARGAS ANA PAULA
PARDO BALVUENA LEIDIS YANETH

UNIVERSIDAD INDUSTRIAL DE SANTANDER


ESCUELA DE ESTUDIOS INDUSTRIALES Y EMPRESARIALES
INGENIERÍA INDUSTRIAL
SEGUNDO SEMESTRE DE 2014
PRUEBAS DE HIPÓTESIS.

Presentado por:
ACEVEDO BRACAMONTE ISABEL
FLÓREZ VARGAS ANA PAULA
PARDO VALBUENA LEIDIS YANETH

PH para la diferencia de medias (t-student), PH Relación entre varianzas, Pruebas


de bondad de ajustes y Regresión lineal múltiple.

Profesor.
OLMEDO GONZALEZ HERRERA

UNIVERSIDAD INDUSTRIAL DE SANTANDER


ESCUELA DE ESTUDIOS INDUSTRIALES Y EMPRESARIALES
INGENIERÍA INDUSTRIAL
SEGUNDO SEMESTRE DE 2014
Índice

1. Introducción 4
2. Objetivos 5
3. Prueba de hipótesis para la diferencia de medias (t-student) 6
4. Pruebas de hipótesis sobre la varianza 19
5. Prueba de hipótesis para la relación de varianza 27
6. Prueba de bondad del ajuste 30
7. Regresión lineal múltiple 33
8. Conclusiones 39
Referencias 40
1. Introducción.

Dentro del estudio de la inferencia estadística, se describe como se puede tomar


una muestra aleatoria y a partir de esta muestra estimar el valor de un parámetro
poblacional en la cual se puede emplear el método de muestreo y el teorema del
valor central lo que permite explicar cómo a partir de una muestra se puede inferir
algo acerca de una población, lo cual nos lleva a definir y elaborar una distribución
de muestreo de medias muestrales que nos permite explicar el teorema del límite
central y utilizar este teorema para encontrar las probabilidades de obtener las
distintas medias maestrales de una población.
Pero es necesario tener conocimiento de ciertos datos de la población como la
media, la desviación estándar o la forma de la población, pero a veces no se
dispone de esta información.
En este caso es necesario hacer una estimación puntual que es un valor que se
usa para estimar un valor poblacional. Pero una estimación puntual es un solo
valor y se requiere un intervalo de valores a esto se denomina intervalote
confianza y se espera que dentro de este intervalo se encuentre el parámetro
poblacional buscado. También se utiliza una estimación mediante un intervalo, el
cual
de un parámetro poblacional este método es denominado Prueba de hipótesis
para una muestra es un rango de valores en el que se espera se encuentre el
parámetro poblacional
En nuestro caso se desarrolla un procedimiento para probar la validez de una
aseveración acerca.

Prueba de hipótesis: es un procedimiento, basado en la evidencia de la muestra y


en la teoría de las probabilidades, usado para determinar si la hipótesis es una
afirmación razonable y debería no ser rechazada o si no es razonable debería ser
rechazada

Las hipótesis es una aseveración de una población elaborado con el propósito de


poner a prueba, para verificar la afirmación razonable se usan datos.

4
[Link].

General.

Ampliar los conocimientos adquiridos durante el curso de Estadística ll, mediante


la investigación, comprensión y aplicación de las pruebas de hipótesis para
poblaciones pequeñas y grandes a través del uso de la distribución t- student,
relación entre varianzas, pruebas de bondad de ajustes y regresión lineal múltiple.

Específicos.

 Comprender los fundamentos teóricos de la metodología de pruebas de


hipótesis estadísticas.
 Aplicar los procedimientos de pruebas de hipótesis estadísticas para diferentes
parámetros poblacionales.
 Conocer acerca de los errores que se pueden cometer en el proceso de
decisión basado en muestras.
 Aplicar conceptos y procedimientos de la metodología en la resolución de
problemas.

5
3. PRUEBA DE HIPÓTESIS PARA LA DIFERENCIA DE MEDIAS (T-STUDENT).

3.1 Distribución t-student

En ocasiones interesa definir un intervalo de valores tal que permita establecer


cuáles son los valores mínimo y máximo aceptables para la diferencia entre las
medias de dos poblaciones. Pueden darse dos situaciones según las muestras
sean o no independientes; siendo en ambos casos condición necesaria que las
poblaciones de origen sean normales o aproximadamente normales:

 MUESTRAS INDEPENDIENTES

Si puede suponerse que las varianzas de ambas poblaciones son iguales, el


intervalo de confianza para la diferencia de medias poblacionales está centrado en
la diferencia de las medias muestrales, siendo sus límites superior e inferior:

t /2 es el valor crítico correspondiente al grado de confianza 1- de la distribución


t de Student con n1+ n2-2 grados de libertad y

6
Es una estimación de la desviación típica común a ambas poblaciones obtenida a
partir de las varianzas de las dos muestras. En la práctica si n1 y n2 son
moderadamente grandes, el valor crítico.

t /2 se aproxima, como ya se ha visto anteriormente, a los valores de la


distribución normal.

Si las varianzas poblacionales no pueden suponerse iguales los límites del


intervalo de confianza son:

El valor crítico t /2 corresponde a una distribución t cuyos grados de libertad se


calculan en base a ambos tamaños muestrales y a las desviaciones típicas de
cada grupo según la corrección propuesta por Dixon y Massey:

Para definir grados de libertad se hará referencia a la varianza muestral:

Esta fórmula puede verse como un promedio de las distancias a la media sobre n-
1 datos.
La terminología de grados de libertad resulta del hecho de que si bien s 2 considera
n cantidades, solo n-1 de ellas pueden determinarse libremente.

Por ejemplo, si tenemos 4 datos (n=4) entonces tenemos cuatro diferencias: XI-𝑋

7
Pero sabemos que la suma de ellas es = 0, por lo que si conocemos, por ejemplo:

𝑥1 − 𝑥 = 4, 𝑥2 − 𝑥 = −2, 𝑥4 − 𝑥 = 3 𝟒−𝟐+𝟑=𝟓
Entonces, la última diferencia queda definida porque 5-5=0 por lo tanto

𝑥3 − 𝑥 = −5
Lo que indica que solo 3 de las diferencias (n-1=4-1=3) son ¨libres” y la otra queda
definida por las demás.

3.2 Prueba de hipótesis para la media de una población, desviación estándar


desconocida y tamaño muestral pequeño

Cuando se plantean hipótesis para la media de la población y la desviación


estándar poblacional es desconocida y el tamaño de la muestra es pequeño, el
estadístico de prueba está dado por:

x 
t  t gl n1
Sn1 / n

El cual se distribuye como una t de Student con n-1 grados de libertad.

3.3 Propiedades de la distribución t

 Es continua, campanular, y simétrica como la distribución z.

 Existe una familia de distribuciones t con media cero, pero con diferentes
desviaciones estándar.

 La distribución t es más aplanada y de colas más largas que la z.

 Tiende a la z para tamaños grandes de muestra.

8
 Es más plana que la normal. Hay una distribución t diferente para cada tamaño
posible de muestra.

 Una distribución t es menor en la media y mayor en las colas que una


distribución normal.

 Es unimodal, con media en 0.

 Es una familia de curvas en función de los llamados grados de libertad. Es decir


hay una distribución t de student con un grado de libertad, una distribución de t
de student con dos grados de libertad, etc.

 A medida que aumentan los grados de libertad, la distribución tiende más a una
distribución normal estandarizada.

L
o
s
Distribución z

Distribución t

Figura 1.1 Forma de la distribución Normal estandarizada y la t-Student.

9
3.4 Tabla de distribución t de student.

 La tabla t es más compacta y muestra áreas y valores de t solo para algunos


porcentajes.

 La tabla de la distribución t no se concentra en la probabilidad de que el


parámetro de la población que se está estimando se encuentre dentro del
intervalo de confianza.

 En lugar de ello, mide la probabilidad de que este parámetro NO esté dentro de


nuestro intervalo de confianza (mide la probabilidad de que esté fuera).

 En la tabla t debemos especificar los grados de libertad que se manejan.

10
Tabla 1. T-Student.

3.5 Prueba de hipótesis para dos medias desviaciones estándar


poblacionales desconocidas pero iguales y muestras pequeñas- Muestras
independientes.

Cuando se plantean hipótesis para la diferencia de medias de dos poblaciones y


las desviaciones estándar poblacionales son desconocidas y el tamaño de la
muestra es pequeño, el estadístico de prueba está dado por:

( x1  x2 )  ( 1   )
t  t gl  n1  n 2  2
1 1
S p2 (  )
n1 n2

Dónde:

(n1  1) * S12  (n2  1) * S 22


S 
2

(n1  1)  (n2  1)
p

El cual se distribuye como una t de Student con n1+n2-1 grados de libertad.

3.6 Prueba de hipótesis para dos medias desviaciones estándar


poblacionales desconocidas, distintas y muestras pequeñas- Muestras
independientes

Cuando se plantean hipótesis para la diferencia de medias de dos poblaciones y


las desviaciones estándar poblacionales son desconocidas y el tamaño de la
muestra es pequeño, el estadístico de prueba está dado por:

11
( x1  x2 )  ( 1   )
t  t gl v
S2 S2
( 1  2)
S12 S 22 2 n1 n2
(  )
n1 n2
v 2
S1 2 S 22 2
Donde: ( ) ( )
n1 n
 2
(n1  1) (n2  1)

Parte entera, el cual se distribuye como una t de Student con v grados de libertad.

3.7 Prueba de hipótesis para dos medias, desviación estándar poblacional


conocida o muestras grandes. Muestras relacionadas o dependientes

Cuando las muestras están relacionadas y se quiere probar si luego de aplicar un


tratamiento las medias difieren (antes/después) y las desviaciones estándar
poblacionales son desconocidas y el tamaño de la muestra es pequeño, el
estadístico de prueba está dado por:

d  d
t  t gl  n 1
sd
n
Donde: n n n

 d  (x  x )
i i 2  (d i  d )2
d i 1
 i 1
S 2d  i 1
n n n 1

El cual se distribuye como una t de Student con n-1 grados de libertad.

12
La prueba t-Student se utiliza para contrastar hipótesis sobre medias en
poblaciones con distribución normal. También proporciona resultados aproximados
para los contrastes de medias en muestras suficientemente grandes cuando estas
poblaciones no se distribuyen normalmente (aunque en este último caso es
preferible realizar una prueba no paramétrica). Para conocer si se puede suponer
que los datos siguen una distribución normal, se pueden realizar diversos
contrastes llamados de bondad de ajuste, de los cuales el más usado es la prueba
de Kolmogorov.

Existen dos versiones de la prueba t-Student: una que supone que las varianzas
poblacionales son iguales y otra versión que no asume esto último.

𝐻𝑜: 𝜇1 = 𝜇2 𝐻𝑜: 𝜇1 = 𝜇2 𝐻𝑜: 𝜇1 = 𝜇2


𝐻𝑎: 𝜇1 ≠ 𝜇2 𝐻𝑎: 𝜇1 < 𝜇2 𝐻𝑎: 𝜇1 > 𝜇2
Regla de decisión:
Regla de decisión: Regla de decisión:
Acepto Ho si: Dci <𝐷 ̂𝑋̅ <Dcs
̂𝑋̅ ≥Dcs ó
Rechazo Ho si: 𝐷 Acepto Ho si: 𝐷̂𝑋̅ >Dci Acepto Ho si: 𝐷̂𝑋̅ <Dcs
̂𝑋̅ ≤Dci
𝐷 ̂𝑋̅ ≤Dci
Rechazo Ho si: 𝐷 ̂𝑋̅ ≥Dcs
Rechazo Ho si: 𝐷

Regla de decisión: Regla de decisión: Regla de decisión:

Acepto Ho si: Tci <𝑇𝑒 <Tcs Acepto Ho si: 𝑇𝑒 >Tci Acepto Ho si: 𝑇𝑒 <Tcs
Rechazo Ho si: 𝑇𝑒 ≥Tcs ó Rechazo Ho si: 𝑇𝑒 ≤Tci Rechazo Ho si: 𝑇𝑒 ≥Tcs
𝑇𝑒 ≤Tci

13
Cálculo de la prueba t-Student para la diferencia de medias suponiendo
igualdad de varianzas.

Cuando 𝑛1 + 𝑛2 < 120 la diferencia de las medias sigue una distribución 𝑡𝑛1 +𝑛2 −2

(𝑋̅1 − 𝑋̅2 ) − (𝑈1 − 𝑈2 )


𝑡𝑒 𝑛 =
1 +𝑛2 −2
1 1
√𝑆𝑝2 (
𝑛1 + 𝑛2 )

Siendo 𝑆𝑝2 la varianza combinada


(𝑛1 − 1)𝑆12 + (𝑛2 − 1)𝑆22
𝑆𝑝2 =
𝑛1 + 𝑛2 − 2

1 1
Calculo de valores críticos 𝐷𝑐𝑟𝑖𝑡𝑖𝑐𝑜𝑠 = (𝑈1 − 𝑈2 ) ± 𝑡(∝⁄2 , 𝑣) ∗ 𝑆𝑝√𝑛 + 𝑛
1 2

̂𝑋̅ = 𝑋̅1 − 𝑋̅2


𝐷

Ejemplos:
Durante 20 días se registraron las temperaturas de operación de 2 hornos de
secado para pintura.

𝑋̅1 = 164 𝑋̅2 = 170

𝑆12 = 81 𝑠22 = 172

Determine si existe diferencia significativa entre las temperaturas promedio, si ∝=


5%

1. Planteamiento del problema

14
𝑋̅1 = 164 𝑋̅2 = 170
𝑆12 = 81 𝑠22 = 172
∝= 5% 𝑛1 = 𝑛2 = 20

2. Planteamiento de hipótesis

𝐻𝑜: 𝜇1 = 𝜇2 → 𝜇1 − 𝜇2 = 0

𝐻𝑎: 𝜇1 ≠ 𝜇2 → 𝜇1 − 𝜇2 ≠ 0

3. Tipo de distribución y gráfica

Distribución: t-student
=-7,2 =7,2

̂𝑋̅ = −6
𝐷

𝑡201 +202 −2 = 2,0244

4. Regla de decisión

Acepto Ho si: ̂𝑋̅ <Dcs


Dci <𝐷
̂𝑋̅ ≥Dcs ó
Rechazo Ho si: 𝐷
̂𝑋̅ ≤Dci
𝐷
̂𝑋̅ = 164 − 170 = −6
𝐷

5. Cálculo de valores Dcriticos

15
(20−1)(81)+(20−1)(172)
𝑆𝑝2 = =126,5
20+20−2

(20 − 1)(81) + (20 − 1)(172) 1 1


𝐷𝑐𝑟𝑖𝑡𝑖𝑐𝑜𝑠 = 0 ± 2,0244(0,025;38) ∗ √ ∗√ +
20 + 20 − 2 20 20

𝐷𝑐𝑟𝑖𝑡𝑖𝑐𝑜𝑠 = ±7,2

6. Toma de decisión
Como:

̂𝑋̅ ≤Dci ; -6<7,2


𝐷 Acepto Ho

Cálculo de la prueba t-Student para la diferencia de medias suponiendo


varianzas diferentes.

Regiones de rechazo y no rechazo

𝑣⁄ = 𝑡1 𝑤1 +𝑡2 𝑤2 𝑆2 𝑆2
𝑐 ; 𝑤1 = 𝑛1 𝑤2 = 𝑛2
𝑤1 +𝑤2 1 1

𝑡1 = 𝑣𝑎𝑙𝑜𝑟 𝑡 𝑐𝑟𝑖𝑡𝑖𝑐𝑜 𝑎𝑙 𝑛𝑖𝑣𝑒𝑙 ∝ 𝑑𝑒 𝑠𝑖𝑔𝑛𝑖𝑓𝑖𝑐𝑎𝑛𝑐𝑖𝑎 𝑐𝑜𝑛 (𝑛2 − 1) 𝑔𝑟𝑎𝑑𝑜𝑠 𝑑𝑒 𝑙𝑖𝑏𝑒𝑟𝑡𝑎𝑑

𝑡2 = 𝑣𝑎𝑙𝑜𝑟 𝑡 𝑐𝑟𝑖𝑡𝑖𝑐𝑜 𝑎𝑙 𝑛𝑖𝑣𝑒𝑙 ∝ 𝑑𝑒 𝑠𝑖𝑔𝑛𝑖𝑓𝑖𝑐𝑎𝑛𝑐𝑖𝑎 𝑐𝑜𝑛 (𝑛2 − 1) 𝑔𝑟𝑎𝑑𝑜𝑠 𝑑𝑒 𝑙𝑖𝑏𝑒𝑟𝑡𝑎𝑑


𝑤1 = 𝑝𝑒𝑠𝑜 𝑝𝑟𝑜𝑚𝑒𝑑𝑖𝑜 𝑑𝑒 𝑣𝑎𝑟𝑖𝑎𝑏𝑖𝑙𝑖𝑑𝑎𝑑 𝑒𝑛 𝑙𝑎 𝑝𝑜𝑏𝑙𝑎𝑐𝑖ó𝑛 1

16
𝑤2 = 𝑝𝑒𝑠𝑜 𝑝𝑟𝑜𝑚𝑒𝑑𝑖𝑜 𝑑𝑒 𝑣𝑎𝑟𝑖𝑎𝑏𝑖𝑙𝑖𝑑𝑎𝑑 𝑒𝑛 𝑙𝑎 𝑝𝑜𝑏𝑙𝑎𝑐𝑖ó𝑛 2

Ejemplo:

Un Fabricante de monitores prueba dos diseños de microcircuitos para determinar


si producen un flujo de corriente equivalente. El departamento de ingeniería ha
obtenido los datos siguientes:

Diseño 1 𝑛1 = 15 𝑋̅1 = 24,2 𝑆12 = 10


Diseño 2 𝑛2 = 10 𝑋̅2 = 23,9 𝑆22 = 20

Con ∝= 0,10, se desea determinar si existe alguna diferencia significativa en el


flujo de corrientes promedio entre los dos diseños, donde se supone que las dos
poblaciones son normales, pero no es posible suponer que las varianzas
desconocidas 𝜎12 𝑦 𝜎12 sean iguales.
1. Planteamiento del problema
2. Planteamiento de hipótesis

𝐻𝑜: 𝜇1 = 𝜇2 → 𝜇1 − 𝜇2 = 0

𝐻𝑎: 𝜇1 ≠ 𝜇2 → 𝜇1 − 𝜇2 ≠ 0

3. Tipo de distribución y gráfico

=-1,81 =1,81
0,83

4. Regla de decisión
Acepto Ho si: Tci <𝑇0∗ <Tcs

Rechazo Ho si: 𝑇0∗ ≥Tcs ó

17
𝑇0∗ ≤Tci

5. Calculo de de 𝑣⁄𝑐 𝑦 𝑇0∗

𝑡1 (14) = 1,76 𝑡2(9) = 1,83

10 20
𝑤1 = = 0,67 𝑤2 = =2
151 101

𝑣⁄ = ± 1,761 ∗ 0,671 + 1,832 ∗ 22 = ±1,81


𝑐 0,67 + 2 1 2

24,2 − 23,9
𝑡0∗ = = 0,183
√0,67 + 2

6. Toma de decisión

Como: Tci <𝑇0∗ <Tcs

Aceptamos Ho

4. PRUEBAS DE HIPOTESIS SOBRE LA VARIANZA

Algunas veces se necesitan pruebas sobre la varianza o desviación estándar de


una población. Se pueden calcular con los siguientes procedimientos; uno se basa
en la hipótesis de que la población es normal, mientras que el otro es una prueba
para una muestra grande que no requiere la suposición de normalidad.

18
a. Procedimientos de prueba para una población normal y prueba para
muestras grandes.

Si la varianza s² de una población normal es desconocida, y queremos verificar si


es igual o no a determinado valor, podemos plantear las siguientes pruebas:

El estimador de la varianza poblacional s² es la varianza muestral S², y la variable


aleatoria asociada con el estadístico es la distribución chi cuadrado, definida
como:

(1)

Si X1, X2, Xn es una muestra aleatoria de tamaño n tomada de una población


normal, y si S² es la varianza muestral, y se desea probar la hipótesis de que la
varianza de una población normal 𝜎 2 es igual a un valor específico entonces el
estadístico de prueba bajo H0 se calcula como:

(𝑛−1)𝑆 2
𝑋02 = (2)
𝜎02

Debe tenerse en cuenta que como la distribución chi cuadrado no es simétrica,


entonces las regiones de críticas deben calcularse por separado para cada tipo de
prueba.

El criterio de decisión es el siguiente: Rechace la hipótesis nula 𝐻𝑜: 𝜎 2 = 𝜎02 si:

 2
𝑋 2 ≤ 𝑋1−∝,𝑛−1 cuando la hipótesis alternativa sea 𝐻1 : 𝜎 2 < 𝜎02
 2
𝑋 2 ≥ 𝑋∝,𝑛−1 cuando la hipótesis alternativa sea 𝐻1 : 𝜎 2 > 𝜎02

19
 2
𝑋 2 ≤ 𝑋1−∝/2,𝑛−1 2
ó 𝑋 2 ≥ 𝑋∝/2,𝑛−1 cuando la hipótesis alternativa sea 𝐻1 : 𝜎 2 ≠
2
𝜎02 , o equivalentemente se acepta la hipótesis nula si: 𝑋1−∝/2,𝑛−1 < 𝑋2 <
2
𝑋∝/2,𝑛−1

Al igual que en el caso de la media poblacional, el criterio de rechazo puede


basarse en el cálculo del valor P, o en el cálculo del límite físico para la varianza
muestral de acuerdo con las características evaluadas. Es decir, en vez de decidir
la aceptación o el rechazo según el estadístico de prueba X2, se puede definir el
límite para el valor máximo y/o mínimo que pueda tomar la varianza muestral S².
Los criterios de decisión serían: Rechace la hipótesis nula 𝐻𝑜: 𝜎 2 = 𝜎02 si:

Cuando la hipótesis alternativa sea 𝐻1 : 𝜎 2 < 𝜎02

Cuando la hipótesis alternativa sea 𝐻1 : 𝜎 2 > 𝜎02

Cuando la hipótesis alternativa sea 𝐻1 : 𝜎 2 ≠ 𝜎02 , o

Gráfica.

20
De (2) Donde S2 es la varianza muestral. Ahora, si 𝐻𝑜: 𝜎 2 = 𝜎02 es verdadera,
entonces el estadístico de prueba X02 sigue una distribución Ji-cuadrada con n-1
grados de libertad. Por consiguiente, se calcula el valor de la estadística de prueba
X02 y la hipótesis 𝐻𝑜: 𝜎 2 = 𝜎02 debe rechazarse si

o si

Donde y son los puntos que corresponden a los porcentajes 100


∝⁄ inferior y superior de la distribución ji-cuadrada con n-1 grados de libertad,
2
respectivamente. El mismo estadístico de prueba se utiliza para hipótesis
alternativas unilaterales. Para la hipótesis unilateral.

Se rechaza Ho si

Para la otra hipótesis unilateral

21
Se rechaza Ho si

Ejemplo:
Al tomar una muestra aleatoria de 20 botellas se obtiene una varianza muestral
para el volumen de llenado S2=0,0153 (onzas de fluido)2. Si la varianza del
volumen de llenado es mayor que 0,01 (onzas de fluido)2 , entonces existe una
proporción inaceptable de botellas que serán llenadas con una cantidad menor de
líquido. ¿Existe evidencia en los datos muéstrales que sugieran que el fabricante
tiene un problema con el llenado de las botellas? Utilice ∝= 0,05

1. planteamiento del problema

S2=0,0153 (onzas de fluido)2 n = 20

𝜎 2 = 0,01 (onzas de fluido)2 ∝= 0,05

2. Planteamiento de Hipótesis

𝐻𝑜: 𝜎 2 = 0,01

𝐻𝑎: 𝜎 2 > 0,01

22
3. Tipo de distribución y gráfica

2
𝑋𝑇𝑎𝑏𝑙𝑎

𝑋𝑒2 = 29,07

2
𝑋𝑜,𝑜5;(20−1) = 30,14

4. Regla de decisión
Acepto Ho si: 𝑋𝑒2 < 30,14

Rechazo Ho si: 𝑋𝑒2 ≥ 30,14

5. Calculo de 𝑋𝑒2

(20 − 1) ∗ 0,0153
𝑋𝑒2 = = 29,07
0,01
6. Toma de decisión.

2
Como: 𝑋𝑒2 = 29,07 < 𝑋𝑜,𝑜5;(20−1) = 30,14 se acepta Ho, no hay ninguna evidencia
fuerte de que la varianza del volumen de llenado sea mayor que 0,01 (onzas de
fluido)2

Utilizando la tabla III del apéndice del libro de probabilidad y estadística aplicada a
la ingeniería del libro de Montgomery, se puede colocar cotas sobre el valor P de
2
una prueba Ji-cuadrada. Buscado en tabla, se tiene que 𝑋𝑜,10;19 = 27,20 y
2
𝑋𝑜,𝑜5;(20−1) = 30,14. Dado que 27,20<29,07<30,14 se concluye que el valor P para
la prueba se encuentra en el intervalo 0,05<P<0,10. El valor real de P es
P=0,0649

23
Para muestras grandes.

El procedimiento de prueba Ji-cuadrado es bastante sensible a la suposición de


normalidad. En consecuencia, es deseable desarrollar un procedimiento que no
requiera esta hipótesis. Cuando la población subyacente no es necesariamente
normal pero n es grande (por ejemplo, n≥35 o 40), entonces puede utilizarse el
resultado siguiente: si X1, X2,…Xn es una muestra aleatoria tomada de una
población que tiene una varianza 𝜎 2 , entonces la desviación estándar muestral S
tiene una distribución que es aproximadamente normal con media E(S) ≈ 𝜎 y
varianza V(S)=𝜎 2 /2𝑛, si n es grande. Entonces la distribución es de:

𝐻𝑜: 𝜎12 = 𝜎22 𝐻𝑜: 𝜎12 = 𝜎22 𝐻𝑜: 𝜎12 = 𝜎22


𝐻𝑎: 𝜎12 ≠ 𝜎22 𝐻𝑎: 𝜎12 < 𝜎22 𝐻𝑎: 𝜎12 > 𝜎22
Regla de decisión:
Regla de decisión: Regla de decisión:
Acepto Ho si: Zci
<𝑍𝑒 <Zcs Acepto Ho si: 𝑍𝑒 >zci Acepto Ho si: 𝑍𝑒 <Zcs
Rechazo Ho si: 𝑍𝑒 ≤ Zci Rechazo Ho si: 𝑍𝑒 ≤Zci Rechazo Ho si: 𝑍𝑒 ≥Zcs
ó
𝑍𝑒 ≥Zcs
Ejemplo:

En una impresora gráfica se utiliza una pieza de plástico moldeada por inyección.
Antes de firmar un contrato de largo plazo, el fabricante de la impresora desea
asegurarse de que el proveedor puede producir piezas con una desviación

24
estándar de longitud de 0,025 mm como máximo. Para ello se obtiene una
muestra aleatoria de 75 piezas, obteniéndose una desviación estándar muestral
de longitud s = 0,022 mm ¿A qué conclusión debe llegarse si se utiliza ∝= 0,01?

1. Planteamiento del problema

𝜎 = 0,025 mm n = 75

𝑠 = 0,022 mm ∝= 0,01

2. Planteamiento de Hipótesis

3. Tipo de distribución gráfica

𝑍𝑒 = −1,47

𝑍0,01 = −2,33

4. Regla de decisión

Acepto Ho si: 𝑍𝑒 >zci

Rechazo Ho si: 𝑍𝑒 ≤Zci

25
5. Cálculo de Ze

0,022 − 0,025
𝑍𝑒 = = −1,47
0,025
√150
6. Toma de decisión

Como: 𝑍𝑒 >zci -1,47>-2,33

Acepto Ho. La evidencia del proveedor no es lo suficientemente fuerte para


justificar un contrato de largo plazo.
Valor P

-1,47

0,42922

P = 0.5-0.42922=0,0708

𝑃 ≥∝ → 7% > 1% Acepto Ho

5. PRUEBA DE HIPÓTESIS PARA LA RELACIÓN DE VARIANZA

Se tienen dos poblaciones normales e independientes con varianzas


Desconocidas s²1 y s²2, respectivamente, y se desea verificar la hipótesis de que
las varianzas son iguales contra una hipótesis alternativa de que son diferentes.

26
Las posibles hipótesis pueden ser:

Para verificar las hipótesis anteriores nos basamos en el hecho de que la siguiente
relación tiene una distribución muestral F con n1-1 y n2-1 grados de libertad:

Bajo la hipótesis nula de que 𝜎12 = 𝜎22 = 𝜎 2 el estadístico de prueba se calcula


𝑆2
como 𝐹 = 𝑆12
2

El criterio de decisión es:

𝑆2
 Rechazo Ho 𝐹 = 𝑆12 ≤ 𝐹1−∝,𝑛1−1,𝑛2 −1 si cuando la hipótesis alternativa es
2
𝐻1 : 𝜎12 < 𝜎22
𝑆12
 Rechazo Ho 𝐹 = ≤ 𝐹∝,𝑛1 −1,𝑛2 −1 si cuando la hipótesis alternativa es
𝑆22
𝐻1 : 𝜎12 > 𝜎22
𝑆12 𝑆12
 Rechazo Ho 𝐹 = ≤ 𝐹1−∝/2,𝑛1 −1,𝑛2 −1 ó ≥ 𝐹∝/2,𝑛1 −1,𝑛2 −1 si cuando la
𝑆22 𝑆22
hipótesis alternativa es
𝐻1 : 𝜎12 ≠ 𝜎22

La tabla proporciona sólo los puntos de la cola superior de la distribución F, para


encontrar la cola inferior se debe aplicar

27
Ejemplo:

Las capas de óxido en las obleas semiconductoras son depositadas en una


mezcla de gases para alcanzar el espesor apropiado. La variabilidad del espesor
de las capas de óxido es una característica crítica de la oblea, y lo deseable para
los siguientes pasos de la fabricación es tener una variabilidad baja. Para ello se
estudian dos mezclas diferentes de gases con la finalidad de determinar con cuál
se obtienen mejores resultados en cuanto a la reducción en la variabilidad del
espesor del óxido. Veinte obleas son depositadas en cada gas. Las desviaciones
estándar de cada muestra del espesor del óxido son 𝑠1 = 1,96 angstroms y 𝑠2 =
2,13 angstroms, respectivamente. ¿Existe alguna evidencia que indique
preferencia por alguno de los gases? Utilice ∝= 0,05

1. Planteamiento del problema


𝑠1 = 1,96 ∝= 0,05

𝑠2 = 2,13 𝑛1 = 𝑛2 = 20

2. Planteamiento de Hipótesis

𝐻0 : 𝜎12 = 𝜎22
𝐻1 : 𝜎12 ≠ 𝜎22

28
3. Tipo de distribución y gráfica

Distribución Fisher

0,40 2,53

4. Regla de decisión

Acepto Ho si: Fi < F0 <Fs


1
Rechazo Ho si: 𝐹0 > 𝐹0,025;19;19 = 2,53 o si 𝐹0 < 𝐹0,975;19;19 = 2,53 = 0,40

5. Calculo de Fo

1,962
𝐹𝑜 = = 0,85
2,132

6. Toma de decisión

Como: 𝐹0,975;19;19 = 0,40 < 0,85 < 𝐹0,025;19;19 = 2,53 no se puede rechazar la
hipótesis nula, por consiguiente no hay evidencia fuerte que indique cuál de los
dos gases dará como resultado una varianza más pequeña en el espesor de la
capa de óxido.

Para encontrar el valor P dado que 𝐹0,50;19;19 = 1,00 el valor calculado del
estadístico de prueba 𝐹𝑜 = 𝑠12 ⁄𝑠22 = 3,84⁄4,54 = 0,85 está más próximo a la cola
inferior de la distribución F que a la cola superior. La probabilidad de que una

29
variable aleatoria F con 19 grados de liberta en el numerador y en el denominador
sea menor que 0,85, es 0,3634. Ya que es arbitrario el hecho de cuál población
sea identificada como la “uno”, el estadístico de prueba también pudo calcularse
como 𝐹𝑜 = 4,54⁄3,84 = 1,18. La probabilidad de que una variable aleatoria F con
19 grados de libertad en el numerador y en el denominador, sea mayor que 1,18,
es 0,3610. Por consiguiente, el valor P del estadístico de prueba 𝐹𝑜 = 0,85 es la
suma de estas dos probabilidades, o P = 0,3634+0,3634=0,7244. Como el valor P
es mayor que 0,05, no es posible rechazar la hipótesis nula.

6. PRUEBA DE BONDAD DEL AJUSTE.

Los procedimientos de prueba de hipótesis que se han presentado anteriormente


están diseñados para problemas en los que conoce la población o distribución de
probabilidad y la hipótesis involucra los parámetros de la distribución. A menudo
se encuentra otra clase de hipótesis: no se sabe cuál es la distribución de la
población, y se desea probar la hipótesis de que una distribución en particular será
un modelo satisfactorio de la población. Por ejemplo, tal vez se quiera probar la
hipótesis de que la población es normal.

Son medidas sobre qué tan cerca se ajustan los datos muéstrales observados a
una forma de distribución particular planteada como hipótesis. Si el ajuste es
razonablemente cercano, puede concluirse que si existe la forma de distribución
planteada como hipótesis.

6.1 Prueba chi-cuadrada ( 2) de bondad del ajuste

La distribución chi cuadrada es toda una familia de distribuciones. Existe una


distribución chi-cuadrada para cada grado de libertad y a medida que se
incrementan los grados de libertad la distribución se vuelve menos sesgada.

El procedimiento de prueba requiere una muestra aleatoria de tamaño n


proveniente de la población cuya distribución de probabilidad es desconocida.
Estas n observaciones se acomodan en un histograma de frecuencia, el cual tiene

30
k intervalos de clase. Sea Oi la frecuencia observada en el i-ésimo intervalo de
clase. De la distribución de probabilidad propuesta, se calcula la frecuencia
esperada en el i-ésimo intervalo de clase, la cual se denota por Ei. El estadístico
de prueba es:

 
2
k
Oi  Ei 2
i 1 Ei

Puede demostrarse que, si la población sigue la distribución propuesta, X 2 tiene,


de manera aproximada, una distribución Ji-cuadrada con k-p-1 grados de libertad,
donde p representa el número de parámetros de la distribución propuesta
estimada por los estadísticos muéstrales. Esta aproximación mejora a medida que
n aumenta. Debe rechazarse la hipótesis de que la distribución de la población es
la distribución propuesta, si el valor calculado del estadístico de prueba es 𝑋02 >
2
𝑋∝,𝑘−𝑝−1

Un aspecto que debe notarse en la aplicación de este procedimiento de prueba es


el relacionado con la magnitud de las frecuencias esperadas. Si estas frecuencias
son muy pequeñas, entonces el estadístico de prueba X 2 no reflejará el
alejamiento entre lo observado y lo esperado, sino sólo la pequeña magnitud de
las frecuencias esperadas.

Ejemplo.

Un científico de la computación ha desarrollado un algoritmo para generar enteros


seudoaleatorios sobre el intervalo 0 a 9. El científico codifica el algoritmo y genera
1000 dígitos seudoaleatorios. La tabla contiene los datos como frecuencias
observadas. ¿Existe evidencia de que el generador de números aleatorios
funciona de manera correcta? Utilice ∝= 0,05

31
Si el generador de números aleatorios está trabajando correctamente, entonces
los valores 0-9 deben tener distribución discreta uniforme, lo que implica que cada
uno de los enteros debe presentarse exactamente 100 veces. Por tanto, las
frecuencias esperadas son Ei = 100, para i = 0, 1,…9. Estas frecuencias
esperadas también aparecen en la tabla. Puesto que estas frecuencias esperadas
pueden obtenerse sin estimar ningún parámetro a partir de los datos muéstrales,
el estadístico Ji-cuadrada de bondad del ajuste tendrá k-p-1= 10-1=9 grados de
libertad.
1. Planteamiento del problema.

2. Planteamiento de Hipótesis.

𝐻𝑜 : 𝐿𝑎 𝑓𝑜𝑟𝑚𝑎 𝑑𝑒 𝑙𝑎 𝑑𝑖𝑠𝑡𝑟𝑖𝑏𝑢𝑐𝑖ó𝑛 𝑒𝑠 𝑙𝑎 𝑑𝑖𝑠𝑡𝑟𝑖𝑏𝑢𝑐𝑖ó𝑛 𝑢𝑛𝑖𝑓𝑜𝑟𝑚𝑒 𝑑𝑖𝑠𝑐𝑟𝑒𝑡𝑎

𝐻𝑜 : 𝐿𝑎 𝑓𝑜𝑟𝑚𝑎 𝑑𝑒 𝑙𝑎 𝑑𝑖𝑠𝑡𝑟𝑖𝑏𝑢𝑐𝑖ó𝑛 𝑛𝑜 𝑒𝑠 𝑙𝑎 𝑑𝑖𝑠𝑡𝑟𝑖𝑏𝑢𝑐𝑖ó𝑛 𝑢𝑛𝑖𝑓𝑜𝑟𝑚𝑒 𝑑𝑖𝑠𝑐𝑟𝑒𝑡𝑎

3. Tipo de distribución y gráfica

Distribución Ji-cuadrada

16,92
3,72

4. Regla de decisión

2
Acepto Ho si: 𝑋02 < 𝑋0,05;9

32
2
Rechazar Ho si: 𝑋02 ≥ 𝑋0,05;9

5. Calculo de 𝑋02

(94 − 100)2 (93 − 100)2 (94 − 100)2


𝑋02 = + +⋯+ = 3,72
100 100 100

6. Toma de decisión

2
Como: 𝑋02 = 3,72 < 𝑋0,05;9 = 16,92 no es posible rechazar la hipótesis de que
los datos provienen de una distribución uniforme discreta. Por consiguiente parece
ser que el generador de números aleatorios trabaja de manera satisfactoria. El
valor P para 𝑋02 = 3,72 es P = 0,929.

7. REGRESIÓN LINEAL MÚLTIPLE

Es una de las técnicas estadísticas más ampliamente utilizadas, se presentarán


algunas técnicas básicas de estimación de parámetros, de estimación del intervalo
de confianza y de la verificación de la suficiencia del modelo para la regresión
múltiple.

En la Regresión lineal múltiple modelizamos la relación entre una variable


dependiente y dos o más variables independientes mediante una función lineal,
una función que será, ahora, no una recta, como sucedía con la Regresión lineal
simple, sino un plano (si tenemos dos variables independientes) o un hiperplano
(si tenemos más de dos variables independientes).

En la Regresión lineal múltiple el punto de partida es el mismo que en la


Regresión lineal simple. Se pretende modelizar la relación entre unas variables
con la finalidad última de poder pronosticar una de ellas: la variable dependiente, a
partir del conocimientos de las otras: las variables independientes. En la
Regresión lineal múltiple se introducen nuevas variables independientes con la

33
finalidad de reducir la dispersión de la predicción, con la finalidad de disminuir el
residuo.

El modelo de regresión lineal múltiple tiene la forma

siendo U el término de perturbación o error

Para determinar el modelo anterior, es necesario hallar (estimar) el valor de los


coeficientes β1, β2, ..., βk. La linealidad en parámetros posibilita la interpretación
correcta de los parámetros del modelo. Los parámetros miden la intensidad media
de los efectos de las variables explicativas sobre la variable a explicar y se
obtienen al tomar las derivadas parciales de la variable a explicar respecto a cada
una de las variables explicativas:

Hipótesis sobre el término de perturbación:

Para una muestra de n observaciones (cada observación estará formada por una
tupla con los valores de X2, X3,..., Xk y el valor de Y asociado), tendremos el
siguiente sistema de n ecuaciones lineales:

o, en forma matricial: Y = X⋅β + U, donde:

34
Estimación por mínimos cuadrados ordinarios:

Sea un modelo en forma matricial Y = X⋅B + U. Supongamos que el modelo ha


sido estimado, obteniéndose Ŷ, vector de valores de la variable dependiente
implicado por el modelo. La diferencia entre los valores observados y los valores
estimados, e = Y − Yˆ = Y − X ⋅ Bˆ , la denominaremos vector de residuos. Ahora
bien, nuestro problema consiste en minimizar la suma de los cuadrados de
residuos, e’e con respecto del vector de parámetros estimados, B.

Ejemplo:

Una familia desea estimar sus gastos de alimentación (Y) en base a la información
que proporcionan las variables regresoras X1= “ingresos mensuales” y X2 =
“número de miembros de la familia”. Para ello se recoge una muestra aleatoria
simple de 15 familias cuyos resultados son los de la tabla. (El gasto e ingresos
está dado en cientos de miles de pesos)

35
Datos en forma matricial:

Con estos datos se obtiene

36
Por tanto

De donde

El modelo de regresión lineal que se obtiene es:

A partir de esta ecuación se obtienen las predicciones y los residuos asociados a


las observaciones muéstrales. Para la primera observación
se obtiene

Razonando así en todos los puntos muéstrales se obtiene

37
Calculo de SCR

CONCLUSIONES.

38
Una prueba de hipótesis estadística ofrece un conjunto de hipótesis que se
excluyen mutuamente y establece una conclusión en cuanto a estas hipótesis.
Dicha conclusión se debe reinterpretar en cuanto a las hipótesis originales para
facilitar el entendimiento del informe.

La conclusión de una prueba de hipótesis apunta hacia la localización del


resultado de un informe, dado que dicha conclusión afirma a qué hipótesis de la
prueba apuntan los datos. La mayoría de los informes estadísticos dan sus
conclusiones en la forma "se rechaza la hipótesis nula en favor de la hipótesis
alternativa" o "no rechazamos la hipótesis nula"

El valor "p" es posiblemente la pieza más importante de información en una


prueba de hipótesis estadística. Aunque la definición matemática de un valor de
"p" puede ser complicado para las personas comunes, una manera fácil de
interpretarlo es la "fuerza" de las pruebas para la conclusión. Para rechazar la
hipótesis nula, los valores "p" cercanos a cero muestran evidencia más fuerte,
mientras que para la aceptación (o no rechazar) de la hipótesis nula, los valores
de “p” más cercanos a uno muestran evidencia más fuerte.

Siempre que se emplea una prueba de hipótesis en la toma de decisiones está


involucrada una acción; y el hecho de no realizar acciones cuando no se rechaza
H0 está dado por el riesgo de cometer error tipo II, y para disminuir esta
incertidumbre se debe calcular éste error.

Los errores tipo I y tipo II están relacionados. Una disminución en la probabilidad


de uno por lo general tiene como resultado un aumento en la probabilidad del otro;
así como, un aumento en el tamaño muestral n reducirá α y β de forma simultánea

El tamaño de la región crítica, y por tanto la probabilidad de cometer un error tipo I,


siempre se puede reducir al ajustar el o los valores críticos.

Si la hipótesis nula es falsa, β es un máximo cuando el valor real del parámetro se


aproxima al hipotético. Entre más grande sea la distancia entre el valor real y el
valor hipotético, será menor β.

Referencias.

39
[Link]

[Link]
est-ind-clase03

[Link]
res/[Link]

[Link]
RECTORADOS/INVESTIGACION/O.T.R.I/OFERTAS%20TECNOLOGICAS/DMA
C/DOCUMENTOS%20Y%20TUTORIALES/REGRESION_LINEAL_MULTIPLE_3.
PDF

40

También podría gustarte