CAPÍTULO 12
PRUEBAS DE BONDAD DE AJUSTE E INDEPENDENCIA
1. EJERCICIO N° 5
¿Dónde es más frecuente que las mujeres compren ropa informal? Según la base de datos de U.S.
Shopper se obtuvieron los porcentajes siguientes acerca de las compras de ropa que realizan las
mujeres en cada uno de los distintos tipos de tiendas.
La categoría otras comprende tiendas como Target, Kmart y Sears, así como numerosas tiendas
especializadas. Ninguna de las tiendas de este grupo tiene más de 5% de las compras femeninas. En
Atlanta, Georgia, un estudio reciente en el que se usó una muestra de 140 mujeres, los datos
encontrados fueron Wal-Mart, 42; Tiendas departamentales tradicionales, 20; JC Penny, 8; Kohl´s,
10; por correo, 21; otras, 39. ¿Estos datos muestran que en Atlanta las compras femeninas difieren
de las preferencias que indica la base de datos de U.S. Shopper? ¿Cuál es el valor-p? ¿Cuál es la
conclusión?
𝑃𝐴 = 𝐹𝑟𝑒𝑐𝑢𝑒𝑛𝑐𝑖𝑎 𝑑𝑒 𝑐𝑜𝑚𝑝𝑟𝑎 𝑑𝑒 𝑟𝑜𝑝𝑎 𝑖𝑛𝑓𝑜𝑟𝑚𝑎𝑙 𝑑𝑒 𝑙𝑎𝑠 𝑚𝑢𝑗𝑒𝑟𝑒𝑠 𝑒𝑛 𝑊𝑎𝑙 − 𝑀𝑎𝑟𝑡
𝑃𝐵 = 𝐹𝑟𝑒𝑐𝑢𝑒𝑛𝑐𝑖𝑎 𝑑𝑒 𝑐𝑜𝑚𝑝𝑟𝑎 𝑑𝑒 𝑟𝑜𝑝𝑎 𝑖𝑛𝑓𝑜𝑟𝑚𝑎𝑙 𝑑𝑒 𝑙𝑎𝑠 𝑚𝑢𝑗𝑒𝑟𝑒𝑠 𝑒𝑛 𝑙𝑎𝑠 𝑡𝑖𝑒𝑛𝑑𝑎𝑠 𝑑𝑒𝑝𝑎𝑟𝑡. 𝑡𝑟𝑎𝑑.
𝑃𝐶 = 𝐹𝑟𝑒𝑐𝑢𝑒𝑛𝑐𝑖𝑎 𝑑𝑒 𝑐𝑜𝑚𝑝𝑟𝑎 𝑑𝑒 𝑟𝑜𝑝𝑎 𝑖𝑛𝑓𝑜𝑟𝑚𝑎𝑙 𝑑𝑒 𝑙𝑎𝑠 𝑚𝑢𝑗𝑒𝑟𝑒𝑠 𝑒𝑛 𝐽𝐶 𝑃𝑒𝑛𝑛𝑒𝑦
𝑃𝐷 = 𝐹𝑟𝑒𝑐𝑢𝑒𝑛𝑐𝑖𝑎 𝑑𝑒 𝑐𝑜𝑚𝑝𝑟𝑎 𝑑𝑒 𝑟𝑜𝑝𝑎 𝑖𝑛𝑓𝑜𝑟𝑚𝑎𝑙 𝑑𝑒 𝑙𝑎𝑠 𝑚𝑢𝑗𝑒𝑟𝑒𝑠 𝑒𝑛 𝑙𝑎 𝐾𝑜ℎ𝑙′𝑠
𝑃𝐸 = 𝐹𝑟𝑒𝑐𝑢𝑒𝑛𝑐𝑖𝑎 𝑑𝑒 𝑐𝑜𝑚𝑝𝑟𝑎 𝑑𝑒 𝑟𝑜𝑝𝑎 𝑖𝑛𝑓𝑜𝑟𝑚𝑎𝑙 𝑑𝑒 𝑙𝑎𝑠 𝑚𝑢𝑗𝑒𝑟𝑒𝑠 𝑝𝑜𝑟 𝐶𝑜𝑟𝑟𝑒𝑜
𝑃𝐹 = 𝐹𝑟𝑒𝑐𝑢𝑒𝑛𝑐𝑖𝑎 𝑑𝑒 𝑐𝑜𝑚𝑝𝑟𝑎 𝑑𝑒 𝑟𝑜𝑝𝑎 𝑖𝑛𝑓𝑜𝑟𝑚𝑎𝑙 𝑑𝑒 𝑙𝑎𝑠 𝑚𝑢𝑗𝑒𝑟𝑒𝑠 𝑒𝑛 𝑜𝑡𝑟𝑎𝑠 𝑡𝑖𝑒𝑛𝑑𝑎𝑠
𝐻𝑜 ∶ 𝑃𝐴 = 0.24, 𝑃𝐵 = 0.11, 𝑃𝐶 = 0.8, 𝑃𝐷 = 0.8, 𝑃𝐸 = 0.12, 𝑃𝐹 = 0.37
𝐻𝐴 ∶ 𝐿𝑎𝑠 𝑝𝑟𝑜𝑝𝑜𝑟𝑐𝑖𝑜𝑛𝑒𝑠 𝑛𝑜 𝑠𝑜𝑛 𝑃𝐴 = 0.24, 𝑃𝐵 = 0.11, 𝑃𝐶 = 0.8, 𝑃𝐷 = 0.8, 𝑃𝐸 = 0.12, 𝑃𝐹 = 0.37
CUADRADO DE LA
DIFERENCIA
CUADRO DE DIVIDIDO ENTRE
PROPORCIÓN FRECUENCIA FRECUENCIA LA FRECUENCIA
HIPOTÉTICA OBSERVADA ESPERADA DIFERENCIA DIFERENCIA ESPERADA
CATEGORÍA (ʄᵢ) (eᵢ) (ʄᵢ - eᵢ) (ʄᵢ - eᵢ)² (ʄᵢ - eᵢ)²/eᵢ
Wal-Mart 0.24 42 33.6 8.4 70.56 2.10
Tiendas
departamentales
tradicionales 0.11 20 15.4 4.6 21.16 1.37
JC Penney 0.08 8 11.2 -3.2 10.24 0.91
Kohl's 0.08 10 11.2 -1.2 1.44 0.13
Por correo 0.12 21 16.8 4.2 17.64 1.05
Otras 0.37 39 51.8 -12.8 163.84 3.16
140 X² = 8.73
𝑋 2 = 8.73
K (número de categorías) = 6
Grados de libertad (K-1) = 5
P-VALOR se encuentra entre 0.90 y 0.10 Por lo tanto, teniendo in nivel de significancia del 5%:
P-Valor > 0.05
Se Acepta 𝐻𝑜 , confirmando que…..
2. EJERCICIO N° 6
La American Bankers Association recoge datos sobre el uso de tarjetas de crédito, tarjetas de débito,
efectivo y cheques personales en el pago de compras en tienda (The Wall Street Journal, 16 de
diciembre de 2003). En 1999, los datos encontrados fueron los siguientes:
En una muestra tomada en el 2003, en 220 compras en tienda se encontró que en 46 se usó tarjeta
de crédito, en 67 se usó tarjeta de débito, en 33 se usó un cheque personal y en 74 se pagó en
efectivo.
N 220
α 0.01
Σ(fi − ℯi)2
𝑥2 =
ℯi
1999 2003
TIENDA ESPERADOS % OBSERVADOS SUMATORIA %
TARJETA DE CRÉDITO 48.40 22% 46 0.12 21%
TARJETA DE DÉBITO 46.20 21% 67 9.36 30%
CHEQUE PERSONAL 39.60 18% 33 1.10 15%
EFECTIVO 85.80 39% 74 1.62 34%
Sumando cada resultado del procedimiento, el x2 calculado es igual a:
𝑥 2 𝑐𝑎𝑙𝑐𝑢𝑙𝑎𝑑𝑜 = 12.21
Con un α=0.01 y con grados de libertad (n-1)=(4-1)=3 el chi-cuadrado de tabla es igual a:
𝑥 2 𝑡𝑎𝑏𝑙𝑎 = 11.345
𝑥 2 𝑐𝑎𝑙𝑐𝑢𝑙𝑎𝑑𝑜 > 𝑥 2 𝑡𝑎𝑏𝑙𝑎; 𝑆𝑒 𝑟𝑒𝑐ℎ𝑎𝑧𝑎 𝑙𝑎 𝐻0
a. Con α= 0.01 ¿puede concluir que, en este periodo de cuatro años, de 1999 a 2003, ha habido
un cambio en la manera en que los clientes pagan sus compras en las tiendas? ¿Cuál es el
valor-p?
- Aumentó la manera de pagar por el medio de Tarjeta de Débito, mientras que los otros
métodos de pago se han mantenido estable.
- El valor -p está ubicado dentro de 0.01 y 0.005 por lo cual se rechaza la H0
b. A partir de los datos muestrales del 2003, calcule el porcentaje de uso de cada método de pago.
¿Cuál parece haber sido el principal o los principales cambios ocurridos en este periodo de cuatro
años? c. En 2003, ¿qué porcentaje de los pagos se hicieron con tarjeta (tarjeta de crédito o débito)?
El mayor cambio ocurrido es el uso de tarjetas de débito con un 8% de crecimiento.
El uso total de tarjetas es de 51%
3. EJERCICIO N° 7
En el cuadro de accionistas de The Wall Street Journal se sigue el comportamiento de las 1 000
empresas principales de Estados Unidos (The Wall Street Journal, 10 de marzo de 2003). El
comportamiento de cada empresa se califica con base en los rendimientos anuales totales, que
comprenden cambios en los precios de las acciones y reinversión de dividendos. Las calificaciones
se asignan dividiendo las 1000 empresas en 5 grupos, del A (20% mejor), B (siguiente 20%), hasta E
(20% inferior). Lo que se muestra a continuación son las calificaciones en un año obtenidas por las
60 empresas más grandes. ¿El comportamiento de las empresas más grandes difiere de las 1000
empresas del cuadro de accionistas?
𝑃𝐴 = 𝐶𝑜𝑚𝑝𝑜𝑟𝑡𝑎𝑚𝑖𝑒𝑛𝑡𝑜 𝑑𝑒 𝑙𝑎 𝑒𝑚𝑝𝑟𝑒𝑠𝑎 𝐴
𝑃𝐵 = 𝐶𝑜𝑚𝑝𝑜𝑟𝑡𝑎𝑚𝑖𝑒𝑛𝑡𝑜 𝑑𝑒 𝑙𝑎 𝑒𝑚𝑝𝑟𝑒𝑠𝑎 𝐵
𝑃𝐶 = 𝐶𝑜𝑚𝑝𝑜𝑟𝑡𝑎𝑚𝑖𝑒𝑛𝑡𝑜 𝑑𝑒 𝑙𝑎 𝑒𝑚𝑝𝑟𝑒𝑠𝑎 𝐶
𝑃𝐷 = 𝐶𝑜𝑚𝑝𝑜𝑟𝑡𝑎𝑚𝑖𝑒𝑛𝑡𝑜 𝑑𝑒 𝑙𝑎 𝑒𝑚𝑝𝑟𝑒𝑠𝑎 𝐷
𝑃𝐸 = 𝐶𝑜𝑚𝑝𝑜𝑟𝑡𝑎𝑚𝑖𝑒𝑛𝑡𝑜 𝑑𝑒 𝑙𝑎 𝑒𝑚𝑝𝑟𝑒𝑠𝑎 𝐸
𝐻𝑜 ∶ 𝑃𝐴 = 0.20, 𝑃𝐵 = 0.20, 𝑃𝐶 = 0.20, 𝑃𝐷 = 0.20, 𝑃𝐸 = 0.20
𝐻𝐴 ∶ 𝐿𝑎𝑠 𝑝𝑟𝑜𝑝𝑜𝑟𝑐𝑖𝑜𝑛𝑒𝑠 𝑑𝑒𝑙 𝑐𝑜𝑚𝑝𝑜𝑟𝑡𝑎𝑚𝑖𝑒𝑛𝑡𝑜 𝑛𝑜 𝑠𝑜𝑛 𝑃𝐴 = 0.20, 𝑃𝐵 = 0.20, 𝑃𝐶 = 0.20, 𝑃𝐷
= 0.20, 𝑃𝐸 = 0.20
CUADRADO DE LA
DIFERENCIA
CUADRO DE DIVIDIDO ENTRE
PROPORCIÓN FRECUENCIA FRECUENCIA LA FRECUENCIA
HIPOTÉTICA OBSERVADA ESPERADA DIFERENCIA DIFERENCIA ESPERADA
CATEGORÍA (ʄᵢ) (eᵢ) (ʄᵢ - eᵢ) (ʄᵢ - eᵢ)² (ʄᵢ - eᵢ)²/eᵢ
Empresa A 0.2 5 12 -7 49.00 4.08
Empresa B 0.2 8 12 -4 16.00 1.33
Empresa C 0.2 15 12 3 9.00 0.75
Empresa D 0.2 20 12 8 64.00 5.33
Empresa E 0.2 12 12 0 0.00 0.00
60 X² = 11.50
P-valor se encuentra entre 0.025 y 0.01 , por lo tanto al ser un valor inferior al nivel de
significancia, se Rechaza Ho
4. EJERCICIO N° 10
La siguiente tabla de contingencia 3 x 3 contiene las frecuencias observadas en una muestra de 240.
Pruebe la independencia de la variable de los renglones y la variable en las columnas usando la
prueba 2 con α 0.05.
COLUMNA OBSERVADAS ESPERADAS
TOTAL
RENGLON A B C A B C
P 20.0 30.0 20.0 70.00 17.50 30.63 21.88
Q 30.0 60.0 25.0 115.00 28.75 50.31 35.94
R 10.0 15.0 30.0 55.00 13.75 24.06 17.19
60.0 105.0 75.0 240.0 60.00 105.00 75.00
N 240
α 0.05
PROCEDIMIENTO
RENGLON A B C
P 0.36 0.01 0.16
Q 0.05 1.87 3.33
R 1.02 3.41 9.55
x calculado 19.77
x de tabla 9.48
P-VALOR menor a 0.05
SE RECHAZA H0
5. EJERCICIO N° 12
Visa Card USA estudió la frecuencia con que los consumidores de diversos rangos de edades usan
tarjetas plásticas (de crédito o de débito) al pagar sus compras (Associated Press, 16 de enero de
2006). A continuación se presentan los datos muestrales de 300 clientes divididos en cuatro
grupos de edades.
GRUPO DE EDAD
FORMA DE PAGO TOTAL
18-24 25-34 35-44 45 y más
PLÁSTICO 21 27 27 36 111
EFECTIVO O CHEQUE 21 36 42 90 189
TOTAL 42 63 69 126 300
a. Pruebe la independencia entre el método de pago y el grupo de edad. ¿Cuál es el valor-p?
Usando α = 0.05, ¿cuál es su conclusión?
Ho: La forma de pago y el grupo edad son independientes.
Ha: La forma de pago y el grupo edad no son independientes
CUADRADO DE LA
DIFERENCIA
CUADRO DE DIVIDIDO ENTRE
FRECUENCIA FRECUENCIA LA FRECUENCIA
FORMA DE GRUPO DE OBSERVADA ESPERADA DIFERENCIA DIFERENCIA ESPERADA
PAGO EDAD (ʄᵢj) (eᵢj) (ʄᵢj - eᵢj) (ʄᵢj - eᵢj)² (ʄᵢj - eᵢj)²/eᵢj
18-24 21 15.54 5.46 29.81 1.92
25-34 27 23.31 3.69 13.62 0.58
Plástico
35-44 27 25.53 1.47 2.16 0.08
45 y más 36 46.62 -10.62 112.78 2.42
18-24 21 26.46 -5.46 29.81 1.13
Efectivo o 25-34 36 39.69 -3.69 13.62 0.34
cheque 35-44 42 43.47 -1.47 2.16 0.05
45 y más 90 79.38 10.62 112.78 1.42
140 X² = 7.95
X² = 7.95 ,
Grados de libertad (n-1)(m-1)= 3
Entonces el Valor-P se encontrará entre 0.05 y 0.025 , Por lo tanto al ser un valor menor al nivel de
significancia ∞ = 0.05 , se Rechaza 𝐻𝑜 confirmando que la forma de pago y el grupo de edad no
son independientes.
b. Si la forma de pago y el grupo de edad no son independientes, ¿qué observación puede
hacer acerca de la diferencia en el uso de plástico en los diversos grupos de edades?
Que, de 18 a 24 la usan más.
c. ¿Qué consecuencias tiene este estudio para empresas como Visa, MasterCard y Discover?
6. EJERCICIO N° 14
Un estudio del Public Interest Research Group (PIRG) del estado de Washington indica que 46% de
los estudiantes universitarios de tiempo completo trabaja 25 o más horas por semana. El estudio
del PIRG proporciona datos sobre los efectos del trabajo en las calificaciones USA Today, 17 de abril
de 2002). En este estudio, de 200 estudiantes que conformaban la muestra, 90 trabajaban 1-15
horas por semana, 60 trabajaban 16-24 horas por semana y 50 trabajaban 25-34 horas por semana.
A continuación se presentan las cantidades muestrales de estudiantes que indicaron que su trabajo
tenía un efecto positivo, ningún efecto o un efecto negativo sobre sus calificaciones.
a. Realice una prueba de independencia para determinar si el efecto sobre las calificaciones es
independiente de las horas trabajadas por semana. Use α = 0.05. ¿Cuál es el valor-p y cuál es su
conclusión?
OBSERVADOS ESPERADOS
horas trabajadas por semana positivo ninguno negativo total positivo ninguno negativo
1-15 hrs 26 50 14 90 23.85 43.2 22.95
16-24 hrs 16 27 17 60 15.9 28.8 15.3
25-34 hrs 11 19 20 50 13.25 24 12.75
TOTAL 53 96 51 200 53 96 51
α 0.05
n 200
PROCEDIMIENTO
2
Σ(fi − ℯi)2
𝑥 =
ℯi
horas trabajadas por semana positivo ninguno negativo
1-15 hrs 0.19 1.07 3.49
16-24 hrs 0.00063 0.11 0.19
25-34 hrs 0.38 1.04 4.12
𝑥 2 𝑐𝑎𝑙𝑐𝑢𝑙𝑎𝑑𝑜=10.60 ; 𝑥 2 𝑡𝑎𝑏𝑙𝑎 = 9.48
Se rechaza H0
P-valor= Se encuentra entre 0.025 y 0.05
b. Use porcentajes de renglón para conocer más acerca del efecto del trabajo sobre las
calificaciones.
horas trabajadas por semana negativo total %NEGATIVO
1-15 hrs 14 90 7%
16-24 hrs 17 60 9%
25-34 hrs 20 50 10%
TOTAL 200
El efecto negativo sobre las notas es mayor cuando las horas aumentan.
7. EJERCICIO N° 16
En los negocios cada vez se hacen más pedidos en línea. Una asociación recabó datos sobre la
proporción de órdenes electrónicas llenadas correctamente de acuerdo con el tipo de industria
(Investor’s Business Daily, 8 de mayo de 2000). En una muestra de 700 órdenes electrónicas se
obtuvieron los resultados siguientes.
INDUSTRIA
ORDEN TOTAL
FARMACEÚTICA DE CONSUMO COMPUTADORAS TELECOMUNICACIÓN
CORRECTA 207 136 151 178 672
INCORRECTA 3 4 9 12 28
TOTAL 210 140 160 190 700
a. Haga una prueba de hipótesis para determinar si el llenado correcto de las órdenes es
independiente de la industria. Use α = 0.05. ¿Cuál es la conclusión?
Ho: El llenado correcto de las órdenes es independiente de la industria.
Ha: El llenado correcto de las órdenes no es independiente de la industria.
CUADRADO DE LA
CUADRO DE DIFERENCIA
FRECUENCIA FRECUENCIA
DIFERENCIA LA DIVIDIDO ENTRE
ORDEN GRUPO DE EDAD OBSERVADA ESPERADA
DIFERENCIA FRECUENCIA
ESPERADA
(ʄᵢj) (eᵢj) (ʄᵢj - eᵢj) (ʄᵢj - eᵢj)² (ʄᵢj - eᵢj)²/eᵢj
FARMACEÚTICA 207 201.6 5.4 29.16 0.14
DE CONSUMO 136 134.4 1.6 2.56 0.02
CORRECTA
COMPUTADORAS 151 153.6 -2.6 6.76 0.04
TELECOMUNICACIÓN 178 182.4 -4.4 19.36 0.11
INCORRECTA FARMACEÚTICA 3 8.4 -5.4 29.16 3.47
DE CONSUMO 4 5.6 -1.6 2.56 0.46
COMPUTADORAS 9 6.4 2.6 6.76 1.06
TELECOMUNICACIÓN 12 7.6 4.4 19.36 2.55
140 X² = 7.85
X² = 7.85 ,
Grados de libertad (n-1)(m-1)= 3
Entonces el Valor-P se encontrará entre 0.05 y 0.025 , Por lo tanto al ser un valor menor al nivel de
significancia ∞ = 0.05 , se Rechaza 𝐻𝑜 confirmando que la forma de pago y el grupo de edad no
son independientes.
b. ¿Qué industria tiene el porcentaje más alto de órdenes llenadas correctamente?
Farmaceútica , 98.6%
8. EJERCICIO N° 18
Muestras tomadas en tres ciudades, Anchorage, Atlanta y Miniápolis, se usaron para obtener
información acerca del porcentaje de parejas casadas en las que los dos cónyuges trabajan (USA
Today, 15 de enero de 2006). Analice los datos siguientes para ver si el hecho de que los dos
cónyuges trabajen es independiente del lugar donde viven. Use 0.05 como nivel de significancia.
¿Cuál es su conclusión? Dé la estimación general del porcentaje de parejas casadas en las que
ambos cónyuges trabajan.
CUADRADO DE LA
CUADRO DE DIFERENCIA
FRECUENCIA FRECUENCIA
DIFERENCIA LA DIVIDIDO ENTRE
ORDEN GRUPO DE EDAD OBSERVADA ESPERADA
DIFERENCIA FRECUENCIA
ESPERADA
(ʄᵢj) (eᵢj) (ʄᵢj - eᵢj) (ʄᵢj - eᵢj)² (ʄᵢj - eᵢj)²/eᵢj
FARMACEÚTICA 57 47.10743802 9.89256198 97.86 2.08
CORRECTA DE CONSUMO 70 62.80991736 7.19008264 51.70 0.82
-
COMPUTADORAS 63 80.08264463 17.0826446 291.82 3.64
-
FARMACEÚTICA 33 42.89256198 9.89256198 97.86 2.28
INCORRECTA -
DE CONSUMO 50 57.19008264 7.19008264 51.70 0.90
COMPUTADORAS 90 72.91735537 17.0826446 291.82 4.00
140 X² = 13.73
∞ = 0.05
Grados de libertad = 2
P-Valor es menor a 0.005
Por lo tanto al tener un valor inferior al nivel de significancia, se Rechaza Ho