0% encontró este documento útil (0 votos)
71 vistas12 páginas

P4 Prueba de Hipótesis

Este documento describe cómo realizar una prueba de hipótesis estadística en Excel para comparar dos conjuntos de datos y determinar si provienen de la misma población. Explica los pasos para seleccionar la prueba apropiada (como una prueba t), ingresar los datos y parámetros, y obtener los resultados en Excel.
Derechos de autor
© © All Rights Reserved
Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.
Formatos disponibles
Descarga como DOCX, PDF, TXT o lee en línea desde Scribd
0% encontró este documento útil (0 votos)
71 vistas12 páginas

P4 Prueba de Hipótesis

Este documento describe cómo realizar una prueba de hipótesis estadística en Excel para comparar dos conjuntos de datos y determinar si provienen de la misma población. Explica los pasos para seleccionar la prueba apropiada (como una prueba t), ingresar los datos y parámetros, y obtener los resultados en Excel.
Derechos de autor
© © All Rights Reserved
Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.
Formatos disponibles
Descarga como DOCX, PDF, TXT o lee en línea desde Scribd
Está en la página 1/ 12

Estadística aplicada a la investigación

La distribución normal o campana de Gauss


(distribución de Gauss) es una distribución
estadística continua de probabilidad.

La distribución normal fue reconocida por primera vez por el francés Abraham de


Moivre (1667-1754). Posteriormente, Carl Friedrich Gauss (1777-1855) formuló la
ecuación de la curva y elaboró desarrollos más profundos.

La distribución de una variable normal está determinada por dos parámetros, su media y
su desviación estándar, denotadas generalmente por y. Con esta notación, la densidad de
la normal viene dada por la ecuación:

 
En la columna A disponemos del tiempo empleado por el departamento de
atención al cliente de nuestra empresa, para las quejas y reclamaciones y deseamos
mostrar el gráfico de campana de Gauss.
  A B
1 Valores (minutos) Distribución normal
2 3,00  
3 1,36  
4 0,56  
5 2,26  
6 4,33  
7 4,58  
8 2,25  
9 3,27  
10 4,16  
11 1,10  
12 2,25  
13 2,00  
14 3,34  
15 3,25  
16 2,47  
17 2,78  
1. ORDENAR DATOS. Clic sobre cualquier celda de la columna
A. Seleccionamos una celda del rango para ordenar por dicho criterio.
2. Ir a: Cinta de opciones / Pestaña: Datos / Grupo: Ordenar y
Filtrar / AZ (ordenar de menor a mayor). Ordenará los datos de
forma ascendente.

 
 PROMEDIO
Muestra el promedio o media aritmética de los valores.
1. Ir a: Celda F1. Celda donde deseamos obtener el promedio.
2. Escribir la función:
=PROMEDIO(A2:A17)

 
 DESVIACIÓN ESTÁNDAR
Muestra la desviación estándar en función de la muestra.

1. Ir a: Celda F2. Celda donde deseamos obtener la desviación estándar.


2. Escribir la función:
=DESVEST.M(A2:A17)

 
 DISTRIBUCIÓN NORMAL
Muestra la distribución normal para la media y la desviación estándar de los valores
(empleando la función de densidad de probabilidad = Falso).

1. Ir a: Celda B2. Celda donde deseamos obtener la desviación estándar.


2. Escribir la función:
=DISTR.NORM.N(A2;$F$1;$F$2;FALSO)
3. Copiar la celda B2.
4. Pegar en el rango B3:B17.
 
 GRÁFICO: CAMPANA DE GAUSS
1. Seleccionar el rango A1:B17. Rango de datos para representar la
campana de Gauss.
2. Ir a: Cinta de opciones / Pestaña: Insertar / Grupo: Gráficos /
Dispersión / Dispersión con líneas suavizadas. Tipo de gráfico
deseado para el gráfico.
3. Aplicar el diseño y formato deseado al gráfico.
 
 DISTRIBUCIÓN NORMAL ACUMULADA
Muestra la distribución normal para la media y la desviación estándar de los valores
(empleando la función de distribución acumulativa = Verdadero).

1. Ir a: Celda C2. Celda donde deseamos obtener la desviación estándar


acumulada.
2. Escribir la función:
=DISTR.NORM.N(A2;$F$1;$F$2;VERDADERO)
3. Copiar la celda C2.
4. Pegar en el rango C3:C17.
5. Seleccionar el rango A1:A17 y C1:C17. Rango de datos para
representar la campana de Gauss acumulado.
6.
Ir a: Cinta de opciones / Pestaña: Insertar / Grupo: Gráficos /
Dispersión / Dispersión con líneas suavizadas. Tipo de gráfico
deseado para el gráfico.
Función DISTR.T
Excel para Microsoft 365 Excel para Microsoft 365 para Mac Más...

En este artículo se describen la sintaxis de la fórmula y el uso de la función DISTR.T


en Microsoft Excel.

Descripción

Devuelve los puntos porcentuales (probabilidad) de la distribución t de Student, donde


un valor numérico (x) es un valor calculado de t para el que debe calcular los puntos
porcentuales. Puede usar la distribución t de Student para comprobar pruebas de
hipótesis cuando el tamaño de la muestra es pequeño. Use esta función en lugar de una
tabla de valores críticos para la distribución t.

Importante: Esta función se ha sustituido por una o más funciones nuevas que pueden
proporcionar una precisión mejorada y cuyos nombres reflejan mejor su uso. Aunque
esta función sigue estando disponible para la compatibilidad con versiones anteriores, a
partir de ahora debe considerar el uso de las funciones nuevas, ya que puede que esta
función no esté disponible en futuras versiones de Excel.

Para más información sobre las nuevas funciones, vea DISTR.T.2C (función
DISTR.T.2C) and DISTR.T.CD (función DISTR.T.CD).

Sintaxis

DISTR.T(x,grados_de_libertad,colas)

La sintaxis de la función DISTR.T tiene los siguientes argumentos:

 X     Obligatorio. Es el valor numérico al que debe evaluar la distribución.

 Grados_de_libertad     Obligatorio. Es un número entero que indica el número


de grados de libertad.

 Colas     Obligatorio. Especifica el número de colas de la distribución que deben


devolverse. Si colas = 1, DISTR.T devuelve la distribución de una cola. Si colas
= 2, DISTR.T devuelve la distribución de dos colas.

Observaciones

 Si uno de los argumentos no es numérico, DISTr. t devuelve el #VALUE! o


#VALOR!.

 Si Deg_freedom < 1, DISTr. t devuelve el #NUM! o #VALOR!.

 Grados_de_libertad y colas se truncan a enteros.


 Si colas es un valor distinto de 1 o 2, DISTr. t devuelve el valor de #NUM! o
#VALOR!.

 Si x < 0, DISTr. t devuelve el #NUM! o #VALOR!.

 Si colas = 1, DISTR.T se calcula como DISTR.T = P( X>x ), donde X es una


variable aleatoria que sigue la distribución t. Si colas = 2, DISTR.T se calcula
como DISTR.T = P(|X| > x) = P(X > x o X < -x).

 Puesto que x < 0 no está permitido, para usar DISTR.T cuando x < 0, tenga en
cuenta que DISTR.T(-x,df,1) = 1; DISTR.T(x,df,1) = P(X > -x) y DISTR.T(-
x,df,2) = DISTR.T(x,df,2) = P(|X| > x).

Ejemplo

Copie los datos de ejemplo en la tabla siguiente y péguelos en la celda A1 de una hoja
de cálculo nueva de Excel. Para que las fórmulas muestren los resultados, selecciónelas,
presione F2 y luego ENTRAR. Si lo necesita, puede ajustar el ancho de las columnas
para ver todos los datos.

Datos Descripción
1,959999998 Valor en el que se desea evaluar la distribución
60 Grados de libertad
Fórmula Descripción (resultado) Resultado
Distribución de dos colas (0,054644930 o 5,46 por
=DISTR.T(A2;A3;2) 5,46%
ciento)
Distribución de una cola (0,027322465 o 2,73 por
=DISTR.T(A2;A3;1) 2,73%
ciento)

Práctica 3: prueba de hipótesis en Excel


Paso 1.- Escribe tus datos en una hoja de cálculo de Excel en formato de columna.
Por ejemplo, si tienes dos conjuntos de datos de una población, escribe un conjunto
de datos en la columna "A" y el segundo conjunto de datos en la columna "B".
Paso 2.- Haz clic en "Herramientas" y luego haz clic en "Análisis de datos".
Paso 3.-Haz clic en una prueba para realizarla. Por ejemplo, si quieres realizar una
prueba de hipótesis para una prueba "t" con varianzas iguales, has clic en "prueba t: dos
muestras suponiendo varianzas iguales". Haz clic en "Aceptar" para hacer tu selección.
Paso 4
Escribe la ubicación de tus datos en la ventana de prueba de hipótesis. Los campos que
se muestran dependerán de qué prueba hayas seleccionado. En el ejemplo del paso
anterior, escribe las ubicaciones de las celdas para los datos de la primera población en
el cuadro de texto "Rango de variable 1" y escribe las ubicaciones de las celdas para los
adatos de la segunda población en el cuadro de texto "Rango de variable 2".

Paso 5.- Escribe un número decimal para el nivel alfa en el cuadro de texto "Alpha".
Por ejemplo, si quieres seleccionar un nivel alpha de 10 por ciento, escribe ".1" en el
cuadro de texto.
Paso 6.- Escribe un rango de salida en el cuadro de texto "Rango de salida". Por
ejemplo, si quieres que tus resultados se muestren en la hoja de cálculo comenzando en
la celda E1, escribe "E1" en el cuadro de texto.
Paso 7.- Haz clic en "Aceptar". Excel realizará la prueba y los resultados aparecerán en
la hoja de cálculo.

Problema 1.- Un investigador de mercados y hábitos de comportamiento afirma que el


tiempo que los niños de tres a cinco años dedican a ver la televisión cada semana se distribuye
normalmente con una media de 22 horas y desviación estándar 6 horas. Frente a este estudio,
una empresa de investigación de mercados cree que la media es mayor y para probar su
hipótesis toma una muestra de 64 observaciones procedentes de la misma población,
obteniendo como resultado una media de 25. Si se utiliza un nivel de significación del 5%.
Verifique si la afirmación del investigador es realmente cierta.

SOLUCIÓN

Ho: µ= 22

Ha: µ<>22

α =0.05

n=64

m=25

Zc>1.96

Se rechaza la hipótesis nula

Problema 2.- Una empresa eléctrica fabrica baterías de celular que tienen una duración
que se distribuye de forma aproximadamente normal con una media de 800 horas. Se extrae
una muestra aleatoria de 30 baterías, ¿muestran los datos suficiente evidencia para decir que
la duración media no es de 800 horas?.

755 752 770 780 806 769 814 782 798 774
786 752 702 799 824 820 771 752 776 805
792 832 848 760 828 772 792 803 803 817
µ=800 horas

Ho: µ=800

Ha: µ<>800

Resp.- Se rechaza la hipótesis nula.


Problema 3.- En los últimos tiempos hay una cantidad cada vez mayor de opciones de
entretenimiento que compiten por el tiempo de los consumidores. En el 2016, la televisión
por cable y el Internet superaron a la televisión abierta, a la radio y a los periódicos,
convirtiéndose en los medios de entretenimiento más usados. Con una muestra de 15
individuos se obtienen los datos de las horas por semana que ven televisión por cable y de
las horas por semana que navegan en el Internet.

Haga una prueba para la diferencia entre las medias poblacionales de la cantidad de horas
de televisión por cable y de la cantidad de horas que navegan en Internet.

Número Internet TV por Cable


1 22 25

2 8 10

3 25 29

4 22 19

5 12 13

6 26 28

7 22 23

8 19 21

9 21 21

10 23 23

11 14 15

12 14 18

13 14 17

14 16 15

24 23
15

i. Formulación de hipótesis
H 0 :μ d =0

H a : μd ≠ 0

ii. Estadístico de prueba


n

∑ (d 2−d 2 )
i
i=1
S 2d =
Cuando no se conoce σ2 y n < 30, n
d́−μd
t c= t n −1
S d́

Sd
Sd́ =
√n
Usando estas fórmulas, con ayuda de Excel obtenemos Sd =1.971, tc =
2.3577
De la tabla o Excel deducimos
tα/2 = 1.761
Comparando estos valores observamos que tc > tα/2
Lo que demuestra que tc está en la zona de rechazo, por tanto
rechazamos Ho.

Problema 4.-
En una universidad peruana se toma una muestra aleatoria de 600
mujeres, 300 de las cuales indican que están a favor de la supresión de
sustentación de tesis en público. En una muestra de 400 hombres, 240
indican que están a favor del mismo. Pruebe la hipótesis al nivel del 5%
si la diferencia entre las proporciones es significativa.
SOLUCIÓN
1. Formulación de hipótesis
H 0 :P 1=P2

H a : P1 ≠ P2

2. Nivel de significancia
α=0.05
3. Elección del estadístico de prueba
p1− p 2−( P1−P 2)
Z c= N (0,1)
Sp −p
1 2
1 2

S p − p = p(1−p)
( n1 + n1 )
1 2

x 1+ x2 300+240
p= = =0.54
n1+ n2 600+400

300 240 0.5−0.6−0


p1 = =0. 5 p2 = =0 .6 Z c= =−3.11
600 400
√ 0.54 (1−0.54) ( 6001 + 4001 )
4. Formulación de la regla de decisión
Si Zc es menor que -1,96 o mayor a 1,96; entonces se rechaza la H0.
Z t =Z 0. 05 =±1 . 96
2

5. Toma de decisión
Existen evidencias estadísticas con un nivel de significancia del 5%
para rechazar la H0 y aceptar Ha, con lo que se concluye que la
diferencia entre las proporciones es significativa, al nivel de
significancia del 5%.

También podría gustarte