#==============================================================================#
# UNIVERSIDAD PRIVADA ANTENOR ORREGO #
# PROGRAMA DE ESTUDIO: MEDICINA VETERINARIA Y ZOOTECNIA #
# #
#CURSO: Métodos Estadísticos #
# #
#PRÁCTICA: Semana 7 #
# #
#TEMA:Diseño completamente al azar con covariable #
# #
#DOCENTE: Ph. D. José Isaí Cedano Castro #
# #
#==============================================================================#
# 1. Preparamos la base de datos para realizar el análisis de la varianza (ANOVA)
#Observemos primero la estructura de la base de datos con la orden
#"str(nombre_de_la_base_de_datos)"
str(s7_Práctica)
#tibble [223 × 3] (S3: tbl_df/tbl/data.frame)
#$ TRATAMIENTO: chr [1:223] "C" "C" "C" "C" ... (Carácter)
#$ TC : num [1:223] 10 10 10 10 10 10 10 10 10 10 ... (Número)
#$ PESOS : num [1:223] 59 40 43 32 45 60 55 47 55 40 ... (Número)
#Podemos observar que la columna "TRATAMIENTO" la identifica como carácter, sin
embargo
#para nuestros análisis deberia ser factor. Para ello aplicamos la orden
"as.factor()"
#para cambiarlo a factor.
#Por otro lado, la variable Tamaño de Camada (TC) si la identifica como número.
s7_Práctica$TRATAMIENTO<-as.factor(s7_Práctica$TRATAMIENTO)
#Corremos nuevamente la orden "str()" y podemos observar que ahora el TRATAMIENTO
#en el docuemento es un factor
#tibble [223 × 3] (S3: tbl_df/tbl/data.frame)
#$ TRATAMIENTO: Factor w/ 5 levels "C","E","E+LH",..: 1 1 1 1 1 1 1 1 1 1 ...
#$ TC : num [1:223] 10 10 10 10 10 10 10 10 10 10 ...
#$ PESOS : num [1:223] 59 40 43 32 45 60 55 47 55 40 ...
#--------------------Diseño completamente con covariable------------------------
#
# 2. Previo al análisis de la covarianza se plantea las hipótesis estadísticas
# Hipótesis para el factor TRATAMIENTO
# Ho: Todos los niveles del factor TRATAMIENTO tienen el mismo efecto
# Ha: Al menos un par de los niveles del factor TRATAMIENTO tiene efecto diferente
# Hipótesis para el coeficiente de regresión
# Ho: El coeficiente de regresión no es diferente de cero
# Ha: El coeficiente de regresión es diferente de cero
# 3. Ahora si procedemos a realizar el análisis de la covarianza. Para ello
aplicamos
#la función "aov(variable~factor A + variable, data=nombre_de_la_base_de_datos)
ANCOVA<-aov(PESOS ~ TRATAMIENTO + TC, data = s7_Práctica)
#Para observar el cuadro del ANOVA se procede a correr la orden "summary(...)"
summary(ANCOVA)
# Df Sum Sq Mean Sq F value Pr(>F)
#TRATAMIENTO 4 918 230 1.538 0.192
#TC 1 6822 6822 45.693 1.26e-10 ***
#Residuals 217 32397 149
#---
#Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
#Podemos observar dos cosas:
##Existe evidencia estadística para afirmar que todos los tratamientos tienen el
mismo
##efecto
#
##Existe evidencia estadística para afirmar que el coeficiente de regresión es
##diferente de cero
# 4. Prodemos a calcular el coeficiente de determinación, para conocer que
porcentaje
#de la varianza de los datos es explicada por el modelo. Para ello dividimos el
#valor de la "suma de cuadarado de los factores / la suma de cuadrados totales"
R2<-(918+6822)/(918+682+32397)
R2
#[1] 0.2276671
#Podemos observar que el modelo representa un 22.7% de la variabilidad de los datos
# Para poder aceptar los resultados del ANCOVA se tiene que comprobar que se
#cumplan ciertos supuestos, como el supuesto de normalidad y el de homogeneidad
#de varianza
# 5. Comprobar si se cumplen los supuestos del modelo
# a). Supuesto de normalidad
#Para poder conocer si se cumplen el supuesto de normalidad se aplica la prueba
#de shapiro wilK, mediante la función "shapiro.test(residuals(...))
#
#Antes de aplicar dicha prueba se debe de plantear las hipótesis estadísticas
#
# Ho: Los errores se distribuyen de forma normal
# Ha: Los errores no se distribuyen de forma normal
#
#Ahora si procedemos a correr el test de Shapiro
shapiro.test(residuals(ANCOVA))
#Shapiro-Wilk normality test
#
#data: residuals(ANCOVA)
#W = 0.98717, p-value = 0.04251
#Se observa que no existe evidencia estadística para afirmar que los errores se
#distribuyen de forma normal
# b). Supuesto de homogeneidad de varianza
#Para poder conocer si se cumplen el supuesto de homogeneidad de varianza se aplica
#la prueba ncvTest, mediante la función
#"ncvTest(lm(PESOS ~ TRATAMIENTO + TC, data = s7_Práctica)) (Package: Car y
CarData)
#
#Antes de aplicar dicha prueba se debe de plantear las hipótesis estadísticas
#
# Ho: Las varianzas de los grupos son iguales
# Ha: Al menos un par de varianzas entre grupos son diferentes
#
#Ahora si procedemos a correr el test de homogeneidad
ncvTest(lm(PESOS ~ TRATAMIENTO + TC, data = s7_Práctica))
#Non-constant Variance Score Test
#Variance formula: ~ fitted.values
#Chisquare = 3.094945, Df = 1, p = 0.078536
#Podemos observar que existe evidencia estadística para afirmar que las varianzas
#de los grupos son iguales - Se cumple el supuesto de homogeneidad de varianza
# 6. Conclusión
#
# No se acepta los resultados del análisis de la varianza debido a que no se cumple
el
#supuesto de normalidad. Además, el modelo no es eficiente explicando la
variabilidad
#de los datos