4
Lo más leído
5
Lo más leído
6
Lo más leído
DISEÑOS FACTORIALES
1.- ¿Qué es un experimento factorial completo?

Un diseño factorial es un método de selección de tratamientos (es decir, combinaciones
factor-nivel) que se incluirán en un experimento. Un experimento factorial completo es uno
en el que los tratamientos consisten en todas las combinaciones factor- nivel.

2.- ¿Cuántos efectos se pueden estudiar con un factorial 4 x 3 x 2? Bosqueje su tabla de
análisis de varianza.

Se pueden estudiar 7 efectos en este modelo y son A, B, C, AB, AC, BC y ABC.

     FV              SC               GL             CM              F0             Valor-p
  Efecto A           SCA              a-1            CMA           CMA/ CME
  Efecto B           SCB              b-1            CMB           CMB/ CME
  Efecto C           SCC              c-1             CMC          CMC/ CME
  Efecto AB          SCAB         (a-1)(b-1)         CMAB         CMAB/ CME
  Efecto AC          SCAC          (a-1)(c-1)        CMAC         CMAC/ CME
  Efecto BC          SCBC          (b-1)(c-1)        CMBC         CMBC/ CME
                                 (a-1)(b-1)(c-
 Efecto ABC         SCABC                            CMABC        CMABC/ CME
                                       1)
    Error            SCE            abc(n-1)          CME
    Total            SCT            abcn-1


3.- Mencione al menos tres ventajas de la experimentación factorial sobre la estrategia de
mover un factor a la vez.

   1. Permiten estudiar el efecto individual y de interacción de los distintos factores.
   2. Son diseños que se pueden aumentar para formar diseños compuestos en caso de
      que se requiera una exploración más completa.
   3. La interacción y el cálculo de los efectos en los experimentos factoriales se puede
      hacer con aritmética elemental, en particular cuando cada factor se prueba en dos
      niveles.

4.- ¿Cuál es la implicación practica de utilizar tres niveles de prueba en lugar de dos en un
factor dado?

Si un factor se prueba en dos niveles, todo su efecto marginal (individual) es lineal, o sea
que su efecto individual no se puede descomponer; pero, si tuviera tres niveles su efecto
marginal se puede descomponer en una parte lineal y otra cuadrática pura.
5 ¿Por qué no tiene sentido utilizar el modelo de regresión cuando los factores son
cualitativos? Si fueran cuantitativos, ¿Qué se gana con el modelo de regresión en relación
al modelo de efectos?

Porque cuando son cualitativos no se puede hacer un análisis minucioso sobre el
comportamiento de la variable de respuesta alno tener datos numéricos. Con el modelo de
regresión podemos obtener una predicción más acertada del comportamiento de cierta
variable en cambio con el modelo de efectos solo nos sirve para determinar qué tan
significativos son los factores involucrados.

6 ¿Cómo se construye la gráfica de un efecto de interacción doble? ¿Cómo se interpreta?

En el eje de las abscisas se coloca el factor A denotando los niveles que tenga, en el eje de
las ordenadas la variable de respuesta del experimento y en el plano aparecerán tantas
líneas como niveles tenga el factor B. Según el problema debe seleccionarse la combinación
de niveles donde se obtenga el resultado óptimo.

7.- ¿Cuáles son los supuestos del modelo en un diseño factorial y con cuales graficas de
residuos se puede verificar cada uno de estos supuestos?

Los supuestos del modelo son normalidad, varianza constante e independencia de los
residuos y se pueden verificar graficando los residuos contra los predichos en las graficas de
normalidad en la que se cumple el supuesto del modelo si caen todos los residuos alineados
en la línea recta de la grafica y la varianza constante al caer todos los puntos distribuidos
dentro de una banda horizontal.

8.-En la pregunta anterior, ¿Cómo se vería en las graficas un punto muy alejado o
aberrante?

                                                  Gráficas de residuos para RESPUESTA
                               Gráfica de probabilidad normal                                                               vs. ajustes
                  99.9                                                                                 5.0
                                                                               Residuo estandarizado




                   99

                   90
 Porcentaje




                                                                                                       2.5
                   50

                   10                                                                                  0.0
                    1
                   0.1
                         -4           -2          0         2          4                                       88         90        92      94    96
                                           Residuo estandarizado                                                           Valor ajustado

                                              Histograma                                                                    vs. orden
                   20                                                                                  5.0
                                                                               Residuo estandarizado




                   15
     Frecuencia




                                                                                                       2.5
                   10

                                                                                                       0.0
                    5

                    0
                          -2     -1         0     1     2    3     4       5                                 1 5    10 15 20 25 30 35 40 45 50 55 60
                                           Residuo estandarizado                                                         Orden de observación
9. De los tres supuestos del modelo, ¿Cuál puede afectar más el análisis en caso de no
cumplirse?

Los supuestos de normalidad y varianza constante

10. En caso de no cumplirse los supuestos de normalidad y varianza constante ¿Qué se
puede hacer para evitar problemas con el análisis y los resultados obtenidos?

Existen al menos tres maneras de solucionar o minimizar el problema por falta de
normalidad y varianza heterogénea en los residuos:

   1. Utilizar métodos de análisis no parametritos, que no requieren las suposiciones de
      normalidad y varianza constante
   2. Hacer el análisis mediante modelos lineales generalizados(GLM), en los que se ajusta
      un modelo lineal usando otras distribuciones diferentes a la normal, donde la
      varianza no tiene por qué ser constante
   3. Hacer el análisis sobre la respuesta transformada a una escala en la que los
      supuestos se cumplan.


11 ¿Con base en que se puede encontrar una transformación adecuada de la respuesta
cuando no se cumpla los supuestos?

Para corregir o minimizar los problemas de falta de normalidad y de varianza constante
depende del tipo de relación que existe entre la media y la varianza de y. Esta relación se
puede visualizar en la gráfica de residuos vs. Predichos. Según lo pronunciado que sea la
“forma de corneta” de los puntos en dicha gráfica, se determina la transformación más
adecuada.

12.- ¿Qué significa que el modelo estadístico sea de efectos aleatorios? ¿En que cambian
las hipótesis de interés en factor aleatorio con respecto a uno fijo?

Cuando los niveles de prueba utilizados en un factor son una muestra aleatoria de la
población de niveles para ese factor.

La diferencia entre las hipótesis aleatorias y fijas son: en las fijas se basa en el efecto sobre
la variabilidad de respuesta y en las aleatorias se basa en la varianza.

  H0:σ2α = 0, H0: σ2 β = 0 Y H0 : σ2α β = 0
13. Represente en el plano cartesiano un diseño factorial 4x4.




Representación del diseño factorial 4x4

14.- a continuación se muestra parte del ANOVA para un diseño factorial 3x5 con dos
replicas, el factor A con tres niveles y el B con cinco.

 Factores de    Suma de           Grados de        Cuadrado
                                                                     Razón f
  variación     cuadrados          libertad         medio
      A             800                2              400            15.003
      B             900                4              225            8.439
     AB             300                8              37.5           1.406
   ERROR            400               15             26.66
   TOTAL           2400               29


   a) Suponga efectos fijos, anote el modelo estadístico apropiado y formule las hipótesis a
      probar para este experimento.
                                            Modelo estadístico
                                  Yijk =
                                   I = 1,2,…., ; j =1,2,….,b ; k = 1,2,…,n
                                                  Hipótesis
                                             HO =: Efecto A =
                                            HA =: Efecto A
                                             HO =: Efecto B =
                                            HA =: Efecto B
                                            HO =: Efecto AB =
                                            HA =: Efecto AB
b) Agregue en esta tabla los grados de libertad, el cuadrado medio y la razón F para cada una
      de las fuentes de variación.
   c) Explique de manera esquemática como calcular el valor-p para A, por ejemplo.
       Con la formula P (F>FAO) que dando valores quedaría P (F>F30), quiere decir que se calcula la
          probabilidad de que Fo sea mayor que valor critico de F con 3 en el numerador y 0 en
                                                 denominador.
   d) Con la información disponible ¿se pueden hacer conjeturas sobre cuáles de las fuentes de
      variación son significativas estadísticamente? Argumente su respuesta.
                             Si se tiene la suficiente información para afirmar:
                                                  Conclusiones
                              A = 15.003 > 3.682 el efecto A es significativo.
                               B = 8.429 > 3.056 el efecto B es significativo.
                           AB = 1.406 < 2.641 el efecto AB no es significativo.

15.- conteste todo el ejercicio anterior, pero ahora suponiendo que ambos factores son
aleatorios.

 Factores de    Suma de            Grados de        Cuadrado
                                                                      Razón f
  variación     cuadrados           libertad         medio
      A             800                 2              400             10.66
      B             900                 4              225               6
     AB             300                 8              37.5            1.406
   ERROR            400                15             26.66
   TOTAL           2400                29
   a) Supongo efectos fijos, anote el modelo estadístico apropiado y formule las hipótesis a
      probar para este experimento.
                                               Modelo estadístico
                                     Yijk =
                                      I = 1,2,…., ; j =1,2,….,b ; k = 1,2,…,n
                                                     Hipótesis
                                                  HO =: 2 A =
                                                 HA =: 2A
                                                  HO =: 2 B =
                                                 HA =: 2B
                                                 HO =: 2 AB =
                                                 HA =: 2AB
   b) Agregue en esta tabla los grados de libertad, el cuadrado medio y la razón f para cada una de
      las fuentes de variación.
   c) Explique de manera esquemática como calcular el valor-p para A, por ejemplo.
       Con la formula P (F>FAO) que dando valores quedaría P (F>F30), quiere decir que se calcula la
           probabilidad de que Fo sea mayor que valor critico de F con 3 en el numerador y 0 en
                                                  denominador.
   d) Con la información disponible ¿se pueden hacer conjeturas sobre cuáles de las fuentes de
      variación son significativas estadísticamente? Argumente su respuesta.
                             Si, se tiene la suficiente información para afirmar:
                                                  Conclusiones
                               A = 10.66 > 3.682 el efecto A es significativo.
                                  B = 6 > 3.056 el efecto B es significativo.
                           AB = 1.406 < 2.641 el efecto AB no es significativo.
16.- conteste todos los incisos del ejercicio 14, paro ahora suponga que el factor A es fijo y el
factor B es aleatorio.

 Factores de      Suma de           Grados de         Cuadrado
                                                                        Razón f
  variación       cuadrados          libertad          medio
      A               800                2               400             15.003
      B               900                4               225                6
     AB               300                8               37.5            1.406
   ERROR              400               15              26.66
   TOTAL             2400               29


    a) Supongo efectos fijos, anote el modelo estadístico apropiado y formule las hipótesis a
       probar para este experimento.
                                                Modelo estadístico
                                      Yijk =
                                       I = 1,2,…., ; j =1,2,….,b ; k = 1,2,…,n
                                                      Hipótesis
                                                HO =: Efecto A =
                                                HA =: Efecto A
                                                   HO =: 2 B =
                                                  HA =: 2B
                                                  HO =: 2 AB =
                                                  HA =: 2AB
    b) Agregue en esta tabla los grados de libertad, el cuadrado medio y la razón f para cada una de
       las fuentes de variación.
    c) Explique de manera esquemática como calcular el valor-p para A, por ejemplo.
        Con la formula P (F>FAO) que dando valores quedaría P (F>F30), quiere decir que se calcula la
            probabilidad de que Fo sea mayor que valor critico de F con 3 en el numerador y 0 en
                                                   denominador.
    d) Con la información disponible ¿se pueden hacer conjeturas sobre cuáles de las fuentes de
       variación son significativas estadísticamente? Argumente su respuesta.
                              Si, se tiene la suficiente información para afirmar:
                                                   Conclusiones
                               A = 15.003 > 3.682 el efecto A es significativo.
                                   B = 6 > 3.056 el efecto B es significativo.
                            AB = 1.406 < 2.641 el efecto AB no es significativo.

Preguntas Diseno Factoriales

  • 1.
    DISEÑOS FACTORIALES 1.- ¿Quées un experimento factorial completo? Un diseño factorial es un método de selección de tratamientos (es decir, combinaciones factor-nivel) que se incluirán en un experimento. Un experimento factorial completo es uno en el que los tratamientos consisten en todas las combinaciones factor- nivel. 2.- ¿Cuántos efectos se pueden estudiar con un factorial 4 x 3 x 2? Bosqueje su tabla de análisis de varianza. Se pueden estudiar 7 efectos en este modelo y son A, B, C, AB, AC, BC y ABC. FV SC GL CM F0 Valor-p Efecto A SCA a-1 CMA CMA/ CME Efecto B SCB b-1 CMB CMB/ CME Efecto C SCC c-1 CMC CMC/ CME Efecto AB SCAB (a-1)(b-1) CMAB CMAB/ CME Efecto AC SCAC (a-1)(c-1) CMAC CMAC/ CME Efecto BC SCBC (b-1)(c-1) CMBC CMBC/ CME (a-1)(b-1)(c- Efecto ABC SCABC CMABC CMABC/ CME 1) Error SCE abc(n-1) CME Total SCT abcn-1 3.- Mencione al menos tres ventajas de la experimentación factorial sobre la estrategia de mover un factor a la vez. 1. Permiten estudiar el efecto individual y de interacción de los distintos factores. 2. Son diseños que se pueden aumentar para formar diseños compuestos en caso de que se requiera una exploración más completa. 3. La interacción y el cálculo de los efectos en los experimentos factoriales se puede hacer con aritmética elemental, en particular cuando cada factor se prueba en dos niveles. 4.- ¿Cuál es la implicación practica de utilizar tres niveles de prueba en lugar de dos en un factor dado? Si un factor se prueba en dos niveles, todo su efecto marginal (individual) es lineal, o sea que su efecto individual no se puede descomponer; pero, si tuviera tres niveles su efecto marginal se puede descomponer en una parte lineal y otra cuadrática pura.
  • 2.
    5 ¿Por quéno tiene sentido utilizar el modelo de regresión cuando los factores son cualitativos? Si fueran cuantitativos, ¿Qué se gana con el modelo de regresión en relación al modelo de efectos? Porque cuando son cualitativos no se puede hacer un análisis minucioso sobre el comportamiento de la variable de respuesta alno tener datos numéricos. Con el modelo de regresión podemos obtener una predicción más acertada del comportamiento de cierta variable en cambio con el modelo de efectos solo nos sirve para determinar qué tan significativos son los factores involucrados. 6 ¿Cómo se construye la gráfica de un efecto de interacción doble? ¿Cómo se interpreta? En el eje de las abscisas se coloca el factor A denotando los niveles que tenga, en el eje de las ordenadas la variable de respuesta del experimento y en el plano aparecerán tantas líneas como niveles tenga el factor B. Según el problema debe seleccionarse la combinación de niveles donde se obtenga el resultado óptimo. 7.- ¿Cuáles son los supuestos del modelo en un diseño factorial y con cuales graficas de residuos se puede verificar cada uno de estos supuestos? Los supuestos del modelo son normalidad, varianza constante e independencia de los residuos y se pueden verificar graficando los residuos contra los predichos en las graficas de normalidad en la que se cumple el supuesto del modelo si caen todos los residuos alineados en la línea recta de la grafica y la varianza constante al caer todos los puntos distribuidos dentro de una banda horizontal. 8.-En la pregunta anterior, ¿Cómo se vería en las graficas un punto muy alejado o aberrante? Gráficas de residuos para RESPUESTA Gráfica de probabilidad normal vs. ajustes 99.9 5.0 Residuo estandarizado 99 90 Porcentaje 2.5 50 10 0.0 1 0.1 -4 -2 0 2 4 88 90 92 94 96 Residuo estandarizado Valor ajustado Histograma vs. orden 20 5.0 Residuo estandarizado 15 Frecuencia 2.5 10 0.0 5 0 -2 -1 0 1 2 3 4 5 1 5 10 15 20 25 30 35 40 45 50 55 60 Residuo estandarizado Orden de observación
  • 3.
    9. De lostres supuestos del modelo, ¿Cuál puede afectar más el análisis en caso de no cumplirse? Los supuestos de normalidad y varianza constante 10. En caso de no cumplirse los supuestos de normalidad y varianza constante ¿Qué se puede hacer para evitar problemas con el análisis y los resultados obtenidos? Existen al menos tres maneras de solucionar o minimizar el problema por falta de normalidad y varianza heterogénea en los residuos: 1. Utilizar métodos de análisis no parametritos, que no requieren las suposiciones de normalidad y varianza constante 2. Hacer el análisis mediante modelos lineales generalizados(GLM), en los que se ajusta un modelo lineal usando otras distribuciones diferentes a la normal, donde la varianza no tiene por qué ser constante 3. Hacer el análisis sobre la respuesta transformada a una escala en la que los supuestos se cumplan. 11 ¿Con base en que se puede encontrar una transformación adecuada de la respuesta cuando no se cumpla los supuestos? Para corregir o minimizar los problemas de falta de normalidad y de varianza constante depende del tipo de relación que existe entre la media y la varianza de y. Esta relación se puede visualizar en la gráfica de residuos vs. Predichos. Según lo pronunciado que sea la “forma de corneta” de los puntos en dicha gráfica, se determina la transformación más adecuada. 12.- ¿Qué significa que el modelo estadístico sea de efectos aleatorios? ¿En que cambian las hipótesis de interés en factor aleatorio con respecto a uno fijo? Cuando los niveles de prueba utilizados en un factor son una muestra aleatoria de la población de niveles para ese factor. La diferencia entre las hipótesis aleatorias y fijas son: en las fijas se basa en el efecto sobre la variabilidad de respuesta y en las aleatorias se basa en la varianza. H0:σ2α = 0, H0: σ2 β = 0 Y H0 : σ2α β = 0
  • 4.
    13. Represente enel plano cartesiano un diseño factorial 4x4. Representación del diseño factorial 4x4 14.- a continuación se muestra parte del ANOVA para un diseño factorial 3x5 con dos replicas, el factor A con tres niveles y el B con cinco. Factores de Suma de Grados de Cuadrado Razón f variación cuadrados libertad medio A 800 2 400 15.003 B 900 4 225 8.439 AB 300 8 37.5 1.406 ERROR 400 15 26.66 TOTAL 2400 29 a) Suponga efectos fijos, anote el modelo estadístico apropiado y formule las hipótesis a probar para este experimento. Modelo estadístico Yijk = I = 1,2,…., ; j =1,2,….,b ; k = 1,2,…,n Hipótesis HO =: Efecto A = HA =: Efecto A HO =: Efecto B = HA =: Efecto B HO =: Efecto AB = HA =: Efecto AB
  • 5.
    b) Agregue enesta tabla los grados de libertad, el cuadrado medio y la razón F para cada una de las fuentes de variación. c) Explique de manera esquemática como calcular el valor-p para A, por ejemplo. Con la formula P (F>FAO) que dando valores quedaría P (F>F30), quiere decir que se calcula la probabilidad de que Fo sea mayor que valor critico de F con 3 en el numerador y 0 en denominador. d) Con la información disponible ¿se pueden hacer conjeturas sobre cuáles de las fuentes de variación son significativas estadísticamente? Argumente su respuesta. Si se tiene la suficiente información para afirmar: Conclusiones A = 15.003 > 3.682 el efecto A es significativo. B = 8.429 > 3.056 el efecto B es significativo. AB = 1.406 < 2.641 el efecto AB no es significativo. 15.- conteste todo el ejercicio anterior, pero ahora suponiendo que ambos factores son aleatorios. Factores de Suma de Grados de Cuadrado Razón f variación cuadrados libertad medio A 800 2 400 10.66 B 900 4 225 6 AB 300 8 37.5 1.406 ERROR 400 15 26.66 TOTAL 2400 29 a) Supongo efectos fijos, anote el modelo estadístico apropiado y formule las hipótesis a probar para este experimento. Modelo estadístico Yijk = I = 1,2,…., ; j =1,2,….,b ; k = 1,2,…,n Hipótesis HO =: 2 A = HA =: 2A HO =: 2 B = HA =: 2B HO =: 2 AB = HA =: 2AB b) Agregue en esta tabla los grados de libertad, el cuadrado medio y la razón f para cada una de las fuentes de variación. c) Explique de manera esquemática como calcular el valor-p para A, por ejemplo. Con la formula P (F>FAO) que dando valores quedaría P (F>F30), quiere decir que se calcula la probabilidad de que Fo sea mayor que valor critico de F con 3 en el numerador y 0 en denominador. d) Con la información disponible ¿se pueden hacer conjeturas sobre cuáles de las fuentes de variación son significativas estadísticamente? Argumente su respuesta. Si, se tiene la suficiente información para afirmar: Conclusiones A = 10.66 > 3.682 el efecto A es significativo. B = 6 > 3.056 el efecto B es significativo. AB = 1.406 < 2.641 el efecto AB no es significativo.
  • 6.
    16.- conteste todoslos incisos del ejercicio 14, paro ahora suponga que el factor A es fijo y el factor B es aleatorio. Factores de Suma de Grados de Cuadrado Razón f variación cuadrados libertad medio A 800 2 400 15.003 B 900 4 225 6 AB 300 8 37.5 1.406 ERROR 400 15 26.66 TOTAL 2400 29 a) Supongo efectos fijos, anote el modelo estadístico apropiado y formule las hipótesis a probar para este experimento. Modelo estadístico Yijk = I = 1,2,…., ; j =1,2,….,b ; k = 1,2,…,n Hipótesis HO =: Efecto A = HA =: Efecto A HO =: 2 B = HA =: 2B HO =: 2 AB = HA =: 2AB b) Agregue en esta tabla los grados de libertad, el cuadrado medio y la razón f para cada una de las fuentes de variación. c) Explique de manera esquemática como calcular el valor-p para A, por ejemplo. Con la formula P (F>FAO) que dando valores quedaría P (F>F30), quiere decir que se calcula la probabilidad de que Fo sea mayor que valor critico de F con 3 en el numerador y 0 en denominador. d) Con la información disponible ¿se pueden hacer conjeturas sobre cuáles de las fuentes de variación son significativas estadísticamente? Argumente su respuesta. Si, se tiene la suficiente información para afirmar: Conclusiones A = 15.003 > 3.682 el efecto A es significativo. B = 6 > 3.056 el efecto B es significativo. AB = 1.406 < 2.641 el efecto AB no es significativo.