0% encontró este documento útil (0 votos)
225 vistas6 páginas

Ji Cuadrada

Este documento explica la prueba de chi cuadrado y su aplicación en estadística y genética. Describe la prueba de chi cuadrado de Pearson y cómo se usa para probar la independencia entre dos variables cualitativas mediante el uso de tablas de contingencia. También explica cómo se usa la prueba de chi cuadrado para evaluar si los resultados observados se ajustan a las proporciones esperadas según las leyes de Mendel en genética.
Derechos de autor
© © All Rights Reserved
Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.
Formatos disponibles
Descarga como PDF, TXT o lee en línea desde Scribd
0% encontró este documento útil (0 votos)
225 vistas6 páginas

Ji Cuadrada

Este documento explica la prueba de chi cuadrado y su aplicación en estadística y genética. Describe la prueba de chi cuadrado de Pearson y cómo se usa para probar la independencia entre dos variables cualitativas mediante el uso de tablas de contingencia. También explica cómo se usa la prueba de chi cuadrado para evaluar si los resultados observados se ajustan a las proporciones esperadas según las leyes de Mendel en genética.
Derechos de autor
© © All Rights Reserved
Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.
Formatos disponibles
Descarga como PDF, TXT o lee en línea desde Scribd
Está en la página 1/ 6

PRÁCTICA: ESTADÍSTICA Y GENÉTICA

INTRODUCCIÓN: Prueba χ²
En estadística y estadística aplicada se denomina prueba χ² (pronunciado como "ji-cuadrado" y a veces
incorrectamente como "chi-cuadrado") a cualquier prueba en la que el estadístico utilizado sigue una
distribución χ² si la hipótesis nula es cierta. Algunos ejemplos de pruebas χ² son:
 La prueba χ² de Pearson, la cual tiene numerosas aplicaciones:
 La prueba χ² de frecuencias
 La prueba χ² de independencia
 La prueba χ² de bondad de ajuste
 La prueba χ² de Pearson con corrección por continuidad o corrección de Yates
 La prueba de Bartlett de homogeneidad de varianzas

Prueba χ² de Pearson
La prueba χ² de Pearson es considerada como una prueba no paramétrica que mide la discrepancia entre
una distribución observada y otra teórica (bondad de ajuste), indicando en qué medida las diferencias
existentes entre ambas, de haberlas, se deben al azar en el contraste de hipótesis. También se utiliza para
probar la independencia de dos variables entre sí, mediante la presentación de los datos en tablas de
contingencia. La fórmula que da el estadístico es la siguiente:

Cuanto mayor sea el valor de χ2, menos verosímil es que la hipótesis nula sea correcta. De la misma forma,
cuanto más se aproxima a cero el valor de ji-cuadrado, más ajustadas están ambas distribuciones.

Los grados de libertad (gl) vienen dados por:


gl= (r-1)(k-1). Donde r es el número de filas y k el de columnas.

 Criterio de decisión:
Se acepta H0 cuando .
En caso contrario se rechaza. Donde t representa el valor proporcionado por las tablas, según el nivel de
significación estadística elegido.
A MODO DE EJEMPLO
En la investigación biomédica nos encontramos con frecuencia con datos o variables de tipo cualitativo,
mediante las cuales un grupo de individuos se clasifican en dos o más categorías mutuamente excluyentes.
Las proporciones son una forma habitual de expresar frecuencias cuando la variable objeto de estudio tiene
dos posibles respuestas, como presentar o no un evento de interés (enfermedad, muerte, curación, etc.).
Cuando lo que se pretende es comparar dos o más grupos de sujetos con respecto a una variable categórica,
los resultados se suelen presentar a modo de tablas de doble entrada que reciben el nombre de tablas de
contingencia. Así, la situación más simple de comparación entre dos variables cualitativas es aquella en la
que ambas tienen sólo dos posibles opciones de respuesta (es decir, variables dicotómicas). En esta
situación la tabla de contingencia se reduce a una tabla dos por dos como la que se muestra en la Tabla 1.

Tabla 1. Tabla de contingencia general para la


comparación de dos variables dicotómicas.
Característica A
Característica
Presente Ausente Total
B
Presenta a b a+b
Ausente c d c+d
Total a+c b+d n

Supongamos que se quiere estudiar la posible asociación entre el hecho de que una gestante fume durante
el embarazo y que el niño presente bajo peso al nacer. Por lo tanto, se trata de ver si la probabilidad de tener
bajo peso es diferente en gestantes que fumen o en gestantes que no fumen durante la gestación. Para

1
responder a esta pregunta se realiza un estudio de seguimiento sobre una cohorte de 2000 gestantes, a las
que se interroga sobre su hábito de tabaquismo durante la gestación y se determina además el peso del
recién nacido. Los resultados de este estudio se muestran en la Tabla 2.

Tabla 2. Tabla de contingencia para estudiar la


asociación entre fumar durante la gestación y el bajo
peso del niño al nacer. Estudio de seguimiento de 2000
gestantes.
Recién nacido de bajo peso
Gestante Sí No Total
Fumadora 43 (a) 207 (b) 250
No fumadora 105 (c) 1645 (d) 1750
Total 148 1852 2000
En la Tabla 1, a, b, c y d son las frecuencias observadas del suceso en la realidad de nuestro ejemplo de
estudio (43, 207, 105 y 1645), siendo n (2000) el número total de casos estudiados, y a+b, c+d, a+c y b+d
los totales marginales. En el ejemplo, a+b=250 sería el número total de mujeres fumadoras durante el
embarazo, c+d=1750 el número total de mujeres no fumadoras, a+c=148 el número de niños con bajo peso
al nacer y b+d=1852 el número de niños con peso normal al nacimiento.
Ante una tabla de contingencia como la anterior pueden planteársenos distintas cuestiones. En primer lugar,
se querrá determinar si existe una relación estadísticamente significativa entre las variables estudiadas. En
segundo lugar, nos interesará cuantificar dicha relación y estudiar su relevancia clínica. Esta última cuestión
podrá resolverse mediante las denominadas medidas de asociación o de efecto (riesgo relativo (RR), odds
ratio (OR), o reducción absoluta del riesgo (RAR)). Por otro lado, para responder a la primera pregunta, la
metodología de análisis de las tablas de contingencia dependerá de varios aspectos como son: el número de
categorías de las variables a comparar, del hecho de que las categorías estén ordenadas o no, del número de
grupos independientes de sujetos que se estén considerando o de la pregunta a la que se desea responder.
Existen diferentes procedimientos estadísticos para el análisis de las tablas de contingencia como la prueba
 2 , la prueba exacta de Fisher, la prueba de McNemar o la prueba Q de Cochran, entre otras. Por ejemplo,
se puede usar el cálculo e interpretación de la prueba 2 como método estándar de análisis en el caso de
grupos independientes.
EL VALOR p
De ser cierta la hipótesis nula, el valor obtenido debería estar dentro del rango de mayor probabilidad según
la distribución ji-cuadrado correspondiente. El valor-p que usualmente reportan la mayoría de paquetes
estadísticos no es más que la probabilidad de obtener, según esa distribución, un dato más extremo que el
que proporciona el test o, equivalentemente, la probabilidad de obtener los datos observados si fuese cierta
la hipótesis de independencia. Si el valor-p es muy pequeño (usualmente se considera p<0.05) es poco
probable que se cumpla la hipótesis nula y se debería de rechazar.

En la Tabla  , se determinan los grados de libertad (en la primera columna) y el valor de α (en la primera
2

fila). El número que determina su intersección es el valor crítico correspondiente. De este modo, si el

estadístico  que se obtiene toma un valor mayor se dirá que la diferencia es significativa. Así, para una
2

seguridad del 95% (α =0.05) el valor teórico de una distribución ji-cuadrado con un grado de libertad es
3,84. Para α =0.01 es de 6,63 y para α =0.005 es de 7,88. Por ejemplo, si se obtiene un valor de 40,04, que
supera al valor para α =0.005, podremos concluir que las dos variables no son independientes, sino que
están asociadas (p<0.005). Por lo tanto, a la vista de los resultados, rechazamos la hipótesis nula (H0) y
aceptamos la hipótesis alternativa (Ha) como probablemente cierta.
χ² EN GENÉTICA: SUPUESTOS TEÓRICOS
 Las predicciones mendelianas 3:1 ó 9:3:3:1 son predicciones teóricas basadas en:
 Cada alelo es D ó R.
 Hay segregación.
 Hay transmisión independiente.
 La fecundación es al azar.
 Los tres últimos están influenciados por el azar fluctuaciones aleatorias.

2
DESVIACIÓN AL AZAR
 Si se lanza al aire una moneda infinitas veces se obtiene caras y sellos con la misma probabilidad: ½.
 Por eso, las proporciones esperadas son 1:1.
 Si se lanza mil veces 500 caras y 500 sellos.
 Cualquier fluctuación “razonable” (486+514) se atribuye al azar.
REDUCCIÓN DEL TAMAÑO DE LA MUESTRA
 Si se lanza la moneda sólo 4 veces no sería extraño que todas fuesen cara o sello.
 Pero si se lanza las mil veces sería muy raro que todas sean caras o todas sellos.
 Este último caso sería considerado un suceso casi “imposible”, con probabilidad de menos de 1 en un
millón.
 Los resultados de la segregación, la trasmisión independiente y la fecundación están sujetos a
fluctuaciones al azar respecto de los acontecimientos previstos como consecuencia de las desviaciones
al azar.
 Todo muy semejante al lanzamiento al aire de la moneda.
 A medida que el tamaño muestral aumenta, la desviación promedio respecto de la proporción esperada
disminuye proporcionalmente.
 Una muestra más grande disminuye el impacto de las desviaciones al azar sobre el resultado final.
LA HIPÓTESIS NULA
 En genética se debe evaluar la desviación observada.
 Si se asume que los datos se adecuarán a una proporción dada (3:1; 3:3:1; 9:3:3:1; 1:1, etc) y se
establece la hipótesis nula=Ho.
 Se llama así porque asume que no hay diferencia real entre los valores observados y los valores
esperados.
 La diferencia aparente se atribuye al azar.
VALORACIÓN DE LA Ho
 Se realiza por análisis estadístico.
 Según esto la Ho puede o rechazarse o no rechazarse.
 Si se rechaza, la desviación observada respecto de la esperada no se atribuye sólo al azar.
 Entonces, hay que reexaminar la Ho y sus supuestos.
 Si la Ho no se rechaza, las desviaciones observadas se atribuyen al azar.
BONDAD DEL AJUSTE
 Ahora se tiene una base matemática para examinar si los datos observados están de acuerdo o difieren
de los esperados.
 Es decir, se comprueba la “Bondad del ajuste” a una proporción esperada.
 Pero, si los datos no son exactamente los mismos que los esperados, ¿Cuánta desviación puede
permitirse antes de rechazar la Ho?
ANÁLISIS JI-CUADRADO
 Esta prueba tiene en cuenta las desviaciones observadas de cada componente de una proporción
esperada, así como el tamaño de la muestra, y las reduce a un solo número.
 Este valor χ2 se usa luego para estimar cuan frecuentemente la desviación observada, o una mayor, se
puede esperar suceda estrictamente como consecuencia del azar.
FÓRMULA JI-CUADRADO

o=valor observado de una clase dada.


e=valor esperado de una clase dada.
Σ=suma de los valores calculados para cada clase.

3
CÁLCULOS PARA UN MONOHÍBRIDO
 Para calcular el χ2 para la F2 de un cruce monohíbrido se siguen los siguientes procedimientos:

PROPORCIÓN OBSERVADO (o) ESPERADO(e) DESVIACIÓN (DESVIACIÓN)2 (DESVIACIÓN)2/e


ESPERADA (o-e)

3/4 740 3/4(1000)=750 740-750=-10 100 0,13


1/4 260 1/4(1000)=250 260-250=+10 100 0,4
TOTAL=1000 χ2=0,53
p=0,48

CÁLCULOS PARA UN DIHÍBRIDO


 Para calcular el χ2 para la F2 de un cruce dihíbrido se desarrollan los siguientes procedimientos:
PROPORCIÓN OBSERVADO (o) ESPERADO(e) DESVIACIÓN (DESVIACIÓN)2 (DESVIACIÓN)2/e
ESPERADA (o-e)

9:16 587 567 20 400 0,71


3:16 197 189 8 64 0,34
3:16 168 189 -21 441 2,33
1:16 56 63 -7 49 0,78
TOTAL=1008 χ2=4,16
p=0,26

INTERPRETAR EL VALOR χ2
 Grados de libertad: gl=n-1, donde n=número de clases (fenotipos) diferentes en las que cada dato
puntual puede encontrase.
 El valor χ2 se debe interpretar en términos de un VALOR DE PROBABILIDAD (p) correspondiente.
 El cálculo es complejose usa una tabla o un gráfico (más abajo).
EJEMPLO DE CÁLCULO DE χ2
 Para el cruce dihíbrido se encontró χ2 es 4,16 y los gl=3. En tabla o gráfico se encuentra que p=0,26.
 Para el cruce monohíbrido, χ2 es 0,53, los gl=1 y por tanto, en tabla o en gráfico, p=0,48.
INTERPRETACIÓN DE p
 Para el cruce dihíbrido p=0,26. Es decir se puede pensar que 0,26=26%.
 Es decir, si se repitiera el experimento muchas veces, en el 26% de las repeticiones se espera una
desviación por azar igual o aún mayor que la observada en la prueba inicial.
 Por el contrario, el 74% de las repeticiones mostrarían menos desviación por azar.
VALOR CRÍTICO DE RECHAZO
 Esta interpretación significa que la Ho nunca se prueba o se rechaza de manera absoluta.
 Por ello se debe fijar de antemano un límite relativo que sirva de base para rechazar la Ho o no.
 Este límite es a menudo un valor de probabilidad de 0,05 (α).

4
ZONA CRÍTICA
 Cuando se aplica al análisis χ2 un valor de p menor a 0,05 significa que la probabilidad de obtener solo
por azar una desviación similar a la observada en el grupo de resultados es sólo del 5% o menor.
 En la práctica se determina de antemano que valor (n-1) de gl y el valor p crítico, ya sea a nivel de 0,05
o a nivel de 0,01.
 Luego se calcula el valor χ2, y se le puede trasformar a p (con tabla o gráfico) y se le compara con el
valor crítico.
 Si p de χ2 ≤ a valor crítico, entonces la Ho no se rechaza.
 Si p de χ2 > que valor crítico, la Ho se rechaza.
¿Y SI SE RECHAZA Ho?
 El investigador debe reconsiderar primero las muchas suposiciones a priori subyacentes a la Ho.
 Obviamente, debe revisar cuidadosamente sus cálculos y sus datos.

OBJETIVOS
1. Recordar conceptos de estadística utilizados en genética.

2. Aplicar la prueba  2 a problemas de genética

PROCEDIMIENTOS
Con la teoría correspondiente (incluyendo la presentada arriba), se debe desarrollar los siguientes ejercicios:
1. Una moneda es lanzada 10 veces y cae con la cara hacia arriba 6 veces y con la cruz hacia arriba 4
veces, (a)¿están estos resultados de acuerdo con la proporción esperada de 50-50?; (b)si una moneda
es lanzada 100 veces con la misma magnitud relativa de desviación de la proporción esperada, ¿es
aceptable aún la hipótesis?; (c)¿Qué conclusión puede obtenerse de los resultados de las partes a y b?
2. En el guisante, el color amarillo del cotiledón es dominante sobre el verde, y la forma inflada(lisa) de
la vaina es dominante a la forma contraída(rugosa). Cuando ambos rasgos fueron considerados
conjuntamente en dihíbridos autofertilizados la descendencia se presentó en los siguientes números:

5
193 verdes,lisos; 184 amarillos, rugosos;556 amarillos, lisos; 61 verdes, rugosos. Comprobar estos
datos de acuerdo a una distribución independiente.
3. Los tomates rojos apareados con tomates amarillos produjeron una F1 toda roja. De 400 plantas en F2,
90 eran amarillas. Se supone que un par de alelos únicos están involucrados. Comprobar esta hipótesis.
4. Un total de 160 familias con 4 hijos cada una fueron investigadas con los resultados de la tabla anexa.
¿Es consistente la distribución en estas familias con la hipótesis de igual número de hombres y mujeres?

NIÑAS 4 3 2 1 0
NIÑOS 0 1 2 3 4
FAMILIAS 7 50 55 32 16

Se cruzó moscas con alas largas normales con moscas alas dumpy(regordetas) mutantes. En F1 todas
las moscas fueron alas largas. En F2 se obtuvo 792 alas largas y 208 alas dumpy. Comprobar la
hipótesis de que las alas dumpy se heredan como carácter recesivo.
5. En un experimento se encontró vainas hinchadas (882) y vainas arrugadas(299), flores violeta(705) y
flores blancas(224). Establecer una Ho y comprobar mediante χ2 ¿cuál de los 2 cruces muestra mayor
desviación?
6. Se realizó un experimento. Se observó que los datos se distribuían en dos clases fenotípicas, con valores
250:150. Se decidió realizar análisis χ2 usando dos Ho diferentes: (a)los datos se adecúan a la
proporción 3:1,(b) los datos se adecúan a la proporción 1:1. ¿Qué se puede concluir en cada caso?
7. En un cruce dihíbrido se observó en las semillas F2 315 redondas y amarillas, 108 redondas y verdes,
101 rugosas y amarillas y 32 rugosas y verdes. Analizar los datos usando una χ2 para comprobar si: (a)
están de acuerdo a 9:3:3:1, (b)los datos sobre semillas redondas y rugosas se adecúan a 3:1, (c) los
datos sobre amarillas y verdes se adecúan a 3:1.
8. Las bases para rechazar cualquier Ho son arbitrarias. El investigador puede ser más o menos estricto
en cuanto a decidir elevar o disminuir los valores de p utilizados para rechazar o admitir la Ho.
Examinar algún caso de cruce genético y explicar: ¿el uso de un nivel de p=0,10 es más o menos
estricto que p=0.05 a la hora de rechazar o no la Ho?
9. Se eligen 300 individuos al azar de cierta población para estudiar los genes A y B. Se observa las
siguientes frecuencias: AB(165),Ab (47), aB(67) y ab(21). Formular una Ho y una hipótesis alternativa
(H1) y comprobarlas mediante una prueba de ji-cuadrado.
10. ¿Qué significa el valor p?
11. En una hoja de cálculo desarrollar la prueba ji-cuadrada para los casos del monohíbrido, del dihíbrido
y de los cruces de prueba.

También podría gustarte