E R N S T G L AT Z E R , W E R N E R G .
M U L L E R
DIAGNÓSTICO
RESIDUAL PARA EL
AJUSTE DE UN
VARIOGRAMA
INTRODUCCIÓN
• Para la descripción y predicción de datos espaciales como la contaminación
del agua subterránea usamos la noción de un campo aleatorio
intrínsecamente estacionario.
Componente estocástico
Modelo
paramétrico o no
paramétrico
X: coordenadas espaciales
NUBE DE VARIOGRAMA
• puede servir como base para estimar una forma parametrizada (un modelo de
variograma), como el variograma esférico ampliamente utilizado (que se
utilizará como ejemplo en el resto del artículo) y con frecuencia su uso
eventual en técnicas de predicción paramétrica como el kriging (cf.
Matheron, 1971).
• la utilizaremos para la detección de valores atípicos y observaciones
influyentes.
• El análisis de esta nube permite localizar los pares de datos responsables de
los valores altos del variograma experimental y poner en evidencia los datos
notablemente diferentes de sus vecinos. (Xavier Emery, Universidad de
Chile,2013)
Izquierda: nube variográfica para los datos de concentración de cobalto. Derecha: mapa de
ubicación. (Xavier Emery, Universidad de Chile,2013)
Modelo de variograma paramétrico
• El articulo plantea que los parámetros para un modelo de variograma paramétrico como el de arriba puede
estimarse ajustándolo a la nube de variogramas.
• Dado que las observaciones yi están generalmente correlacionadas (dado que cada observación original está
contenida en una serie de "observaciones" derivadas), el procedimiento de mínimos cuadrados ordinarios
produce estimaciones ineficientes. Por lo tanto, Muller (1999) sugirió usar una versión iterativa de mínimos
cuadrados generalizados factibles, es decir,
• Este procedimiento requiere datos sin tendencia, se asume también que la estructura de correlación es
isotrópica (el variograma para dos observaciones solo depende de la distancia entre las ubicaciones,
independientemente de la dirección de la línea de conexión entre sus ubicaciones).
• En el caso de la contaminación del agua subterránea, por ejemplo, una anisotropía podría deberse a una
dirección predominante en la corriente de agua subterránea.
EJEMPLO ILUSTRATIVO
• El gobierno de la Baja Austria opera redes de medición de aguas subterráneas en Sudliche
Tullner Feld. El área cubierta tiene un tamaño de 208km2.
• El conjunto de datos consta de 746 mediciones en 35 ubicaciones que cubren el período de
1992 a 1997 para una variedad de contaminantes.
• Seleccionamos para este artículo las medidas de concentraciones de cloruro para nuestro
análisis. Los datos constituyen un conjunto de datos espaciotemporales, donde los datos se
recopilan en n ubicaciones distintas xk; k = 1; . . .; n en T puntos en el tiempo tj; j = 1; . . .; T:
• Como utilizamos los datos sólo con fines ilustrativos y como los métodos presentados se
limitan a las dimensiones espaciales, asumimos que las observaciones de cada día son
réplicas independientes de un proceso espacial (cf. Cressie, 1993, p. 274). Esto nos brinda
una oportunidad sencilla para estimar la tendencia espacial.
Red de medición de
aguas subterráneas en
Sudliche Tullner Feld.
• puede ver que los datos se distribuyen simétricamente, pero la curtosis es
Se
mayor que la de una distribución normal. John y Draper (1980) sugieren para
casos como este la siguiente familia de transformaciones:
• En nuestro caso se obtuvo un mejor resultado para λ=1/3, por lo cual los
datos se transformaron para dar
DIAGNÓSTICO RESIDUAL
Residuos ordinarios:
• Los residuos ordinarios se pueden usar para verificar los supuestos del
modelo de variograma. Por ejemplo, se pueden usar residuos únicos
excepcionalmente grandes para detectar valores atípicos en la nube de
variogramas, que generalmente se pueden rastrear hasta valores atípicos en
los datos originales. Como los residuos ordinarios tienen diferentes
variaciones, su valor es limitado a este respecto. Para resolver este problema
se han propuesto varias transformaciones de los residuos ordinarios (ver
Cook y Weisberg, 1982, Belsley et al., 1980 o Atkinson, 1985 y
particularmente en un modelo lineal generalizado como Haslett y Hayes,
1998). los llamados residuales estudentizados o estandarizados.
¿QUÉ ES UN RESIDUO?
En el contexto de la regresión lineal, llamamos residuos a las diferencias entre los valores de la
variable dependiente observados y los valores que predecimos a partir de nuestra recta de regresión.
https://www.youtube.com/watch?v=k964_uNn3l0&t=443s
Residuos estudentizados
• Para poder comparar diferentes modelos de variogramas, es ventajoso tener a
mano una versión estandarizada de los residuos que no dependa de la escala
del problema y que siga una distribución que se acerque a una distribución
normal estándar. La estandarización se logra dividiendo los residuos por su
desviación estándar.
• Dado que se desconoce esta desviación estándar, se debe emplear un
estimador. Esto conduce a una distribución t de Student para los residuos
estandarizados. Por lo tanto, estos residuos transformados se denominan
residuos studentizados.