Analisis Exploratorio de Datos 4.0
Analisis Exploratorio de Datos 4.0
Facultad de ingeniera
Departamento de ingeniera en minas
Laboratorio de Evaluacin de Yacimientos
ANALISIS
EXPLORATORIO DE
DATOS
Laboratorio N1
Objetivo principal
Objetivos secundarios
Alcances
Ilustracin 1: Vista en planta de ley para Ilustracin 2: Vista en planta de ley para
composito 2 mts, cota 1200 mts; fuente composito 6 mts, cota 1200 mts; fuente
Vulcan 8.0 Vulcan 8.0
Ilustracin 4: Leyenda
Ilustracin 3: Vista en planta composito
correspondiente a cada composito,
16 mts, cota 1200 mts; fuente Vulcan 8.0
fuente Vulcan 8.0
Se observan las muestras de leyes y como se distribuyen en el espacio
en los diferentes compsitos, diferencindose en las distancias de cada
muestra.
Estadstica
Anlisis Box Plot
Box plot de cada composito; la cual entrega de manera resumida la
estadstica relevante segn cada unidad, como primer cuantil 25%, segundo
cuantil 50%, tercer cuantil 75% y los valores mximos y mnimos.
0.400
ug 10 ug 20 ug 30 general
Grfico 1: Box plot composito 2 mts de ley de cobre, Fuente vulcan 8.0
El box plot del composito 2 refleja que entre 0,058 y 0,205% de ley de
cobre esta contenido el 50% de los datos.
La ley media tiende a disminuir a medida que se pasa de la zona oxidada
a la zona sulfurada.
La UG 10 (oxido) muestra menor variabilidad entre las leyes 0,058 y
0,110 % y por tanto mayor dispersin entre las leyes 0,110 y 0,205 %.
La UG 20 (transicin) muestra menor variabilidad entre las leyes 0,543 y
1,041 %. Por tanto mayor dispersin entre las leyes 1,041 y 2,000 %.
La UG 30 (sulfuros) muestra menos dispersin entre las leyes 0,438 y
0,673 % y mayor dispersin entre 0,676 y 1,085 % de ley.
En general se tiene menor variabilidad entre las leyes 0,121 y 0,350 % y
mayor variabilidad entre las leyes 0,350 y 0,798 %
Por lo tanto se afirma que existe el efecto proporcional ya que existe
presencia de mayores leyes en zonas que hay mayor variabilidad.
0.300
ug 10 ug 20 ug 30 general
Grfico 2: Box plot composito 6 mts del porcentaje de ley de cobre, fuente vulcan 8.0
0.150
ug 10 ug 20 ug 30 general
Grfico 3: Box plot composito 16 mts del porcentaje ley de cobre, fuente vulcan 8.0.
Composito 2
Es posible distinguir valores escapados
tanto en la parte inferior como superior
de todas las unidades geolgicas.
Se observa una pequea inflexin de la
distribucin en la UG 20 desde el 0,3%
de cobre total, lo que podra indicar
dos poblaciones.
La distribucin con menores leyes es
perteneciente tanto a la UG 10 como la
UG 30.
Dentro de la estadstica entregada se observa un coeficiente de
variacin mayor para el UG 10 por lo tanto tiene mayor dispersin que
UG 20 y UG 30, por lo que estos ltimos tienen un mejor
Grfico 4: Probplot para composito 2 comportamiento para un modelo
mt, fuente GeoInnova. predictivo.
Composito 6
Existen valores escapados en la parte
superior e inferior de la distribucin, es
decir existen leyes muy pequeas y
muy altas para la poblacin.
Se observa para UG 30 una sola
poblacin bien definida, de la misma
manera para UG 10.
Tiene mayor dispersin UG 10 y la
mejor UG 30, igual que para el
composito 2.
Composito
16
Se
observa
que a medida que se a aumentado
el largo del composito han disminuido
los valores extremos.
Tambin es fcil Grfico 5: Grafico de probabilidad distinguir
que al aumentar el composito 6 mts, fuente GeoInnova. composito
disminuye la dispersin de las
distribuciones, y tambin
comprobados con el coeficiente
de variacin, ya que por ejemplo
para el comp 2 UG 10 se tena una
variacin de 1,51 y en comp 16 a
1,08.
se distinguen
Grfico 6: Grafico de probabilidad
distribuciones de solo una composito 16 mts, fuente GeoInnova. poblacin
para todas las UG.
Al
Ilustracin 1: Vista en planta de los pesos Ilustracin 2: Vista en planta de los pesos
creados por desagrupamiento por mtodo creados por desagrupamiento mediante
de polgonos para composito 2 mts, fuente mtodos de celdas composito 2 mts, fuente
Vulcan 8.0. Vulcan 8.0.
Se distingue para ambos mtodos que los mayores pesos se encuentran
en la periferia del depsito ya que el desagrupamiento pondera los pesos en
funcin de la distribucin espacial de los datos.
Grfico 10: Nube de dispersin para dos variables, ley de cobre total versus ley de cobre total
ponderada, fuente Excel.
2.5
CuT
Se observa que se tiene una gran concentracin de datos entre las leyes de 1,5
para ambos grficos (celda, polgonos) eso puede indicar que hay informacin
redundante debido a que se estudi mucho un sector o que las mayora de las
leyes estn en esos tramos.
Al comparar los 2 mtodos de desagrupamiento se observa que el
grfico por celdas genera datos con una mejor distribucin y estn ms
correlacionados
Grfico 11: Nube de dispersin para dos variables, ley de cobre total versus ley de cobre total
ponderada, fuente Excel.
Derivas
El anlisis de las derivas, corresponde a una elaboracin del anlisis
exploratorio de datos, porque su finalidad es la de evaluar el comportamiento
espacial de la variable de inters correspondiente a la ley de Cobre total %
CuT, detectando tendencias tanto al alza como a la baja de las leyes que
componen la variable bajo estudio en las distintas direcciones de los ejes
coordenados (Este, Norte, Cota), adems entrega informacin relacionada con
la cantidad de datos mediante las cuales fueron obtenidas las leyes promedios,
permitiendo detectar los datos escapados en la distribucin de la variable.
Considerando lo anteriormente expuesto, esta herramienta permite concluir
respecto a la estacionaridad de las poblaciones estudiadas UG (10, 20, 30)
UG-10
Ug - 10 Norte
Norte (mt)
0.60 800
700
0.50
600
0.40
500
0.30 400
300
N MUESTRAS 0.20 %cut
200
0.10
100
0.00 0
Grfico 12: Deriva de la coordenada norte, del composito 2 mts, UG 10 xidos. Fuente Excel.
Ug-10 Este
este (mt)
1.40 2000
1.20 1800
1600
1.00 1400
0.80 1200
1000
0.60 800
N muestras 0.40 600 %Cut
400
0.20 200
0.00 0
Grfico 13: Deriva la coordenada este, del composito 2 mts, UG 10 oxidos. Fuente Excel.
Ug-10 Cota
cota (mt)
0.80 3000
0.70 2500
0.60
0.50 2000
0.40 1500
n muestras %cut
0.30 1000
0.20
0.10 500
0.00 0
1237.5 1312.5 1387.5 1462.5 1537.5 1612.5
Grfico 14: Deriva con tajadas en la cota, del composito 2 mts, UG 10 oxidos. Fuente Excel.
La deriva Ug-10 Cota con peso y sin peso la concentracin de datos se
encuentra en el tramo (1462,5- 1537,5)mt el cual representa el 78,2% de los
datos, al comparar estos tramos con respecto al cambio de ley cuando se
utiliza peso se puede observar:
Norte, Ug-20
Norte
1.60 2000
1.40 1800
1600
1.20
1400
1.00 1200
0.80 1000
0.60 800
N Muestras 0.40
600 %Cut
400
0.20 200
0.00 0
Grfico 15: Deriva de la coordenada norte, del composito 2 mts, UG 20 transicin. Fuente Excel.
Grfico 16: Deriva de la coordenada este, del composito 2 mts, UG 20 transicin. Fuente Excel.
Cota, Ug-20
Cota
6.00 3000
5.00 2500
4.00 2000
3.00 1500
NMuestras 2.00 1000 %Cut
1.00 500
0.00 0
Norte Ug-30
Norte (mt)
3.00 1000
900
2.50 800
2.00 700
600
1.50 500
400
N muestras 1.00 300 %Cut
0.50 200
100
0.00 0
Grfico 18: Deriva de la coordenada norte, del composito 2 mts, UG 30 sulfuros. Fuente Excel.
La deriva Ug-30 Norte con peso y sin peso la concentracin de datos se
encuentra en el tramo (7308338- 7308638) mt el cual representa el 82,4% de
los datos, al comparar estos tramos con respecto al cambio de ley cuando se
utiliza peso se puede observar:
1.50 1000
NMuestras 1.00 %Cut
500
0.50
0.00 0
Grfico 19: Deriva de la coordenada este, del composito 2 mts, UG 30 sulfuros. Fuente Excel.
3.50 1000
900
3.00
800
2.50 700
2.00 600
500
1.50
N MUESTRAS 400 %cut
1.00 300
200
0.50
100
0.00 0
Grfico 20: Deriva con tajadas en la cota, del composito 2 mts, UG 30 sulfuros. Fuente Excel
10 20(Mixtos 30(Sulfuros
(xido) ) )
10 (xido) D TD
20
(Mixtos) D TD
30
(Sulfuros) TD TD
10 20 30
(xidos) (Mixtos) (Sulfuros)
10
(xidos) TD TB
20
(Mixtos) TD D
30
(Sulfuros) TB D
Conclusiones
Para poder realizar la estimacin de un modelo es conveniente tener que
normalizar o regular los datos recaudados por sondajes, ya que se constituyen
tramos de sondajes largos y cortos donde existe el mismo porcentaje de ley, lo
que implica tener que realizar una compositacion de estos tramos, es decir
regularizarlos para que las muestras tengas influencia segn su peso. Al
realizar compositos de 2, 6 y 16 metros se observa en las imgenes en vista en
planta, como se regulan las muestras agrupando tramos de sondajes de
distancias ms cortas a ms largas. Y realizando quiebres segn unidad
geolgica se permite distinguir las leyes en funcin de esta variable categrica.
Gracias a esto ltimo se concluye que las unidades contempladas
corresponden a zonas con minerales oxidados, de transicin y sulfurados;
consumando que los datos entregados corresponde a un prfido cuprfero.
La estadstica desplegada por box plot demuestra que existe mayor
variabilidad en zonas donde hay mayores leyes, puesto que la mayor parte de
los datos se encuentra en las leyes bajas y menor cantidad en leyes altas y
ms distintas entre s, describiendo por lo tanto el llamado efecto proporcional.
Debido a esto se puede asociar este fenmeno a las unidades geolgicas
presentes ya que las leyes varan segn estas caractersticas mineralgicas.
Gracias al grafico de probabilidad se distinguen valores escapados para cada
unidad que representan leyes muy altas y muy distintas a la poblacin general
caracterizada por leyes de menor tamao. Adems a medida que se ha
aumentado el largo de composito se concluye que los valores son menos
dispersos, sin embargo no es posible dar un soporte muy elevado puesto que
se comienza a perder la influencia que tendra cada muestra. Finalmente
mediante la visualizacin del grafico de dispersin de media versus desviacin
estndar se afirma por medio del coeficiente de variacin que este disminuye a
medida que aumenta el largo de los compositos. Cabe tambin mencionar que
los grficos de probabilidad no permiten dar un indicio de estacionalidad dado
que no entrega dispersin en el espacio, como si lo indicara una deriva.
Adems de realizar una regularizacin en el soporte tambin es
necesario efectuar un desagrupamiento de las muestras por el caso de
muestreo preferencial recordando que se suele recaudar mayor informacin en
direccin de las zonas que estn mayor mente mineralizadas. Al consumar
cuyo desgrupamiento se concluye que los mayores pesos se encuentran en la
periferia del depsito puesto que las muestras se encuentran ms alejadas, es
decir se recaud menor informacin en esas zonas debido a lo bajo de sus
leyes conduciendo as al llamado efecto proporcional.
Con respecto al scatterplot o nube de dispersin desplegada segn leyes
brutas y leyes ponderadas segn peso se establece que la explicacin de la
razn por la que se est ms correlacionado el mtodo por celdas que por
polgonos, por que a medida que aumenta la ley del cobre la cantidad de
muestras disminuyen aumentando por lo tanto el peso para el
desagrupamiento, describiendo as mejor la linealizacin de ambas variables.
Con respecto a las derivas realizadas se debe tener en mente que en los
grficos, si no se realiza un buen estudio de datos previo, la gran cantidad de
informacin que existe en una zona determinada llevando a contener
redundancia de informacin puede conllevar a errores. Sin embargo en las
derivas con datos desagrupados brinda la ventaja, que en lugares donde hay
ms exploracin y se genera mayor concentracin de datos, no genera un
sesgo.
Es fcil concluir que las derivas con muestras no desagrupadas tiende a
un mayor comportamiento estacionario que los datos desagrupados, esto se
debe a que el peso de los datos desagrupados genera en algunos puntos un
despegue significante en porcentaje de cobre total.
En general para las derivas es de crucial importancia dar un
espaciamiento ptimo, que no sea de gran magnitud para generar valores
irreales o demasiado pequeos que dara valores discretos y perdera el
objetivo de la deriva.
Para encontrar valores extremos o escapados es preferible realizar
derivas pequeas por que se genera ms sensibilidad y es mucho mejor para
un anlisis de nube de datos. Los grficos con derivas muy grandes tienden a
ser simtricos por la falta de sensibilidad y por lo tanto se tiende a diluir el
porcentaje de cobre total.
Del anlisis de contacto, se concluye que existe relacin entre cada una
de las unidades geolgicas. La mayor parte de los contactos establecidos
corresponden a contactos duros o de transicional duro, con excepcin del
contacto entre la UG 10 y la UG 30 que estableci un contacto de tipo
transicional blando para un anlisis global de los datos.
De las diferencias entre el anlisis global y por sondaje, la ms
importante recae en el paso que se elegir para para realizar tal anlisis,
donde globalmente se necesitara un paso mayor, acorde al distanciamiento
entre sondajes, lo que determinara una mayor cantidad de pares evaluados.
En el caso, del anlisis por sondajes, los mejores resultados se obtienen
utilizando la distancia del paso igual al tamao de compositacin. Para ambos
casos, es importante escoger un paso que permita obtener una buena
apreciacin de la continuidad espacial de los datos, y as tambin obtener un
anlisis ms confiable.
Al analizar el comportamiento de las leyes en las cercanas del contacto,
se supone independencia entre los datos pertenecientes a unidades contiguas,
independencia que se aprecia de mejor forma cuando el tipo de contacto es
duro, y existen transiciones abruptas de las leyes al pasar de una UG a otra.
Por lo cual, la mera divisin de las grficas de leyes por unidades geolgicas,
constituye cierto control geolgico en la estimacin de recursos, ya que
considera la variabilidad espacial de las leyes por cada unidad geolgica.
Por lo tanto se podra suponer estacionalidad segn estas variables
geolgicas y poder estimar un modelo en base a cada unidad.
Anexos
Grfico 21: Anlisis por sondaje de las leyes de cobre en funcin de la distancia al contacto
entre las UG 10 y 20, fuente GeoInnova.
Grfico 22: Anlisis por sondaje de las leyes de cobre en funcin de la distancia al contacto
entre las UG 10 y 30, fuente GeoInnova.
Grfico 23: Anlisis por sondaje de las leyes de cobre en funcin de la distancia al contacto
entre las UG 20 y 30, fuente GeoInnova.
Grfico 24: Anlisis global de las leyes de cobre en funcin de la distancia al contacto entre las
UG 10 y 20, fuente GeoInnova.
Grfico 25: Anlisis global de las leyes de cobre en funcin de la distancia al contacto entre las
UG 10 y 30, fuente GeoInnova.
Grfico 26: Anlisis global de las leyes de cobre en funcin de la distancia al contacto entre las
UG 20 y 30, fuente GeoInnova.