0% encontró este documento útil (0 votos)
141 vistas50 páginas

Sentinel 1 Ecuador

Este documento presenta un estudio sobre el análisis multitemporal de imágenes radar Sentinel-1 y la detección de cambios en el uso del suelo entre 2015 y 2018 alrededor de la Reserva Ecológica Manglares Churute en Ecuador. Se utilizaron herramientas de SIG y programación libres como QGIS y R para clasificar imágenes Sentinel-1 y detectar cambios, los cuales mostraron un incremento de camaroneras y caña de azúcar que reemplazaron arrozales. El estudio concluye que es posible

Cargado por

Reinaldo Romero
Derechos de autor
© © All Rights Reserved
Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.
Formatos disponibles
Descarga como PDF, TXT o lee en línea desde Scribd
0% encontró este documento útil (0 votos)
141 vistas50 páginas

Sentinel 1 Ecuador

Este documento presenta un estudio sobre el análisis multitemporal de imágenes radar Sentinel-1 y la detección de cambios en el uso del suelo entre 2015 y 2018 alrededor de la Reserva Ecológica Manglares Churute en Ecuador. Se utilizaron herramientas de SIG y programación libres como QGIS y R para clasificar imágenes Sentinel-1 y detectar cambios, los cuales mostraron un incremento de camaroneras y caña de azúcar que reemplazaron arrozales. El estudio concluye que es posible

Cargado por

Reinaldo Romero
Derechos de autor
© © All Rights Reserved
Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.
Formatos disponibles
Descarga como PDF, TXT o lee en línea desde Scribd
Está en la página 1/ 50

Universidad Pública de Navarra Nafarroako Unibertsitate Publikoa

ESCUELA TECNICA SUPERIOR NEKAZARITZAKO INGENIARIEN


DE INGENIEROS AGRONOMOS GOI MAILAKO ESKOLA TEKNIKOA

ANÁLISIS MULTITEMPORAL DE UNA SERIE DE IMÁGENES SENTINEL-1 Y


DETECCIÓN DE CAMBIOS DEL USO DE SUELO PARA LA EVALUACIÓN DE LA RESERVA
ECOLÓGICA MANGLARES CHURUTE Y SUS ALREDEDORES EN
GUAYAS-ECUADOR

presentado por

DIANA VÉLEZ ALVARADO (e)k

aurkeztua

MÁSTER EN SISTEMAS DE INFORMACIÓN GEOGRÁFICA Y TELEDETECCIÓN


MASTERRA INFORMAZIO SISTEMA GEOGRAFIKOETAN ETA TELEDETEKZIOAN

Mes, Año / Junio, 2019


AGRADECIMIENTOS

A Dios, a mis padres Andrea y Agustín, a mi mamita Blanca, a mis hermanos Wendy,
Marlene, Ezequiel e Israel, por su apoyo incondicional en las decisiones que he tomado en
la vida, a los Vélez y Alvarado por estar pendiente de mí. A los hermanos de la Iglesia “El
Tabernáculo Plenitud” por sus oraciones.

A la Fundación Carolina, que mediante su programa de becas me brindo la oportunidad de


seguir formándome profesionalmente. A mi tutor Jesús, por valorar el esfuerzo, por toda la
ayuda brindada y a animarme a seguir adelante para alcanzar este objetivo. A Josían, por
sus sugerencias en el script. A los amigos y profesores del MUSIGT, fue una dicha
conocerlos.

A Ronald, por su colaboración en todos los aspectos y sugerencias en este trabajo desde
que se lo comenté y a Sandrita por leerlo; son unos amigos excepcionales.

A Trivi, el hermano que la vida me dio, a Alejandro y al equipo de Ilimit Consult por el
trabajo de campo. Al ing. Luis y Carlos por la información proporcionada.

Al Ec. Nicanor por su aprecio, ayuda durante el proceso de solicitud de la licencia de


estudios y por todo su apoyo. A mis amigos (as) de DIRDRA y en especial a Mariuxi por
defender mi espacio a capa y a espada. A Rocío por venir a visitarme y traerme cosas de mi
lindo Ecuador.

A mis amigos pichuleros y en especial a Marlene, que aunque hayan pasado muchos años,
la amistad se conserva. A mi Robin que ha sido fundamental durante todo este proceso de
estudios, por animarme, apoyarme, por soportarme, por escucharme y por todo lo bueno de
la vida y a sus padres también por estar pendiente.

A Karlita, Jacqui, por ser unas amigas del uno, a Jhon por formar parte de la familia, a
Vanesa por recibirme muy bien en Granada, y la lista sigue…

Simplemente muchas gracias a todos.


Trabajo Fin de Master-Diana Vélez A, junio 2019

Resumen
El manejo de áreas naturales protegidas administradas por el Estado requiere de
información oportuna, veraz y de bajo costo. El territorio que rodea a un área protegida es
parte de la atención de los planes de gestión de cada unidad de conservación, porque las
actividades desarrolladas en estas zonas pueden influir en la efectiva conservación de los
recursos naturales. Determinar los tipos de uso del suelo del área que rodea a un área
protegida con medios convencionales resulta costoso en términos económicos y humanos,
demandando recursos financieros con los que generalmente no cuentan las entidades de
conservación.

Este estudio propone como herramienta de trabajo de bajo costo, el uso de imágenes radar
Sentinel-1, los lenguajes de programación y los sistemas de información geográfica de libre
acceso para elaborar los mapas preliminares antes de ejecutar las medidas de validación y
verificación que se deben aplicar con el uso de cualquiera de los métodos disponibles. Para
determinar los tipos de uso del suelo, comparar los cambios de uso con tres años de
diferencia y hacer un análisis multitemporal de los cultivos se utilizaron imágenes Sentinel-1,
disponibles desde el año 2014, QGIS y el lenguaje de programación R. Para la validación y
verificación de campo se contó con visitas realizadas por personal técnico.

Como unidad de trabajo se utilizó la Reserva Ecológica Manglares Churute, área natural
protegida de 50.000 ha, ubicada en el centro occidental de Ecuador. Se analizaron los usos
de suelo a 1 km de distancia del perímetro y en un área de 70.000 ha de la llanura aluvial
en la que se encuentra. Se determinó que entre los años 2015 y 2018 hubo un incremento
del área ocupada por camaroneras y por caña de azúcar a 1 km de distancia del perímetro,
usos del suelo que reemplazaron a los cultivos de arroz y otros usos como pasto y matorral.
Se concluye que es posible elaborar mapas de cambios de uso del suelo y de
estacionalidad, a bajo costo, utilizando herramientas de acceso libre y con un margen de
error bajo.

Palabras clave: SIG, teledetección, cambios de uso de suelo, áreas naturales protegidas,
Sentinel-1, Ecuador.

1
Trabajo Fin de Master-Diana Vélez A, junio 2019

Abstract

The management of natural protected areas administered by the State requires timely,
accurate and low-cost information. The territory surrounding a protected area is part of the
attention of the management plans of each conservation unit, because the activities
developed in these areas can influence the effective conservation of natural resources.
Determining the types of land use of the area surrounding a protected area with conventional
methods is costly in economic and human terms, demanding financial resources with which
conservation departments do not usually count.

This study proposes as a low-cost work tool the use of Sentinel-1 radar images,
programming languages and free access Geographic Information Systems (GIS) to prepare
preliminary maps before executing the validation and verification measures that should be
applied with the use of any of the available methods. For determining the types of land use,
comparing land use changes with a difference of three years, and making a multitemporal
analysis of the crops, there were used Sentinel-1 images, available since 2014, also there
were used QGIS and the programming language R. Validation and field verification were
carried out by technical personnel on field.

As a unit of work, it was used the Churute Manglares Ecological Reserve, a 50,000 ha
natural protected area, located on the center western of Ecuador. It was analyzed the land
use 1 km away from the perimeter and in an area of 70,000 ha of the alluvial plain in which it
is located. It was determined that between 2015 and 2018 there was an increase in the area
occupied by shrimp farms and by sugarcane 1 km away from the perimeter, land uses that
replaced rice crops and other uses such as pasture and scrub. It is concluded that it is
possible to prepare maps of changes in land use and seasonality, at low cost, using free
access tools, and with a low margin of error.

Keywords: GIS, remote sensing, land use change, protected natural areas, Sentinel-1,
Ecuador.

2
Trabajo Fin de Master-Diana Vélez A, junio 2019

Índice

1. INTRODUCCIÓN ........................................................................................................... 6
1.1. Los sistemas de información geográfica y la teledetección ..................................... 6
1.2. Objetivos ................................................................................................................. 8
2. MATERIAL Y MÉTODOS ............................................................................................... 9
2.1. Área de estudio ....................................................................................................... 9
2.2. Imágenes Sentinel -1 .............................................................................................10
2.3. Procesamiento de imágenes Sentinel 1 .................................................................11
2.4. Clasificación supervisada .......................................................................................13
2.5. Evaluación de los resultados ..................................................................................21
2.6. Detección de cambios de uso del suelo .................................................................23
3. RESULTADOS Y DISCUSIÓN ......................................................................................24
3.1. Matrices de correlación ..........................................................................................24
3.2. Análisis de separabilidad ........................................................................................27
3.3. Clasificación supervisada .......................................................................................31
3.4. Detección de cambios de uso del suelo .................................................................34
4. CONCLUSIONES..........................................................................................................37
5. BIBLIOGRAFÍA .............................................................................................................38
ANEXOS ..............................................................................................................................41

3
Trabajo Fin de Master-Diana Vélez A, junio 2019

Índice de figuras

Figura 1. Principales mecanismos de retrodispersión (Larrañaga & Alvarez-Mozos, 2016a) 7


Figura 2. Ubicación del área de estudio ............................................................................... 9
Figura 3 . Modelo gráfico para el recorte de las imágenes ..................................................11
Figura 4. Modelo gráfico para el procesamiento de las imágenes. ......................................12
Figura 5. Áreas de entrenamiento .......................................................................................14
Figura 6. Cultivo de arroz ....................................................................................................15
Figura 7. Cultivo de banano ................................................................................................15
Figura 8. Bosque .................................................................................................................16
Figura 9. Cultivo de cacao ...................................................................................................16
Figura 10. Cultivo de camarón.............................................................................................17
Figura 11. Cultivo de caña de azúcar ..................................................................................18
Figura 12. Cultivo de palma africana ...................................................................................18
Figura 13. Manglar ..............................................................................................................19
Figura 14. Matorral ..............................................................................................................19
Figura 15. Herbazal .............................................................................................................20
Figura 16. Estructura del algoritmo Random Forest ............................................................21
Figura 17. Delimitación zona buffer alrededor de la reserva ................................................23
Figura 18. Combinación RGB, para el 12-ene, 18-may, 21-sep...........................................24
Figura 19. Combinación RGB, para el 17-feb, 17-jun, 03-oct ..............................................25
Figura 20. Curvas temporales de retrodispersión del camarón: VHdb, VVdb y qdb .............25
Figura 21. Curvas temporales de retrodispersión del arroz: VHdb, VVdb y qdb...................26
Figura 22. Curvas temporales de retrodispersión de la caña de azúcar: VHdb, VVdb y qdb26
Figura 23. Curvas temporales de retrodispersión del banano: VHdb, VVdb y qdb ...............26
Figura 24. Análisis separabilidad arroz ................................................................................27
Figura 25. Análisis separabilidad banano ............................................................................28
Figura 26. Análisis separabilidad bosque ............................................................................29
Figura 27. Análisis separabilidad cacao ..............................................................................29
Figura 28. Análisis separabilidad camarón ..........................................................................30
Figura 29. Análisis separabilidad caña de azúcar, palma y manglar ....................................31
Figura 30. Ranking de importancia de valores .....................................................................32
Figura 31. Resultado de la clasificación ..............................................................................33
Figura 32 Usos de suelo 2015-2018 ....................................................................................34
Figura. 33 Cambios de uso de suelo 2018 ..........................................................................35

4
Trabajo Fin de Master-Diana Vélez A, junio 2019

Índice de tablas

Tabla 1. Características de las imágenes Sentinel 1 en modo operacional IW .....................10


Tabla 2. Parámetros del modelo gráfico ...............................................................................13
Tabla 3. Áreas (ha) de entrenamiento ................................................................................13
Tabla 4. Estructura de una matriz de confusión (clasificación) .............................................22
Tabla 5. Clasificación del estadístico Kappa.........................................................................23
Tabla 6. Correlación entre enero, mayo y septiembre ..........................................................24
Tabla 7. Matriz de confusión.................................................................................................33
Tabla 8. Fiabilidad del usuario y productor ...........................................................................34
Tabla 9. Cambios de uso de suelo 2015-2018 .....................................................................35

5
Trabajo Fin de Master-Diana Vélez A, junio 2019

1. INTRODUCCIÓN
El Sistema Nacional de Áreas Protegidas del Ecuador alberga a 56 reservas naturales, que
cubren aproximadamente un 20 % del territorio nacional (Elbers, 2011); la Reserva
Ecológica Manglares Churute (REMCh) forma parte de este sistema desde 1979, siendo
único por la gran diversidad de ecosistemas que posee (Yanez, 1996), también está incluida
en la lista de sitios Ramsar desde 1990 y actualmente se encuentra bajo la administración
del Ministerio del Ambiente del Ecuador.

Uno de los aspectos más críticos en el manejo de áreas protegidas es determinar los
cambios en el uso del suelo en las áreas vecinas o lo que se conoce como área de
amortiguación que corresponde a la zona de transición entre los sistemas naturales y los
usos intensivos de la tierra. Para el año 2015 más de la mitad (58 %) del área de
amortiguación (1km) alrededor de la REMCh, estuvo ocupada por tres cultivos: arroz,
banano y caña de azúcar (IEE, MAGAP, & CGSIN, 2015) que utilizan agroquímicos de
distintos tipos para el control de insectos, hongos y malezas y por granjas destinadas al
cultivo de camarón cuyo proceso de cría produce incrementos de salinidad del agua, el uso
de químicos para el control de peces depredadores y la muerte de aves que se alimentan de
camarón en las piscinas.

Un cambio de uso de suelo alrededor de la REMCh, es un motivo de preocupación por parte


de sus administradores, porque puede afectar la conservación de los recursos naturales que
protegen, es así que para maximizar el potencial de las áreas, quienes la administran
necesitan estar al tanto de lo que ocurre a su alrededor, para tomar las decisiones correctas
para el éxito de su gestión (Hockings, 2003).

Existe una propuesta de manejo para la reserva (Yanez, 1996), en la que se incluye una
serie de programas para su administración y gestión, sin embargo su conservación no solo
dependerá de las actividades que se realicen al interior de la reserva sino de las acciones a
su alrededor que tengan influencia directa sobre ella.

Lo que se pretende con este trabajo es analizar, mediante el uso de los sistemas de
información geográfica y la teledetección, si ha existido o no cambios en el uso de suelo en
los alrededores de la REMCh en un período comprendido entre el 2015 y el 2018.

1.1. Los sistemas de información geográfica y la teledetección

Los SIG (Sistemas de Información Geográfica), son sistemas que integran tecnología
informática, personas e información geográfica, cuya función es capturar, analizar,
almacenar, editar y representar datos georeferenciados (Olaya, 2014).

La teledetección (remote sensing), es la ciencia y el arte de obtener información de un


objeto o área, o fenómeno, mediante la adquisición de datos (imágenes), sin entrar en
contacto con el mismo (Lillesand, Kiefer, & Chipman, 2015), para lo cual se capta la
radiación electromagnética emitida o reflejada por la superficie terrestre en una o más
regiones del espectro electromagnético (Campbell & Wynne, 2011).

Los sensores de teledetección radar trabajan en la región de las microondas (longitud de


ondas en cm), emiten un pulso de radiación hacia el terreno y reciben el eco o retorno del
que se extrae información sobre los objetos presentes en la trayectoria del pulso, su
posición y algunas propiedades de interés; este eco se produce por un fenómeno
denominado retrodispersión.

6
Trabajo Fin de Master-Diana Vélez A, junio 2019

La retrodispersión varía en función de la frecuencia del sensor, de su ángulo de incidencia y


polarización (HH, HV, VH, VV); se puede interpretar en función de tres principales
mecanismos: superficial, doble rebote y volumen (figura 1).

Figura 1. Principales mecanismos de retrodispersión (Larrañaga & Alvarez-Mozos, 2016a)

Por lo general, la retrodispersión superficial ocurre en superficies lisas, superficies de aguas


en calma, en donde el flujo de energía se comporta de forma especular, la señal no retorna
a la antena por lo que en la imagen se visualizan zonas en colores oscuros y con poco brillo.
En la retrodispersión de doble rebote (zonas urbanas, y en cubiertas forestales a nivel de
tronco), se produce cuando el pulso incide sobre una superficie lisa y el pulso reflejado
vuelve a incidir sobre otra superficie perpendicular a la anterior produciendo un retorno
intenso en la dirección del sensor, en estos casos la señal es muy intensa por lo que en la
imagen se visualizan zonas muy brillantes. El mecanismo de retrodispersión de volumen, es
un fenómeno intermedio entre los dos anteriores, se presenta en zonas forestales cultivos
densos, superficies rugosas, a la antena retorna una parte de la señal que se emite en
función de las características geométricas y dieléctricas de las cubiertas, en la imagen se
visualizan en tonos grises1.

Al ser sensores activos, generan su propia energía, por lo tanto pueden obtener imágenes
tanto de día como de noche y la nubosidad no afecta su capacidad de observación, teniendo
así una cobertura continua de la tierra lo que facilita su uso en zonas en donde la nubosidad
es constante (Woodhouse, 2006). El uso de imágenes radar ha tenido éxito en muchos
campos de aplicación, entre ellos el mapeo cobertura y uso de suelo, geología, tipos de
hielo marino, ríos y lagos (Lillesand et al., 2015; Skriver, 2007). La misión Sentinel 1
compuesta por una constelación de dos satélites: Sentinel-1A, lanzado en abril del 2014 y
Sentinel 1-B, lanzado en abril del 2016, proporciona imágenes de tipo radar en la banda-C
(ESA, 2019), lo que permite su uso global en la detección de cambios, monitoreo de áreas
con vegetación, hielos, océanos, navegación marítima.

En zonas tropicales y húmedas en donde la cobertura nubosa es constante como en la zona


de estudio, el uso de series temporales de imágenes Sentinel-1, han contribuido con el
monitoreo del sector agrícola, forestal (Del‟Arco Sanches et al., 2018) y acuícola (Ottinger et
al., 2017).

1
Apuntes de clases. Teledetección RADAR y LiDAR, MUSIGT 2018-2019

7
Trabajo Fin de Master-Diana Vélez A, junio 2019

1.2. Objetivos

El objetivo general de este trabajo consiste en analizar los cambios de uso de suelo en los
alrededores de la Reserva Manglares Churute (REMCh) para su evaluación, además de los
siguientes objetivos específicos.

 Ejecutar el procesamiento de las imágenes Sentinel-1 en modo Interferometric Wide


Swath Mode (IW) y nivel 1.5 Ground Range Detected (GRD).
 Realizar la clasificación supervisada mediante el algoritmo Random Forest y evaluar
sus resultados.
 Determinar los cambios de uso de suelo entre el 2015 y 2018.
 Interpretar cómo los cambios en el uso del suelo pueden modificar la conservación
de recursos naturales de la REMCh.

8
Trabajo Fin de Master-Diana Vélez A, junio 2019

2. MATERIAL Y MÉTODOS

2.1. Área de estudio

El área de estudio (figura 2) comprende aproximadamente 123.000 hectáreas, de las cuales


50.000 hectáreas pertenecen a la REMCh, ubicada en el cantón Naranjal (zona continental)
y en el cantón Guayaquil (islas) en la provincia del Guayas, en Ecuador. Entre los cultivos
que predominan en el área están: caña de azúcar industrial (25%), arroz (24%), camaronera
(14%), banano (9%), cacao (4%), palma (1%), en menor proporción, los pastos, maíz, teca,
y vegetación herbácea y arbustiva (matorral).

Figura 2. Ubicación del área de estudio

La REMCh se encuentra en una llanura fluvio-marina, con pendiente menor a 5 % de un


área conocida como Cuenca Baja del Río Guayas que se extiende desde el estuario del río
Guayas, al Oeste, hasta el piedemonte de la cordillera occidental de los Andes, al Este.

9
Trabajo Fin de Master-Diana Vélez A, junio 2019

Esta zona forma parte de cinco subsistemas hidrográficos que la drenan: Jujan, Chimbo -
Yaguachi, Taura - Boliche - Bulubulu, Churute y Cañar. Estos ríos inundaban la planicie,
durante la estación lluviosa (diciembre a marzo) de la zona costera del Ecuador, hasta que
el estado ecuatoriano construyó un sistema de control de inundaciones que opera desde el
año 1997.

En el extremo oeste de la Cuenca Baja y antes de que los ríos Taura, Churute y Cañar
descarguen en el estuario del río Guayas, se encuentra la REMCh. En su interior se
conserva bosque de manglar, bosque seco, bosque húmedo de neblina y vegetación
acuática (Navarrete, 2000). La REMCh protege tres importantes ecosistemas: la Laguna El
Canclón, la Cordillera de Churute y los remanentes de manglar (ECOLAP & MAE, 2007).

En estos variados hábitats existen distintas especies de mamíferos, aves, anfibios, reptiles e
invertebrados endémicos de la región seca del oeste de Ecuador y Perú. Las especies
estuarinas más comunes son: mejillones (Mytella guayanensis), el cangrejo rojo (Ucides
occidentalis), ostiones (Cassostrea columbiensis), que son la principal fuente de ingresos
económicos de pescadores artesanales (ECOLAP & MAE, 2007; Yanez, 1996) y también la
operación de granjas destinadas al cultivo de camarón blanco (Penaeus vannamei), algunas
de las cuales existen desde antes de la creación de la REMCh. Otras de las actividades
económicas es la agricultura principalmente de arroz, la ganadería en sus alrededores y el
ecoturismo.

Desde la construcción y operación (1997) del sistema de control de inundaciones que


minimiza los riesgos de daños en los diferentes usos del suelo alrededor de la REMCh, el
área de amortiguación del área protegida ha sufrido cambios. Antes del año 1997, la parte
septentrional y oriental del sector norte de la REMCh estaba cubierta principalmente por
pastos naturales que eran aprovechados por una ganadería extensiva. Posteriormente ha
sido ocupada por distintos usos del suelo, alguno de los cuales (como el cacao y pastos
naturales) son beneficiosos para los objetivos de conservación de la biodiversidad de la
REMCh y otros (como el cultivo de arroz y la acuicultura del camarón) en cambio,
representan una amenaza y para lo cual se requiere diseñar estrategias de manejo
consensuado con los propietarios.

2.2. Imágenes Sentinel -1

La descarga de las imágenes Sentinel-1, se realizó desde la página de la ESA (Agencia


Espacial Europea) Copernicus Open Acces Hub: https://scihub.copernicus.eu/dhus/#/home,
previo registro. Se descargaron 12 imágenes Sentinel 1A y 1B, en modo Interferometric
Wide Swath Mode (IW) y nivel 1.5 Ground Range Detected (GRD), con polarizaciones VH y
VV; sus características se detallan en la siguiente tabla (Torres et al., 2012).
Tabla 1. Características de las imágenes Sentinel 1 en modo operacional IW
Parámetro Interferometric Wide-swath mode (IW)
Polarización Dual (HH+HV, VV+VH)
Rango del ángulo de incidencia 31º - 46º
Resolución en azimuth < 20 m
Resolución en ground range <5m
Number of looks 1x5
Ancho de pasada > 250 km
Ruido máximo equivalente Sigma cero (NESZ) -22dB
Estabilidad radiométrica 0.5 dB (3)
Precisión radiométrica 1 dB (3)
Error de fase 5º

10
Trabajo Fin de Master-Diana Vélez A, junio 2019

2.3. Procesamiento de imágenes Sentinel 1


Las imágenes Sentinel-1 se encuentran en formato GRD y en unidades de amplitud, tanto
para la polarización en VH como en VV; el procesamiento consiste en reducir el moteado,
correcciones radiométricas, geométricas, topográficas y transformación de unidades lineales
a decibelios.

El procesamiento de estas, se realizó mediante el software SNAP2 (Sentinel Aplication


Platform), desarrollado por la Agencia Espacial Europea para el proceso y análisis de
imágenes satelitales provenientes de la familia Sentinel.

Para ello se crearon dos modelos gráficos: uno para realizar el recorte de las imágenes en la
zona de estudio (figura 3), y el otro para el procesado masivo de todas las imágenes (figura
4).

Figura 3 . Modelo gráfico para el recorte de las imágenes

Recorte y lectura de las imágenes

Mediante el modelo gráfico indicado en la figura 3, se realizó el recorte masivo de todas las
imágenes del área de estudio. Una vez recortadas fueron procesadas en secuencia hasta
obtener las ideales para realizar los análisis correspondientes.

Corrección de la órbita

Aunque las imágenes disponen de los datos de orbita, estos suelen ser aproximados dado
que se calculan en tiempo real, por lo tanto, para garantizar una corrección geométrica
precisa, es necesario descargar los datos orbitales reprocesados, que suelen estar
disponibles días después de la generación de la imagen.

Calibración de las imágenes a βº

En este punto se transforma los niveles digitales a unidades de coeficiente de


retrodispersión βº, magnitud que normaliza la sección equivalente radar (RCS) la cual
representa la capacidad de un objeto de retrodispersar el pulso de radiación recibido.

Filtrado de moteado

Las imágenes radar se ven afectadas por una distorsión radiométrica denominada moteado
(efecto sal y pimienta), que introduce variabilidad en los valores individuales de cada pixel lo
que dificulta su interpretación y posterior análisis. Para reducirlo se han desarrollado
distintos filtros que tratan de reducir la varianza en zonas homogéneas a la vez que
mantienen la retro dispersión de reflectores discretos (Filtro de Lee y de Frost), bordes,
elementos lineales (Refined Lee, Lee Sigma e IDAN) y texturas (GammaMAP).

2
http://step.esa.int/main/download/

11
Trabajo Fin de Master-Diana Vélez A, junio 2019

Ortorrectificación

La ortorrectificación, es un paso a una proyección precisa, debe hacerse con modelos


matemáticos rigurosos que tengan en cuenta la posición del sensor, la geometría de la
adquisición y el relieve. El modelo empleado en este trabajo es el Range-Doppler que
resuelve matemáticamente las ecuaciones del rango y del efecto Doppler para obtener la
posición precisa de cada punto de la imagen (Small & Schubert, 2008).

Corrección topográfica

El relieve (la pendiente y orientación de las laderas) aunque sea leve, modifica no solo la
geometría de la imagen si no su radiometría, haciendo que las laderas orientadas hacia el
sensor vaya incrementando su coeficiente de retrodispersión y las laderas opuestas lo vean
reducido. Este efecto limita la extracción de información de las cubiertas y el uso de estas
imágenes en aplicaciones de todo tipo. Para la corrección topográfica se aplicó el método
denominado Terrain Flattening desarrollado por Small (2011), cuyo resultado es el
coeficiente de retro dispersión en unidades de 0 normalizado topográficamente a través del
ratio entre el área en la dirección del rango y el área realmente iluminada por el pulso radar.


Como ya se mencionó, el procesamiento masivo de las imágenes se realizó mediante un


modelo gráfico, cuya estructura se presenta en la figura 4.

Figura 4. Modelo gráfico para el procesamiento de las imágenes.

En la siguiente tabla se presenta un resumen de los parámetros utilizados para el modelo


gráfico.

12
Trabajo Fin de Master-Diana Vélez A, junio 2019

Tabla 2. Parámetros del modelo gráfico


No. Proceso Parámetros
1 Read Cargar la imagen
Orbit State Vectors: Sentinel Precise (Auto Download)
2 Apply-Orbit-File
Polynomial Degree:3
3 Calibration Create beta0 virtual band
Multi-Temporal-Speckle- Gamma Map 3 x 3
4
Filter
Digital Elevation Model: SRTM 1Sec HGT (Auto Download)
5 Terrain Flattening
DEM Resampling Method: BILINEAR_INTERPOLATION
Digital Elevation Model: SRTM 1Sec HGT (Auto Download)
DEM Resampling Method: BILINEAR_INTERPOLATION
Image Resampling Method: BILINEAR_INTERPOLATION
6 Terrain-Correction
Pixel Spacing (m): 10
Map Projection: UTM Zone 17, South/World Geodetic System
1984
7 Linear To From dB Transformación de unidades lineales a dB
Cálculo del ratio de polarización cruzada q=VH/VV en dB
8 Band Maths
Gamma0_VH_db – Gamma0_VV_db
9 Band Merge Une en un mismo archivo gamma0VH, gamma0VV y q_db

2.4. Clasificación supervisada

El método de clasificación supervisada, parte de un cierto conocimiento de la zona de


estudio, lo que permite delimitar sobre una imagen áreas representativas de las distintas
categorías (clases) a las que se denominarán áreas de entrenamiento. Dichas áreas sirven
para entrenar al programa de clasificación en el reconocimiento de las distintas categorías,
es decir, reunir un conjunto de estadísticas que describan el patrón de respuesta espectral
para cada tipo de cobertura en la que la imagen será clasificada (Chuvieco, 2010; Lillesand
et al., 2015).

Partiendo del conocimiento básico de la zona, levantamiento de puntos geo referenciados


de cultivos, cartografía a escala 1:25.000 (IEE et al., 2015), e imágenes de Google Earth, se
procedió a delimitar las áreas que comprenderán el set de entrenamiento. De estas áreas,
se seleccionó aleatoriamente un 70% para realizar la clasificación, el resto se consideró
para la validación de la misma. En la figura 5 se presentan las áreas de entrenamiento tanto
para clasificación y validación. Se utilizaron nueve categorías para realizar la clasificación:
arroz, banano, bosque, cacao, camarón, caña de azúcar, palma, manglar, y pastizales
(incluye vegetación y matorral).

En la tabla 3, se presentan las clases para el conjunto de entrenamiento y validación.

Tabla 3. Áreas (ha) de entrenamiento


Area (ha)
Clase
Train Test (Validacion)
Arroz 152 64
Banano 394 178
Bosque 101 32
Cacao 81 48
Camarón 596 266
Caña de azúcar 395 86
Palma 38 22
Manglar 337 158
Pastizal 7 3
Total 2101 856

13
Trabajo Fin de Master-Diana Vélez A, junio 2019

Figura 5. Áreas de entrenamiento

Descripción de clases

1.- Arroz

Es uno de los principales productos de la canasta básica en los hogares ecuatorianos. Es


una gramínea que tiene entre 60 y 120 cm de altura, que se desarrolla bajo inundación, en
ciclos que van entre 120 y 140 días dependiendo de la variedad. Se distinguen tres fases
de desarrollo: vegetativa, reproductiva y madurez. La fase vegetativa dura de 55 a 60 días,
va desde la germinación de la semilla hasta la diferenciación del primordio floral. La fase
reproductiva empieza desde la formación del primordio floral hasta la emergencia de la
panícula (floración) dura entre 35 y 40 días. La fase de madurez dura de 30 a 40 días,
abarca desde la floración, llenado y desarrollo de los granos, hasta la cosecha. La siembra
se realiza con el terreno inundado con una lámina de agua de cinco centímetros de altura, a
medida que crece el cultivo, esta se va incrementando hasta los 15 cm aproximadamente;
previo a la cosecha el terreno se deja secar para la realización de la misma3.

3
Arroz: http://cultivodearrozoryzasativa.blogspot.com/

14
Trabajo Fin de Master-Diana Vélez A, junio 2019

Preparación de terrenos previo a la siembra de arroz Desarrollo del cultivo de arroz


Figura 6. Cultivo de arroz
4
Fuente: Ilimit Consult

2.- Banano

El banano es el primer producto de exportación no petrolero, de Ecuador, es una planta


herbácea perenne, es decir, mientras se encuentra en producción también se están
desarrollando nuevas plantas que crecen a su alrededor, de las cuales el productor
selecciona la más adecuada para que continúe con la propagación del cultivo. La planta
alcanza una altura entre 3.5 a 7.5 metros y tiene un período de vida de 13 meses. Se
distinguen las siguientes fases de desarrollo: infantil, independiente y reproductiva.

La fase infantil va desde la aparición de la yema lateral en la base de la planta madre hasta
que el hijo se hace independiente de la misma, esta fase dura entre 120 a 160 días y ocurre
cuando la planta madre tiene aproximadamente cinco meses. La fase independiente, está
demarcada por la emisión de la primera hoja del hijo, y una vez independiente comienza a
desarrollar hojas de tamaño normal. Esta fase dura entre 50 a 60 días. La fase reproductiva
empieza desde el inicio de la floración hasta la cosecha del racimo (Florio de Real et al.,
2012).

Lote de banano Fruto de banano


Figura 7. Cultivo de banano
Fuente: Ilimit Consult

4
https://www.ilimitconsul.com/

15
Trabajo Fin de Master-Diana Vélez A, junio 2019

3.- Bosque

La REMCh, protege los remanentes de bosque seco tropical, ecotonos importantes y el tipo
de bosque húmedo existente principalmente en alturas intermedias y altas de los cerros
(Yanez, 1996).

Bosque seco Bosque húmedo


Figura 8. Bosque
5
Fuente: Navarrete R. (Izquierda), diario El Universo, 2019 (derecha)

4.- Cacao

Llamado también „pepa de oro‟ es una planta perenne, dependiendo de la variedad (CCN51,
o fino de aroma) su altura oscila entre 4 y 7 metros aproximadamente. Se cultiva solo o
asociado con otras especies. Su crecimiento es rápido, y la fructificación empieza entre el
segundo y tercer año a partir de la siembra. La cosecha inicia cuando el fruto ha alcanzado
su madurez, la cual se da por el cambio de coloración, que depende de la variedad.

Lote de cacao Fruto de cacao


Figura 9. Cultivo de cacao
Fuente: Ilimit Consult

5
Una reserva ecológica del Guayas rodeada de sembríos, pesca y recintos en Ecuador,
https://www.eluniverso.com/noticias/2019/05/12/nota/7323134/reserva-guayas-rodeada-sembrios-
pesca-recintos-ecuador

16
Trabajo Fin de Master-Diana Vélez A, junio 2019

5.- Camarón

Es un cultivo de alto rendimiento que empezó a partir de los años 50, siendo, en Ecuador, el
segundo mayor producto de exportación no petrolera después del banano. Su sistema de
producción es en piscinas, se desarrolla en alrededor de cuatro meses hasta lograr el peso y
las medidas deseadas. En función del sistema de producción puede variar entre 1 a 2.5
ciclos al año; entre cada ciclo se realiza el vaciado de las piscinas y su preparación para
recibir a un nuevo lote de larvas las cuales se desarrollan en laboratorios, comenzando un
nuevo ciclo (Palacios, 2016).

Alimentación de los camarones Camarón


Figura 10. Cultivo de camarón
6
Fuente: Navarrete R. (Izquierda), diario El Comercio (derecha)

6.- Caña de azúcar

La caña de azúcar es un producto de exportación pero en menor proporción en comparación


con el banano y camarón. Es una gramínea anual, que tiene un tallo macizo de 2 a 5 metros
de altura con unos 5 o 6 cm de diámetro. A los 13 meses de edad se realiza la primera
cosecha, luego viene el desarrollo de la caña soca, la cual empieza después del primer
corte y termina con el último en los que puede llegar hasta cinco. Posteriormente se realiza
la renovación de la plantación (Ingenio San Carlos, 2013).

Tiene cuatro fases de desarrollo: emergencia, amacollamiento, rápido crecimiento y


maduración. La fase de emergencia o germinación inicia a los 7 o 10 días después de la
siembra, dura hasta 35 días. El amacollamiento empieza alrededor de los 35 a 40 días
después de la siembra, se caracteriza por el brote de varios tallos desde la base de los tallos
primarios. En la fase de rápido crecimiento se presenta una gran acumulación de materia
seca y la planta alcanza su máximo índice foliar, dura entre 120 y 180 días. La maduración
tiene una duración entre 60 y 90 días; en esta fase se da el proceso de síntesis y
acumulación de sacarosa en los tallos de la caña.

6
¿El camarón ecuatoriano es el mejor del mundo? 5 argumentos para creer que sí, diario El Comercio, 2014
https://www.elcomercio.com/actualidad/camaron-ecuatoriano-mundo.html

17
Trabajo Fin de Master-Diana Vélez A, junio 2019

Plantación de caña de azúcar Plantación de caña de azúcar


Figura 11. Cultivo de caña de azúcar
Fuente: Ilimit Consult
7.- Palma

La palma es una planta perenne cultivada para la extracción de aceite. La producción inicia
a partir de los 2 a 2.5 años de edad, su altura puede llegar hasta los 20 metros. Su
expansión es considerada como uno de los principales agentes de deforestación en el
Ecuador7. En los últimos años, en la Costa ecuatoriana, el cultivo de palma africana ha
sufrido pérdidas por el efecto de hongos y varias plagas de insectos que se alimentan de las
hojas de la planta, por lo que su expansión alrededor de la Reserva debería ser vigilada8.

Cultivo de palma africana


Figura 12. Cultivo de palma africana
9
Fuente: Diario El Telégrafo, 2018

7
La palma africana se apodera silenciosamente de Ecuador, Aguilar D, 2017.
https://es.mongabay.com/2017/10/la-palma-africana-se-apodera-silenciosamente-ecuador/
8
Palmicultores solicitan al Estado declarar en emergencia al sector, diario El Telégrafo 2018
www.eltelegrafo.com.ec https://www.eltelegrafo.com.ec/noticias/economia/4/cogollo-afectacion-palma-aceitera-
ecuador
9
Ibídem

18
Trabajo Fin de Master-Diana Vélez A, junio 2019

8.- Manglar

El 60 % de la REMCh son manglares, es un tipo de formación vegetal siempreverde que se


encuentra en las márgenes de los esteros con influencia de la marea se desarrollan en la
interfaz de tierra firme hacia mar abierto y presentan un dosel cerrado que oscila entre 10 a
12 metros, vegetación típica con la presencia de raíces zancudas (MAE, 2013).

Manglares en Churute, al fondo los cerros de la Sendero en los manglares de Churute


cordillera homónima
Figura 13. Manglar
Fuente Navarrete R.

9.- Pastizales, y vegetación.

La vegetación arbustiva (matorral), pertenece a una vegetación densa, de poca altura. La


vegetación arbustiva seca, comprende vegetación lignificada de poca altura que pierde sus
hojas en la temporada seca y en ocasiones se presentan arboles aislados dominantes. La
vegetación herbácea, por lo general de tipo gramínea mantiene el verdor constante,
utilizados con fines de pastoreo. La vegetación herbácea seca se encuentra de forma
dispersa en toda la zona de estudio (IEE et al., 2015).

Matorral húmedo Matorral seco


Figura 14. Matorral
Fuente: IEE et al., 2015

19
Trabajo Fin de Master-Diana Vélez A, junio 2019

Vegetación herbacea seca Vegetación herbácea


Figura 15. Herbazal
Fuente: IEE et al., 2015

Análisis de correlación, separabilidad y clasificación

Previo al proceso de clasificación de las imágenes es conveniente realizar un análisis


estadístico sobre la separabilidad de las categorías seleccionadas (Chuvieco, 2010). En
principio se determinó la correlación entre las imágenes las 36 imágenes (polarización
VHdb, VVdb, qdb) considerando la zona de estudio mediante lenguaje en R (Hijmans, 2019),
con la cual se determinará a priori la relación que existe entre las diferentes bandas en las
distintas fechas.

Para evaluar la separabilidad, de entre los diferentes métodos existentes, se utilizó el


algoritmo de distancia de Jeffries-Matusita (JM) (Swain & King, 1973), que permite
cuantificar la separabilidad entre dos categorías, tomando en cuenta la distancia de los
valores medios de cada clase así como la distribución de los mismos, de tal forma que se
evalúa el grado de solape entre dos categorías en rangos que van entre 0 y 2 (Dabboor,
Howell, Shokr, & Yackel, 2014).

∫ [√ ( ) √ ( )]

Donde 𝑖𝑗 es la distancia de JM entre los pares de clases 𝑖 y 𝑗, es la variable estudiada


y ( | 𝑖) y ( | 𝑗) son las funciones de probabilidad para un determinado , en 𝑖 y 𝑗
respectivamente.

Valores de 0 serían dos clases que se solapan completamente y de 2 serían dos clases
completamente separadas (Larrañaga & Alvarez-Mozos, 2016b), también se podría
considerar que valores entre 0 y 1 corresponden a una muy pobre separabilidad, entre 1 y
1.5 corresponden a una pobre separabilidad, y entre 1,5 y 2 corresponden a una
separabilidad alta (Skriver, 2007). Para el cálculo de la distancia JM, se utilizó una función
en lenguaje R facilitada por el tutor del trabajo.

Realizado el análisis de separabilidad, se realizó la clasificación, mediante el algoritmo


Random Forest (RF) en lenguaje R, con base a extractos de código por (Gil Martínez, 2018;
Santacruz, 2015), haciendo uso de la librería caret (Classification and Regression Training)
(Kuhn et al., 2019).

El algoritmo Random Forest (RF) (Breiman, 2001), consiste de una colección de


clasificadores basados en árboles estructurados; es un método que combina árboles de
decisión independientes probados sobre un conjunto de datos seleccionados aleatoriamente

20
Trabajo Fin de Master-Diana Vélez A, junio 2019

con igual distribución, cada árbol da una clasificación y el resultado es la clase con mayor
número de votos en todo el bosque (figura 16).

Figura 16. Estructura del algoritmo Random Forest


Fuente: (Orellana Alvear, 2018)

Cada árbol de decisión (k) se forma a partir de un conjunto de datos de entrenamiento,


tomados aleatoriamente y con reemplazo, los nodos de cada árbol se construyen utilizando
la mejor variable de división entre un subconjunto (m) de variables predictivas seleccionados
al azar, acorde a una determinada medida que maximice un estadístico de desigualdad o
desorden (coeficiente de Gini o entropía). Cuanto mayor sea la pureza del nodo, menor el
valor del índice Gini; con la entropía se mide el grado de desorden, que se corresponde con
la impureza, si un nodo es puro su entropía es cero, de esta forma el resultado de cada
árbol es independiente (Amat Rodrigo, 2018; Larrañaga & Alvarez-Mozos, 2016a).

2.5. Evaluación de los resultados

Internamente el clasificador RF guarda para cada árbol 1/3 del conjunto de datos de
entrenamiento para calcular el error out of bag (OOB), el cual se estima de forma interna
para optimizar los parámetros (árboles de decisión y variables predictivas); adicionalmente a
ello se procedió a evaluar la fiabilidad de la clasificación utilizando el conjunto de datos
externos, haciendo uso de matrices de confusión.

Con los resultados obtenidos en la clasificación y el conjunto de datos, se generó dicha


matriz, la cual refleja los conflictos que se presentan entre el mapa clasificado y la realidad
(Chuvieco & Huete, 2010). De esta matriz se generan una serie de cálculos estadísticos con
los cuales se validó numéricamente los resultados de la clasificación. En la siguiente tabla
se presenta la estructura de una matriz de confusión (Chuvieco, 2010).

21
Trabajo Fin de Master-Diana Vélez A, junio 2019

Tabla 4. Estructura de una matriz de confusión (clasificación)


Referencia
Fiabilidad
Clase 1 Clase 2 Clase 3 Clase n Total
usuario
Clasificación

Clase 1 X11 X1+ X11/X1+


Clase 2 X22 X2+ X22/X2+
Clase 3 X33 X3+ X33/X3+
Clase n Xnn Xn+ Xnn/Xn+
Total X+1 X+2 X+3 X+n ΣXij
Fiabilidad
X11/X+1 X22/X+2 X33/X+3 Xnn/X+n
productor

La diagonal de la matriz corresponde a los puntos en donde se produce acuerdo entre la


imagen clasificada y la realidad, mientras los marginales suponen errores de asignación. Los
cálculos estadísticos derivados de esta matriz que se utilizaron para validar la clasificación
fueron:

Fiabilidad global, se obtiene relacionando los elementos de la diagonal con el total de


puntos muestreados (Chuvieco & Huete, 2010).


̂
∑ ∑

Donde xii corresponde a los valores de la diagonal en cada columna y xij el valor en la fila i
(clasificador) y el valor en la columna j (referencia), de la matriz de confusión.

La fiabilidad global, como se calcula a nivel general puede ocultar diferencias en las
categorías, para ello se requiere un análisis que incluya las celdillas marginales (Chuvieco,
2010), como los que se presenta a continuación.

Fiabilidad del productor, probabilidad de que los pixeles de una determinada clase
i, realmente correspondan a dicha clase en la imagen clasificada.

Fiabilidad del usuario, es la probabilidad de que los píxeles clasificados como la


clase i representen realmente dicha clase en el terreno.

Estadístico Kappa, es una medida de la diferencia entre el acuerdo observado (mapa-


realidad) y el que cabría esperar por el azar, se calcula (Hudson & Ramm, 1987):

∑ ∑
𝑘̂

Donde n es el tamaño de la muestra, Xii pixeles correctamente clasificados, y el producto de


los marginales Xi+ y X+i.

Los resultados van en un rango entre 0 y 1, en la siguiente tabla se indica una clasificación
de la calidad de los valores propuestas por (Landis & Koch, 1977).

22
Trabajo Fin de Master-Diana Vélez A, junio 2019

Tabla 5. Clasificación del estadístico Kappa


Estadístico Kappa Clasificación
< 0.00 Malo
0.00-0.20 Leve
0.21-0.40 Razonable
0.41-0.60 Moderado
0.61-0.80 Considerable
0.81-1.00 Casi perfecto

Con base a la clasificación obtenida y el 30% de las áreas consideradas para la validación
de la misma se procedió a construir la matriz de confusión en QGIS, utilizando el
complemento “Semi-Automatic Classification” desarrollado por Congedo (2018).

2.6. Detección de cambios de uso del suelo

Para cuantificar el cambio de uso del suelo, se realizó un análisis de los cultivos de arroz,
caña de azúcar, banano y camarón, por ser los más importantes en la zona en cuanto a su
extensión e importancia en su producción y comercio. El resto de cultivos se los agrupó en
una categoría llamada “otros cultivos”. En esta categoría se encuentran: palma, cacao,
vegetación arbustiva (matorral), vegetación herbácea y pastos, no se considera el manglar
ni bosque ya que forman parte de la REMCh, y sus límites y su uso se encuentran definidos.

La evaluación del cambio del uso de suelo se realizó tomando en cuenta una franja de 1 km
alrededor de la reserva (zona buffer) y el resto que contempla el área de estudio (figura 17).
En este estudio se ha considerado esta zona buffer como área de amortiguamiento, aunque
en términos legales, en 1992 se definió en 100 metros de ancho en la falda de los cerros
(Yanez, 1996).

Figura 17. Delimitación zona buffer alrededor de la reserva


Fuente: Elaboración propia

23
Trabajo Fin de Master-Diana Vélez A, junio 2019

Para ello se transformó a archivo vectorial el mapa clasificado con QGIS, del cual se
consideraron las clases (cultivos) de interés y posteriormente se trataron individualmente
para eliminar el ruido (polígonos de astilla); teniendo las áreas de los cultivos finales, estas
se transformaron a raster para poder realizar la detección de cambios con el mapa del año
2015 (IEE et al., 2015).

Con los mapas de uso de suelo tipo raster del año 2015 y 2018, se realizó una resta entre
ambos, quedando en evidencia las modificaciones del uso del suelo con respecto al año
2015. Este proceso se realizó en Arcgis, pero también se puede realizar en QGIS.

3. RESULTADOS Y DISCUSIÓN

3.1. Matrices de correlación

Los valores de correlación más altos se encuentran en un rango entre 0.87 y 0.90, que
corresponden a sendas imágenes en las polarizaciones VHdb y VVdb, ocurriendo lo
contrario al correlacionar estas con el ratio qdb, en donde los resultados indican una
correlación negativa y baja, también se observa una correlación similar entre los diferentes
pares de fechas en las polarizaciones VHdb y VVdb, no así en qdb, por ejemplo entre enero
mayo y septiembre (tabla 6). En el anexo 1 se presenta una tabla que contiene la correlación
entre todas las bandas.
Tabla 6. Correlación entre enero, mayo y septiembre
18-may 21-sep
Bandas Fechas b13 b14 b15 b25 b26 b27
VHdb VVdb qdb VHdb VVdb qdb
b1 VHdb 0.78 0.78 -0.35 0.72 0.69 0.01
12-ene b2 VVdb 0.76 0.79 -0.38 0.70 0.71 -0.06
b3 qdb -0.04 -0.08 0.10 -0.02 -0.09 0.13

A continuación se presentan combinaciones RGB, de algunas imágenes.

Polarización VHdb Polarización VVdb


Figura 18. Combinación RGB, para el 12-ene, 18-may, 21-sep

24
Trabajo Fin de Master-Diana Vélez A, junio 2019

Polarización VHdb Polarización VVdb


Figura 19. Combinación RGB, para el 17-feb, 17-jun, 03-oct

En las combinaciones presentadas (figuras 18 y 19), se logra visualizar una tendencia


constante en tonos grises al sur este que se identifica con el cultivo de banano, al sur oeste
con algo de moteado rosa que sería el manglar y el bosque ubicado en el centro norte; esto
significa que en las seis fechas no existe mayor cambio con el comportamiento de aquellas
cubiertas y además considerando que son de tipo perenne. Las zonas negras que se
encuentran al oeste y que su color no cambia, corresponden al río Guayas y sus afluentes.
En el caso de las áreas en donde predomina el color negro seguido de colores rojos, azules
y verdes, corresponden a las zonas de camaroneras; este cambio multicolor está
relacionado con el proceso de vaciado de las piscinas y en donde si existen valores de
retrodispersión este comportamiento se puede ver a detalle con la curva media temporal del
cultivo. Para el resto de área, en donde predominan mayormente los cultivos de caña y
arroz, casi no se ve un patrón definido, salvo en ciertas áreas; esto nos da una idea de que
la producción de los cultivos en la zona es de manera intermitente.

En las siguientes gráficas se muestran las curvas medias temporales de los cultivos de
camarón, arroz, caña de azúcar y banano, en la zona de amortiguamiento de la REMCh,
tomando en cuenta una parcela por cada cultivo, este comportamiento podría ser diferente
en otras parcelas. Los valores aquí representados son referenciales, nos da una idea del
comportamiento de los cultivos a lo largo del año en las diferentes polarizaciones, para
interpretar de una mejor manera es preciso conocer los calendarios de siembra reales y
conocer un poco más del comportamiento de dichas cubiertas.

Camarón

Figura 20. Curvas temporales de retrodispersión del camarón: VHdb, VVdb y qdb

25
Trabajo Fin de Master-Diana Vélez A, junio 2019

Por el tipo de retrodispersión superficial que se dan en superficies de aguas en calma en la


que predominan las polarizaciones directas, los valores en VVdb son más altos que en
VHdb. El valor más bajo en VVdb se da en junio lo que se ve reflejado en qdb en donde en
esa fecha se ve el valor más alto, predominando el mecanismo de retrodispersión en VH.

Arroz

Figura 21. Curvas temporales de retrodispersión del arroz: VHdb, VVdb y qdb

Tomando en cuenta que el arroz es un cultivo que durante la mayor parte de su desarrollo
es bajo inundación, a nivel general se puede ver que predomina la polarización en VVdb. Al
analizar la curva qdb el ratio entre las dos polarizaciones, se denotan dos picos en positivo
en marzo y agosto, en donde la polarización en VHdb predomina, lo que se relaciona con el
punto de crecimiento máximo del cultivo. Se podría concluir de que en esa parcela se han
realizado dos cosechas en ese año.

Caña de azúcar

Figura 22. Curvas temporales de retrodispersión de la caña de azúcar: VHdb, VVdb y qdb

En general la curva temporal de la caña de azúcar mantiene una tendencia constante. En


febrero presenta el pico más alto, luego a partir de marzo esta se estabiliza. Predomina la
polarización en VVdb.

Banano

Figura 23. Curvas temporales de retrodispersión del banano: VHdb, VVdb y qdb

Tomando en cuenta de que el banano de cierta forma es perenne, y se van realizando


cosechas paulatinamente; la curva temporal tanto en VHdb y VVdb es constante, en qdb se
mantienen picos positivos y negativos pero siempre dentro del rango entre -5 y -10.

26
Trabajo Fin de Master-Diana Vélez A, junio 2019

3.2. Análisis de separabilidad

El análisis de separabilidad, de cierta forma ayuda a entender los resultados que se


obtengan de la clasificación, la certeza de los datos de este análisis se ve influenciado por la
calidad del set de entrenamiento, en las siguientes gráficas de tipo radial, se representa el
análisis de separabilidad entre las distintas clases.

Cultivo de arroz

Polarización VHdb Polarización VVdb

Polarización qdb Leyenda

Figura 24. Análisis separabilidad arroz

En las polarizaciones VHdb y VVdb la separabilidad es similar en las diferentes


combinaciones del cultivo de arroz, siendo el banano con el que mejor se separa. Con el
camarón existe una baja separabilidad en la polarización VVdb el 25 de marzo y 28 de
agosto, lo que podría estar relacionado con las parcelas de arroz inundadas ya sea por la
preparación del terreno (fangueo), o por el desarrollo del cultivo en sus primeros días; con el
cultivo que menos separabilidad presenta en ambas polarizaciones es con la caña de
azúcar, la separabilidad más alta se da en la polarización VHdb el 25 de marzo luego una
baja el 30 de abril, sube de nuevo el 18 de mayo para luego ir en descenso hasta llegar a
valores de 0.

En qdb la separabilidad es variante a lo largo del año pero en general baja. Existen varios
picos en las combinaciones con el camarón, bosque y pastizales, sin embargo son valores
en torno a 0.3, lo que se considera una separabilidad muy pobre.

27
Trabajo Fin de Master-Diana Vélez A, junio 2019

Cultivo de banano

Polarización VHdb Polarización VVdb

Polarización qdb Leyenda

Figura 25. Análisis separabilidad banano

Se discrimina muy bien con el cultivo de camarón en VHdb, VVdb e incluso con qdb entre el
18 de mayo y 23 de julio; con la cubierta que menos se discrimina es con el manglar
llegando a valores por debajo de 0.5.

Bosque

Polarización VHdb Polarización VVdb

28
Trabajo Fin de Master-Diana Vélez A, junio 2019

Polarización qdb Leyenda

Figura 26. Análisis separabilidad bosque

En el caso del bosque, según las polarizaciones en VHdb y VVdb, con el cultivo de camarón,
es con el que mayor índice de separabilidad tiene, con el resto de cubiertas se obtienen
separabilidades muy bajas.

Cacao

Polarización VHdb Polarización VVdb

Polarización qdb Leyenda

Figura 27. Análisis separabilidad cacao

Así como en el bosque, el cacao tiene mejor índice de separabilidad con el camarón en
VHdb y VVdb.

29
Trabajo Fin de Master-Diana Vélez A, junio 2019

Camarón

Polarización VHdb Polarización VVdb

Polarización qdb Leyenda

Figura 28. Análisis separabilidad camarón

La separabilidad con las demás combinaciones de cultivos es regularmente alta en las


polarizaciones VHdb y VVdb, un caso especial se da con el cultivo de arroz que se
desarrolla bajo inundación y como ya se mencionó, en ciertas épocas del año el
comportamiento de ambas cubiertas sería similar, sobre todo en los primeros días de
desarrollo del cultivo de arroz.

Caña, Palma y Manglar

En las combinaciones entre caña, palma y manglar, en VVdb, se puede ver un mayor grado
de separabilidad, en el caso de los pastizales en VHdb es un poco mayor, sin embargo
sigue siendo baja.

30
Trabajo Fin de Master-Diana Vélez A, junio 2019

Polarización VHdb Polarización VVdb

Polarización qdb Leyenda

Figura 29. Análisis separabilidad caña de azúcar, palma y manglar

3.3. Clasificación supervisada

Estudios demuestran que utilizando el algoritmo Random Forest sobre imágenes radar, es
posible obtener resultados satisfactorios a la hora de determinar usos de suelo, (Caballero et
al., 2018; Larrañaga & Alvarez-Mozos, 2016a).

En este estudio el resultado de la clasificación con RF fue considerable (figura 31), utilizando
en total las 36 bandas en las polarizaciones VHdb, VVdb y qdb; la precisión del algoritmo
fue de 0.87 y un coeficiente de Kappa de 0.84 usando un mtry de 10 (nº de variables
seleccionadas aleatoriamente en cada árbol por RF), 500 árboles y cinco validaciones
cruzadas. El error OOB (out of bag) fue de 12.5%, en los resultados de la matriz de
confusión generados por RF, podemos saber de antemano cuales son las clases en las que
el error de clasificación es alto.

En cuanto a las variables (bandas), más importantes seleccionadas por RF para la


clasificación, toma en cuenta la disminución de la precisión media (Mean Decrease
Accuracy). En el siguiente gráfico se representa la importancia de las bandas en función a
este índice.

31
Trabajo Fin de Master-Diana Vélez A, junio 2019

Figura 30. Ranking de importancia de valores

Lo que se puede observar en la figura 30, la banda 7, 11 y 20 tienen mayor influencia en el


rendimiento de la clasificación, estas corresponden a la polarización en VHdb del 25 de
marzo y VV del 30 de abril y 23 de julio.

En la evaluación del mapa clasificado con el 30 % de las áreas asignadas para la validación
por medio de la matriz de confusión (tabla 7), resulta una precisión de un 84% con un
coeficiente de Kappa de 0.80 que según (Landis & Koch, 1977) sería considerable.

Tanto en el mapa resultante, como en las matrices de confusión se denota que los cultivos
de cacao, palma y pastizales no han sido correctamente clasificados, esto podría ser por
varias razones:

a) El número y tamaño de muestras señaladas en el set de entrenamiento no fueron


suficientes: a diferencia de los demás cultivos en caso particular de estas cubiertas,
el área existente con relación al área de estudio no es grande (cacao 4%, palma 1%,
pastos 2%), entonces a estas clases se le asignó un número menor de muestras que
las demás.

b) El comportamiento de las cubiertas de dichos cultivos se confunde con los demás: en


el caso de los pastizales aunque en la matriz de confusión no le atina ninguna, el
análisis de separabilidad y la matriz de confusión del RF (anexo) nos da una idea,
por ejemplo, con el cultivo de banano y palma es con el único que tiene mayor
índice de separabilidad.

32
Trabajo Fin de Master-Diana Vélez A, junio 2019

Tabla 7. Matriz de confusión


Clases Arroz Banano Bosque Cacao Camaron Caña de a. Palma Manglar Pastizal Total
Arroz 3495 0 37 48 168 282 130 91 10 4261
Banano 0 17238 48 54 0 0 0 341 0 17681
Bosque 131 16 1388 761 0 17 108 824 144 3389
Cacao 120 0 115 624 0 49 213 137 10 1268
Camaron 31 0 4 5 26317 6 2 26 10 26401
Caña de a. 2493 1 393 1345 83 8251 1390 279 101 14336
Palma 22 0 1 129 0 7 133 22 0 314
Manglar 31 525 1189 1805 2 14 195 14067 42 17870
Pastizal 0 0 0 0 0 0 0 0 0 0
Total 6323 17780 3175 4771 26570 8626 2171 15787 317 85520

El cultivo de banano, caña de azúcar, camarón, y manglar, son los que mejor se clasifican,
el arroz se clasifica con menor precisión, tiende a confundirse con la caña de azúcar
principalmente, tal como se ve en la matriz de confusión (tabla 7) y visto en el análisis de
separabilidad, seguido del camarón. El bosque aunque visualmente se logra distinguir sus
límites, hay mezcla entre las demás clases a excepción del camarón, lo que se debe a sus
características en cuanto a su volumen que es parecido al manglar, además que en su
interior hay diferencia entre ecosistemas como el bosque seco y bosque húmedo. En la tabla
8 se puede visualizar la fiabilidad del usuario y productor de cada una de las clases.

Figura 31. Resultado de la clasificación

33
Trabajo Fin de Master-Diana Vélez A, junio 2019

Tabla 8. Fiabilidad del usuario y productor


Fiabilidad del Fiabilidad del Coeficiente
Clases
productor usuario Kappa
Arroz 55.27 82.02 0.81
Banano 96.95 97.49 0.97
Bosque 43.72 40.96 0.39
Cacao 13.08 49.21 0.46
Camaron 99.05 99.68 1.00
Caña de a. 95.65 57.55 0.53
Palma 6.13 42.36 0.41
Manglar 89.10 78.72 0.74
Pastizal 0 nan nan

Aunque los resultados obtenidos de la clasificación no son despreciables, esta se podría


mejorar e ir probando, por ejemplo, seleccionar áreas más pequeñas y hacer clasificaciones
por partes, tratando de que el número de muestras por clases sea lo más homogénea
posible. Estudios también han demostrado que las combinaciones entre imágenes radar y
ópticas mejoran la precisión de la clasificación (Mercier et al., 2019; Orynbaikyzy et al.,
2019).

3.4. Detección de cambios de uso del suelo


Los usos del suelo, hasta el año 2018 (tabla 9 figura 32 y 33), han presentado cambios en
sus áreas de ocupación que indican las tendencias a corto y mediano plazo.

Figura 32 Usos de suelo 2015-2018

34
Trabajo Fin de Master-Diana Vélez A, junio 2019

Tabla 9. Cambios de uso de suelo 2015-2018


Area de amortiguamiento Alrededor > 1km
Cultivo
2015 2018 Diferencia (ha) 2015 2018 Diferencia (ha)
Camarón 2716 2988 272 7256 9714 2458
Banano 118 79 -39 6478 5626 -852
Caña de azúcar 1070 1196 126 17212 17428 216
Arroz 2592 2010 -582 15164 12556 -2608
Otros 4801 5024 -223 16283 17068 786

En el siguiente mapa, se presenta la diferencia de cambios entre el 2018 y 2015, en donde


los tonos grises corresponden a zonas en donde el uso del suelo ha sufrido modificaciones.

Figura. 33 Cambios de uso de suelo 2018

En el año 2013, el precio del camarón ecuatoriano se incrementó debido a que en los países
de Centroamérica y Asia se presentó en sus granjas camaroneras la enfermedad Necrosis
Aguda del Hepatopáncreas (Palacios, 2016), lo que produjo un incremento del área
cultivada y un aumento de la producción. Para el 2018 este cultivo ha ocupado los terrenos
localizados en las márgenes de esteros con influencia de la marea, donde existía pasto
natural y algunas parcelas de arroz.

A nivel nacional, la producción del arroz en el 2017 disminuyó un 16% respecto al 2016, a lo
que se le atribuye una reducción en su superficie de un 20% (MAG & SIPA, 2017a), para el
2018 en el área de este estudio se denota esa reducción, como ya se mencionó, cultivos de
arroz han sido reemplazados por cultivos de camarón y también por caña de azúcar (figura
32). La superficie nacional cosechada de caña de azúcar se incrementó en el 2017 (MAG &
SIPA, 2017b) aunque en ese año la producción disminuyó en un 2%, debido a las
condiciones climáticas. Entre los derivados de la caña de azúcar que se exportan están:
confitería, alcohol etílico sin desnaturalizar, alcohol etílico y aguardiente desnaturalizado,

35
Trabajo Fin de Master-Diana Vélez A, junio 2019

azúcar de caña, azúcar los demás y azúcar orgánica certificada. En el 2018, pequeñas
áreas de banano fueron reemplazadas por arroz y caña de azúcar, en otras el banano gana
terreno a la caña de azúcar; en el área de amortiguación se da una reducción de 39
hectáreas aproximadamente (figura 32).

En general, la tendencia de uso del suelo alrededor de la REMCh es la de incrementar el


área ocupada para el cultivo de camarón blanco y caña de azúcar. Las granjas acuícolas
han ocupado los suelos arcillosos en los que eran ocupados para el cultivo de arroz, sobre
todo los que tienen acceso a cursos de agua con influencia de las marea del estuario del río
Guayas. Estos cambios en el uso del suelo incrementan los riesgos de impactos sobre los
recursos naturales que protege la REMCh. La reducción de riesgos de inundaciones por la
construcción de un sistema de canales de alivio en 1997 produjo, en 21 años, un cambio de
uso del suelo de áreas con pastos y cultivos estacionales, a otros de alta intensidad de uso
de los recursos y mayor productividad financiera.

En Ecuador, las áreas alrededor de los límites de las áreas naturales protegidas no tienen
un régimen de manejo especial, pero son parte de los objetivos de manejo de la unidad
protegida. Sin embargo, las áreas naturales protegidas cuentan solo con recursos
financieros y humanos limitados, por lo que no es factible un control permanente sobre estas
áreas y se prevé un deterioro de la calidad ambiental en las áreas de la REMCh más
cercanas al perímetro.

El Estado ecuatoriano podría iniciar un proceso de estímulos de certificación de las


actividades con mayor probabilidad de producir impactos ambientales, como son la
acuicultura del camarón y el cultivo de arroz en la franja de un kilómetro alrededor de la
REMCh. La certificación del camarón abre mercados más exigentes que generarían
mayores beneficios económicos a los propietarios de las granjas camaroneras a cambio de
mejorar sus prácticas de producción. De tal forma que el mismo productor reduciría, a su
beneficio, los riesgos de contaminación del agua, conflictos con los pescadores artesanales
y control de depredadores naturales con métodos no letales.

Para los cultivos de arroz y banano se requeriría un proceso de transferencia de tecnología


basado en la sostenibilidad y la responsabilidad social arrocera que estimule la
organización, la competitividad y la rentabilidad del productor, implementando tecnologías
en forma integral para aumentar los rendimientos, reducir los costos por tonelada en el
cultivo del arroz y disminuir los impactos sobre los recursos naturales de la Reserva
Ecológica Manglares Churute.

36
Trabajo Fin de Master-Diana Vélez A, junio 2019

4. CONCLUSIONES

El seguimiento de cambios en el uso del suelo, así como de la estacionalidad y ciclos de los
cultivos y de la vegetación, alrededor (o al interior) de áreas naturales protegidas, se puede
automatizar mediante el uso de los SIG y la Teledetección, utilizando herramientas de libre
acceso, tales como: SNAP, QGIS, lenguaje R e imágenes de satélite de acceso libre como
lo es la familia Sentinel. En este estudio con el uso de las imágenes radar, se ha
demostrado que es posible determinar los cambios en el uso del suelo, utilizando una
metodología sencilla a bajo costo, que va desde la obtención de las imágenes,
procesamiento de las mismas, clasificación de cultivos, análisis multitemporal de los cultivos
y detección de cambios en diferentes fechas; sin embargo este análisis requiere de trabajo
de campo para validar la información generada.

El éxito de la clasificación supervisada de los cultivos, mediante el uso de sistemas


inteligentes para la extracción de información de las imágenes de satélite, como el algoritmo
Random Forest, depende mucho de la calidad de información real de campo, para el
entrenamiento del algoritmo, estas deben ser de forma equilibrada para las distintas
categorías, sin embargo la distribución en la homogeneidad de las muestras dependerá del
área de cada una de las clases.

En este estudio, el número de muestras para el entrenamiento no se presenta de forma


equilibrada, lo que se debe a la magnitud de las áreas para las distintas categorías. Debido
a esto el error de la clasificación de algunas clases es alto, tal es el caso del cacao, palma,
bosque, pastizales y vegetación en donde la clasificación es mala, ocurriendo lo contrario
con el arroz, banano, caña de azúcar y camarón en donde el error de clasificación es menor.
En general la precisión de la clasificación en el área de estudio es buena, gira en torno al
84% y un coeficiente Kappa de 0.80. Es posible equilibrar estos problemas de clasificación
no balanceado, mediante técnicas de muestreo como under-sampling, over-sampling,
limpieza de datos o híbridas, con las cuales es posible incrementar la precisión de la
clasificación.

Con este estudio se determinó que entre los años 2015 y 2018 se han producido
importantes cambios en el uso del suelo que podrían influir de forma negativa en la
conservación de los recursos naturales del área natural protegida analizada. Un incremento
en el área dedicada a la acuicultura del camarón blanco y de los cultivos agrícolas de caña
de azúcar y banano deberían ser asuntos para analizar durante la elaboración del siguiente
Plan Operativo de la Reserva Ecológica Manglares Churute. Aunque estos cambios se han
producido en las áreas que rodean al área natural protegida no dejan de influir sobre la
conservación de los recursos naturales. Varias prácticas que se realizan en estos usos del
suelo, como el uso de fertilizantes y pesticidas, deterioro de la calidad del agua y conflictos
con las comunidades locales, podrían ser mejoradas mediante el estímulo a la certificación
de sus prácticas y al mismo tiempo mejorar el acceso a otros mercados.

37
Trabajo Fin de Master-Diana Vélez A, junio 2019

5. BIBLIOGRAFÍA
Amat Rodrigo, J. (2018). Árboles de predicción: bagging, random forest, boosting y C5.0.
Retrieved May 19, 2019, from https://rpubs.com/Joaquin_AR/255596

Breiman, L. (2001). RANDOM FORESTS Leo. Machine Learning, 45(1), 5–32.


https://doi.org/https://doi.org/10.1023/A:1010933404324

Campbell, J. B., & Wynne, R. H. (2011). Introduction to Remote Sensing (5th ed.). Guilford
Press.

Chuvieco, E. (2010). Teledetección Ambiental (1st ed.). Barcelona, España: Editorial


Planeta, S. A.

Chuvieco, E., & Huete, A. (2010). Fundamentals of satellite remote sensing. CRC Press.

Congedo, L. (2018). Semi-Automatic Classification Plugin. Retrieved from


https://plugins.qgis.org/plugins/SemiAutomaticClassificationPlugin/

Dabboor, M., Howell, S., Shokr, M., & Yackel, J. (2014). The Jeffries–Matusita distance for
the case of complex Wishart distribution as a separability criterion for fully polarimetric
SAR data. International Journal of Remote Sensing, 35(19), 6859–6873.
https://doi.org/10.1080/01431161.2014.960614

Del‟Arco Sanches, I., Feitosa, R. Q., Achanccaray Diaz, P. M., Dias Soares, M., Barreto Luiz,
A. J., Schultz, B., & Pinheiro Maurano, L. E. (2018). Campo Verde Database: Seeking
to Improve Agricultural Remote Sensing of Tropical Areas. IEEE Geoscience and
Remote Sensing Letters, 15(3), 369–373. https://doi.org/10.1109/LGRS.2017.2789120

ECOLAP, & MAE. (2007). Guía del Patrimonio de Áreas Naturales Protegidas del Ecuador.
Quito-Ecuador. Retrieved from https://www.parks-and-tribes.com/national-
parks/reserva-ecologica-churute/reserva-ecologica-manglares-churute.pdf

Elbers, J. (2011). Las áreas protegidas de América Latina: Situación actual y perspectivas
para el futuro (p. 277). Quito-Ecuador: UICN-Unión Internacional para la Conservación
de la Naturaleza y de los Recursos Naturales.

ESA. (2019). SENTINEL-1. Retrieved June 20, 2019, from


https://sentinel.esa.int/web/sentinel/missions/sentinel-1

Florio de Real, S., Real, F., & Florio, G. (2012). FENOLOGÍA DEL BANANO Ó CAMBUR
(Musa AAA) EN VENEZUELA. Retrieved June 19, 2019, from
http://wwwsunshineflorio.blogspot.com/2012/07/fenologiadel-banano-o-cambur-musa-
aaa.html

Gil Martínez, C. (2018). ÁRBOLES DE DECISIÓN Y MÉTODOS DE ENSEMBLE. Retrieved


May 24, 2019, from https://rpubs.com/Cristina_Gil/arboles_ensemble

Hockings, M. (2003). Systems for Assessing the Effectiveness of Management in Protected


Areas. BioScience, 53(9), 823–832.

Hudson, W. D., & Ramm, C. W. (1987). Correct formulation of the Kappa coefficient of
agreement. Photogrammetric Engineering & Remote Sensing, 53(4), 421–422.

38
Trabajo Fin de Master-Diana Vélez A, junio 2019

IEE, MAGAP, & CGSIN. (2015). GENERACIÓN DE GEOINFORMACIÓN PARA LA


GESTIÓN DEL TERRITORIO A NIVEL NACIONAL ESCALA 1: 25000; SISTEMAS
PRODUCTIVOS.

Ingenio San Carlos. (2013). Proceso de producción de azúcar. Ing. San Carlos, TOMO 1, 1–
7.

Kuhn, M., Wing, J., Weston, S., Williams, A., Keefer, C., Engelhardt, A., … Hunt, T. (2019).
Package „ caret .‟ Retrieved from https://cran.r-project.org/web/packages/caret/caret.pdf

Landis, J. . R., & Koch, G. G. (1977). The Measurement of Observer Agreement for
Categorical Data. Biometrics, 33(1), 159–174. https://doi.org/10.2307/2529310

Larrañaga, A., & Alvarez-Mozos, J. (2016a). Clasificación de cultivos a partir de


observaciones de teledetección radar. Aplicación a zonas de secano y regadío de
Navarra. Universidad Pública de Navarra.

Larrañaga, A., & Alvarez-Mozos, J. (2016b). On the Added Value of Quad-Pol Data in a
Multi-Temporal Crop Classification Framework Based on RADARSAT-2 Imagery,
(June). https://doi.org/10.3390/rs8040335

Lillesand, T. M., Kiefer, R. W., & Chipman, J. W. (2015). Remote sensing and image
interpretation (7th ed.). Jhon Wiley & Son.

MAE. (2013). Sistema de Clasificación de Ecosistemas del Ecuador Continental. Quito:


Ministerio del Ambiente del Ecuador.

MAG, & SIPA. (2017a). Boletín Situacional - Arroz. Retrieved June 11, 2019, from
http://sipa.agricultura.gob.ec/boletines/situacionales/boletin_situacional_arroz_2017.pdf

MAG, & SIPA. (2017b). Boletín Situacional - Caña de Azúcar. Ministerio de Agricultura y
Ganadería-Sistema de Información Pública Agropecuaria. Retrieved from
http://sipa.agricultura.gob.ec/boletines/situacionales/boletin_situacional_cania_azucar_2
017.pdf

Mercier, A., Betbeder, J., Rumiano, F., Baudry, J., Gond, V., Blanc, L., … Hubert-Moy, L.
(2019). Evaluation of Sentinel-1 and 2 Time Series for Land Cover Classification of
Forest–Agriculture Mosaics in Temperate and Tropical Landscapes. Remote Sensing,
11(8), 979. https://doi.org/10.3390/rs11080979

Navarrete, R. (2000). Atractivos turísticos naturales de la Reserva Ecológica Manglares


Churute (pp. 15–54). Guayaquil: CEDEGE, Ministerio del Ambiente, Fundación Natura.

Olaya, V. (2014). Sistemas de Información Geográfica.

Orellana Alvear, J. (2018). Arboles de decision y Random Forest. Retrieved May 18, 2019,
from https://bookdown.org/content/2031/

Orynbaikyzy, A., Gessner, U., & Conrad, C. (2019). Crop type classification using a
combination of optical and radar remote sensing data: a review. International Journal of
Remote Sensing, 40(17), 6553–6595. https://doi.org/10.1080/01431161.2019.1569791

Ottinger, M., Clauss, K., & Kuenzer, C. (2017). Large-scale assessment of coastal
aquaculture ponds with Sentinel-1 time series data. Remote Sensing, 9(5).
https://doi.org/10.3390/rs9050440

39
Trabajo Fin de Master-Diana Vélez A, junio 2019

Palacios, N. (2016). Estudio de factibilidad para producir camarón de la especie Litopenaeus


vannamei bajo un sistema de producción semi-intensivo en Ecuador. Escuela Agrícola
Panamericana, Zamorano Honduras. Retrieved from
https://bdigital.zamorano.edu/bitstream/11036/5812/1/AGN-2016-T035.pdf

Santacruz, A. (2015). Clasificación de imágenes con RandomForests en R (y QGIS).


Retrieved May 10, 2019, from http://amsantac.co/blog/es/2015/11/28/classification-r-
es.html

Skriver, H. (2007). Signatures of Polarimetric Parameters and their Implications on Land


Cover Classification, 4195–4198. Retrieved from
https://ieeexplore.ieee.org/document/4423775

Small, D. (2011). Flattening Gamma : Radiometric Terrain Correction for SAR Imagery. IEEE
Transactions on Geoscience and Remote Sensing, 49(8), 3081–3093.

Small, D., & Schubert, A. (2008). Guide to ASAR Geocoding. Remote Sensing Laboratores,
University of Zurich, (1), 36.

Swain, P. ., & King, R. . (1973). Two Effective Feature Selection Criteria for Multispectral
Remote Sensing. Retrieved from https://docs.lib.purdue.edu/larstech/39/

Torres, R., Snoeij, P., Geudtner, D., Bibby, D., Davidson, M., Attema, E., … Rostan, F.
(2012). GMES Sentinel-1 mission. Remote Sensing of Environment, 120, 9–24.
https://doi.org/10.1016/J.RSE.2011.05.028

Woodhouse, I. H. (2006). Introduction to Microwave Remote Sensing. Taylor & Francis.

Yanez, B. (1996). Plan de Manejo de la Reserva Ecológica Manglares Churute-Fase 1-Tomo


IV-Propuesta de Manejo INEFAN/Fundacion Natura. Retrieved May 10, 2019, from
http://simce.ambiente.gob.ec/sites/default/files/documentos/anny/El Plan de Manejo de
la Reserva Ecológica Manglares Churute.pdf

40
Trabajo Fin de Master-Diana Vélez A, junio 2019

ANEXOS
Correlación de imágenes Sentinel 1, polarización VHdb, VVdb y VHdb-VVdb (qdb), 2018
12-ene 17-feb 25-mar 30-abr 18-may 17-jun 23-jul 28-ago 21-sep 03-oct 14-nov 08-dic
Bandas
b1 b2 b3 b4 b5 b6 b7 b8 b9 b10 b11 b12 b13 b14 b15 b16 b17 b18 b19 b20 b21 b22 b23 b24 b25 b26 b27 b28 b29 b30 b31 b32 b33 b34 b35 b36
Fechas
VH VV q VH VV q VH VV q VH VV q VH VV q VH VV q VH VV q VH VV q VH VV q VH VV q VH VV q VH VV q
VH 0.88 0.17 0.68 0.68 -0.26 0.65 0.65 -0.11 0.68 0.68 -0.21 0.78 0.78 -0.35 0.72 0.73 -0.34 0.65 0.65 -0.27 0.66 0.63 0.04 0.72 0.69 0.01 0.68 0.66 -0.04 0.78 0.76 -0.09 0.78 0.76 0.00
12-ene VV -0.32 0.66 0.68 -0.31 0.64 0.66 -0.15 0.66 0.68 -0.23 0.76 0.79 -0.38 0.71 0.73 -0.37 0.62 0.64 -0.30 0.64 0.63 -0.01 0.70 0.71 -0.06 0.66 0.67 -0.09 0.76 0.78 -0.16 0.76 0.77 -0.07
q 0.00 -0.05 0.11 -0.03 -0.07 0.09 -0.02 -0.05 0.07 -0.04 -0.08 0.10 -0.02 -0.06 0.10 0.01 -0.03 0.08 -0.01 -0.06 0.10 -0.02 -0.09 0.13 -0.01 -0.06 0.10 -0.02 -0.09 0.14 -0.01 -0.08 0.14
VH 0.90 -0.16 0.65 0.61 -0.03 0.74 0.73 -0.19 0.68 0.68 -0.30 0.66 0.67 -0.32 0.71 0.72 -0.31 0.61 0.57 0.06 0.63 0.60 0.03 0.71 0.70 -0.04 0.64 0.63 -0.08 0.64 0.62 -0.01
17-feb VV -0.58 0.64 0.62 -0.07 0.75 0.75 -0.23 0.69 0.71 -0.33 0.67 0.69 -0.35 0.71 0.74 -0.35 0.61 0.58 0.03 0.64 0.62 0.00 0.72 0.72 -0.07 0.65 0.65 -0.11 0.64 0.64 -0.03
q -0.24 -0.27 0.10 -0.31 -0.34 0.16 -0.29 -0.32 0.18 -0.27 -0.31 0.21 -0.28 -0.33 0.22 -0.24 -0.26 0.04 -0.26 -0.28 0.05 -0.30 -0.33 0.09 -0.28 -0.30 0.09 -0.27 -0.28 0.05
VH 0.88 0.08 0.64 0.62 -0.13 0.67 0.67 -0.29 0.73 0.74 -0.37 0.59 0.60 -0.28 0.69 0.66 0.03 0.69 0.66 0.01 0.59 0.58 -0.03 0.63 0.62 -0.09 0.63 0.62 -0.02
25-mar VV -0.41 0.62 0.62 -0.18 0.65 0.67 -0.32 0.72 0.74 -0.39 0.58 0.60 -0.29 0.68 0.68 -0.03 0.68 0.68 -0.05 0.59 0.59 -0.07 0.63 0.64 -0.13 0.63 0.64 -0.05
q -0.07 -0.11 0.12 -0.08 -0.11 0.11 -0.10 -0.13 0.10 -0.07 -0.10 0.08 -0.10 -0.16 0.11 -0.10 -0.16 0.12 -0.08 -0.12 0.08 -0.11 -0.15 0.10 -0.11 -0.15 0.08
VH 0.89 -0.05 0.71 0.70 -0.28 0.69 0.69 -0.32 0.69 0.70 -0.33 0.60 0.58 0.02 0.63 0.61 0.00 0.67 0.66 -0.04 0.66 0.65 -0.07 0.66 0.64 0.01
30-abr VV -0.50 0.69 0.71 -0.33 0.68 0.70 -0.35 0.69 0.71 -0.34 0.60 0.59 0.00 0.63 0.63 -0.03 0.67 0.68 -0.08 0.66 0.66 -0.10 0.66 0.65 -0.02
q -0.17 -0.23 0.20 -0.18 -0.21 0.15 -0.20 -0.22 0.12 -0.17 -0.18 0.04 -0.18 -0.21 0.07 -0.19 -0.22 0.08 -0.19 -0.22 0.09 -0.19 -0.22 0.06
VH 0.89 -0.19 0.73 0.73 -0.33 0.63 0.65 -0.30 0.63 0.62 0.01 0.70 0.69 -0.02 0.65 0.65 -0.06 0.76 0.75 -0.09 0.76 0.74 -0.01
18-may VV -0.62 0.74 0.76 -0.39 0.64 0.66 -0.32 0.65 0.64 -0.01 0.72 0.72 -0.05 0.66 0.67 -0.09 0.76 0.78 -0.14 0.77 0.77 -0.05
q -0.32 -0.38 0.27 -0.29 -0.31 0.17 -0.31 -0.32 0.04 -0.34 -0.37 0.08 -0.30 -0.33 0.09 -0.33 -0.38 0.15 -0.33 -0.37 0.10
VH Valores altos 0.90 -0.23 0.65 0.65 -0.28 0.67 0.65 0.03 0.71 0.70 -0.02 0.63 0.63 -0.05 0.70 0.70 -0.11 0.71 0.69 -0.02
17-jun VV Valores bajos -0.64 0.65 0.67 -0.32 0.68 0.67 0.00 0.72 0.72 -0.04 0.65 0.65 -0.07 0.71 0.72 -0.14 0.71 0.72 -0.05
q Valores my bajos -0.30 -0.34 0.22 -0.33 -0.35 0.04 -0.36 -0.38 0.06 -0.32 -0.33 0.06 -0.34 -0.37 0.12 -0.34 -0.37 0.08
VH 0.89 -0.18 0.61 0.57 0.06 0.62 0.58 0.04 0.68 0.66 -0.03 0.62 0.61 -0.08 0.63 0.60 0.01
23-jul VV -0.61 0.60 0.58 0.02 0.62 0.61 0.00 0.69 0.69 -0.06 0.63 0.64 -0.10 0.63 0.63 -0.02
q -0.25 -0.27 0.06 -0.27 -0.29 0.07 -0.30 -0.33 0.09 -0.28 -0.31 0.09 -0.28 -0.30 0.05
VH 0.87 0.23 0.73 0.68 0.05 0.63 0.60 -0.01 0.64 0.63 -0.08 0.65 0.63 -0.01
28-ago VV -0.28 0.69 0.70 -0.06 0.59 0.59 -0.06 0.62 0.63 -0.12 0.63 0.64 -0.05
q 0.07 -0.05 0.22 0.06 0.00 0.12 0.03 -0.02 0.09 0.02 -0.03 0.09
VH 0.87 0.20 0.68 0.64 0.00 0.73 0.70 -0.06 0.73 0.70 0.00
21-sep VV -0.31 0.64 0.65 -0.09 0.70 0.71 -0.14 0.70 0.71 -0.06
q 0.05 -0.05 0.18 0.01 -0.06 0.15 0.00 -0.06 0.13
VH 0.88 0.16 0.69 0.66 -0.04 0.68 0.64 0.03
03-oct VV -0.34 0.67 0.67 -0.11 0.66 0.65 -0.02
q -0.02 -0.09 0.15 -0.03 -0.08 0.10
VH 0.87 0.10 0.83 0.78 0.05
14-nov VV -0.39 0.79 0.81 -0.07
q -0.06 -0.18 0.24
VH 0.87 0.20
08-dic VV -0.31
q

Mean -15.62 -9.15 -6.47 -14.65 -8.43 -6.22 -14.92 -8.51 -6.41 -15.38 -9.30 -6.08 -14.58 -8.89 -5.69 -15.37 -9.25 -6.12 -15.69 -9.32 -6.37 -15.76 -8.82 -6.94 -15.85 -8.86 -6.99 -15.86 -9.15 -6.71 -15.35 -9.13 -6.22 -15.32 -9.22 -6.10
SD 4.20 4.37 2.13 4.32 5.25 2.35 4.14 4.51 2.18 4.15 4.78 2.19 3.96 4.95 2.32 4.14 5.24 2.39 4.20 5.19 2.39 4.17 4.22 2.13 4.18 4.31 2.16 4.20 4.41 2.15 4.02 4.35 2.13 4.02 4.14 2.08
Min -44.66 -41.76 -28.01 -46.75 -38.92 -31.02 -54.98 -48.50 -27.88 -54.12 -50.13 -30.18 -53.44 -49.75 -29.48 -44.97 -40.49 -26.84 -52.88 -48.51 -30.55 -45.25 -39.29 -30.82 -44.72 -39.00 -34.10 -53.84 -45.98 -27.09 -47.34 -44.20 -26.75 -40.49 -36.02 -31.69
Max 11.94 19.97 5.64 12.38 20.34 5.97 11.60 19.54 5.29 11.39 19.44 6.17 13.02 21.16 6.74 11.51 19.64 7.29 12.37 21.99 5.53 11.13 20.05 4.95 11.63 24.19 6.22 11.63 20.12 5.13 12.01 19.93 4.85 12.58 19.85 4.99

41
Trabajo Fin de Master-Diana Vélez A, junio 2019

CÓDIGO R
Random Forest

rm(list=ls())

#Librerias
library (caret)
library(randomForest)
library(sp)
library(raster)
library(rgdal)
library(lattice)
library(ggplot2)
library(maptools)
library(rgeos)

#Importar imagen: conjunto VHdb, VVdb, VHdb-VVdv denominado "Stackall"


imgs<- brick("C:/TESIS/Imagenes Sentinel 1_2018/Stack/Stackall.tif")

#Asignarle un nombre específico a cada banda


names(imgs) <- paste0("B",c(1:36))

#Cargar archivo máscara del area de analisis. Del área de estudio se ha


considerado un buffer de 100 metros por el efecto borde
masKimgs<-readOGR("C:/TESIS/Clasificacion/shapes/Mask_AE_buff_100.shp")

#Explorar proyecciones
proj4string(imgs)
proj4string(masKimgs)

#Recorte para considerar el área de análisis


imgs <- crop(imgs, masKimgs)

#Hacer máscara para el área de análisis


imgs <- mask(imgs, masKimgs)

#Gráfico
spplot(imgs, main= "Imagenes Sentinel 1, polarización VHdb, VVdb y VHdb-VVdb,
2018")

#Composición en color (ejemplo)


#Mes de Enero VH,VV,VH
plotRGB(imgs, r=1, g=2, b=1, stretch="hist",scale=2000)

#Correlación de Pearson
correlation<-layerStats(imgs, 'pearson',na.rm=TRUE)
write.csv(correlation,"C:/TESIS/Estadisticas_imagenes/Correlacion/estadisticas
.csv")
win.graph()
pairs(imgs,main="Correlación entre bandas VH, VV y VHdb-VVdb, 2018")

#Desviación estándar, mínimo y máximo.


cellStats(imgs,sd,na.rm=TRUE)
cellStats(imgs,min,na.rm=TRUE)
cellStats(imgs,max,na.rm=TRUE)

#Importar áreas de entrenamiento ('train.shp')


#Función shapefile del paquete 'raster' para importar este archivo en R como
un objeto #de clase SpatialPolygonsDataFrame y crear una variable para
almacenar el nombre de la #columna 'class' que es la columna del shape que
contiene las clases.
trainData <- shapefile("C:/TESIS/Clasificacion/shapes/train.shp")
class(trainData)#"SpatialPolygonsDataFrame"
responseCol<-"class"

#Cruce de bandas con las áreas de entrenamiento, para análisis de


separabilidad y #calibración del modelo
#Los datos se almacenan en una data frame (llamado aquí dfAll)
dfAll = data.frame(matrix(vector(), nrow = 0, ncol = length(names(imgs)) + 1))
for (i in 1:length(unique(trainData[[responseCol]]))){
category <- unique(trainData[[responseCol]])[i]
categorymap <- trainData[trainData[[responseCol]] == category,]
dataSet <- extract(imgs, categorymap)
dataSet <- dataSet[!unlist(lapply(dataSet, is.null))]
dataSet <- lapply(dataSet, function(x){cbind(x, class =

42
Trabajo Fin de Master-Diana Vélez A, junio 2019

as.numeric(rep(category, nrow(x))))})
df <- do.call("rbind", dataSet)
dfAll <- rbind(dfAll, df)}

#Guardar el archivo en formato txt, para realizar el análisis de separabilidad


con la #función 'sepMatrix.R'
write.table(dfAll, file = "C:/TESIS/Clasificacion/table.txt", row.names =
FALSE)

#Analisis de separabilidad
separabilidad<-read.table("table.txt", head=T)

#Cargar función
source('sepMatrix.R')
jm<-sepMatrix(separabilidad)

#Entrenamiento del algoritmo RF


#Selección de muestras aleatorias
nsamples <- 25000 #"data.frame"
sdfAll <- dfAll[sample(1:nrow(dfAll), nsamples), ]
sdfAll

#Optimización de hiperparámetros
#Metodo de validación
cv <- trainControl(method="cv", number=5, search="grid")

# Hiperparámetro a evaluar: número de predictores aleatorios en cada


ramificación.
mtry <- expand.grid(.mtry=c(2:35))
set.seed(5)

# Evaluación del mejor mtry


mtry_eval <-
train(as.factor(class)~B1+B2+B3+B4+B5+B6+B7+B8+B9+B10+B11+B12+B13+B14+B15
+B16+B17+B18+B19+B20+B21+B22+B23+B24+B25+B26+B27+B28+B29+B30+B31+B32+B33+
B34+B35+B36, method = "rf", data = sdfAll, tuneGrid=mtry, trControl=cv)
print(mtry_eval)
plot(mtry_eval)

#Modelo random forest


modelo.arbol.rf <- randomForest(as.factor(class)~B1+B2+B3+B4+B5+B6+B7+B8+B9+B1
0+B11+B12+B13+B14+B15+B16+B17+B18+B19+B20+B21+B22+B23+B24+B25+B26+B27+B28+B29+
B30+B31+B32+B33+B34+B35+B36, method = "rf", data = sdfAll,
mtry = 10,
importance = TRUE,
ntree = 500,
type="prob")
modelo.arbol.rf
plot(modelo.arbol.rf, main="Modelo, arboles, RF")

#Identificacion de los predictores más importantes


class(modelo.arbol.rf) #randomForest
varImpPlot(modelo.arbol.rf, main="Modelo, arboles, RF")

#Salida modelo
modelo.arbol.rf[["type"]] #"classification"
write.table(modelo.arbol.rf[["predicted"]], file = "C:/TESIS/Clasificacion/pre
dicted.txt", row.names = FALSE)
write.table(modelo.arbol.rf[["err.rate"]], file = "C:/TESIS/Clasificacion/rati
o_error.txt", row.names = FALSE)
write.table(modelo.arbol.rf[["confusion"]], file = "C:/TESIS/Clasificacion/con
fusionmatrix.txt", row.names = FALSE)
write.table(modelo.arbol.rf[["votes"]], file = "C:/TESIS/Clasificacion/votes.t
xt", row.names = FALSE)
write.table(modelo.arbol.rf[["oob.times"]], file = "C:/TESIS/Clasificacion/oob
times.txt", row.names = FALSE)
write.table(modelo.arbol.rf[["importance"]], file = "C:/TESIS/Clasificacion/im
portance.txt", row.names = FALSE)
write.table(modelo.arbol.rf[["importanceSD"]], file = "C:/TESIS/Clasificacion/
importanceSD.txt", row.names = FALSE)
write.table(modelo.arbol.rf[["y"]], file = "C:/TESIS/Clasificacion/y.txt", row
.names = FALSE)
#Predicciones
#Procesamiento en paralelo
beginCluster()

43
Trabajo Fin de Master-Diana Vélez A, junio 2019

preds_rf1 <- clusterR(imgs, raster::predict, args = list(model = modelo.arbol.


rf))
endCluster()

plot(preds_rf1,main="Clasificación")
print(preds_rf1)
writeRaster(preds_rf1,"C:/TESIS/Clasificacion/Clasificacion.tif")
#End

Separabilidad

# sepMatrix.R
# Función para calcular matrices de separabilidad (usando la distancia de Jeff
ries-Matusita) para diferentes bandas entre diferentes tipos cultivo.
# Jesús Álvarez Mozos, Pamplona, 2/02/2011

# usa como input una tabla con datos separados por tabulador (por ejemplo Tabl
e.txt) en la que en columnas figuran las diferentes bandas
# la última columna es un código de cultivo que va de 1 a n
# en filas van las observaciones (píxeles o parcelas)

# para cada banda se genera una tabla de salida (por ejemplo sepMatrix_jnVV_1.
txt) que contiene la matriz con la separabilidad para cada par de clases
# también se imprime en pantalla el valor de separabilidad medio para cada ban
da

sepMatrix <- function(tabla) {


# calcular el número de columnas de datos
col_dat <- ncol(tabla)- 1

# bucle para que vaya pasando de columna a columna


for(i in 1:col_dat)
{
# calcular el número de cultivos según los códigos de la última colum
na
ncrop <- max(tabla[,ncol(tabla)])

# crear una matriz de ncropXncrop para cada banda en la que se vayan


poniendo las separabilidades como en una matriz de contingencia
sepMatrix_name <- paste("sepMatrix_", colnames(tabla[i]))
sepMatrix <- matrix(nrow = ncrop, ncol=ncrop)

# bucle para que vaya pasando de cultivo a cultivo


for(j in 1:ncrop)
{

# definir un vector con los datos del cultivo j para la banda


i
Vector.1 <- subset(tabla, Reclass==j, select = i)

# bucle para ir pasando de cultivo a cultivo


for(k in j:ncrop)
{

# definir otro vector con los datos del cultivo k par


a la banda i
Vector.2 <- subset(tabla, Reclass==k, select = i)

# calcular la distancia Jeffries-Matusita según el có


digo de Nikos Alexandris "separability.measures.R":

# convert vectors to matrices in case they are not


Matrix.1 <- as.matrix (Vector.1)
Matrix.2 <- as.matrix (Vector.2)

# define means
mean.Matrix.1 <- mean ( Matrix.1 )
mean.Matrix.2 <- mean ( Matrix.2 )

# define difference of means


mean.difference <- mean.Matrix.1 - mean.Matrix.2

44
Trabajo Fin de Master-Diana Vélez A, junio 2019

# define covariances for supplied matrices


cv.Matrix.1 <- cov ( Matrix.1 )
cv.Matrix.2 <- cov ( Matrix.2 )

# define the halfsum of cv's as "p"


p <- ( cv.Matrix.1 + cv.Matrix.2 ) / 2

# calculate the Bhattacharryya index


bh.distance <- 0.125 *
t ( mean.difference ) *
p^ ( -1 ) *
mean.difference +
0.5 * log (
det ( p ) / sqrt (
det
( cv.Matrix.1 ) *
det
( cv.Matrix.2 )
)
)

# calculate Jeffries-Matusita
# following formula is bound between 0 and 2.0
jm.distance <- 2 * ( 1 - exp ( -bh.distance ) )

# also found in the bibliography:


# jm.distance <- 1000 * sqrt ( 2 * ( 1 - exp ( -bh.
distance ) ) )
# the latter formula is bound between 0 and 1414.0

# guardar el dato de jm.distance en la matriz de sepa


rabilidad sepMatrix en la fila i columna k
sepMatrix[j,k] <- jm.distance
}
}

# calcular la separabilidad media para cada banda y mostrarla en pant


alla
pos_sepMatrix <- sepMatrix[(!is.na(sepMatrix)) & sepMatrix>0]
sep_mean <- round (mean(pos_sepMatrix), digits = 3)
cat(paste(colnames(tabla[i]),": ", sep_mean, "\n"))

#convertir el nombre de la tabla a texto para asignarlo como nombre d


e archivo
outputfile_name <- as.character(sepMatrix_name)

# guardar la sepMatrix como .txt


write.table (round (sepMatrix , digits = 3) ,file = paste(outputfile_
name,".txt") , sep = "\t" , eol = "\n")
}
}

45
Trabajo Fin de Master-Diana Vélez A, junio 2019

RESULTADOS RANDOM FOREST

Parámetros utilizados:
25000 samples
36 predictor
9 classes: '1', '2', '3', '4', '5', '6', '7', '8', '9'

No pre-processing
Accuracy was used to select the optimal model using the largest value.
The final value used for the model was mtry = 10.

mtry: Number of variables randomly sampled as candidates at each split. For


classification (sqrt(p) where p is number of variables in x).

mtry Accuracy Kappa mtry Accuracy Kappa


2 0.868 0.836 19 0.871 0.840
3 0.871 0.840 20 0.872 0.841
4 0.872 0.842 21 0.871 0.841
5 0.873 0.843 22 0.870 0.839
6 0.873 0.843 23 0.870 0.839
7 0.873 0.842 24 0.870 0.840
8 0.874 0.844 25 0.869 0.838
9 0.874 0.843 26 0.868 0.837
10 0.874 0.844 27 0.868 0.837
11 0.872 0.842 28 0.868 0.837
12 0.874 0.844 29 0.868 0.836
13 0.872 0.842 30 0.867 0.835
14 0.873 0.842 31 0.867 0.836
15 0.873 0.842 32 0.867 0.835
16 0.873 0.843 33 0.865 0.832
17 0.873 0.842 34 0.864 0.832
18 0.873 0.842 35 0.864 0.832

Matriz de confusión RF

Clase Arroz Banano Bosque Cacao Camaron Caña de a. Palma Manglar Pastizal class.error
Arroz 1310 0 7 17 7 444 7 10 0 0.27
Banano 1 4464 9 4 0 2 0 106 0 0.03
Bosque 5 8 744 40 3 75 2 368 0 0.40
Cacao 23 25 176 164 4 199 6 363 0 0.83
Camaron 12 0 139 26 6821 20 0 104 0 0.04
Caña de a. 94 0 11 16 0 4560 3 7 0 0.03
Palma 25 0 17 43 0 230 65 85 0 0.86
Manglar 13 89 116 23 4 59 3 3734 0 0.08
Pastizal 4 0 26 6 2 36 0 9 5 0.94

46
Trabajo Fin de Master-Diana Vélez A, junio 2019

err.rate: vector error rates of the prediction on the input data, the i-th element being the
(OOB) error rate for all trees up to the i-th

votes: a matrix with one row for each input data point and one column for each class,
giving the fraction or number of (OOB) „votes‟ from the random forest.

Summary
Clases Arroz Banano Bosque Cacao Camaron Caña de a. Palma Manglar Pastizal Total
Voto 1780.1 4572.4 1244.3 1060.1 7134.2 4626.3 515.3 3969.5 97.8 25000
Porcentaje 7.1 18.3 5.0 4.2 28.5 18.5 2.1 15.9 0.4 100.0

importance: The first nclass columns are the class-specific measures computed as
mean descrease in accuracy. The nclass + 1st column is the mean descrease in
accuracy over all classes. The last column is the mean decrease in Gini index.
Mean
Mean
Banda Bosque Cacao Camaron Caña de a. Palma Manglar Pastizal Decrease
Decrease Gini
Accuracy
1 0.056 0.009 0.117 0.140 0.023 0.075 0.011 0.104 2481.837
2 0.031 0.011 0.047 0.115 0.020 0.085 0.010 0.079 2288.862
3 0.017 0.001 0.000 0.006 0.004 0.010 0.002 0.004 193.676
4 0.011 0.009 0.015 0.101 0.014 0.038 0.009 0.056 1155.307
5 0.008 0.003 0.006 0.057 0.009 0.040 0.006 0.038 755.849
6 0.003 0.000 0.000 0.013 0.002 0.012 0.005 0.005 167.718
7 0.009 0.006 0.015 0.122 0.015 0.025 0.010 0.047 715.813
8 0.007 0.001 0.002 0.050 0.005 0.047 0.002 0.025 312.050
9 0.003 0.001 0.000 0.029 0.001 0.008 0.002 0.007 176.362
10 0.009 0.007 0.024 0.110 0.008 0.027 0.006 0.045 457.876
11 0.014 0.005 0.009 0.136 0.018 0.061 0.014 0.055 790.964
12 0.004 0.001 0.000 0.014 0.005 0.005 0.004 0.004 162.008
13 0.019 0.014 0.099 0.139 0.017 0.047 0.009 0.083 1033.213
14 0.021 0.010 0.032 0.091 0.013 0.057 0.006 0.059 1271.667
15 0.002 0.002 0.001 0.012 0.002 0.006 0.001 0.004 167.754
16 0.010 0.000 0.013 0.073 0.009 0.039 0.005 0.036 677.783
17 0.009 0.001 0.005 0.054 0.007 0.063 0.005 0.035 441.541
18 0.004 0.001 0.000 0.019 0.005 0.005 0.002 0.006 180.295
19 0.007 0.000 0.009 0.023 0.003 0.026 0.005 0.019 249.570
20 0.011 0.002 0.003 0.053 0.004 0.090 0.003 0.035 471.355
21 0.003 0.000 0.000 0.013 0.003 0.009 0.001 0.005 181.097
22 0.015 0.003 0.010 0.017 0.007 0.034 0.004 0.027 360.895
23 0.012 0.001 0.004 0.055 0.004 0.074 0.007 0.037 455.918
24 0.006 0.001 0.000 0.002 0.001 0.005 0.003 0.002 156.877
25 0.057 0.015 0.033 0.096 0.011 0.046 0.010 0.060 874.004
26 0.006 0.003 0.009 0.093 0.009 0.075 0.015 0.049 814.800
27 0.024 0.002 0.000 0.005 0.006 0.009 0.003 0.005 198.726
28 0.038 0.015 0.008 0.083 0.006 0.038 0.013 0.037 546.583
29 0.006 0.003 0.002 0.030 0.004 0.039 0.002 0.022 291.390
30 0.011 0.001 0.000 0.005 0.002 0.003 0.004 0.003 164.764
31 0.025 0.005 0.057 0.015 0.007 0.029 0.005 0.036 416.069
32 0.008 0.001 0.009 0.013 0.003 0.065 0.004 0.023 405.914
33 0.014 0.001 0.001 0.004 0.003 0.008 0.004 0.003 190.324
34 0.019 0.006 0.099 0.019 0.005 0.026 0.002 0.050 545.711
35 0.008 0.002 0.004 0.037 0.001 0.028 0.007 0.027 416.464
36 0.019 0.001 0.000 0.003 0.003 0.004 0.004 0.003 186.213

47
Trabajo Fin de Master-Diana Vélez A, junio 2019

importanceSD: The “standard errors” of the permutation-based importance measure.


For classification, a p by nclass + 1 matrix corresponding to the first nclass + 1 columns
of the importance matrix.
Mean Decrease
Banda Arroz Banano Bosque Cacao Camaron Caña de azúcar Palma Manglar Pastizal
Accuracy
1 0.001 0.005 0.002 0.001 0.006 0.002 0.001 0.004 0.002 0.002
2 0.001 0.005 0.002 0.001 0.003 0.003 0.001 0.003 0.001 0.002
3 0.000 0.000 0.001 0.000 0.000 0.000 0.000 0.000 0.001 0.000
4 0.001 0.003 0.001 0.001 0.001 0.002 0.001 0.001 0.001 0.001
5 0.001 0.003 0.001 0.001 0.001 0.002 0.001 0.001 0.001 0.001
6 0.000 0.000 0.000 0.000 0.000 0.000 0.000 0.000 0.001 0.000
7 0.001 0.002 0.001 0.001 0.001 0.001 0.001 0.001 0.001 0.001
8 0.001 0.003 0.001 0.001 0.000 0.001 0.001 0.001 0.001 0.001
9 0.000 0.000 0.000 0.000 0.000 0.001 0.000 0.000 0.001 0.000
10 0.001 0.003 0.001 0.001 0.001 0.002 0.001 0.001 0.001 0.001
11 0.001 0.003 0.001 0.001 0.001 0.002 0.001 0.001 0.001 0.001
12 0.000 0.000 0.000 0.000 0.000 0.000 0.001 0.000 0.001 0.000
13 0.001 0.005 0.001 0.001 0.006 0.002 0.001 0.002 0.001 0.002
14 0.001 0.005 0.001 0.001 0.002 0.003 0.001 0.003 0.001 0.002
15 0.000 0.000 0.000 0.000 0.000 0.000 0.000 0.000 0.001 0.000
16 0.001 0.003 0.001 0.001 0.001 0.002 0.001 0.002 0.001 0.001
17 0.001 0.003 0.001 0.001 0.000 0.002 0.001 0.001 0.001 0.001
18 0.000 0.000 0.000 0.000 0.000 0.000 0.001 0.000 0.001 0.000
19 0.001 0.001 0.000 0.000 0.001 0.001 0.001 0.001 0.001 0.000
20 0.001 0.002 0.001 0.001 0.000 0.001 0.001 0.001 0.001 0.001
21 0.000 0.000 0.000 0.000 0.000 0.000 0.000 0.000 0.001 0.000
22 0.001 0.003 0.001 0.000 0.001 0.000 0.001 0.001 0.001 0.001
23 0.001 0.003 0.001 0.001 0.000 0.001 0.001 0.001 0.001 0.001
24 0.000 0.000 0.000 0.000 0.000 0.000 0.000 0.000 0.001 0.000
25 0.001 0.004 0.001 0.001 0.002 0.001 0.001 0.002 0.001 0.001
26 0.001 0.003 0.001 0.001 0.000 0.002 0.001 0.001 0.001 0.001
27 0.000 0.000 0.001 0.000 0.000 0.000 0.001 0.000 0.001 0.000
28 0.001 0.003 0.001 0.001 0.001 0.001 0.001 0.001 0.001 0.001
29 0.000 0.003 0.001 0.001 0.000 0.001 0.001 0.001 0.001 0.001
30 0.000 0.000 0.000 0.000 0.000 0.000 0.000 0.000 0.001 0.000
31 0.001 0.003 0.001 0.001 0.004 0.001 0.001 0.002 0.001 0.001
32 0.001 0.002 0.001 0.001 0.001 0.001 0.001 0.002 0.001 0.001
33 0.000 0.000 0.001 0.000 0.000 0.000 0.000 0.000 0.001 0.000
34 0.001 0.003 0.001 0.001 0.006 0.001 0.001 0.002 0.001 0.002
35 0.001 0.004 0.001 0.001 0.000 0.001 0.001 0.001 0.001 0.001
36 0.000 0.000 0.001 0.000 0.000 0.000 0.000 0.000 0.001 0.000

48

También podría gustarte