Agenda

Día 1

26 Junio

Lunes

9:00

Registration

9:30

Opening Session:

10:00

Sesión Plenaria: Victor de Oliveira

Inferencia Sobre el Parámetro de Suavidad en Campos Aleatorios de Gaussianos de Matérn

La familia Matérn de funciones de covarianza es actualmente la más utilizada en el análisis de datos geoestadísticos debido a su capacidad para describir diferentes comportamientos de suavidad. Sin embargo, en muchas aplicaciones el parámetro de suavidad se fija en un valor arbitrario. Esta práctica se debe en parte a desafíos computacionales que se encuentran al intentar estimar todos los parámetros de covarianza, y en parte a afirmaciones en la literatura que aseveran que los datos geoestadísticos tienen poca o ninguna información sobre el parámetro de suavidad. Esta charla consta de dos partes.

En la primera parte, investigo críticamente esta afirmación y demuestro que, en general, no es cierta. En concreto, se muestra que la información que los datos tienen sobre los parámetros de correlación varía sustancialmente según el modelo real y el diseño de muestreo y, en particular, la información sobre el parámetro de suavidad puede ser sustancial, en algunos casos mayor que la información sobre el parámetro de rango.

En la segunda parte, propongo una nueva clase de distribuciones previas para el parámetro de suavidad que son fáciles de calcular. Estas previas se aproximan a las previas de referencia, pero su análisis y cálculo computacional son considerablemente más simple. Se muestra que la distribución a posteriori de los parámetros basada en estas previas es propia, y las inferencias Bayesianas sobre los parámetros de covarianza basadas en estas tienen propiedades frecuentista satisfactorias, mucho mejores que las basadas en máxima verosimilitud.

La metodologia propuesta es ilustrada con dos conjuntos de datos reales.

10:45

Coffee break

11:15

CONTRIBUTED I

TALK 1: Ramón Xulvi-Brunet

Urban crime: detection of spatio-temporal patterns by means of complex networks

Research demonstrates that urban crime tends to concentrate in certain areas of cities. But, are crimes in these areas spatio-temporarily related or crimes taking place in an area occur independently of what happens in others? Provided that a crime occurs in a certain area, what is the probability that the next crime occurs in other neighboring area? In this study, we try to answer these questions by means of complex networks.

We divide the city of Valencia, Spain, in 599 non-overlapping sectors, which we associate to the nodes of our network. We start with a complete network where all links have a weight equal to zero. Once a crime occurs in a sector, say sector A, we consider all the next crimes that take place in all sectors that are at a certain distance of sector A and occur within a certain interval of time after the event. We increase the weight of the link between sector A and and another sector, say sector B, provided that the next crime occurs in sector B, the distance between sectors A y B is less than a given R, and the time between both events is less than a certain T. Let us call the network thus constructed the real-events-network. The link weights of this network will shed light upon the second question we posed above.

The real-events-network is then compared with a distribution of networks each one constructed following the same, above-mentioned procedure but after randomizing the events in time. Each link of the real-events-network whose weight is smaller or equal than the maximum weight found for it in the network distribution is removed. After this step, we end up by having a sparse network whose links are directly related with spatio-temporal correlations among the sectors where crimes take place.
Despite of relatively long history of point process theory, see, amongst others, Diggle (2013) and Baddeley et al. (2015), few attention has been paid to the analysis of spatial point patterns when the features of interest are curves, i.e.
realisations of some underlying continuous mechanism occurring over point locations. Examples of such spatial configurations include forest patterns where for each tree we have a growth function, economic and population features related to town locations, and spatial locations and curves defined in terms of LISA functions, which define local characteristics of the underlying point pattern. Despite the increased availability of such complex planar mark point process scenarios, there is still a lack of methodology for the case where each point is augmented by multiple function-valued marks. Addressing these limitations, extension of second order characteristics for non-scalar point attributes, as already defined by Comas et al. (2011), Comas et al. (2013) and Ghorbani et al. (2011), are extended to more complex function-valued mark structures. In particular in this work, extensions of the classical mark variogram function, see Cressie (1993), and the mark correlation function, see Isham (1985) and Stoyan and Stoyan (1994), to cross-function version for (multiple) spatial point processes with multivariate function-valued marks are presented. A case study involving the spatial locations of 799 pines (Pinus sylvestris) with some functional-valued tree characteristics are considered to illustrate our new
approaches. Finally, we discuss the results obtained for the case study and propose some future lines of research to extend our approach to more complex non-scalar mark structures.

11:35

TALK 2: John Santibañez

Una primera mirada geoestadística de la contaminación en sedimentos costeros de la región de Atacama - Norte de Chile

La región de Atacama está localizada en el desierto de Atacama (norte de Chile), y posee una larga costa de más de 500 km de longitud la cual ha sido poco estudiada desde el punto de vista científico. Se desconoce la composición elemental de los sedimentos marino-costeros, sumamente necesarios para llevar a cabo evaluaciones de salud ambiental de los ecosistemas. El principal objetivo de este trabajo fue realizar un análisis estadístico de la distribución de contaminantes en la costa de Atacama a través de herramientas geoestadísticas relacionando la distribución de elementos inorgánicos en sedimentos costeros con el contenido de materia orgánica y la granulometría. La metodología adoptada para moldeamiento espacial compara la estimación vía Kriging vs. SPDE, donde el SPDE adoptó como variable explicativa siete variables de granulometría y dos componentes principales (que explican el 98,7\% de la varianza) que combinan 55 elementos químicos y sus relaciones. Este estudio otorga una aproximación de la distribución de las concentraciones de elementos en sedimentos a lo largo de la costa, destacando su puntos de geoacumulación como por ejemplo de Fe, As y Cu en áreas de mayor influencia humana, como es la Bahía de Caldera y Calderilla, Bahía Sarco en Huasco, y playa Blanca y playa Grande en Chañaral. Se relacionaron los datos con la concentración de materia orgánica presente y se concluyó que las mayores acumulaciones se localizaban en sedimentos del fondo marino en las bahías centrales de la región.

11:55

INVITED VII: MARTHA BOHORQUEZ

RECONOCIMIENTO DE PATRONES USANDO GEOESTADÍSTICA FUNCIONAL Y TÉCNICAS DE APRENDIZAJE

El análisis de datos funcionales espaciales ha ganado relevancia a medida que se registran grandes volúmenes de información. Los métodos estadísticos deben adaptarse a este tipo de objetos aleatorios. Presentamos algunas metodologías novedosas que combinan geoestadística funcional y técnicas de aprendizaje profundo para construir, analizar y clasificar curvas espaciales y series temporales de imágenes en varios campos de las ciencias, como el monitoreo del clima, la contaminación del aire y las señales cerebrales.

12:30

Invited II: Guillermo Ferreira

Filtrado multivariante de Kalman para procesos espacio-temporales

En los últimos años se ha notado un creciente interés en modelos para procesos espacio-temporales multivariados. Algunos de estos modelos son muy flexibles y pueden capturar asociaciones espaciales tanto marginales como cruzadas entre los componentes del proceso multivariado. Con el fin de contribuir al análisis estadístico de estos modelos, este artículo trata sobre la estimación y predicción de procesos espacio-temporales multivariados mediante el uso de modelos de espacio de estado multivariados. En este contexto, se representa un proceso espacio-temporal multivariante a través de la conocida descomposición de Wold. Tal enfoque permite una fácil implementación del filtro de Kalman para estimar procesos temporales lineales que exhiben dependencias de corto y largo alcance, junto con una estructura de correlación espacial. Ilustramos, a través de experimentos de simulación, que nuestro método ofrece un buen equilibrio entre la eficiencia estadística y la complejidad computacional. Finalmente, aplicamos el método para el análisis de un conjunto de datos bivariados sobre temperaturas diarias promedio y radiaciones solares máximas diarias de 21 estaciones meteorológicas ubicadas en una porción del centro-sur de Chile.

13:05

Lunch

15:00

Sesión Plenaria : PAULA MORAGA

CIENCIA DE DATOS GEOESPACIALES PARA LA VIGILANCIA DE LA SALUD PÚBLICA

Los datos de salud geoespaciales son esenciales para informar las políticas de salud pública. Estos datos pueden utilizarse para cuantificar la carga de enfermedades, comprender patrones geográficos y temporales, identificar factores de riesgo y medir desigualdades. En esta charla, describiré mi investigación que se centra en el desarrollo de métodos geoespaciales y herramientas de computación para la vigilancia de la salud. Presentaré modelos en los que datos demográficos, ambientales y climáticos se utilizan para predecir el riesgo y guiar la implementación de intervenciones para la eliminación de enfermedades tropicales. También mostraré los paquetes de R epiflows para la predicción de la propagación de enfermedades por flujos de viajes, y SpatialEpiApp para el mapeo de enfermedades y la detección de clusters. Finalmente, describiré mis líneas de investigación actuales y cómo éstas pueden contribuir a mejorar la salud de la población a nivel global.

Referencias: Paula Moraga (2019). Geospatial Health Data: Modeling and Visualization with R-INLA and Shiny. Chapman & Hall/CRC Biostatistics Series. https://www.paulamoraga.com/book-geospatial/

15:45

CONTRIBUTED II

Talk 3: Jorge Sosa

Método integral de correlación local para la detección de valores atípicos en datos funcionales espacialmente correlacionados

A pesar de la gran cantidad de métodos disponibles para detectar anomalías en datos espacio-temporales, el número de enfoques que consideran la correlación espacial en datos funcionales es limitado. Por ello, en este estudio se propone una nueva metodología para detectar valores atípicos considerando este tipo de dato, teniendo aplicaciones potenciales en una amplia variedad de campos, como la monitorización ambiental, la investigación médica o la ingeniería.
La metodología propuesta se apoya en el algoritmo Local Correlation Integral (LOCI), el cual se modifica para calcular la distancia en el espacio de Hilbert L2. Para tener en cuenta la estructura de correlación espacial, se pondera dicha distancia mediante el semivariograma. Con el fin de evaluar el desempeño de la metodología, se llevó a cabo un extenso estudio de simulación donde se evaluó el efecto de diferentes valores del parámetro de corte "b" en la detección de dichos valores atípicos, comparando los resultados obtenidos con el valor propuesto por el teorema de Chebyshev. Además, se comparó el rendimiento de la distancia ponderada por el semivariograma con otros tipos de distancias.
Los resultados mostraron que la metodología propuesta es efectiva en la detección de valores atípicos en datos funcionales espacialmente correlacionados. En particular, se encontró que utilizando un valor “b” entre 1.5 y 2 se obtienen mejores resultados que el valor “b” de 3 propuesto por el teorema de Chebyshev. Además, se encontró que la distancia ponderada por el semivariograma fue superior a otros tipos de distancias considerados en el estudio. Estos resultados fueron respaldados por la aplicación del método propuesto a una serie temporal de datos de temperatura de la superficie terrestre (LST) en la región de la comunidad de Andalucía, España.
En conclusión, este estudio presenta una metodología prometedora para la detección de valores atípicos en datos funcionales espacialmente correlacionados, que se basa en una modificación del algoritmo LOCI que considera la estructura de correlación espacial mediante el uso del semivariograma. Los resultados obtenidos sugieren que esta metodología puede ser útil en diversas aplicaciones prácticas.

16:05

Talk 4: Camilo Andrés Albarracín

Una Nueva Metodología para la Clasificación de Cultivos de Coca en Colombia: Utilizando XGBoost con Datos Multiespectrales y Espacio-temporales

La clasificación de cultivos de coca es esencial en Colombia desde principios del siglo XXI, debido a su posición como uno de los principales productores de cocaína. Aunque es un insumo clave para orientar las políticas públicas de drogas, el modelo de monitoreo de cultivos ilícitos, establecido entre el Gobierno de Colombia y las Naciones Unidas, presenta limitaciones en términos de oportunidad y precisión. La metodología actual se basa en la interpretación visual de imágenes satelitales por expertos en procesamiento digital de imágenes, con datos actualizados solo hasta el 31 de diciembre de cada año.

Además, el progreso hacia un nuevo modelo de medición es limitado, ya que los esfuerzos para desarrollar e implementar nuevas metodologías enfrentan dificultades en la escalabilidad debido a la complejidad de los modelos entrenados, la recolección de información en campo y el costo de imágenes satelitales de alta resolución. Dada estas limitaciones y el crecimiento en la literatura sobre la integración de sensores remotos y modelos estadísticos para la clasificación de cultivos, en este trabajo se propone una nueva metodología utilizando XGBoost y datos multiespectrales y espacio-temporales para clasificar cultivos de coca en Colombia.

Se presenta un flujo de trabajo escalable que incluye el acceso a imágenes satelitales, el cálculo de índices espectrales, funciones focales y reducciones temporales, aprovechando los recursos de almacenamiento y procesamiento de Google Earth Engine para extraer las variables requeridas. Luego, se entrenan modelos XGBoost para clasificar entre coca y no-coca, optimizando los hiperparámetros mediante un método de validación cruzada espacial.

La aplicación de esta metodología en dos zonas de Putumayo (Colombia) logró una precisión del 99.59% (Kappa 0.9822) en los datos de entrenamiento y del 94.26% en los datos de validación (Kappa 0.7512), con tiempos de entrenamiento y predicción reducidos. La metodología propuesta representa una contribución significativa en el campo de la clasificación de cultivos ilícitos, con un gran potencial para su aplicación en Colombia y otros países productores de la región. Esto permitiría acelerar el proceso de detección de cultivos y tendría implicaciones en áreas como operaciones de fuerzas públicas, construcción de políticas públicas y relaciones internacionales.

16:25

Invited III: DAVID SANCHEZ

CAMBIOS DE PARADIGMA EN EL USO DE DATOS CENSALES – CASO DE ESTUDIO GRADO DE URBANIZACIÓN RONDAS CENSALES 2010 - 2022

La definición de lo urbano y lo rural es aún el tema de discusión de la geografía física y social. Es así que han existido varios intentos de homogeneizar conceptos y aplicaciones que puedan seor comparables a nivel internacional.

En el Ecuador, tanto el INEC, los Municipios, el IGM, entre otros organismos públicos y privados tienen definiciones ambiguas que cumplen con objetivos específicos propios de cada institución, sin ser estos interoperables entre si y temporalmente no son comparables. Dentro de las definiciones las zonas urbanas nacionales se pueden tomar en consideración las referidas al ámbito administrativo y de planificación como: cabeceras parroquiales, cantonales, capitales provinciales, capitales nacionales, límites parroquiales urbanos municipales, áreas de planificación urbana. Mientras que para los fines estadísticos existen definiciones de amanzanamiento y numero de población definidos.

De igual manera los países a través de las Oficinas Nacionales de Estadística y Oficinas Nacionales de Geografía tienen los mismos inconvenientes respecto a la comparación entre países. Es así que, la aplicación de los conceptos unificados de los asentamientos urbanos y ciudades conlleva a realizar la aplicación conceptual internacional para definir de mejor manera de forma de entender el límite entre lo urbano y lo rural así como su representación interoperable; lo que lleva a la evaluación de la actual propuesta en dos rondas censales del Ecuador.

En consecuencia, se necesita la capacidad de definir áreas urbanas y rurales tanto para recolectar datos como para analizar las diferentes condiciones en estas áreas. La definición de áreas urbanas y rurales se acordó en la 51ª Comisión de Estadística de las Naciones Unidas que adoptó una definición tan armonizada para la comparación internacional: el grado de urbanización.

El método del grado de urbanización ayuda a estandarizar la recopilación y presentación de información entre países al ofrecer un método común para clasificar las áreas urbanas y rurales con el objetivo de realizar una comparación estadística basada en el tamaño de la población y los criterios de densidad y mediante un método geoespacial que se basa en la contigüidad y en este caso tambien con una aplicación temporal.

El requisito básico para aplicar el método de grado de urbanización es un ráster de población en una cuadrícula regular (cuadrangular y hexagonal) en una proyección de área equivalente que se puede derivar de los datos de población en formato geoespacial; metodología y herramienta que impulsa el Instituto Nacional de Estadistica y Censos del Ecuador para el uso anonimizado de información estadistica.

17:00

Invited IV: Salvador Naya, Javier Tarrío

Aplicaciones de algoritmos verdes en el contexto de la eficiencia energética y la sostenibilidad.

En esta charla se presentarán diferentes aplicaciones en un entorno de buscar la eficiencia energética o la sostenibilidad. El tema común es el empleo de modelos estadísticos que propongan el ahorro energético o la sostenibilidad, por lo que encajarían dentro de la nueva filosofía de los algoritmos verdes. Concretamente se presentarán dos ejemplos en este contexto. Por una parte, se presenta un ejemplo en el campo de la eficiencia energética aplicada a edificios para rebajar el consumo, lo que se conoce como edificios verdes, y también se propondrá una aplicación en el contexto de la mejora del entorno marino mediante el uso de arrecifes artificiales creados con parte de conchas de bivalvos. La primera de las aplicaciones hace uso del control estadístico de la calidad mientras que la segunda aplicación se centra en el diseño de experimentos aplicado a la búsqueda de materiales sostenibles.

Salvador Naya Fernández y Javier Tarrío Saavedra

Grupo de Investigación MODES. Centro de investigación CITIC. Departamento de Matemáticas. Escuela Politécnica de Ingeniería. Universidad da Coruña.

18:00

Conference Dinner

TELF: (+593) 2 2976 300 Ext: 1551
Esta dirección de correo electrónico está siendo protegida contra los robots de spam. Necesita tener JavaScript habilitado para poder verlo.