Día 2

27 Junio

Martes

9:00

Plenary Session: George Mohler

Modelos de procesos puntuales de eventos de sobredosis para evaluar e informar intervenciones

En esta charla, primero brindamos una descripción general del modelado de procesos puntuales de eventos de sobredosis y discutimos los enfoques para manejar la información faltante, las covariables de alta dimensión y el contagio. Luego discutimos dos aplicaciones de estos modelos a las intervenciones de aplicación de la ley. Primero, investigamos la relación entre las incautaciones de drogas de las fuerzas del orden público y las sobredosis accidentales en Indianápolis utilizando pruebas de Knox bivariadas modificadas que controlan la autoexcitación en los datos. En segundo lugar, discutimos los resultados de un experimento de campo en Indianápolis donde se utilizaron índices de daño de espacio-tiempo basados en procesos puntuales para informar la distribución de información sobre el tratamiento de la adicción.

9:45

CONTRIBUTED III

Talk 5: Yeison Ocampo-Naranjo

A statistical test for the selection of a cluster model in homogeneous spatial point patterns

The selection of the "best model" that fits a data set for making inferences about the estimation of parameters is one of the principal objectives in statistics. Choosing the most suitable among several candidate models that fit a point pattern in the context of spatial point processes constitutes an enormous theoretical and computational challenge due to the wide range of possible structures that can occur in the spatial distribution of points over a region of the plane. In the literature, there are formal tests and graphs that allow testing the null hypothesis that validates whether a spatial point pattern is complete spatial randomness or if, on the contrary, the intrinsic spatial behavior of the points is aggregated or inhibitory. However, the characterization of phenomena that can be modeled as a spatial point process focuses on the classification of the observed pattern into one of the three groups of models assumed in theory and on the fit of some specific model for the type of spatial structure exhibited by the point pattern. A major of the tools used to perform this type of hypothesis testing is envelopes. The global envelope test allows obtaining a $p$-value by testing the hypothesis that an observed pattern can follow a specific point pattern. However, when two or more models pass the goodness-of-fit test for a spatial point pattern, the question arises which is the best possible model to fit a particular data set. In this work, we propose a statistical test for the selection of the best of several models that pass the goodness-of-fit test for a spatial pattern of points. The power of the test and its performance in terms of classification indices over a wide simulation scenario are studied. Finally, its usefulness in the application of a set of real data will be shown.

10:05

Talk 6: Isabel Escudero

Conditional on history-based stochastic point process models for counts of crimes

We propose stochastic log-Gaussian (LGCP) and self-exciting Hawkes (SEHP) point processes to model crime data. LGCPs facilitate the incorporation of first-order information through spatial and temporal deterministic components and second-order information through a stochastic component, and SEHPs provide flexibility to incorporate various components in the background subprocess. The deterministic components of the LGCP are estimated using generalized linear models (GLM) for the temporal component, and generalized additive models with B-splines for the spatial term. A careful choice of the spatio-temporal correlation function is calculated to obtain an adequate estimate of the underlying Gaussian process. The background rate components of the SEHP are estimated by a nonparametric stochastic reconstruction that includes a temporal periodicity, a separable spatial component, a long-term trend, and a semi-parametric for the relaxation coefficients.
The triggering effect is composed of the excitation effect of all events that occurred in the past, which allows us to quantify criminal recidivism. MCMC-MALA and maximum likelihood are used to stabilize and secure the LGCP and SEHP estimation processes, respectively. We analyze crime events in the city of Riobamba-Ecuador.
En los últimos años la literatura ha evidenciado un incremento exponencial en las defunciones por enfermedades oncológicas en la región de Arica y Parinacota, Chile; que se ha asociado al ingreso de 20.000 toneladas de polimetales provenientes de Suecia en el año 1984. Es por ello que este estudio propone analizar la relación entre la exposición de metales pesados y la mortalidad por enfermedades oncológicas en la ciudad de Arica. Para el análisis metodológico se utilizarán modelos gaussianos latentes de efectos mixtos que incorporan una componente espacio-temporal y diversas covariables para explicar el efecto parcial de la exposición del plomo y arsénico en la mortalidad por enfermedades oncológicas mediante un enfoque estadístico Bayesiano con INLA (Integrated Nested Laplace Approximation).

Introduction
Socioeconomic inequalities have played a significant role in the unequal distribution of vaccines. Low-income communities presented lower vaccination rates. In addition, these inequalities have not been distributed evenly in time.
Our objective was to analyse the spatiotemporal heterogeneity of the socioeconomic inequalities in vaccination against COVID-19, as well as exploring the dependence, both separable and non-separable, of the space and time dimensions.

Methods
The study population consisted of health areas of Catalonia, observed between the last week of 2020 until the first week of march of 2022. We specified spatiotemporal two-part joint models, with dependent variables: vaccination (weekly cumulative percentage of vaccinated - one dose, two doses, and booster dose-) and COVID19 outcomes (incidence, hospitalization, ICU admissions and death), which we estimated with a Bayesian approach using R INLA. As explanatory variables we consider the Gini index and the net income per person, controlling for observed confounders, unobserved heterogeneity and spatial and temporal dependencies. We allow the effect of the explanatory variables on the dependent variables to vary in space and in time. Likewise, we allow that the spatial and temporal dimension are not independent, assuming both separability and non-separability.

Results
Those health areas with a lower socioeconomic level were those with the lowest vaccination rates (one dose, two doses, and booster doses) and the highest risk of COVID-19 outcomes. Higher vaccination rates (two doses and booster) reduced the risk of COVID-19 outcomes. The effects of the explanatory variables were not the same in all areas or between the different waves of the pandemic, detecting clusters of excess risk of low vaccination in the most disadvantaged areas. The results of the non-separable model presented a better fit and a better predictive capacity than those of the separable one.

Conclusion:
There were structural barriers such as the lack of access to information about the vaccination process and logistical challenges such as lack of transportation, limited Internet access or difficulty in scheduling appointments, which caused inequalities against the most disadvantaged areas.

10:25

Invited V: Vinicius Mayrink

Modelado espaciotemporal mixto generalizado: efecto aleatorio mediante análisis factorial con interacción no lineal para la detección de conglomerados

En este estudio, desarrollamos un análisis factorial para explorar los datos de área recopilados en el espacio y el tiempo. El objetivo principal es incorporar interacciones no lineales para manejar un efecto aleatorio espaciotemporal en la estructura de una regresión lineal generalizada mixta. La dependencia espacial entre regiones se establece a través del modelo CAR especificado para cada columna de la matriz de cargas. Se considera dependencia temporal para asociar las columnas de la matriz de puntajes factoriales. La presencia de interacciones no lineales pretende mejorar la detección de grupos, ya que pueden surgir nuevos tipos de grupos como una combinación de los efectos de los factores principales y el efecto de interacción. Nuestro estudio se centra en los casos logístico y de Poisson, pero puede extenderse a otros modelos lineales generalizados basados en la familia exponencial. Se lleva a cabo un estudio de simulación integral para investigar el desempeño de la propuesta. Este trabajo fue motivado por el análisis de datos de electrocardiograma (ECG) relacionados con pacientes afectados por infarto agudo de miocardio (IAM). Los datos fueron recopilados entre 2013 y 2016 a través de un sistema de telediagnóstico de ECG que cubre el estado de Minas Gerais en Brasil. El sistema es mantenido por el Centro de Telesalud del Hospital das Clínicas de la Universidad Federal de Minas Gerais. La metodología propuesta que define la interacción no lineal en el entorno espaciotemporal y el análisis del nuevo conjunto de datos de ECG son las contribuciones centrales.

11:00

Coffee break

11:30

Invited VI: FRANCISCO RODRIGUEZ

UN MÉTODO DE ELIMINACIÓN DE RUIDO BASADO EN EL VECINOS MÁS CERCANOS APLICADO A ACCIDENTES DE TRÁNSITO EN LA RED VIAL DE DOS GRANDES CIUDADES COLOMBIA

Consideramos el problema de la detección de características en presencia de ruido en procesos puntuales en una red lineal. Para el caso en el plano, estudios previos abordaron el tema de la eliminación del ruido del vecino más cercano. Nosotros extendemos esta metodología de clasificación a un contexto geométrico más complejo, donde las propiedades clásicas de un proceso puntual cambian y la visualización de los datos no es intuitiva. Como resultado, el método es adecuado para una característica con ruido como dos procesos de Poisson superpuestos en la misma red lineal, sin suposiciones sobre las formas de las características. Presentamos simulaciones y ejemplos de accidentes de tránsito que resultaron en lesiones o muertes en dos ciudades de Colombia para ilustrar el método.

12:05

CONTRIBUTED IV

Talk 7: Carolina Guevara

Spatial spillovers of poverty in Ecuador

According to Amartya Sen, poverty is the deprivation of a person’ capability to have a good life, which is achieved by meeting basic needs and enabling meaningful choices. Based on this conceptualization of poverty, many factors can influence on the capability of a person to have a good life that range from individual characteristics to external factors. Poverty involves a spatial component as poor people agglomerate over space, generally in places with low coverage of basic infrastructure (Guler and Gough, 2001). Poverty is not randomly distributed across space. Poor places are related to each other, therefore poor people in one place are related to those in other poor places. They face scarce and poor quality educational offer, which is probably immersed in very violent environments, which can constitute a poverty trap (Pérez Akaki & Fonseca Soto, 2017). Based on the aforementioned, it is crucial for Ecuador, and other developing economies, to identify where poor people are, and the characteristics of those places to devote resources to them. In addition, it is important to know whether those places are near to other poor places. Therefore, our research aims are: i. to identify geographical clusters of poverty and ii. to measure spatial spillovers of poverty, indicating whether neighboring regions affects the poverty of a specific region. To analyze the spatial distribution of poverty and to identify spatial clusters of poverty, exploratory spatial data analysis (ESDA) is used. To verify the existence of spatial dependence, we use the Moran's Index, which is a global indicator of spatial correlation. In addition, clusters of poverty are identified using the Local Indicator of Spatial Association (LISA), which indicates the degree of significance of the spatial clustering of similar values around a given observation. The local and global correlation are tested using different weight matrices. To measure the regional spatial effect of poverty, a spatial econometric model is employed. Based on the likelihood ratio test, a Durbin Spatial model is retained as our econometric strategy. To conduct this study, administrative data from the Social Register for 2021 is used. The Social Register collects information of people living in marginalized areas, which are previously selected based on the Unsatisfied Basic Needs (UBN) index (UBN >= 50%). This database accounts for 9334889 observations. And this information is aggregated at the cantonal level. In addition, data from the Ministry of Social and Economic Inclusion, Ministry of Public Health, Ministry of Education and the Directory of Companies of Ecuador (DIIE, acronym in Spanish) are used. The results show that there is spatial dependence of poverty, indicating that poor regions are surrounded by other poor regions and vice-versa. The LISA indicator of local spatial correlation indicates that there are clusters of poverty, shown in red in Figure 1. In addition, the results of the spatial econometric model shows that the spatial dependence parameter is positive and significant, which shows that the level of poverty of neighboring regions influences on the level of poverty of a specific region.

12:25

INVITED I: RUBEN FERNANDEZ

MÉTODOS GEOESTADÍSTICOS NO PARAMÉTRICOS

En esta charla se pretende hacer una revisión de algunos de los métodos de geoestadística no paramétrica en los que hemos estado trabajando en los últimos años, incluyendo algunos detalles sobre su implementación en la práctica con el paquete npsp. Nos centraremos en el caso de procesos geoestadísticos homocedásticos con tendencia determinista. El primer paso es el modelado del proceso que consiste en la estimación conjunta de la tendencia y del variograma, sin asumir ninguna forma paramétrica para estas funciones. Para ello se emplea un algoritmo iterativo, en el que se tiene en cuenta la dependencia espacial para la selección del grado de suavizado y se corrige el sesgo debido al uso de residuos en la estimación del variograma (función np.fitgeo). A partir de estas estimaciones se pueden obtener predicciones en posiciones no observadas mediante kriging residual (función np.kriging). También se ha desarrollado un método bootstrap no paramétrico que permite realizar inferencias adicionales sobre el proceso (función np.boot), como la obtención de intervalos de confianza (o de predicción), el contraste de hipótesis o la construcción de mapas de riesgo incondicionales. Este método bootstrap puede ser modificado para realizar inferencias sobre la distribución de la respuesta en nuevas localizaciones condicionada a los valores observados, por ejemplo, para la construcción de mapas de riesgo condicionales.

13:20

Lunch

15:00

CONTRIBUTED V

Invited VIII: Sergio Castillo

Construcción de mapas de riesgo en procesos geoestadísticos heterocedásticos.

En la presente charla nos centraremos en construir mapas de riesgo considerando procesos espaciales con media no estacionaria y bajo heterocedasticidad. Los componentes del modelo se estiman no paramétricamente, utilizando el estimador lineal local y un proceso iterativo que corrige los sesgos debido al uso directo de los residuos en dichas estimaciones. Por otra parte, la probabilidad de excedencia se estima a partir de un método bootstrap, basado tanto en procesos de simulación geoestadística condicional e incondicional. Los resultados de ambos métodos se comparan mediante estudios numéricos y se aplican a datos reales de precipitación en EEUU.

15:35

Talk 9: Kelly Peña

Recent Advances in Dendrochronology: Multi-way Method as an Alternative

This work examines the relationship between the 49 scientific articles and the dendrochronological indicators published in 7 countries and in 9 consecutive years. For this purpose, a multivariate method called STATIS DUAL has been applied, which allows relating and measuring K-matrices on a space– time scale. We observed the Inter-structure presented greater similarity in the following years of publication 2018, 2019, 2021 and 2022. On the other hand, the compromise matrix presented good correlation in the following variables such as Chronology Length (CL), Expressed Population Signal (EPS) and Correlation. In the Intra-structure, we found similarities in the variables from the scientific articles. In this regard, China obtained the largest tree-ring chronologies and the best EPS in most years. Countries with small chronologies were Chile and Argentina. Brazil and Ecuador showed high values in Mean Sensitivity (Ms). Argentina, Brazil and US showed high values in Correlation. Based on progress from 2014 to 2022 and global research potential we expect an increase in dendrochronological research in the word.
Los procesos puntuales permiten modelar una diversidad de eventos que se desarrollan en el espacio, estos buscan estudiar la importancia que el espacio tiene la estructura del modelo. Para describir un proceso puntual, se puede utilizar su medida de intensidad. En particular, los procesos de Cox log-Gaussianos, considera como medida de intensidad un proceso Gaussiano. El presenta trabajo estudia la construcción del proceso Gaussiano mediante métodos Bayesianos considerando un proceso influenciado por n-factores. Se obtiene como resultado una estimación en distribución del conteo de eventos en una región determinada. Como conclusión se tiene que es posible construir un modelo para una base de datos múltiple. Para mostrar la aplicación de esta metodología, se muestra su uso para una base de datos correspondiente a la flotación mineral, en la cual, mediante la introducción de gas en un reactor, permitiendo que este flote y se recolecte de su superficie. Como trabajos futuros se busca incluir características adicionales al proceso puntual y las implicaciones la división regular, considerada puede tener en el modelo.
La región de Atacama está localizada en el desierto de Atacama (norte de Chile), y posee una larga costa de más de 500 km de longitud la cual ha sido poco estudiada desde el punto de vista científico. Se desconoce la composición elemental de los sedimentos marino-costeros, sumamente necesarios para llevar a cabo evaluaciones de salud ambiental de los ecosistemas. El principal objetivo de este trabajo fue realizar un análisis estadístico de la distribución de contaminantes en la costa de Atacama a través de herramientas geoestadísticas relacionando la distribución de elementos inorgánicos en sedimentos costeros con el contenido de materia orgánica y la granulometría. La metodología adoptada para moldeamiento espacial compara la estimación vía Kriging vs. SPDE, donde el SPDE adoptó como variable explicativa siete variables de granulometría y dos componentes principales (que explican el 98,7\% de la varianza) que combinan 55 elementos químicos y sus relaciones. Este estudio otorga una aproximación de la distribución de las concentraciones de elementos en sedimentos a lo largo de la costa, destacando su puntos de geoacumulación como por ejemplo de Fe, As y Cu en áreas de mayor influencia humana, como es la Bahía de Caldera y Calderilla, Bahía Sarco en Huasco, y playa Blanca y playa Grande en Chañaral. Se relacionaron los datos con la concentración de materia orgánica presente y se concluyó que las mayores acumulaciones se localizaban en sedimentos del fondo marino en las bahías centrales de la región.

15:55

INVITED IX: ORIETTA NICOLIS

PREDICCIÓN DE EVENTOS SÍSMICOS MEDIANTE LA COMBINACIÓN DE MÉTODOS ESTADÍSTICOS Y REDES NEURONALES DE APRENDIZAJE PROFUNDO

Los terremotos representan uno de los fenómenos naturales más destructivos a nivel mundial, con un efecto masivo sobre la economía y la vida humana.

Los modelos de procesos de puntos autoexcitantes se han convertido en componentes esenciales en la evaluación del riesgo sísmico. Una clase particular la dan los modelos Epidemic Type Aftershock Sequence (ETAS) que han demostrado ser útiles en la descripción y modelado de ocurrencias de terremotos en determinadas ubicaciones geográficas y períodos de tiempo.

Recientemente, la predicción de eventos sísmicos utilizando modelos de aprendizaje automático ha ganado relevancia debido a la disponibilidad de una gran cantidad de datos, así como a la mejora de los métodos computacionales, especialmente a través de modelos de redes neuronales de aprendizaje profundo.

En esta presentación se abordan diferentes métodos: en primer lugar, se propone la red neuronal Long Short Term Model (LSTM) en una estructura multicolumna para predecir la función de intensidad ETAS en una ubicación y tiempo determinados utilizando variables exógenas. Luego, se introduce una nueva clase de algoritmo de agrupamiento de densidad ST-BSCAN para agrupar eventos sísmicos con características similares y clasificarlos en categorías denominadas sismo anterior, sismo principal y réplica. A continuación, se utilizan redes neuronales LSTM y transformadoras para predecir la etiqueta del último evento.

Los métodos anteriores se prueban en el catálogo sísmico chileno, dado que Chile es uno de los países más sísmicos del mundo debido a la subducción de la placa de Nazca debajo de la placa continental sudamericana. Los resultados muestran que los modelos de redes neuronales pueden predecir la ubicación y hora de ocurrencia de un evento sísmico con un R2 mayor a 0.80 y la etiqueta del último evento con una precisión mayor al 95%.

16:50

TALK 11: VICTOR DE OLIVEIRA

CHARLA INFORMATIVA SOBRE POSIBILIDADES DE ESTUDIOS DE POSGRADO EN LA UNIVERSITY OF TEXAS AT SAN ANTONIO

17:15

Brindis y Exposición de póster

TELF: (+593) 2 2976 300 Ext: 1551
Esta dirección de correo electrónico está siendo protegida contra los robots de spam. Necesita tener JavaScript habilitado para poder verlo.