Más contenido relacionado Más de Benito Zaragozí (18) Modelizacion de variables climaticas con SIG1. 5 10 15
Alicante, 5 de Abril de 2011
5
Modelización de variables climáticas con SIG
10
Benito M. Zaragozí
Instituto Interuniversitario de Geografía
15
Modelización de variables climáticas con SIG por Benito M. Zaragozí se encuentra bajo una
Licencia Creative Commons Reconocimiento-NoComercial-CompartirIgual 3.0 Unported.
2. Modelización de datos climáticos con SIG
Modelización espacial basada en técnicas de interpolación:
● Es un procedimiento estadístico que predice (modelos) el valor de un atributo
concreto en áreas para las que no disponemos de información. El
procedimiento se realiza a partir de las medidas puntuales disponibles en la misma
área o región (ver concepto de GEOSTADÍSTICA).
● La interpolación es utilizada para convertir datos puntuales en superficies
continuas, de tal forma que los patrones espaciales de la variable interpolada
puedan ser comparados con los patrones espaciales de otras variables mediante
su integración en Sistemas de Información Geográfica.
104 93 76 54 104 93 76 54
28 28
104 66
34 34
Benito M. Zaragozí © Abril-2011
93 76 54 93 76 54
45 45
83 45 83 45
56 56
77 53 52 77 53 52
76 73 65 56 76 73 65 56
73 67 74 63 56 73 67 74 63 56
3. Modelización de datos climáticos con SIG
Red de observatorios metereorológicos:
● La red de muestreo vendrá dada por algún organismo y de ella dependerán en
gran medida la posibilidades de una adecuada interpolación.
●Cuanto más dispersa y más irregular, más incertidumbre tendrán los modelos que
desarrollemos.
Benito M. Zaragozí © Abril-2011
Mala distribución (real)
Buena distribución
Existen montañas, valles,
faltan carreteras...
4. Modelización de datos climáticos con SIG
Primera ley del la Geografía (Tobler, 1970):
● "Everything is related to everything else, but near things are more related than
distant things."
● Los métodos de interpolación se fundamentan en la ley de Tobler.
● Si la red de muestreo es dispersa es muy útil disponer de información de los
procesos físicos que condicionan la distribución espacial de los valores de la
variable a interpolar.
16 ºC Gradiente adiabático = 0,65ºC/100 m
800 m.
Benito M. Zaragozí © Abril-2011
(22+16)/2=19 ºC
¿ºC? 22 – (0,65*3) = 20,05 ºC
300 m.
22 ºC
0 m. 1000 m.
500 m.
5. Modelización de datos climáticos con SIG
Tipos de interpoladores. Preguntas que nos podemos hacer:
● ¿Dan modelos simples?, ¿o más bien complejos??
● ¿Determinísticos o geoestadísticos?
● ¿Locales o Globales?
● ¿Cuantifican el error (incertidumbre) o solamente los valores??
● ¿Son exactos o Inexactos?
● ¿Los resultados son suaves o con discontinuidades?
Benito M. Zaragozí © Abril-2011
● ¿Rápidos o computacionalmente exigentes?
6. Modelización de datos climáticos con SIG
Datos para nuestra zona de estudio
● AEMET establece el acceso libre y gratuito a todos sus datos por medios electrónicos:
http://www.aemet.es/es/zona_portada_destacada/politicadatos
● Sistema de Información Agroclimática para el Regadío (SIAR)
http://www.mapa.es/siar/descripcion.asp
● Atlas climático de la Comunidad Valenciana. (Pérez Cuevas, 1994)
Benito M. Zaragozí © Abril-2011
¿Y si usamos imágenes de satélite?
7. Modelización de datos climáticos con SIG
Preparación y creación de la base de datos SIG:
● Tabla de temperaturas: (Tmed, Tmax, Tmin) x 13, Localidad, añadir coord.
● Tabla de precipitaciones: (PP) x 13, coordenadas UTM, altitud.
● SOLAMENTE observatorios de Alicante
●Definir muestras de análisis y de comprobación (60% - 40 %). Por ejemplo,
usando (luego veremos para qué):
=ALEATORIO.ENTRE(Menor; Mayor)
● Guardar las tablas en formato *.dbf.
Benito M. Zaragozí © Abril-2011
8. Modelización de datos climáticos con SIG
Tareas de preprocesado:
● Zona de estudio(en la BD de PostGIS -> public.LIMESMAS).
● Variables (MDE, Continentalidad, Latitud...). ¿Cómo se han creado?
● Tablas de clima (*.dbf) y crear temas de eventos
● Guardar las capas de eventos a Shapefiles
● Editar los observatorios que ''se han caido al mar'' :-)
Benito M. Zaragozí © Abril-2011
9. Modelización de datos climáticos con SIG
Algunas de las herramientas que vamos a usar en el preprocesado son
(R gnu, gvSIG, Sextante y Saga):
● ''Añadir tema de eventos''
● Editar/mover punto
● Point statistics (o como se llame¿! )
● Join ¿?, tal vez...
Valores Variables
Temp_Enero MDE Lat Lon ...
5m ---- ----
Benito M. Zaragozí © Abril-2011
18ºC
15ºC 300 m ---- ----
12ºC 450 m ---- ----
---- ---- ---- ----
Se trata de obtener una tabla parecida al ejemplo
10. Modelización de datos climáticos con SIG
Vecindario y anisotropía
n vecinos más próximos
Radio de búsqueda
Benito M. Zaragozí © Abril-2011
Anisotropía
Vecinos de Voronoi
11. Modelización de datos climáticos con SIG
Métodos locales: Poligonos de Thiessen / Voronoi
http://es.wikipedia.org/wiki/Pol%C3%ADgonos_de_Thiessen
''...especialmente
apropiada cuando los
datos son
cualitativos...''
Benito M. Zaragozí © Abril-2011
12. Modelización de datos climáticos con SIG
Métodos locales: Interpolación polinómica local (global tb)
● El método consiste en ajustar una ecuación polinomial a las observaciones de la
variable.
● Los valores de las áreas sin datos se pueden calcular a partir de sus coordenadas.
● Es un método no exacto
● Se asume que las muestras están distribuidas homogéneamente y el vecindario
presenta una distribución normal local
global
Z x=b0 b1 xb2 y
Benito M. Zaragozí © Abril-2011
local
global
Z x=b0 b1 xb2 yb3 x 2b4 xyb5 y 2
13. Modelización de datos climáticos con SIG
Métodos locales: Inverso de la distancia ponderado (IDW)
n El valor que tomará la variable en un punto del
∑ z x i⋅d −r
ij espacio será un promedio ponderado con la
Z x0 =
i=1
distancia a cada uno de los puntos muestreados que
n
∑ d −r
ij
se encuentren dentro del área establecida para la
i=1 interpolación.
●
Los pesos (distancias) se pueden calcular a partir de una función recíproca: d-r, o
también a partir de una función exponencial negativa: e-d
●
Es un interpolador exacto.
●La distribución del mapa final se ve muy afectada por la presencia de extremos, la
ponderación y la selección del radio de búsqueda.
Benito M. Zaragozí © Abril-2011
p=2
p=1
A medida que p aumenta, el peso asignado
p=0 disminuirá más rápidamente con la distancia
y los vecinos que importan serán menos.
14. Modelización de datos climáticos con SIG
Métodos locales: Splines (tb globales)
● Conjunto de funciones que se ajustan a un pequeño número de datos (la
ventana escogida) y asegura continuidad entre las partes de una curva.
● Producen errores escasos, ajustandose bastante a la realidad.
● Son interpoladores exactos.
● Esta técnica es inapropiada cuando se producen fuertes contrastes en los
valores de la variable dentro de distancias cortas o se sospecha de un mal
muestreo.
●Se necesita un gran número de puntos para obtener resultados óptimos.
Pueden producir valores ''fuera de rango''.
Benito M. Zaragozí © Abril-2011
IDW Splines
15. Modelización de datos climáticos con SIG
Métodos globales: Modelos de regresión (Simple y múltiple)
●Se usan cuando existen factores que condicionan la variable a interpolar. Por
ejemplo, la relación de la temperatura y la altitud es sobradamente conocida.
● Solamente se necesitan variables que encontramos fácilmente en un SIG (MDE,
latitud, ''distancias a '', orientaciones...).
● Es un interpolador inexacto.
● Menor dependencia de la red de muestreo.
y=ab∗x Lineal
b
y=a∗x Potencial
Benito M. Zaragozí © Abril-2011
y=a e bx Exponencial
y=ab∗ln x Logaritmica
z x =b0b1 P1 b2 P2 Regresión Múltiple
16. Modelización de datos climáticos con SIG
Métodos globales: Modelos de regresión con R
> # Importamos los datos
> datosclima = read.csv(file.choose(), sep=',') y ~ x1
> attach(datosclima) y modelado en base a x,
> pairs(datosclima) # Visualización Regresión simple
> # Creación de nuestro modelo y ~ x1 + x2 + x3
> mi.lm= lm(TMED ~ MDE + LON + LAT + CONT) y modelado en base a 3
> summary(mi.lm) variables
Regressión múltiple
Benito M. Zaragozí © Abril-2011
17. Modelización de datos climáticos con SIG
Métodos globales: Modelos de regresión con R
Call:
lm(formula = TMED ~ MDE + LONG + LAT + DISTMEDIT)
Residuals:
Min 1Q Median 3Q Max Probamos varias fórmulas hasta
-1.0746 -0.5601 -0.2624 0.2103 2.1362 encontrar la mejor combinación
Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) 1.830e+01 3.309e-01 55.286 < 2e-16 ***
MDE -6.294e-03 1.065e-03 -5.911 2.68e-06 *** Comparar con los
LONG -1.648e-01 2.893e-01 -0.569 0.574 resultados de SAGA o
LAT 2.355e-02 2.335e-01 0.101 0.920
Benito M. Zaragozí © Abril-2011
Sextante. Aquí tenemos
DISTMEDIT -1.349e-05 4.050e-05 -0.333 0.742
mucha más información.
---
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
Residual standard error: 0.8729 on 27 degrees of freedom
Multiple R-squared: 0.8012, Adjusted R-squared:
0.7718
F-statistic: 27.21 on 4 and 27 DF, p-value: 3.985e-09
18. Modelización de datos climáticos con SIG
Métodos geoestadísticos (Kriging):
En los métodos geoestadísticos la estimación se basa en una serie de modelos
estadísticos que incluyen la autocorrelación de los datos muestreados.
Al igual que en la técnica del inverso de la distancia, la predicción se realiza a partir
de los valores vecinos, pero los pesos no se basan solamente en la distancia, sino
también en la relación que se produce entre los valores de estos.
Pasos a seguir:
1. Cálculo de la semivarianza entre los pares de puntos, que permite determinar la
autocorrelación existente entre los valores de los puntos de muestreo.
2. Ajustar un modelo a las semivarianzas obtenidas (semivariograma).
Benito M. Zaragozí © Abril-2011
3. Creación de las matrices para determinar los pesos de cada uno de los puntos
disponibles.
4. Realizar la predicción en el punto a partir de los pesos obtenidos para cada
punto de medición.
19. Modelización de datos climáticos con SIG
Métodos geoestadísticos (Kriging):
La variación espacial de una variable puede expresarse como la suma de tres
componentes:
● Un componente estructural (media o tendencia)
● Un componente aleatorio, correlacionado espacialmente.
● Un componente aleatorio no correlacionado (residuos).
Z x=m x ' x ' '
Existen diferentes tipos de kriging:
Benito M. Zaragozí © Abril-2011
●Kriging simple.
●Kriging ordinario
●Kriging universal
●Co-kriging
●...
Varían en función del modo de calcular el componente estructural m(x)
20. Modelización de datos climáticos con SIG
Métodos geoestadísticos (Kriging):
● Simple Kriging (SK): Asume que los datos se basan en un valor conocido
cte. La media en todo el área de estudio (es decir, un valor medio global, en
la práctica 0. Este supuesto es muy restrictivo para la mayoría de los
problemas y por esto, el KS se utiliza poco.
● Ordinary Kriging (OK): Esta es la variante del Kriging más extendida entre
los distintos GIS. El OK puede interpolar a partir de puntos o bloques. Se trata
de un SK donde la tendencia media se calcula para cada pixel.
●Universal Kriging (UK): Es muy similar al OK pero calculando la tendencia
mediante modelos de regresión.
Benito M. Zaragozí © Abril-2011
21. Modelización de datos climáticos con SIG
Métodos mixtos: Interpolación de residuales
Los métodos inexactos pueden ser mejorados con la incorporación de los
valores residuales.
Residuales = Observados – Predichos
Se interpolan los valores residuales y añaden al modelo para obtener así un
interpolador exacto que contiene apectos globales y locales.
Pasos a seguir:
● Muestrear un modelo inexacto (ej: regresión múltiple) con la capa de
observatorios.
Benito M. Zaragozí © Abril-2011
● Realizar la resta para obtener los residuos.
●Interpolar los residuos y añadirselos al modelo de regresión (algebra de
mapas).
22. Modelización de datos climáticos con SIG
Validación de resultados
Principalmente se utilizan dos métodos:
●Validación cruzada: Por ejemplo, Sextante la ofrece para el Kriging, pero no en
otros modelos. En SAGA aparece como [residuals] en varios métodos. Hacerlo a
mano, por lo general, supone un gran esfuerzo.
● Validación mediante muestras independientes: Nos la podemos gestionar
nosotros mismos en cualquier software (Para esto nos sirve separar 'a priori' la
muestra en 2 subconjuntos; 60%-40%).
Usar el que más convenga en cada caso. En este caso el que menos trabajo
necesite ;-)
En cualquier caso se obtienen tablas con valores Observados y Estimados a
Benito M. Zaragozí © Abril-2011
partir de los cuales se pueden calcular estadísticos para medir el error asociado
a cada modelo. Por ejemplo, el RMSE (Root Mean Squared Error) en R sería:
> validacion = read.csv(file.choose(), sep=';')
> attach(validacion) Creamos una función en R
> rmse <- function(O, P){sqrt(mean((O-P)^2))} y la aplicamos a los datos
> rmse
function(O, P){sqrt(mean((O-P)^2))}
> rmse(TOBS,TPRED) Error en la misma escala
[1] 0.8022936 estudiada (ºC)
23. Modelización de datos climáticos con SIG
Practica 1: Estimación de las precipitaciones medias anuales. (Si hay tiempo
realizar validación con muestras independientes; 60% - 40%)
●Preparación de los datos
preparar tabla → crear shapefile → obtener variables → separar submuestras
● Crear un modelo de regresión múltiple
Importar datos a R → crear y aplicar un modelo → selección del mejor modelo
(r2) → Aplicar el mejor modelo en SAGA
●Interpolación de residuales
Muestrear el MRM → calcular los residuos → interpolación de residuales →
suma de (residuales + MRM)
Benito M. Zaragozí © Abril-2011
●Validación cruzada o con muestras independientes
Calcular RMSE para los valores calculados con el modelo.
24. Modelización de datos climáticos con SIG
Algunas referencias (para empezar):
●Smith, Michael J De, Michael F. Goodchild, and Paul A. Longley. Geospatial
Analysis: A Comprehensive Guide to Principles, Techniques and Software
Tools. Third. Leicester: Troubador Publishing Ltd, 2009.
http://www.spatialanalysisonline.com/ga_book.html.
●Ninyerola, Miquel, Xavier Pons, and Joan M Roure. Atlas Climático Digital de la
Península Ibérica. Metodología y aplicaciones en bioclimatología y geobotánica.
1st ed. Cerdanyola del Vallès: Universidad Autónoma de Barcelona, Bellaterra,
2005.
● Ninyerola, M., X. Pons, and J.M. Roure. “A methodological approach of
climatological modelling of temperature and precipitation through GIS techniques.”
International Journal of Climatology 20 (2000).
Benito M. Zaragozí © Abril-2011
● Vicente-Serrano, Sm, Ma Saz-Sánchez, and Jm Cuadrat. “Comparative analysis of
interpolation methods in the middle Ebro Valley (Spain): application to annual
precipitation and temperature.” Climate Research 24 (2003): 161-180.
http://www.int-res.com/abstracts/cr/v24/n2/p161-180/.
●Vicente-serrano, Sergio M, S Lanjeri, and Juan I. López-Moreno. “Comparison of
different procedures to map reference evapotranspiration using geographical
information systems and regression-based techniques.” INTERNATIONAL
JOURNAL OF CLIMATOLOGY 27 (2007): 1103-1118.