SlideShare una empresa de Scribd logo
1 de 22
Descargar para leer sin conexión
1
Intro a Spatial Data Science con
R
Alí Santacruz
amsantac.co
JULIO 2016
2
Acerca de mí
• Geomático con background ambiental
• R geek
• Candidato a PhD en Geografía
• Interesado en Spatial Data Science
• Autor de paquetes de R (disponibles en CRAN)
3
Objetivo de esta charla
• Discutir qué es Spatial Data Science
• Presentar de manera introductoria cómo realizar Spatial Data Science
con R
4
Qué es Spatial Data Science?
Spatial Data Scientist (n.):
Estadístico Experto SIG/RSDesarrollador
SIG
Ingeniero de
software
Spatial Data
Scientist
Spatial Data Science
Data Science
Spatial
Persona que es mejor en análisis de datos espaciales que un desarrollador
SIG y mejor en ingeniería de software que un experto SIG/RS
5
Spatial Data Science
Se combinan para el análisis de
datos con el fin de …
Apoyar una mejor toma de
decisiones
"The key word in data science is not data; it is science"
Jeff Leek. Coursera.
6
Spatial
Data
Scientist
Adaptado de
gettingsmart.com
7
Habilidades computacionales
• Programación: Python y R (entre otros)
http://www.kdnuggets.com/2016/06/r-python-top-analytics-data-mining-data-science-software.html
8
Por qué usar R?
• Libre, de código abierto y gratuito
• Un conjunto de paquetes (> 8600) comprehensivo
• Acceso a los datos
• Data cleaning
• Análisis
• Visualización y creación de reportes
• Excelentes ambientes de desarrollo – RStudio IDE
• Una comunidad activa y amigable de desarrolladores
• Una extensa comunidad de usuarios: > 2 millones
9
Por qué usar R para análisis espacial
• 160+ paquetes en CRAN Task View: Analysis of Spatial Data
• Clases para datos espaciales (y espacio-temporales)
• Importación y exportación de datos
• Análisis exploratorio de datos espaciales
• Soporte para operaciones en vector y raster
• Estadística espacial
• Visualización en gráficos estáticos o interactivos (web)
• Integración con software SIG
• Integración con técnicas de análisis de paquetes ‘no-espaciales’ usualmente
sencilla
10
Clases de R para datos espaciales
• Antes de 2003:
• Varios paquetes para datos espaciales con diferentes supuestos sobre cómo los
datos espaciales estaban organizados
• En 2003:
• Paquete ‘sp’: extiende R con clases y métodos para datos espaciales (vector y
raster)
• En 2010:
• Paquete ‘raster’: maneja datos raster almacenados en disco demasiado grandes
como para ser cargados en la memoria (RAM)
11
Clases de R para datos espaciales
SpatialPointsDataFrame SpatialLinesDataFrame SpatialPolygonsDataFrame
SpatialPixelsDataFrame
SpatialGridDataFrame
Paquete sp
RasterLayer
RasterStack
RasterBrick
Paquete raster (preferido)
12
The Data
Science
Process
Adaptado de science2knowledge
Reproducibility
13
MODELAR
los datos
MODELAR
los datos
EXPLORAR
los datos
EXPLORAR
los datos
PREPARAR
los datos
PREPARAR
los datos
• Es esto A o B o C? :: clasificación
• Es esto extraño? :: detección de anomalías
• Cuánto/qué tanto? :: regresión
• Cómo está organizado? :: clustering
• Cómo cambiará? :: predicción
"The key word in data science is not data; it is science"
Jeff Leek. Coursera.
OBTENER
los datos
OBTENER
los datos
Domain expertise
PLANTEAR la
pregunta correcta
PLANTEAR la
pregunta correcta
PLANTEAR la
pregunta correcta
COMUNICAR
los resultados
COMUNICAR
resultados
14
• Importar capas vector: paquetes rgdal, raster
• Importar capas raster: paquete raster
• Obtener datos georreferenciados mediante APIs: paquete twitteR, ver ejemplo
• Descargar imágenes satelitales/información geográfica: paquete raster, modis,
MODISTools
MODELAR
los datos
MODELAR
los datos
EXPLORAR
los datos
EXPLORAR
los datos
PREPARAR
los datos
PREPARAR
los datos
OBTENER
los datos
PLANTEAR la
pregunta correcta
PLANTEAR la
pregunta correcta
PLANTEAR la
pregunta correcta
COMUNICAR
los resultados
COMUNICAR
resultados
Para esta diapositiva y las siguientes ver el
código y ejemplos en esta página
15
• Data cleaning, subset, etc.
• Manipular datos con “verbos” del paquete dplyr y otros del Hadley-verse
• Subset espacial (paquetes sp, raster)
• Operaciones en vector:
• Operaciones en tabla de atributos (paquete sp)
• Superposición: unión, intersección, clip, extracción de valores de raster en
puntos (paquetes raster, rgeos)
• Dissolve (paquetes sp, rgeos), buffer (paquete rgeos)
• Rasterización (paquete raster)
• Operaciones en raster:
• Álgebra de mapas, filtros espaciales, remuestreo, … (paquete raster)
• Vectorización (paquetes rgdal, raster)
MODELAR
los datos
MODELAR
los datos
EXPLORAR
los datos
EXPLORAR
los datos
PREPARAR
los datos
OBTENER
los datos
OBTENER
los datos
PLANTEAR la
pregunta correcta
PLANTEAR la
pregunta correcta
PLANTEAR la
pregunta correcta
COMUNICAR
los resultados
COMUNICAR
resultados
Para diapositivas 14 a 18 ver el código y
ejemplos en esta página
16
MODELAR
los datos
MODELAR
los datos
EXPLORAR
los datos
PREPARAR
los datos
PREPARAR
los datos
OBTENER
los datos
OBTENER
los datos
PLANTEAR la
pregunta correcta
PLANTEAR la
pregunta correcta
PLANTEAR la
pregunta correcta
COMUNICAR
los resultados
COMUNICAR
resultados
Para diapositivas 14 a 18 ver el código y
ejemplos en esta página
• Estadísticos descriptivos: medidas de tendencia central y de dispersión
• Gráficos exploratorios (2D y 3D): scatterplot, boxplot, histograma, …
• Autocorrelación espacial:
• Medidas globales de autocorrelación espacial: I de Moran, C de Geary, G(d) de
Getis y Ord (paquete spdep)
• Medidas locales de autocorrelación espacial: estadístico local Ii de Moran, Gi y
Gi*(d) de Getis y Ord (paquete spdep)
17
MODELAR
los datos
EXPLORAR
los datos
EXPLORAR
los datos
PREPARAR
los datos
PREPARAR
los datos
OBTENER
los datos
OBTENER
los datos
PLANTEAR la
pregunta correcta
PLANTEAR la
pregunta correcta
PLANTEAR la
pregunta correcta
COMUNICAR
los resultados
COMUNICAR
resultados
Para diapositivas 14 a 18 ver el código y
ejemplos en esta página
• Regresión:
• Modelos espaciales autoregresivos (paquete spdep)
• Regresión ponderada geográficamente (paquete spgwr)
• Clasificación (Machine Learning):
• Supervisada: RandomForests, SVM, boosting, … (paquete caret)
• No supervisada: k-means clustering (paquete stats)
• Estadística espacial:
• Geoestadística (paquetes gstat, geoR, geospt, …)
• Patrones de puntos espaciales (paquete spatstat)
18
MODELAR
los datos
MODELAR
los datos
EXPLORAR
los datos
EXPLORAR
los datos
PREPARAR
los datos
PREPARAR
los datos
OBTENER
los datos
OBTENER
los datos
PLANTEAR la
pregunta correcta
PLANTEAR la
pregunta correcta
PLANTEAR la
pregunta correcta
COMUNICAR
los resultados
Para diapositivas 14 a 18 ver el código y
ejemplos en esta página
• Mapas temáticos estáticos o interactivos: paquetes tmap, leaflet, mapview
• Gráficos interactivos, aplicaciones web y dashboards:
• paquetes plotly (ejemplo), rcharts, googleVis (ejemplo)
• paquete shiny, ver ejemplo
• paquete flexdashboard, ver ejemplo
19
No olvides: Reproducibilidad!
• El código de R y los resultados de ejemplos presentados (diapositivas 17-
21) pueden ser reproducidos a partir de este documento .Rmd usando
RMarkdown
• Mira este ejemplo sobre análisis espaciales reproducibles usando
notebooks interactivos
• Conoce más sobre reproducibilidad en análisis geoespaciales
20
Integración de R con software SIG
• QGIS: ver ejemplo en este post
• ArcGIS: paquete arcgisbinding, ver ejemplo en este post
• GRASS GIS: versión 6, paquete spgrass6; versión 7, paquete rgrass7
• gvSIG: más info en este post
• SAGA: paquete RSAGA
• GME (Geospatial Modelling Environment): más info en esta página
21
Referencias / Dónde aprender más
• Bivand, R., Pebesma, E., Gómez-Rubio, V. 2013. Applied Spatial Data
Analysis with R. New York: Springer. 2nd ed.
• R-SIG-Geo mailing list
• CRAN Task View: Analysis of Spatial Data
• Grupos en Facebook: GIS with R, R project en Español
• Grupos en G+: Statistics and R, R Programming for Data Analysis
• Mi blog: amsantac.co/es/blog.html
Si tienes alguna pregunta puedes contactarme en:
amsantac.co/es/contact.html
Gracias!

Más contenido relacionado

Similar a Spatial Data Science con R

Tipos de archivos para datos geográficos
Tipos de archivos para datos geográficosTipos de archivos para datos geográficos
Tipos de archivos para datos geográficosLuis Alan Navarro
 
Introducción a la Creación de Mapas de Potencial Geotérmico Mediante el Métod...
Introducción a la Creación de Mapas de Potencial Geotérmico Mediante el Métod...Introducción a la Creación de Mapas de Potencial Geotérmico Mediante el Métod...
Introducción a la Creación de Mapas de Potencial Geotérmico Mediante el Métod...Carlos Gabriel Asato
 
R Services con SQL Server
R Services con SQL ServerR Services con SQL Server
R Services con SQL ServerdbLearner
 
Charla "GeoPython" Grupo Python Córdoba
Charla "GeoPython" Grupo Python CórdobaCharla "GeoPython" Grupo Python Córdoba
Charla "GeoPython" Grupo Python CórdobaPatricio Soriano Castro
 
Python gis mapping
Python gis mappingPython gis mapping
Python gis mappingkikocorreoso
 
Análisis de datos con R - Techcivica
Análisis de datos con R - TechcivicaAnálisis de datos con R - Techcivica
Análisis de datos con R - TechcivicaSocialTIC
 
Thematic_Maps_ArcGIS_I.pdf
Thematic_Maps_ArcGIS_I.pdfThematic_Maps_ArcGIS_I.pdf
Thematic_Maps_ArcGIS_I.pdfLuiscondori80
 
Introducción al procesamiento del Big Data
Introducción al procesamiento del Big DataIntroducción al procesamiento del Big Data
Introducción al procesamiento del Big DataTomás Fernández Pena
 
Análisis científico en ArcGIS
Análisis científico en ArcGISAnálisis científico en ArcGIS
Análisis científico en ArcGISEsri España
 
Drupal & GIS: Convirtiendo Drupal en un GeoCMS
Drupal & GIS: Convirtiendo Drupal en un GeoCMSDrupal & GIS: Convirtiendo Drupal en un GeoCMS
Drupal & GIS: Convirtiendo Drupal en un GeoCMSPablo López Escobés
 
Comparación e implementación de liberías webmapping como herramienta de visua...
Comparación e implementación de liberías webmapping como herramienta de visua...Comparación e implementación de liberías webmapping como herramienta de visua...
Comparación e implementación de liberías webmapping como herramienta de visua...Golgi Alvarez
 
Taller: Tableau Public (Semana 3)
Taller: Tableau Public (Semana 3)Taller: Tableau Public (Semana 3)
Taller: Tableau Public (Semana 3)Francisco Pesante
 
Tableau Public: Herramienta para la visualización de datos 3
 Tableau Public: Herramienta para la visualización de datos 3 Tableau Public: Herramienta para la visualización de datos 3
Tableau Public: Herramienta para la visualización de datos 3Francisco Pesante
 

Similar a Spatial Data Science con R (20)

Practica 4
Practica 4Practica 4
Practica 4
 
Tipos de archivos para datos geográficos
Tipos de archivos para datos geográficosTipos de archivos para datos geográficos
Tipos de archivos para datos geográficos
 
Introducción a la Creación de Mapas de Potencial Geotérmico Mediante el Métod...
Introducción a la Creación de Mapas de Potencial Geotérmico Mediante el Métod...Introducción a la Creación de Mapas de Potencial Geotérmico Mediante el Métod...
Introducción a la Creación de Mapas de Potencial Geotérmico Mediante el Métod...
 
Sistemas silvia florez
Sistemas silvia florezSistemas silvia florez
Sistemas silvia florez
 
BigData y MapReduce
BigData y MapReduceBigData y MapReduce
BigData y MapReduce
 
R Services con SQL Server
R Services con SQL ServerR Services con SQL Server
R Services con SQL Server
 
ArcGIS_Nivel1.pdf
ArcGIS_Nivel1.pdfArcGIS_Nivel1.pdf
ArcGIS_Nivel1.pdf
 
Exposición spring
Exposición springExposición spring
Exposición spring
 
Charla "GeoPython" Grupo Python Córdoba
Charla "GeoPython" Grupo Python CórdobaCharla "GeoPython" Grupo Python Córdoba
Charla "GeoPython" Grupo Python Córdoba
 
Python gis mapping
Python gis mappingPython gis mapping
Python gis mapping
 
Mariana corzo
Mariana corzoMariana corzo
Mariana corzo
 
Análisis de datos con R - Techcivica
Análisis de datos con R - TechcivicaAnálisis de datos con R - Techcivica
Análisis de datos con R - Techcivica
 
Thematic_Maps_ArcGIS_I.pdf
Thematic_Maps_ArcGIS_I.pdfThematic_Maps_ArcGIS_I.pdf
Thematic_Maps_ArcGIS_I.pdf
 
Introducción al procesamiento del Big Data
Introducción al procesamiento del Big DataIntroducción al procesamiento del Big Data
Introducción al procesamiento del Big Data
 
Análisis científico en ArcGIS
Análisis científico en ArcGISAnálisis científico en ArcGIS
Análisis científico en ArcGIS
 
Drupal & GIS: Convirtiendo Drupal en un GeoCMS
Drupal & GIS: Convirtiendo Drupal en un GeoCMSDrupal & GIS: Convirtiendo Drupal en un GeoCMS
Drupal & GIS: Convirtiendo Drupal en un GeoCMS
 
Comparación e implementación de liberías webmapping como herramienta de visua...
Comparación e implementación de liberías webmapping como herramienta de visua...Comparación e implementación de liberías webmapping como herramienta de visua...
Comparación e implementación de liberías webmapping como herramienta de visua...
 
Taller: Tableau Public (Semana 3)
Taller: Tableau Public (Semana 3)Taller: Tableau Public (Semana 3)
Taller: Tableau Public (Semana 3)
 
Tableau Public: Herramienta para la visualización de datos 3
 Tableau Public: Herramienta para la visualización de datos 3 Tableau Public: Herramienta para la visualización de datos 3
Tableau Public: Herramienta para la visualización de datos 3
 
Sig
SigSig
Sig
 

Último

Biografías y Cuadro compartivo_Cuautle Ocelotl Angel Efren.pdf.pdf
Biografías y Cuadro compartivo_Cuautle Ocelotl Angel Efren.pdf.pdfBiografías y Cuadro compartivo_Cuautle Ocelotl Angel Efren.pdf.pdf
Biografías y Cuadro compartivo_Cuautle Ocelotl Angel Efren.pdf.pdfANGELEFRENCUAUTLEOCE
 
Partes y elementos de una iglesia básicos
Partes y elementos de una iglesia básicosPartes y elementos de una iglesia básicos
Partes y elementos de una iglesia básicosMarycarmenNuez4
 
Ivu- taller de diseño arquitectonico l , adicion y sustraccion de cubos,
Ivu- taller de diseño arquitectonico l , adicion y sustraccion de cubos,Ivu- taller de diseño arquitectonico l , adicion y sustraccion de cubos,
Ivu- taller de diseño arquitectonico l , adicion y sustraccion de cubos,juberrodasflores
 
REPORTE-HEMEROGRÁFICO-MARZO-2024-IRAPUATO-¿CÓMO VAMOS?.pdf
REPORTE-HEMEROGRÁFICO-MARZO-2024-IRAPUATO-¿CÓMO VAMOS?.pdfREPORTE-HEMEROGRÁFICO-MARZO-2024-IRAPUATO-¿CÓMO VAMOS?.pdf
REPORTE-HEMEROGRÁFICO-MARZO-2024-IRAPUATO-¿CÓMO VAMOS?.pdfIrapuatoCmovamos
 
PANTEÓN DE Paris en historia de la arquitectura
PANTEÓN DE Paris en historia de la arquitecturaPANTEÓN DE Paris en historia de la arquitectura
PANTEÓN DE Paris en historia de la arquitecturaRosaHurtado26
 
2 PROCESO ESTADISTICO PARA LA INVESTIGACION.pdf
2 PROCESO ESTADISTICO PARA LA INVESTIGACION.pdf2 PROCESO ESTADISTICO PARA LA INVESTIGACION.pdf
2 PROCESO ESTADISTICO PARA LA INVESTIGACION.pdfAnaBelindaArmellonHi
 
Posiciones del IDH a nivel global en México (1982-2024).pdf
Posiciones del IDH a nivel global en México (1982-2024).pdfPosiciones del IDH a nivel global en México (1982-2024).pdf
Posiciones del IDH a nivel global en México (1982-2024).pdfJC Díaz Herrera
 
Las marcas automotrices con más ventas de vehículos (2024).pdf
Las marcas automotrices con más ventas de vehículos (2024).pdfLas marcas automotrices con más ventas de vehículos (2024).pdf
Las marcas automotrices con más ventas de vehículos (2024).pdfJC Díaz Herrera
 
Los artistas mexicanos con más ventas de discos en la historia (2024).pdf
Los artistas mexicanos con más ventas de discos en la historia (2024).pdfLos artistas mexicanos con más ventas de discos en la historia (2024).pdf
Los artistas mexicanos con más ventas de discos en la historia (2024).pdfJC Díaz Herrera
 
Posiciones de México en el PNB PPA per cápita (1982-2024).pdf
Posiciones de México en el PNB PPA per cápita (1982-2024).pdfPosiciones de México en el PNB PPA per cápita (1982-2024).pdf
Posiciones de México en el PNB PPA per cápita (1982-2024).pdfJC Díaz Herrera
 
Posiciones en el IDH global de EUA (1950-2024).pdf
Posiciones en el IDH global de EUA (1950-2024).pdfPosiciones en el IDH global de EUA (1950-2024).pdf
Posiciones en el IDH global de EUA (1950-2024).pdfJC Díaz Herrera
 
Familias sionistas dentro de los 10 clanes familiares más ricos por regiones ...
Familias sionistas dentro de los 10 clanes familiares más ricos por regiones ...Familias sionistas dentro de los 10 clanes familiares más ricos por regiones ...
Familias sionistas dentro de los 10 clanes familiares más ricos por regiones ...JC Díaz Herrera
 
La importancia de las pruebas de producto para tu empresa
La importancia de las pruebas de producto para tu empresaLa importancia de las pruebas de producto para tu empresa
La importancia de las pruebas de producto para tu empresamerca6
 
Técnica palatina baja, anestesiología dental
Técnica palatina baja, anestesiología dentalTécnica palatina baja, anestesiología dental
Técnica palatina baja, anestesiología dentalIngrid459352
 
Análisis de datos en acción: Optimizando el crecimiento de Cyclistic
Análisis de datos en acción: Optimizando el crecimiento de CyclisticAnálisis de datos en acción: Optimizando el crecimiento de Cyclistic
Análisis de datos en acción: Optimizando el crecimiento de CyclisticJamithGarcia1
 
REPORTE DE INCIDENCIA DELICTIVA MARZO 2024.pdf
REPORTE DE INCIDENCIA DELICTIVA MARZO 2024.pdfREPORTE DE INCIDENCIA DELICTIVA MARZO 2024.pdf
REPORTE DE INCIDENCIA DELICTIVA MARZO 2024.pdfIrapuatoCmovamos
 
Los más ricos administradores de fondo de cobertura (1968-2024).pdf
Los más ricos administradores de fondo de cobertura (1968-2024).pdfLos más ricos administradores de fondo de cobertura (1968-2024).pdf
Los más ricos administradores de fondo de cobertura (1968-2024).pdfJC Díaz Herrera
 
Cuáles son las características biológicas que están marcadas en tu individual...
Cuáles son las características biológicas que están marcadas en tu individual...Cuáles son las características biológicas que están marcadas en tu individual...
Cuáles son las características biológicas que están marcadas en tu individual...israel garcia
 
AA CUADRO DE TEORIA DEL CASO. (1) (1).docx
AA CUADRO DE TEORIA DEL CASO. (1) (1).docxAA CUADRO DE TEORIA DEL CASO. (1) (1).docx
AA CUADRO DE TEORIA DEL CASO. (1) (1).docxLuisAngelYomonaYomon
 
Unidad 3 Elementos y compuestos. Física y química
Unidad 3 Elementos y compuestos. Física y químicaUnidad 3 Elementos y compuestos. Física y química
Unidad 3 Elementos y compuestos. Física y químicaSilvia García
 

Último (20)

Biografías y Cuadro compartivo_Cuautle Ocelotl Angel Efren.pdf.pdf
Biografías y Cuadro compartivo_Cuautle Ocelotl Angel Efren.pdf.pdfBiografías y Cuadro compartivo_Cuautle Ocelotl Angel Efren.pdf.pdf
Biografías y Cuadro compartivo_Cuautle Ocelotl Angel Efren.pdf.pdf
 
Partes y elementos de una iglesia básicos
Partes y elementos de una iglesia básicosPartes y elementos de una iglesia básicos
Partes y elementos de una iglesia básicos
 
Ivu- taller de diseño arquitectonico l , adicion y sustraccion de cubos,
Ivu- taller de diseño arquitectonico l , adicion y sustraccion de cubos,Ivu- taller de diseño arquitectonico l , adicion y sustraccion de cubos,
Ivu- taller de diseño arquitectonico l , adicion y sustraccion de cubos,
 
REPORTE-HEMEROGRÁFICO-MARZO-2024-IRAPUATO-¿CÓMO VAMOS?.pdf
REPORTE-HEMEROGRÁFICO-MARZO-2024-IRAPUATO-¿CÓMO VAMOS?.pdfREPORTE-HEMEROGRÁFICO-MARZO-2024-IRAPUATO-¿CÓMO VAMOS?.pdf
REPORTE-HEMEROGRÁFICO-MARZO-2024-IRAPUATO-¿CÓMO VAMOS?.pdf
 
PANTEÓN DE Paris en historia de la arquitectura
PANTEÓN DE Paris en historia de la arquitecturaPANTEÓN DE Paris en historia de la arquitectura
PANTEÓN DE Paris en historia de la arquitectura
 
2 PROCESO ESTADISTICO PARA LA INVESTIGACION.pdf
2 PROCESO ESTADISTICO PARA LA INVESTIGACION.pdf2 PROCESO ESTADISTICO PARA LA INVESTIGACION.pdf
2 PROCESO ESTADISTICO PARA LA INVESTIGACION.pdf
 
Posiciones del IDH a nivel global en México (1982-2024).pdf
Posiciones del IDH a nivel global en México (1982-2024).pdfPosiciones del IDH a nivel global en México (1982-2024).pdf
Posiciones del IDH a nivel global en México (1982-2024).pdf
 
Las marcas automotrices con más ventas de vehículos (2024).pdf
Las marcas automotrices con más ventas de vehículos (2024).pdfLas marcas automotrices con más ventas de vehículos (2024).pdf
Las marcas automotrices con más ventas de vehículos (2024).pdf
 
Los artistas mexicanos con más ventas de discos en la historia (2024).pdf
Los artistas mexicanos con más ventas de discos en la historia (2024).pdfLos artistas mexicanos con más ventas de discos en la historia (2024).pdf
Los artistas mexicanos con más ventas de discos en la historia (2024).pdf
 
Posiciones de México en el PNB PPA per cápita (1982-2024).pdf
Posiciones de México en el PNB PPA per cápita (1982-2024).pdfPosiciones de México en el PNB PPA per cápita (1982-2024).pdf
Posiciones de México en el PNB PPA per cápita (1982-2024).pdf
 
Posiciones en el IDH global de EUA (1950-2024).pdf
Posiciones en el IDH global de EUA (1950-2024).pdfPosiciones en el IDH global de EUA (1950-2024).pdf
Posiciones en el IDH global de EUA (1950-2024).pdf
 
Familias sionistas dentro de los 10 clanes familiares más ricos por regiones ...
Familias sionistas dentro de los 10 clanes familiares más ricos por regiones ...Familias sionistas dentro de los 10 clanes familiares más ricos por regiones ...
Familias sionistas dentro de los 10 clanes familiares más ricos por regiones ...
 
La importancia de las pruebas de producto para tu empresa
La importancia de las pruebas de producto para tu empresaLa importancia de las pruebas de producto para tu empresa
La importancia de las pruebas de producto para tu empresa
 
Técnica palatina baja, anestesiología dental
Técnica palatina baja, anestesiología dentalTécnica palatina baja, anestesiología dental
Técnica palatina baja, anestesiología dental
 
Análisis de datos en acción: Optimizando el crecimiento de Cyclistic
Análisis de datos en acción: Optimizando el crecimiento de CyclisticAnálisis de datos en acción: Optimizando el crecimiento de Cyclistic
Análisis de datos en acción: Optimizando el crecimiento de Cyclistic
 
REPORTE DE INCIDENCIA DELICTIVA MARZO 2024.pdf
REPORTE DE INCIDENCIA DELICTIVA MARZO 2024.pdfREPORTE DE INCIDENCIA DELICTIVA MARZO 2024.pdf
REPORTE DE INCIDENCIA DELICTIVA MARZO 2024.pdf
 
Los más ricos administradores de fondo de cobertura (1968-2024).pdf
Los más ricos administradores de fondo de cobertura (1968-2024).pdfLos más ricos administradores de fondo de cobertura (1968-2024).pdf
Los más ricos administradores de fondo de cobertura (1968-2024).pdf
 
Cuáles son las características biológicas que están marcadas en tu individual...
Cuáles son las características biológicas que están marcadas en tu individual...Cuáles son las características biológicas que están marcadas en tu individual...
Cuáles son las características biológicas que están marcadas en tu individual...
 
AA CUADRO DE TEORIA DEL CASO. (1) (1).docx
AA CUADRO DE TEORIA DEL CASO. (1) (1).docxAA CUADRO DE TEORIA DEL CASO. (1) (1).docx
AA CUADRO DE TEORIA DEL CASO. (1) (1).docx
 
Unidad 3 Elementos y compuestos. Física y química
Unidad 3 Elementos y compuestos. Física y químicaUnidad 3 Elementos y compuestos. Física y química
Unidad 3 Elementos y compuestos. Física y química
 

Spatial Data Science con R

  • 1. 1 Intro a Spatial Data Science con R Alí Santacruz amsantac.co JULIO 2016
  • 2. 2 Acerca de mí • Geomático con background ambiental • R geek • Candidato a PhD en Geografía • Interesado en Spatial Data Science • Autor de paquetes de R (disponibles en CRAN)
  • 3. 3 Objetivo de esta charla • Discutir qué es Spatial Data Science • Presentar de manera introductoria cómo realizar Spatial Data Science con R
  • 4. 4 Qué es Spatial Data Science? Spatial Data Scientist (n.): Estadístico Experto SIG/RSDesarrollador SIG Ingeniero de software Spatial Data Scientist Spatial Data Science Data Science Spatial Persona que es mejor en análisis de datos espaciales que un desarrollador SIG y mejor en ingeniería de software que un experto SIG/RS
  • 5. 5 Spatial Data Science Se combinan para el análisis de datos con el fin de … Apoyar una mejor toma de decisiones "The key word in data science is not data; it is science" Jeff Leek. Coursera.
  • 7. 7 Habilidades computacionales • Programación: Python y R (entre otros) http://www.kdnuggets.com/2016/06/r-python-top-analytics-data-mining-data-science-software.html
  • 8. 8 Por qué usar R? • Libre, de código abierto y gratuito • Un conjunto de paquetes (> 8600) comprehensivo • Acceso a los datos • Data cleaning • Análisis • Visualización y creación de reportes • Excelentes ambientes de desarrollo – RStudio IDE • Una comunidad activa y amigable de desarrolladores • Una extensa comunidad de usuarios: > 2 millones
  • 9. 9 Por qué usar R para análisis espacial • 160+ paquetes en CRAN Task View: Analysis of Spatial Data • Clases para datos espaciales (y espacio-temporales) • Importación y exportación de datos • Análisis exploratorio de datos espaciales • Soporte para operaciones en vector y raster • Estadística espacial • Visualización en gráficos estáticos o interactivos (web) • Integración con software SIG • Integración con técnicas de análisis de paquetes ‘no-espaciales’ usualmente sencilla
  • 10. 10 Clases de R para datos espaciales • Antes de 2003: • Varios paquetes para datos espaciales con diferentes supuestos sobre cómo los datos espaciales estaban organizados • En 2003: • Paquete ‘sp’: extiende R con clases y métodos para datos espaciales (vector y raster) • En 2010: • Paquete ‘raster’: maneja datos raster almacenados en disco demasiado grandes como para ser cargados en la memoria (RAM)
  • 11. 11 Clases de R para datos espaciales SpatialPointsDataFrame SpatialLinesDataFrame SpatialPolygonsDataFrame SpatialPixelsDataFrame SpatialGridDataFrame Paquete sp RasterLayer RasterStack RasterBrick Paquete raster (preferido)
  • 12. 12 The Data Science Process Adaptado de science2knowledge Reproducibility
  • 13. 13 MODELAR los datos MODELAR los datos EXPLORAR los datos EXPLORAR los datos PREPARAR los datos PREPARAR los datos • Es esto A o B o C? :: clasificación • Es esto extraño? :: detección de anomalías • Cuánto/qué tanto? :: regresión • Cómo está organizado? :: clustering • Cómo cambiará? :: predicción "The key word in data science is not data; it is science" Jeff Leek. Coursera. OBTENER los datos OBTENER los datos Domain expertise PLANTEAR la pregunta correcta PLANTEAR la pregunta correcta PLANTEAR la pregunta correcta COMUNICAR los resultados COMUNICAR resultados
  • 14. 14 • Importar capas vector: paquetes rgdal, raster • Importar capas raster: paquete raster • Obtener datos georreferenciados mediante APIs: paquete twitteR, ver ejemplo • Descargar imágenes satelitales/información geográfica: paquete raster, modis, MODISTools MODELAR los datos MODELAR los datos EXPLORAR los datos EXPLORAR los datos PREPARAR los datos PREPARAR los datos OBTENER los datos PLANTEAR la pregunta correcta PLANTEAR la pregunta correcta PLANTEAR la pregunta correcta COMUNICAR los resultados COMUNICAR resultados Para esta diapositiva y las siguientes ver el código y ejemplos en esta página
  • 15. 15 • Data cleaning, subset, etc. • Manipular datos con “verbos” del paquete dplyr y otros del Hadley-verse • Subset espacial (paquetes sp, raster) • Operaciones en vector: • Operaciones en tabla de atributos (paquete sp) • Superposición: unión, intersección, clip, extracción de valores de raster en puntos (paquetes raster, rgeos) • Dissolve (paquetes sp, rgeos), buffer (paquete rgeos) • Rasterización (paquete raster) • Operaciones en raster: • Álgebra de mapas, filtros espaciales, remuestreo, … (paquete raster) • Vectorización (paquetes rgdal, raster) MODELAR los datos MODELAR los datos EXPLORAR los datos EXPLORAR los datos PREPARAR los datos OBTENER los datos OBTENER los datos PLANTEAR la pregunta correcta PLANTEAR la pregunta correcta PLANTEAR la pregunta correcta COMUNICAR los resultados COMUNICAR resultados Para diapositivas 14 a 18 ver el código y ejemplos en esta página
  • 16. 16 MODELAR los datos MODELAR los datos EXPLORAR los datos PREPARAR los datos PREPARAR los datos OBTENER los datos OBTENER los datos PLANTEAR la pregunta correcta PLANTEAR la pregunta correcta PLANTEAR la pregunta correcta COMUNICAR los resultados COMUNICAR resultados Para diapositivas 14 a 18 ver el código y ejemplos en esta página • Estadísticos descriptivos: medidas de tendencia central y de dispersión • Gráficos exploratorios (2D y 3D): scatterplot, boxplot, histograma, … • Autocorrelación espacial: • Medidas globales de autocorrelación espacial: I de Moran, C de Geary, G(d) de Getis y Ord (paquete spdep) • Medidas locales de autocorrelación espacial: estadístico local Ii de Moran, Gi y Gi*(d) de Getis y Ord (paquete spdep)
  • 17. 17 MODELAR los datos EXPLORAR los datos EXPLORAR los datos PREPARAR los datos PREPARAR los datos OBTENER los datos OBTENER los datos PLANTEAR la pregunta correcta PLANTEAR la pregunta correcta PLANTEAR la pregunta correcta COMUNICAR los resultados COMUNICAR resultados Para diapositivas 14 a 18 ver el código y ejemplos en esta página • Regresión: • Modelos espaciales autoregresivos (paquete spdep) • Regresión ponderada geográficamente (paquete spgwr) • Clasificación (Machine Learning): • Supervisada: RandomForests, SVM, boosting, … (paquete caret) • No supervisada: k-means clustering (paquete stats) • Estadística espacial: • Geoestadística (paquetes gstat, geoR, geospt, …) • Patrones de puntos espaciales (paquete spatstat)
  • 18. 18 MODELAR los datos MODELAR los datos EXPLORAR los datos EXPLORAR los datos PREPARAR los datos PREPARAR los datos OBTENER los datos OBTENER los datos PLANTEAR la pregunta correcta PLANTEAR la pregunta correcta PLANTEAR la pregunta correcta COMUNICAR los resultados Para diapositivas 14 a 18 ver el código y ejemplos en esta página • Mapas temáticos estáticos o interactivos: paquetes tmap, leaflet, mapview • Gráficos interactivos, aplicaciones web y dashboards: • paquetes plotly (ejemplo), rcharts, googleVis (ejemplo) • paquete shiny, ver ejemplo • paquete flexdashboard, ver ejemplo
  • 19. 19 No olvides: Reproducibilidad! • El código de R y los resultados de ejemplos presentados (diapositivas 17- 21) pueden ser reproducidos a partir de este documento .Rmd usando RMarkdown • Mira este ejemplo sobre análisis espaciales reproducibles usando notebooks interactivos • Conoce más sobre reproducibilidad en análisis geoespaciales
  • 20. 20 Integración de R con software SIG • QGIS: ver ejemplo en este post • ArcGIS: paquete arcgisbinding, ver ejemplo en este post • GRASS GIS: versión 6, paquete spgrass6; versión 7, paquete rgrass7 • gvSIG: más info en este post • SAGA: paquete RSAGA • GME (Geospatial Modelling Environment): más info en esta página
  • 21. 21 Referencias / Dónde aprender más • Bivand, R., Pebesma, E., Gómez-Rubio, V. 2013. Applied Spatial Data Analysis with R. New York: Springer. 2nd ed. • R-SIG-Geo mailing list • CRAN Task View: Analysis of Spatial Data • Grupos en Facebook: GIS with R, R project en Español • Grupos en G+: Statistics and R, R Programming for Data Analysis • Mi blog: amsantac.co/es/blog.html
  • 22. Si tienes alguna pregunta puedes contactarme en: amsantac.co/es/contact.html Gracias!