SlideShare una empresa de Scribd logo
1 de 42
¿Qué hace la gente en Monterrey?
Foro: Data Science & Python MTY Join Meetup
Análisis de Datos de Twitter y Foursquare
Impartida por:
Agenda
1. Acerca de Nosotros
2. Objetivos de la sesión
3. Datos de Foursquare & Twitter ¿Cómo funcionan?
4. Análisis de Datos
1. Metodología
2. Extracción y procesamiento: Twitter → Python
3. Visualización: Python → Google Fusion Tables
5. Potencial de Uso – Caso de Monterrey
6. ¿Qué hacemos en Datlas?
Agenda
1. Acerca de Nosotros
2. Objetivos de la sesión
3. Datos de Foursquare & Twitter ¿Cómo funcionan?
4. Análisis de Datos
1. Metodología
2. Extracción y procesamiento: Twitter → Python
3. Visualización: Python → Google Fusion Tables
5. Potencial de Uso – Caso de Monterrey
6. ¿Qué hacemos en Datlas?
Acerca de Nosotros: Equipo Datlas
blogdatlas.
wordpress.com
Agenda
1. Acerca de Nosotros
2. Objetivos de la sesión
3. Datos de Foursquare & Twitter ¿Cómo funcionan?
4. Análisis de Datos
1. Metodología
2. Extracción y procesamiento: Twitter → Python
3. Visualización: Python → Google Fusion Tables
5. Potencial de Uso – Caso de Monterrey
6. ¿Qué hacemos en Datlas?
Objetivos de la sesión:
¿Qué hace la gente en Monterrey?
Queremos entender la dinámica
recreativa por medio de check-ins:
• ¿A qué lugares salen?
• ¿En qué horarios y qué días de la
semana salen?
• ¿Cuáles son sus lugares
favoritos?
• ¿Qué plaza comercial es la más
visitada?
• ¿Cuál es su cine favorito?
• Entre otros….
Agenda
1. Acerca de Nosotros
2. Objetivos de la sesión
3. Datos de Foursquare & Twitter ¿Cómo funcionan?
4. Análisis de Datos
1. Metodología
2. Extracción y procesamiento: Twitter → Python
3. Visualización: Python → Google Fusion Tables
5. Potencial de Uso – Caso de Monterrey
6. ¿Qué hacemos en Datlas?
Datos que hablan…
• Utilizamos los registros de & compartidos en
• ¿Cómo haces check-in?
• ¿Por qué hacer check-in? → Recomendaciones, calificas los lugares y
puedes ver donde están tus amigos.
Podemos interpretar la información de
checkins para entender la dinámica de una
ciudad
Agenda
1. Acerca de Nosotros
2. Objetivos de la sesión
3. Datos de Foursquare & Twitter ¿Cómo funcionan?
4. Análisis de Datos
1. Metodología
2. Extracción y procesamiento: Twitter → Python
3. Visualización: Python → Google Fusion Tables
5. Potencial de Uso – Caso de Monterrey
6. ¿Qué hacemos en Datlas?
Metodología
• Método: Analizamos información de check-ins compartida en Twitter
por usuarios de Nuevo León
• ¿Cómo? Utilizamos en Python la librería de “tweepy” que permite
autentificarte y extraer los tweets de una manera relativamente
sencilla
• Para el Análisis: Usamos tweets con check-ins geo referenciados en la
zona metropolitana de Monterrey
• Para Visualizar: Usamos Google Fusion Tables por su facilidad para
manejar grandes cantidades de datos en la nube, usar Google Maps
para hacer mapeo de puntos, además de ser muy intuitivo.
Agenda
1. Acerca de Nosotros
2. Objetivos de la sesión
3. Datos de Foursquare & Twitter ¿Cómo funcionan?
4. Análisis de Datos
1. Metodología
2. Extracción y procesamiento: Twitter → Python
3. Visualización: Python → Google Fusion Tables
5. Potencial de Uso – Caso de Monterrey
6. ¿Qué hacemos en Datlas?
Primeros pasos: Registrarse para API
Twitter
• Registrarse como Developer en el sitio de Twitter
Primeros pasos: Registrarse para API
Twitter
• Registrarse como Developer en el sitio de Twitter
• Con eso te dan una clave para usar su API y descargar Tweets
• Limitante: Sólo se pueden bajar los últimos 100 tweets por
llamada.
• Tip: Hacer un ciclo con un máximo de 450 llamadas cada 15
minutos.
¿Cómo es la estructura del Tweet? Pt.1
• La llamada a la API de twitter te regresa un JSON que se ve así…
¿Cómo es la estructura del Tweet? Pt.2
• La llamada a la API de twitter te regresa un JSON que se ve así…
¿Cómo es la estructura del Tweet? Pt.3
Pasos a Seguir: → Variables
• Hacemos una extracción y filtrado de las variables que nos interesan
• Ajustamos la zona horaria a la correspondiente a México
• Filtramos por location (eliminamos los tweets que no estén
georeferenciados)
• Quitamos caracteres, signos, links o fotos para una mejor lectura del
tweet
• Extraemos y damos formato a la fecha
• Limpiamos los nombres de los usuarios
Pasos a Seguir: Variables → Diccionario
• Se hace un “diccionario” en Python que contiene las variables de
interés del tweet
• Se renombran las variables
Pasos a Seguir: Diccionario →
• Se utiliza la librería pandas para manipular datos y conservar el
rango de fechas de nuestro interés. (de Lunes anterior al Domingo)
• Se utiliza la librería pandas para manipular datos y conservar el
rango de fechas de nuestro interés. (de Lunes anterior al Domingo)
• Se realiza la conversión a CSV, facilitado por la misma librería.
Pasos a Seguir: →
Pasos a Seguir: → Spreadsheet
• Hacemos una validación visual de que las columnas estén en orden.
Agenda
1. Acerca de Nosotros
2. Objetivos de la sesión
3. Datos de Foursquare & Twitter ¿Cómo funcionan?
4. Análisis de Datos
1. Metodología
2. Extracción y procesamiento: Twitter → Python
3. Visualización: Python → Google Fusion Tables
5. Potencial de Uso – Caso de Monterrey
6. ¿Qué hacemos en Datlas?
Pasos a Seguir: Spreadsheet → Visualización
• Creamos una Fusion Table seleccionando nuestro archivo CSV.
(En nuestro caso cargamos un nuevo archivo cada semana)
http://fusiontables.google.com
Pasos a Seguir: Spreadsheet → Visualización
• Fusion Tables detecta las columnas lat y long como geo referencia
para proponernos un mapa por default con la información
• Tomando esta referencia podemos tener un mapa como este…
Mapa de Tweets
También se pueden hacer otras personalizaciones como
una Categorización de Tweets por hora
Personalización de pop-ups
Resumen de estadísticas
Agenda
1. Acerca de Nosotros
2. Objetivos de la sesión
3. Datos de Foursquare & Twitter ¿Cómo funcionan?
4. Análisis de Datos
1. Metodología
2. Extracción y procesamiento: Twitter → Python
3. Visualización: Python → Google Fusion Tables
5. Potencial de Uso – Caso de Monterrey
6. ¿Qué hacemos en Datlas?
Nuestro ejemplo de Mapa para Monterrey:
Analizando por Mapas de Calor
Analizando por Mapas de Calor las
zonas más “calientes” en fin de semana
Aeropuerto Internac.
Parque Fundidora
Paseo La Fe
Esfera City Center
Nuevo Sur
Galerías Monterrey
Centrito Valle
Plaza Fiesta San Ag.
Galerías Valle Oriente
Tec de Monterrey
Barrio Antiguo
¿Qué días hubo más actividad?
• Los días con más actividad son los días después de la
quincena y los fines de semana. Tiene lógica, ¿no?
¿A qué horas incrementa la actividad?
• A partir de las 6 de la tarde hay un incremento en las visitas a
parques, estadios, restaurantes y al cine.
Resumen de Hallazgos
• ¿Qué actividades ocasionaron más tráfico?
• Más de 6,000 lugares que registraron check-ins,
encontramos como principales motivadores:
eventos deportivos y estrenos de cine
• En los 3 sábados de Julio:
• Partidos de fútbol 45-52% de los check-ins
• Peliculas de estreno
Hallazgos recientes
Y todo esto ¿Para qué?
• ¿Dónde pongo mi negocio o dónde me expando?
• ¿En qué zonas me puedo anunciar dado que hay más
tráfico de personas en fin de semana?
• ¿En qué lugares los clientes son más exigentes con
sus comentarios?
Este tipo de análisis es útil para comercios que quieren posicionarse con sus
consumidores, entender la dinámica diaria de su mercado meta, y responder
preguntas como:
Agenda
1. Acerca de Nosotros
2. Objetivos de la sesión
3. Datos de Foursquare & Twitter ¿Cómo funcionan?
4. Análisis de Datos
1. Metodología
2. Extracción y procesamiento: Twitter → Python
3. Visualización: Python → Google Fusion Tables
5. Potencial de Uso – Caso de Monterrey
6. ¿Qué hacemos en Datlas?
¿Qué es Datlas?
Link: http://www.thedatlas.com/
Invitación a DEMO y Taller en INCMTY
Suscríbanse para un DEMO y
si nos dan retro les mandaremos
Un archivo con una semana de tweets:
http://www.thedatlas.com/
Daremos un taller en INCMTY 2016
Título: “Datlas: tengo una idea ¿Dónde la pongo?”
Contacto:
contacto@thedatlas.com
Suscríbanse para demo gratis en:
www.thedatlas.com
Lean nuestro blog:
https://blogdatlas.wordpress.com/
Gracias por su tiempo

Más contenido relacionado

Similar a Datlas - BigData con Twitter - Qué hace la gente en Monterrey

Minería de datos (práctica twitter)
Minería de datos (práctica twitter)Minería de datos (práctica twitter)
Minería de datos (práctica twitter)Jio Nox
 
SocialBro: Cómo sacar el máximo partido a tus contactos de Twitter
SocialBro: Cómo sacar el máximo partido a tus contactos de TwitterSocialBro: Cómo sacar el máximo partido a tus contactos de Twitter
SocialBro: Cómo sacar el máximo partido a tus contactos de TwitterLeticia Polese
 
Sumo Logic Cert Jam - Fundamentals (Spanish)
Sumo Logic Cert Jam - Fundamentals (Spanish)Sumo Logic Cert Jam - Fundamentals (Spanish)
Sumo Logic Cert Jam - Fundamentals (Spanish)Sumo Logic
 
Analítica de datos en comunicación política
Analítica de datos en comunicación políticaAnalítica de datos en comunicación política
Analítica de datos en comunicación políticaDavid Alvarez Sabalegui
 
Otra forma de escuchar a través de Internet (BiMe), Gonzalo Ruiz
Otra forma de escuchar a través de Internet (BiMe), Gonzalo RuizOtra forma de escuchar a través de Internet (BiMe), Gonzalo Ruiz
Otra forma de escuchar a través de Internet (BiMe), Gonzalo RuizAragón Open Data
 
Analítica web para consultores ux
Analítica web para consultores uxAnalítica web para consultores ux
Analítica web para consultores uxJordi Galobart
 
Taller de comunicación corporativa Estrategia de comunicación corporativa online
Taller de comunicación corporativa Estrategia de comunicación corporativa onlineTaller de comunicación corporativa Estrategia de comunicación corporativa online
Taller de comunicación corporativa Estrategia de comunicación corporativa onlineOPS Colombia
 
Obtención de datos de redes sociales
Obtención de datos de redes socialesObtención de datos de redes sociales
Obtención de datos de redes socialesAragón Open Data
 
Coolhunting Empresarial para Gestores de la Cadena Agroalimentaria
Coolhunting Empresarial para Gestores de la Cadena AgroalimentariaCoolhunting Empresarial para Gestores de la Cadena Agroalimentaria
Coolhunting Empresarial para Gestores de la Cadena AgroalimentariaLourdes Rodríguez Rodríguez
 
Exprime tu Comunidad de Twitter con SocialBro
Exprime tu Comunidad de Twitter con SocialBroExprime tu Comunidad de Twitter con SocialBro
Exprime tu Comunidad de Twitter con SocialBroLeticia Polese
 
Maestros del tweet - Spa Mencey
Maestros del tweet - Spa MenceyMaestros del tweet - Spa Mencey
Maestros del tweet - Spa MenceyLearn & Show
 
Estrategia para la Apertura de Datos
Estrategia para la Apertura de DatosEstrategia para la Apertura de Datos
Estrategia para la Apertura de DatosSocialTIC
 
Vigilancia 2.0
Vigilancia 2.0Vigilancia 2.0
Vigilancia 2.0lara.rey
 
Vigilancia Tecnologica 2.0
Vigilancia Tecnologica 2.0Vigilancia Tecnologica 2.0
Vigilancia Tecnologica 2.0lara.rey
 
Seminario Sevilla: Content Manager y SMO
Seminario Sevilla: Content Manager y SMOSeminario Sevilla: Content Manager y SMO
Seminario Sevilla: Content Manager y SMODolores Vela
 
Metodologia de investigacion
Metodologia de investigacionMetodologia de investigacion
Metodologia de investigacionRodolfo Alvarez
 

Similar a Datlas - BigData con Twitter - Qué hace la gente en Monterrey (20)

Ii curso oficial de coolhunting marzo 11
Ii curso oficial de coolhunting   marzo 11Ii curso oficial de coolhunting   marzo 11
Ii curso oficial de coolhunting marzo 11
 
Minería de datos (práctica twitter)
Minería de datos (práctica twitter)Minería de datos (práctica twitter)
Minería de datos (práctica twitter)
 
SocialBro: Cómo sacar el máximo partido a tus contactos de Twitter
SocialBro: Cómo sacar el máximo partido a tus contactos de TwitterSocialBro: Cómo sacar el máximo partido a tus contactos de Twitter
SocialBro: Cómo sacar el máximo partido a tus contactos de Twitter
 
Curs 2.7. Análisis de datos de redes sociales
Curs 2.7. Análisis de datos de redes socialesCurs 2.7. Análisis de datos de redes sociales
Curs 2.7. Análisis de datos de redes sociales
 
Sumo Logic Cert Jam - Fundamentals (Spanish)
Sumo Logic Cert Jam - Fundamentals (Spanish)Sumo Logic Cert Jam - Fundamentals (Spanish)
Sumo Logic Cert Jam - Fundamentals (Spanish)
 
Analítica de datos en comunicación política
Analítica de datos en comunicación políticaAnalítica de datos en comunicación política
Analítica de datos en comunicación política
 
Otra forma de escuchar a través de Internet (BiMe), Gonzalo Ruiz
Otra forma de escuchar a través de Internet (BiMe), Gonzalo RuizOtra forma de escuchar a través de Internet (BiMe), Gonzalo Ruiz
Otra forma de escuchar a través de Internet (BiMe), Gonzalo Ruiz
 
Tutorial Buscar Informacion. 1
Tutorial Buscar Informacion. 1Tutorial Buscar Informacion. 1
Tutorial Buscar Informacion. 1
 
Analítica web para consultores ux
Analítica web para consultores uxAnalítica web para consultores ux
Analítica web para consultores ux
 
Taller de comunicación corporativa Estrategia de comunicación corporativa online
Taller de comunicación corporativa Estrategia de comunicación corporativa onlineTaller de comunicación corporativa Estrategia de comunicación corporativa online
Taller de comunicación corporativa Estrategia de comunicación corporativa online
 
Obtención de datos de redes sociales
Obtención de datos de redes socialesObtención de datos de redes sociales
Obtención de datos de redes sociales
 
My tools @ridehf
My tools @ridehfMy tools @ridehf
My tools @ridehf
 
Coolhunting Empresarial para Gestores de la Cadena Agroalimentaria
Coolhunting Empresarial para Gestores de la Cadena AgroalimentariaCoolhunting Empresarial para Gestores de la Cadena Agroalimentaria
Coolhunting Empresarial para Gestores de la Cadena Agroalimentaria
 
Exprime tu Comunidad de Twitter con SocialBro
Exprime tu Comunidad de Twitter con SocialBroExprime tu Comunidad de Twitter con SocialBro
Exprime tu Comunidad de Twitter con SocialBro
 
Maestros del tweet - Spa Mencey
Maestros del tweet - Spa MenceyMaestros del tweet - Spa Mencey
Maestros del tweet - Spa Mencey
 
Estrategia para la Apertura de Datos
Estrategia para la Apertura de DatosEstrategia para la Apertura de Datos
Estrategia para la Apertura de Datos
 
Vigilancia 2.0
Vigilancia 2.0Vigilancia 2.0
Vigilancia 2.0
 
Vigilancia Tecnologica 2.0
Vigilancia Tecnologica 2.0Vigilancia Tecnologica 2.0
Vigilancia Tecnologica 2.0
 
Seminario Sevilla: Content Manager y SMO
Seminario Sevilla: Content Manager y SMOSeminario Sevilla: Content Manager y SMO
Seminario Sevilla: Content Manager y SMO
 
Metodologia de investigacion
Metodologia de investigacionMetodologia de investigacion
Metodologia de investigacion
 

Último

CALENDARIZACIÓN ACTUALIZADA DEL 2024 alt.pdf
CALENDARIZACIÓN ACTUALIZADA DEL 2024 alt.pdfCALENDARIZACIÓN ACTUALIZADA DEL 2024 alt.pdf
CALENDARIZACIÓN ACTUALIZADA DEL 2024 alt.pdfPOULANDERSONDELGADOA2
 
Letra de cambio definición y características.ppt
Letra de cambio definición y características.pptLetra de cambio definición y características.ppt
Letra de cambio definición y características.pptssuserbdc329
 
Panorama Sociodemográfico de México 2020: GUANAJUATO
Panorama Sociodemográfico de México 2020: GUANAJUATOPanorama Sociodemográfico de México 2020: GUANAJUATO
Panorama Sociodemográfico de México 2020: GUANAJUATOJuan Carlos Fonseca Mata
 
Porcentaje de población blanca europea en Europa Occidental (1923-2024).pdf
Porcentaje de población blanca europea en Europa Occidental (1923-2024).pdfPorcentaje de población blanca europea en Europa Occidental (1923-2024).pdf
Porcentaje de población blanca europea en Europa Occidental (1923-2024).pdfJC Díaz Herrera
 
ETICA EN LA CADENAS la cadena de suministro
ETICA EN LA CADENAS la cadena de suministroETICA EN LA CADENAS la cadena de suministro
ETICA EN LA CADENAS la cadena de suministroIrisMoreno27
 
Posiciones_del_sionismo_en_los_imperios globales de la humanidad (2024).pdf
Posiciones_del_sionismo_en_los_imperios globales de la humanidad (2024).pdfPosiciones_del_sionismo_en_los_imperios globales de la humanidad (2024).pdf
Posiciones_del_sionismo_en_los_imperios globales de la humanidad (2024).pdfJC Díaz Herrera
 
Conversacion.pptx en guarani boliviano latino
Conversacion.pptx en guarani boliviano latinoConversacion.pptx en guarani boliviano latino
Conversacion.pptx en guarani boliviano latinoBESTTech1
 
COMUNICADO PARA TODO TIPO DE REUNIONES .
COMUNICADO PARA TODO TIPO DE REUNIONES .COMUNICADO PARA TODO TIPO DE REUNIONES .
COMUNICADO PARA TODO TIPO DE REUNIONES .GIANELAKAINACHALLCOJ2
 
INFORME FINAL ESTADISTICA DESCRIPTIVA E INFERENCIAL
INFORME FINAL ESTADISTICA DESCRIPTIVA E INFERENCIALINFORME FINAL ESTADISTICA DESCRIPTIVA E INFERENCIAL
INFORME FINAL ESTADISTICA DESCRIPTIVA E INFERENCIALMANUELVILELA7
 
Evolución de la fortuna de la familia Slim (1994-2024).pdf
Evolución de la fortuna de la familia Slim (1994-2024).pdfEvolución de la fortuna de la familia Slim (1994-2024).pdf
Evolución de la fortuna de la familia Slim (1994-2024).pdfJC Díaz Herrera
 
EXPOSICION. PROCEOS SAW SEMIATUMATIZADO,
EXPOSICION. PROCEOS SAW SEMIATUMATIZADO,EXPOSICION. PROCEOS SAW SEMIATUMATIZADO,
EXPOSICION. PROCEOS SAW SEMIATUMATIZADO,LANZAPIANDAJOSEANDRE
 
metodo SOAP utilizado para evaluar el estado de un paciente
metodo SOAP utilizado para evaluar el estado de un pacientemetodo SOAP utilizado para evaluar el estado de un paciente
metodo SOAP utilizado para evaluar el estado de un pacienteMedicinaInternaresid1
 
Investigacion cualitativa y cuantitativa....pdf
Investigacion cualitativa y cuantitativa....pdfInvestigacion cualitativa y cuantitativa....pdf
Investigacion cualitativa y cuantitativa....pdfalexanderleonyonange
 
Los países por porcentaje de población blanca europea en AL (2024).pdf
Los países por porcentaje de población blanca europea en AL (2024).pdfLos países por porcentaje de población blanca europea en AL (2024).pdf
Los países por porcentaje de población blanca europea en AL (2024).pdfJC Díaz Herrera
 
Las marcas automotrices con más ventas de vehículos (2024).pdf
Las marcas automotrices con más ventas de vehículos (2024).pdfLas marcas automotrices con más ventas de vehículos (2024).pdf
Las marcas automotrices con más ventas de vehículos (2024).pdfJC Díaz Herrera
 
Industria musical de EUA vs Industria musical Corea del Sur (2024).pdf
Industria musical de EUA vs Industria musical Corea del Sur (2024).pdfIndustria musical de EUA vs Industria musical Corea del Sur (2024).pdf
Industria musical de EUA vs Industria musical Corea del Sur (2024).pdfJC Díaz Herrera
 
procedimiento paran la planificación en los centros educativos tipo v(multig...
procedimiento  paran la planificación en los centros educativos tipo v(multig...procedimiento  paran la planificación en los centros educativos tipo v(multig...
procedimiento paran la planificación en los centros educativos tipo v(multig...claudioluna1121
 
La Guerra Biologica - Emiliano Paico Vilchez.pdf
La Guerra Biologica - Emiliano Paico Vilchez.pdfLa Guerra Biologica - Emiliano Paico Vilchez.pdf
La Guerra Biologica - Emiliano Paico Vilchez.pdfjosellaqtas
 
Análisis de datos en acción: Optimizando el crecimiento de Cyclistic
Análisis de datos en acción: Optimizando el crecimiento de CyclisticAnálisis de datos en acción: Optimizando el crecimiento de Cyclistic
Análisis de datos en acción: Optimizando el crecimiento de CyclisticJamithGarcia1
 
EPIDEMIO CANCER PULMON resumen nnn.pptx
EPIDEMIO CANCER PULMON  resumen nnn.pptxEPIDEMIO CANCER PULMON  resumen nnn.pptx
EPIDEMIO CANCER PULMON resumen nnn.pptxJEFFERSONMEDRANOCHAV
 

Último (20)

CALENDARIZACIÓN ACTUALIZADA DEL 2024 alt.pdf
CALENDARIZACIÓN ACTUALIZADA DEL 2024 alt.pdfCALENDARIZACIÓN ACTUALIZADA DEL 2024 alt.pdf
CALENDARIZACIÓN ACTUALIZADA DEL 2024 alt.pdf
 
Letra de cambio definición y características.ppt
Letra de cambio definición y características.pptLetra de cambio definición y características.ppt
Letra de cambio definición y características.ppt
 
Panorama Sociodemográfico de México 2020: GUANAJUATO
Panorama Sociodemográfico de México 2020: GUANAJUATOPanorama Sociodemográfico de México 2020: GUANAJUATO
Panorama Sociodemográfico de México 2020: GUANAJUATO
 
Porcentaje de población blanca europea en Europa Occidental (1923-2024).pdf
Porcentaje de población blanca europea en Europa Occidental (1923-2024).pdfPorcentaje de población blanca europea en Europa Occidental (1923-2024).pdf
Porcentaje de población blanca europea en Europa Occidental (1923-2024).pdf
 
ETICA EN LA CADENAS la cadena de suministro
ETICA EN LA CADENAS la cadena de suministroETICA EN LA CADENAS la cadena de suministro
ETICA EN LA CADENAS la cadena de suministro
 
Posiciones_del_sionismo_en_los_imperios globales de la humanidad (2024).pdf
Posiciones_del_sionismo_en_los_imperios globales de la humanidad (2024).pdfPosiciones_del_sionismo_en_los_imperios globales de la humanidad (2024).pdf
Posiciones_del_sionismo_en_los_imperios globales de la humanidad (2024).pdf
 
Conversacion.pptx en guarani boliviano latino
Conversacion.pptx en guarani boliviano latinoConversacion.pptx en guarani boliviano latino
Conversacion.pptx en guarani boliviano latino
 
COMUNICADO PARA TODO TIPO DE REUNIONES .
COMUNICADO PARA TODO TIPO DE REUNIONES .COMUNICADO PARA TODO TIPO DE REUNIONES .
COMUNICADO PARA TODO TIPO DE REUNIONES .
 
INFORME FINAL ESTADISTICA DESCRIPTIVA E INFERENCIAL
INFORME FINAL ESTADISTICA DESCRIPTIVA E INFERENCIALINFORME FINAL ESTADISTICA DESCRIPTIVA E INFERENCIAL
INFORME FINAL ESTADISTICA DESCRIPTIVA E INFERENCIAL
 
Evolución de la fortuna de la familia Slim (1994-2024).pdf
Evolución de la fortuna de la familia Slim (1994-2024).pdfEvolución de la fortuna de la familia Slim (1994-2024).pdf
Evolución de la fortuna de la familia Slim (1994-2024).pdf
 
EXPOSICION. PROCEOS SAW SEMIATUMATIZADO,
EXPOSICION. PROCEOS SAW SEMIATUMATIZADO,EXPOSICION. PROCEOS SAW SEMIATUMATIZADO,
EXPOSICION. PROCEOS SAW SEMIATUMATIZADO,
 
metodo SOAP utilizado para evaluar el estado de un paciente
metodo SOAP utilizado para evaluar el estado de un pacientemetodo SOAP utilizado para evaluar el estado de un paciente
metodo SOAP utilizado para evaluar el estado de un paciente
 
Investigacion cualitativa y cuantitativa....pdf
Investigacion cualitativa y cuantitativa....pdfInvestigacion cualitativa y cuantitativa....pdf
Investigacion cualitativa y cuantitativa....pdf
 
Los países por porcentaje de población blanca europea en AL (2024).pdf
Los países por porcentaje de población blanca europea en AL (2024).pdfLos países por porcentaje de población blanca europea en AL (2024).pdf
Los países por porcentaje de población blanca europea en AL (2024).pdf
 
Las marcas automotrices con más ventas de vehículos (2024).pdf
Las marcas automotrices con más ventas de vehículos (2024).pdfLas marcas automotrices con más ventas de vehículos (2024).pdf
Las marcas automotrices con más ventas de vehículos (2024).pdf
 
Industria musical de EUA vs Industria musical Corea del Sur (2024).pdf
Industria musical de EUA vs Industria musical Corea del Sur (2024).pdfIndustria musical de EUA vs Industria musical Corea del Sur (2024).pdf
Industria musical de EUA vs Industria musical Corea del Sur (2024).pdf
 
procedimiento paran la planificación en los centros educativos tipo v(multig...
procedimiento  paran la planificación en los centros educativos tipo v(multig...procedimiento  paran la planificación en los centros educativos tipo v(multig...
procedimiento paran la planificación en los centros educativos tipo v(multig...
 
La Guerra Biologica - Emiliano Paico Vilchez.pdf
La Guerra Biologica - Emiliano Paico Vilchez.pdfLa Guerra Biologica - Emiliano Paico Vilchez.pdf
La Guerra Biologica - Emiliano Paico Vilchez.pdf
 
Análisis de datos en acción: Optimizando el crecimiento de Cyclistic
Análisis de datos en acción: Optimizando el crecimiento de CyclisticAnálisis de datos en acción: Optimizando el crecimiento de Cyclistic
Análisis de datos en acción: Optimizando el crecimiento de Cyclistic
 
EPIDEMIO CANCER PULMON resumen nnn.pptx
EPIDEMIO CANCER PULMON  resumen nnn.pptxEPIDEMIO CANCER PULMON  resumen nnn.pptx
EPIDEMIO CANCER PULMON resumen nnn.pptx
 

Datlas - BigData con Twitter - Qué hace la gente en Monterrey

  • 1. ¿Qué hace la gente en Monterrey? Foro: Data Science & Python MTY Join Meetup Análisis de Datos de Twitter y Foursquare Impartida por:
  • 2. Agenda 1. Acerca de Nosotros 2. Objetivos de la sesión 3. Datos de Foursquare & Twitter ¿Cómo funcionan? 4. Análisis de Datos 1. Metodología 2. Extracción y procesamiento: Twitter → Python 3. Visualización: Python → Google Fusion Tables 5. Potencial de Uso – Caso de Monterrey 6. ¿Qué hacemos en Datlas?
  • 3. Agenda 1. Acerca de Nosotros 2. Objetivos de la sesión 3. Datos de Foursquare & Twitter ¿Cómo funcionan? 4. Análisis de Datos 1. Metodología 2. Extracción y procesamiento: Twitter → Python 3. Visualización: Python → Google Fusion Tables 5. Potencial de Uso – Caso de Monterrey 6. ¿Qué hacemos en Datlas?
  • 4. Acerca de Nosotros: Equipo Datlas blogdatlas. wordpress.com
  • 5. Agenda 1. Acerca de Nosotros 2. Objetivos de la sesión 3. Datos de Foursquare & Twitter ¿Cómo funcionan? 4. Análisis de Datos 1. Metodología 2. Extracción y procesamiento: Twitter → Python 3. Visualización: Python → Google Fusion Tables 5. Potencial de Uso – Caso de Monterrey 6. ¿Qué hacemos en Datlas?
  • 6. Objetivos de la sesión: ¿Qué hace la gente en Monterrey? Queremos entender la dinámica recreativa por medio de check-ins: • ¿A qué lugares salen? • ¿En qué horarios y qué días de la semana salen? • ¿Cuáles son sus lugares favoritos? • ¿Qué plaza comercial es la más visitada? • ¿Cuál es su cine favorito? • Entre otros….
  • 7. Agenda 1. Acerca de Nosotros 2. Objetivos de la sesión 3. Datos de Foursquare & Twitter ¿Cómo funcionan? 4. Análisis de Datos 1. Metodología 2. Extracción y procesamiento: Twitter → Python 3. Visualización: Python → Google Fusion Tables 5. Potencial de Uso – Caso de Monterrey 6. ¿Qué hacemos en Datlas?
  • 8. Datos que hablan… • Utilizamos los registros de & compartidos en • ¿Cómo haces check-in? • ¿Por qué hacer check-in? → Recomendaciones, calificas los lugares y puedes ver donde están tus amigos.
  • 9. Podemos interpretar la información de checkins para entender la dinámica de una ciudad
  • 10. Agenda 1. Acerca de Nosotros 2. Objetivos de la sesión 3. Datos de Foursquare & Twitter ¿Cómo funcionan? 4. Análisis de Datos 1. Metodología 2. Extracción y procesamiento: Twitter → Python 3. Visualización: Python → Google Fusion Tables 5. Potencial de Uso – Caso de Monterrey 6. ¿Qué hacemos en Datlas?
  • 11. Metodología • Método: Analizamos información de check-ins compartida en Twitter por usuarios de Nuevo León • ¿Cómo? Utilizamos en Python la librería de “tweepy” que permite autentificarte y extraer los tweets de una manera relativamente sencilla • Para el Análisis: Usamos tweets con check-ins geo referenciados en la zona metropolitana de Monterrey • Para Visualizar: Usamos Google Fusion Tables por su facilidad para manejar grandes cantidades de datos en la nube, usar Google Maps para hacer mapeo de puntos, además de ser muy intuitivo.
  • 12. Agenda 1. Acerca de Nosotros 2. Objetivos de la sesión 3. Datos de Foursquare & Twitter ¿Cómo funcionan? 4. Análisis de Datos 1. Metodología 2. Extracción y procesamiento: Twitter → Python 3. Visualización: Python → Google Fusion Tables 5. Potencial de Uso – Caso de Monterrey 6. ¿Qué hacemos en Datlas?
  • 13. Primeros pasos: Registrarse para API Twitter • Registrarse como Developer en el sitio de Twitter
  • 14. Primeros pasos: Registrarse para API Twitter • Registrarse como Developer en el sitio de Twitter • Con eso te dan una clave para usar su API y descargar Tweets • Limitante: Sólo se pueden bajar los últimos 100 tweets por llamada. • Tip: Hacer un ciclo con un máximo de 450 llamadas cada 15 minutos.
  • 15. ¿Cómo es la estructura del Tweet? Pt.1 • La llamada a la API de twitter te regresa un JSON que se ve así…
  • 16. ¿Cómo es la estructura del Tweet? Pt.2 • La llamada a la API de twitter te regresa un JSON que se ve así…
  • 17. ¿Cómo es la estructura del Tweet? Pt.3
  • 18. Pasos a Seguir: → Variables • Hacemos una extracción y filtrado de las variables que nos interesan • Ajustamos la zona horaria a la correspondiente a México • Filtramos por location (eliminamos los tweets que no estén georeferenciados) • Quitamos caracteres, signos, links o fotos para una mejor lectura del tweet • Extraemos y damos formato a la fecha • Limpiamos los nombres de los usuarios
  • 19. Pasos a Seguir: Variables → Diccionario • Se hace un “diccionario” en Python que contiene las variables de interés del tweet • Se renombran las variables
  • 20. Pasos a Seguir: Diccionario → • Se utiliza la librería pandas para manipular datos y conservar el rango de fechas de nuestro interés. (de Lunes anterior al Domingo)
  • 21. • Se utiliza la librería pandas para manipular datos y conservar el rango de fechas de nuestro interés. (de Lunes anterior al Domingo) • Se realiza la conversión a CSV, facilitado por la misma librería. Pasos a Seguir: →
  • 22. Pasos a Seguir: → Spreadsheet • Hacemos una validación visual de que las columnas estén en orden.
  • 23. Agenda 1. Acerca de Nosotros 2. Objetivos de la sesión 3. Datos de Foursquare & Twitter ¿Cómo funcionan? 4. Análisis de Datos 1. Metodología 2. Extracción y procesamiento: Twitter → Python 3. Visualización: Python → Google Fusion Tables 5. Potencial de Uso – Caso de Monterrey 6. ¿Qué hacemos en Datlas?
  • 24. Pasos a Seguir: Spreadsheet → Visualización • Creamos una Fusion Table seleccionando nuestro archivo CSV. (En nuestro caso cargamos un nuevo archivo cada semana) http://fusiontables.google.com
  • 25. Pasos a Seguir: Spreadsheet → Visualización • Fusion Tables detecta las columnas lat y long como geo referencia para proponernos un mapa por default con la información • Tomando esta referencia podemos tener un mapa como este…
  • 27. También se pueden hacer otras personalizaciones como una Categorización de Tweets por hora
  • 30. Agenda 1. Acerca de Nosotros 2. Objetivos de la sesión 3. Datos de Foursquare & Twitter ¿Cómo funcionan? 4. Análisis de Datos 1. Metodología 2. Extracción y procesamiento: Twitter → Python 3. Visualización: Python → Google Fusion Tables 5. Potencial de Uso – Caso de Monterrey 6. ¿Qué hacemos en Datlas?
  • 31. Nuestro ejemplo de Mapa para Monterrey:
  • 33. Analizando por Mapas de Calor las zonas más “calientes” en fin de semana Aeropuerto Internac. Parque Fundidora Paseo La Fe Esfera City Center Nuevo Sur Galerías Monterrey Centrito Valle Plaza Fiesta San Ag. Galerías Valle Oriente Tec de Monterrey Barrio Antiguo
  • 34. ¿Qué días hubo más actividad? • Los días con más actividad son los días después de la quincena y los fines de semana. Tiene lógica, ¿no?
  • 35. ¿A qué horas incrementa la actividad? • A partir de las 6 de la tarde hay un incremento en las visitas a parques, estadios, restaurantes y al cine.
  • 36. Resumen de Hallazgos • ¿Qué actividades ocasionaron más tráfico? • Más de 6,000 lugares que registraron check-ins, encontramos como principales motivadores: eventos deportivos y estrenos de cine • En los 3 sábados de Julio: • Partidos de fútbol 45-52% de los check-ins • Peliculas de estreno
  • 38. Y todo esto ¿Para qué? • ¿Dónde pongo mi negocio o dónde me expando? • ¿En qué zonas me puedo anunciar dado que hay más tráfico de personas en fin de semana? • ¿En qué lugares los clientes son más exigentes con sus comentarios? Este tipo de análisis es útil para comercios que quieren posicionarse con sus consumidores, entender la dinámica diaria de su mercado meta, y responder preguntas como:
  • 39. Agenda 1. Acerca de Nosotros 2. Objetivos de la sesión 3. Datos de Foursquare & Twitter ¿Cómo funcionan? 4. Análisis de Datos 1. Metodología 2. Extracción y procesamiento: Twitter → Python 3. Visualización: Python → Google Fusion Tables 5. Potencial de Uso – Caso de Monterrey 6. ¿Qué hacemos en Datlas?
  • 40. ¿Qué es Datlas? Link: http://www.thedatlas.com/
  • 41. Invitación a DEMO y Taller en INCMTY Suscríbanse para un DEMO y si nos dan retro les mandaremos Un archivo con una semana de tweets: http://www.thedatlas.com/ Daremos un taller en INCMTY 2016 Título: “Datlas: tengo una idea ¿Dónde la pongo?”
  • 42. Contacto: contacto@thedatlas.com Suscríbanse para demo gratis en: www.thedatlas.com Lean nuestro blog: https://blogdatlas.wordpress.com/ Gracias por su tiempo