1. Elecciones 20N en
Twitter
6-Julio-2012 M. Luz Congosto / Pablo Aragón 1
2. ÍNDICE
Twitter en campañas electorales
Estado del arte de predicción electoral
Caso de estudio: elecciones 20N-2011
Conclusiones
6-Julio-2012 M. Luz Congosto / Pablo Aragón 2
3. Twitter en campañas electorales
Comunicación Sonda de opinión
Minería de datos Predicción
6-Julio-2012 M. Luz Congosto / Pablo Aragón 3
4. Estado del arte de predicción electoral
(Tumasjan, 2010) elecciones parlamento alemán 2009. Método
contar menciones 1,65% MAE (Mean Absolute Error)
(Jungherr, 2011) del parlamento alemán 2009
(Conover D. , 2010) analizó las elecciones del US del 2010
(Gayo-Avello D. , 2011) analizó las elecciones de presidenciales de
US en 2008
(Tjong, 2012) elecciones al senado de Holanda 2011
(Skoric, 2012) elecciones de Singapur 2011
(Bermingham et al., 2011) elecciones generales irlandesas 2011
(Panagiotis, 2011) elecciones de US de 2010
6-Julio-2012 M. Luz Congosto / Pablo Aragón 4
5. Caso de estudio: elecciones 20N-2011
Metodología
Twitter como canal de comunicación
Twitter como sonda de opinión
Twitter como red de conexiones
Twitter como fuente de predicción de resultados
6-Julio-2012 M. Luz Congosto / Pablo Aragón 5
6. Caso de estudio: elecciones 20N-2011
Metodología
– Dataset 1: Monitorizó los partidos nacionales desde el 08/10/11
hasta el 22/11/11 mediante el streaming API de Twittter desde la
Universidad Carlos III obteniendo 2.973.110 tweets de 441.795
usuarios diferentes
– Dataset 2: Capturó los mensajes de los partidos que tienen
representación parlamentaria, del 9-10-2011 al 24-11-2011
utilizando un proceso periódico de descarga del timeline de un
conjunto de perfiles y el streaming API de Twitter desde la
Fundació Barcelona Media, obteniendo 2.279.250 tweets de
442.014 usuarios diferentes
6-Julio-2012 M. Luz Congosto / Pablo Aragón 6
7. Twitter como canal de campaña
Candidato vs. Partido
PSOE PP
Rajoy
Cayo
Rubalcaba Lara UpyD Equo
Seguidores inicio campaña 20N (Dataset-1)
6-Julio-2012 M. Luz Congosto / Pablo Aragón 7
8. Twitter como canal de campaña
Actividad de las cuentas Twitter
Acumulado de tweets campaña 20N (Dataset-1)
6-Julio-2012 M. Luz Congosto / Pablo Aragón 8
9. Twitter como canal de campaña
Adquisición de nuevos seguidores
Acumulado de nuevos seguidores campaña 20N (Dataset-1)
6-Julio-2012 M. Luz Congosto / Pablo Aragón 9
10. Twitter como canal de campaña
Correlación nuevos seguidores / menciones únicas
Campaña 20N (Dataset-1)
6-Julio-2012 M. Luz Congosto / Pablo Aragón 10
11. Twitter como sonda de opinión
Participación de los ciudadanos
Tweets por día de la campaña 20N (Dataset-1)
6-Julio-2012 M. Luz Congosto / Pablo Aragón 11
12. Twitter como sonda de opinión
Medida de emotividad (valencia)
Valencia por día de la campaña 20N (Dataset-2)
6-Julio-2012 M. Luz Congosto / Pablo Aragón 12
13. Twitter como sonda de opinión
Medida de emotividad (dominancia)
Dominancia por día de la campaña 20N (Dataset-2)
6-Julio-2012 M. Luz Congosto / Pablo Aragón 13
14. Twitter como sonda de opinión
Difusión de enlaces
Europa
Política. El País Press ABC
El País
Público
El mundo
Mapa de menciones de sitios Web en la campaña 20N (Dataset-1)
Imagen interactiva: http://barriblog.com/taller/javascript/protovis/sites_20N.html
6-Julio-2012 M. Luz Congosto / Pablo Aragón 14
15. Twitter como red de conexiones
Comunidades de usuarios
Mapa de RTs de la campaña 20N (Dataset-2)
6-Julio-2012 M. Luz Congosto / Pablo Aragón 15
16. Twitter como fuente de predicción de
resultados
Menciones vs. Resultados
Menciones totales (nombre + @usuario + #hashtag) MAE=1,66%
Cómputo menciones campaña 20N (Dataset-1)
6-Julio-2012 M. Luz Congosto / Pablo Aragón 16
17. Twitter como fuente de predicción de
resultados
Polaridad política vs. Resultados
Usuarios en general MAE: 5,00%
Usuarios con más de tres RTs o #hashtags polarizados en la campaña 20N (Dataset-1)
6-Julio-2012 M. Luz Congosto / Pablo Aragón 17
18. Twitter como fuente de predicción de
resultados
Polaridad política vs. Resultados
Hombres (61,38%) MAE: 6,49% Mujeres (38,62%) MAE: 3,88%
Usuarios con más de tres RTs o #hashtags polarizados en la campaña 20N (Dataset-1)
6-Julio-2012 M. Luz Congosto / Pablo Aragón 18
19. Conclusiones
Con las medidas basadas en el cómputo de menciones
se ha obtenido un buen resultado, no obstante:
Los resultados dependen de muchos factores como: el
entorno socio-cultural de las elecciones, el periodo de la
muestra, los eventos de campaña, la recogida de datos en
Twitter, los partidos analizados y la forma de cómputo
La validación de este método para predicción requeriría
sistematizar todos los pasos y comprobar si los resultados son
similares para otras elecciones en diferentes entornos
6-Julio-2012 M. Luz Congosto / Pablo Aragón 19
20. Conclusiones
Con las medidas basadas en la polaridad política ha
obtenido un peor resultado, habrá que tener en cuenta
para mejorar los algoritmos de predicción:
•Demografía: Los usuarios de Twitter son jóvenes y en un alto
porcentaje con estudios superiores.
•Opinión oculta: No todos los usuarios manifiestan sus
preferencias políticas
•Sobreopinión: En contraposición al punto anterior, los
simpatizantes de algunos partidos opinan activamente
Sigue…
6-Julio-2012 M. Luz Congosto / Pablo Aragón 20
21. Conclusiones
Continúa:
•Entidades vs. Personas: Es difícil distinguir en Twitter una
entidad de una persona
•Anonimato vs. “Identidad real”: Los usuarios con identidad
real son más propensos a la opinión oculta
•Hombres vs. Mujeres: Se ha detectado diferencia de
comportamiento según género. Los hombres son más
propensos a ocultar su opinión o a sobreopinar que las mujeres
6-Julio-2012 M. Luz Congosto / Pablo Aragón 21