Ponencia preparada para el I Congreso International en Comunicación Política y Estrategias de Campaña.
Autores: Pablo Barberá (@p_barbera) y Gonzalo Rivero (@griverorz).
¿Un tweet, un voto? Desigualdad en la discusión política en Twitter
1. ¿Un tweet, un voto?
Desigualdad en la discusión política en Twitter
Pablo Barberá Gonzalo Rivero
Ponencia preparada para el I Congreso Internacional en
Comunicación Política y Estrategias de Campaña
2. Motivación Datos y métodos Resultados Conclusiones
Twitter y opinión pública
Twitter: uno de los espacios de comunicación más relevantes
en la política actual. >140M usuarios activos, 15 % españoles
con acceso a internet (CIS), 400.000 tuitean sobre política.
Diferentes estudios muestran que Twitter permite predecir
eventos offline: prevalencia de enfermedades, éxito de
películas, felicidad, índices de acciones...
¿Podemos medir opinión pública y predecir elecciones
mediante el análisis de datos de Twitter?
Paso previo: examinar las características de sus usuarios (¿son
representativos?) y su comportamiento (¿es homogéneo?)
Nuestra contribución: análisis de la discusión política en
Twitter en la campaña electoral de 2011 en España.
Barberá y Rivero (NYU) ¿Un tweet, un voto? Desigualdad en la discusión política en Twitter 2/14
3. Motivación Datos y métodos Resultados Conclusiones
Tuitómetro.es
3M tweets mencionando los dos principales candidatos y
partidos entre 10 de sept. y 20 de nov. de 2011, publicados por
375.000 usuarios únicos.
Producción de tweets es muy desigual:
! 47,2 % de usuarios publicaron un solo tweet.
! 94 usuarios excedieron los 1000 tweets
! 1 % de usuarios publicaron 35 % de tweets
! 10 % de usuarios publicaron 71 % de tweets
Variación a nivel longitudinal: aumento de actividad durante
las dos semanas de campaña y eventos extraordinarios.
Barberá y Rivero (NYU) ¿Un tweet, un voto? Desigualdad en la discusión política en Twitter 3/14
4. Motivación Datos y métodos Resultados Conclusiones
Tuitómetro.es
300000 Debate Rubalcaba−Rajoy
250000
200000
Número de tweets
150000
Elecciones
100000
50000 Anuncio disolución ETA
01−Oct 15−Oct 01−Nov 15−Nov
Barberá y Rivero (NYU) ¿Un tweet, un voto? Desigualdad en la discusión política en Twitter 4/14
5. Motivación Datos y métodos Resultados Conclusiones
Diseño de investigación
Análisis en profundidad: muestra aleatoria de 12.000 usuarios
activos en la discusión política en Twitter.
4 variables independientes clave:
! Género
! Ubicación geográfica
! Identificación partidista
! Momento de la campaña electoral
2 dimensiones de análisis:
1 ¿Hasta qué punto se corresponde la distribución de estas
variables en Twitter con su distribución en la población?
2 ¿Existe variación significativa en el comportamiento en Twitter
de los diferentes grupos de usuarios según estas variables?
Barberá y Rivero (NYU) ¿Un tweet, un voto? Desigualdad en la discusión política en Twitter 5/14
6. Motivación Datos y métodos Resultados Conclusiones
Género
Medida Hombres Mujeres Total t-stat
6.192 3.389 9.581
Número de usuarios
[65 %] [35 %] [100 %] 29,9⇤⇤
Media de tweets 19,6 21,4 20,2 1,9⇤
Media de retweets 8,8 9,5 9,0 1,2
Media de replies enviados 3,6 3,9 3,7 1,1
Media de hashtags usados 7,6 8,8 8,0 2,0⇤⇤
El género se identificó en función del nombre, aunque este procedimiento no nos permitió
inferir el género de 1.773 usuarios (15 %). Significación (igualdad de medias o proporciones):
⇤
10 %, ⇤⇤ 5 %.
La discusión política en Twitter está protagonizada por hombres.
Las mujeres tienden a ser ligeramente más activas en Twitter.
Barberá y Rivero (NYU) ¿Un tweet, un voto? Desigualdad en la discusión política en Twitter 6/14
7. Motivación Datos y métodos Resultados Conclusiones
Ubicación geográfica
Distribución geográfica de usuarios de Twitter y habitantes es
similar a nivel de provincia (⇢ =, 866, N = 52).
Barberá y Rivero (NYU) ¿Un tweet, un voto? Desigualdad en la discusión política en Twitter 7/14
8. Motivación Datos y métodos Resultados Conclusiones
Ubicación geográfica
La proporción de tweets enviados desde cada provincia es similar a
la distribución geográfica de habitantes (⇢ =, 846, N = 52).
Barberá y Rivero (NYU) ¿Un tweet, un voto? Desigualdad en la discusión política en Twitter 8/14
9. Motivación Datos y métodos Resultados Conclusiones
Ubicación geográfica
Grandes
Medida ciudades Resto Total t-stat
2.007 4.288 6.295
Número de usuarios
[32 %] [68 %] [100 %] 30,0⇤⇤
Media de tweets 20,4 21,8 21,3 1,1
Media de retweets 8,9 9,8 9,6 1,2
Media de replies enviados 3,7 3,8 3,7 0,1
Media de hashtags usados 8,1 8,8 8,6 1,0
La ubicación se identificó a partir de la información proporcionada por cada usuario,
utilizando la API de geolocalización de Yahoo, aunque este procedimiento no nos permitió
inferir la ciudad de residencia de 5.705 usuarios (47 %). Significación (igualdad de medias
o proporciones): ⇤ 10 %, ⇤⇤ 5 %.
Las zonas urbanas están sobrerepresentadas: 17 % de población,
32 % de usuarios activos en política en Twitter.
Similares niveles medios de actividad en ambos tipos de hábitat.
Barberá y Rivero (NYU) ¿Un tweet, un voto? Desigualdad en la discusión política en Twitter 9/14
10. Motivación Datos y métodos Resultados Conclusiones
Identificación partidista
Medida PP PSOE Total t-stat
2.895 2.626 12.000
Número de usuarios
[25 %] [23 %] [100 %]
Media de tweets 26,4 26,6 20,1 0,1
Media de retweets 10,9 13,0 9,0 2,2⇤⇤
Media de replies enviados 4,7 5,1 3,8 1,0
Media de hashtags usados 14,3 9,1 8,0 5,1⇤⇤
Menciones a #PeleaPorLoQueQuieres 0,3 0,8 0,2 13,5⇤⇤
Menciones a #SumateAlCambio 4,6 0,1 1,3 11,9⇤⇤
La identificación partidista se construyó aplicando iterativamente un método de item-respuesta ba-
yesiano a la red de amigos de cada usuario (Barberá, 2012). Significación (igualdad de medias entre
PP y PSOE): ⇤ 10 %, ⇤⇤ 5 %. Todas las diferencias entre los identificados con PP y PSOE respecto
al resto son significativas al 5 %.
Usuarios identificados con un partido son más activos en Twitter.
PP: discusión más jerarquizada y estructurada.
PSOE: discusión horizontal y más interactiva.
Barberá y Rivero (NYU) ¿Un tweet, un voto? Desigualdad en la discusión política en Twitter 10/14
11. Motivación Datos y métodos Resultados Conclusiones
Identificación partidista
Polarización del debate
en Twitter:
! usuarios con una
identificación partidista
más intensa generan
mayor actividad.
Barberá y Rivero (NYU) ¿Un tweet, un voto? Desigualdad en la discusión política en Twitter 11/14
12. Motivación Datos y métodos Resultados Conclusiones
Evolución durante campaña
Conferencia PSOE
Campaña electoral
Conferencia PP
Disolución ETA
Debate
0.8
Coeficientes de Gini
0.7
0.6
Candidato
Rajoy
Rubalcaba
0.5
15−Sep 01−Oct 15−Oct 01−Nov 15−Nov
Tendencia descendente en la desigualdad en la participación
durante la campaña electoral, con excepciones.
Sistemáticamente mayor desigualdad en la discusión sobre Rajoy,
que se concentra en un menor número de usuarios, muy activos.
Barberá y Rivero (NYU) ¿Un tweet, un voto? Desigualdad en la discusión política en Twitter 12/14
13. Motivación Datos y métodos Resultados Conclusiones
Twitter puede ser una valiosa fuente de información sobre
opinión pública, pero su validez está condicionada a la
representatividad del debate en esta plataforma.
La discusión está dominada por hombres, residentes en zonas
urbanas y con unas preferencias ideológicas intensas.
Las estrategias de los partidos importan: el PP estaba mucho
mejor organizado en Twitter, aunque el PSOE participaba de
manera más horizontal e interactiva.
Estas diferencias están correlacionadas con el comportamiento
electoral, por lo que cualquier predicción basada en volumen
de tweets o su “sentimiento” estará inherentemente sesgada.
¿Un tweet, un voto? No. Pero combinando mejores métodos
de análisis con un conocimiento más profundo de estos sesgos,
puede proporcionar información relevante en tiempo real.
Barberá y Rivero (NYU) ¿Un tweet, un voto? Desigualdad en la discusión política en Twitter 13/14
14. ¿Un tweet, un voto?
Desigualdad en la discusión política en Twitter
Pablo Barberá Gonzalo Rivero
Ponencia preparada para el I Congreso Internacional en
Comunicación Política y Estrategias de Campaña
Artículo completo disponible en: tuitometro.es