SlideShare une entreprise Scribd logo
1  sur  30
Télécharger pour lire hors ligne
¿Representan los
Datos de
Medios Sociales
a Chile?
¿Y es Big Data?
Ricardo Baeza-Yates
IMFD, DCC, Universidad de Chile
Northeastern University at Silicon Valley
Universitat Pompeu Fabra, Catalunya
@polarbeaRBY
1
Correlación no implica Causalidad
Correlación no implica Causalidad
Presencia no siempre es Influencia
Correlación no implica Causalidad
Presencia no siempre es InfluenciaPresencia no siempre es influencia
ni el mismo mensaje
¿Qué son Datos Masivos? (Big Data)
Los macrodatos es un término que hace referencia a
conjuntos de datos tan grandes y complejos como
para que hagan falta aplicaciones informáticas no
tradicionales de procesamiento de datos para tratarlos
adecuadamente. (Wikipedia)
¿Cuán grandes? ¿Cuán complejos?
¿Qué son Datos Masivos? (Big Data)
Volumen: la cantidad de datos generados y guardados
Variedad: el tipo y naturaleza heterogénea de los datos
Velocidad: tasa a la cual se generan y procesan los datos
Veracidad: calidad de los datos capturados
Valor: los datos generados deben ser útiles y accionables
Característica Problema de los datos Problema de
procesamiento
Volumen Escala,
Redundancia
Escalabilidad
Variedad Heterogeneidad,
Complejidad
Adaptabilidad,
Extensibilidad
Veracidad Exhaustividad, Sesgo,
Escasez, Ruido, Spam
Fiabilidad,
Confianza
Velocidad Tiempo real En línea
Valor Utilidad,
Privacidad
Depende del
negocio
¿Quiénes tienen Big Data?
Volumen de Datos
Empresas
Datos
Masivos
Datos normales, pequeños,
escasos, caros, ….
Si, las Redes Sociales Generan Big Data
DOMO, 2015
Y en Chile También
Población: 19M
Internet: 15M de usuarios (79%)
en Celulares: 14M (74%)
Usuarios reales de Twitter: a lo más 3,5M (18%)
Red Social ¿Datos
Públicos?
Usuarios
Chilenos*
Whatsapp
(implícita)
Ninguno 14M
Facebook Pocos 13M
Instagram Algunos 7,3M
YouTube Muchos ?
Twitter Todos 1,5M
* Audiencia publicitaria
Estos Usuarios tienen Sesgos Demográficos de Género y Edad
Y Geográficos, Económicos, Educacionales, Tecnológicos, etc.
0,5M
1M
2M
2018
Otros Sesgos de Muestreo
* Los datos que entrega la API de Twitter ya son una muestra
* Que tweets seleccionamos: #hashtags, palabras claves, etc.
à completitud de opiniones de usuarios menos expertos
Y una muestra de big data NO es big data
Por lo tanto Twitter es una muestra sesgada
No permitido
Analógicos
Sin
Internet
¿Podemos Mitigar estos Sesgos?
• Si, parcialmente
• Podemos segmentar la muestra y darle a cada segmento el peso
correcto que debería tener
- Segmentación demográfica: género, edad, etc. y usar el último censo
• Más segmentos, menos sesgo pero más error de muestreo
• La segmentación debe decidirse SIN mirar los datos (p-hacking)
Análisis Longitudinal
de Discusión de
Ley de Aborto
en Chile y Argentina
Eduardo Graells-Garrido
Ricardo Baeza-Yates
Mounia Lalmas
rakelilla79@twitter 17
Contexto: legislación de Aborto en Chile y Argentina,
influencia entre países entre 2015-2018.
Leyes discutidas en Twitter extensivamente.
Pero:
¿Qué tan representativa es la discusión?
¿Qué podemos aprender de ella?
Marcha en defensa de los derechos a abortar en marzo de 2015.
Source: MovilH (CC licensed).
Manifestación pública en oposición a los derechos a abortar en marzo de 2016.
Source: Radio BioBio.19
Marcha en defensa de los derechos a abortar en Argentina, 2018.
Source: flickr(CC licensed).
Proyecto
enviado al
congreso
Se aprueba idea
de legislar, se
incluyen casos
de violación
Cámara de
Diputados
aprueba el
proyecto
Comisión de
Salud del
Senado
aprueba el
proyecto
Senado aprueba
idea de legislar
Senado aprueba
la ley. Denuncia
y posterior
aprobación del
Tribunal
Constitucional
Legislación en
Argentina de ley
de aborto libre.
Rechazada.
6M tweets :: 660 mil perfiles
Palabras y términos más empleados en la discusión, y emoji más frecuente
Segmentación en Chile: Género y edad
ACM Web Science 2019, Boston, Junio 2019
Argentina tiene más perfiles, y mayor representación de mujeres menores a 18 años.
Los atributos de perfiles fueron clasificados utilizando XGBoost.
Cuentas que participaron en la discusión son en su mayoría consolidadas en la red. Solamente
en el estallido social se registró más gente que en el terremoto del 27 de Febrero de 2010.
Posiciones
A pesar del sesgo poblacional,
los resultados son coherentes
con la encuesta CEP.
Por ejemplo:
● Probabilidad de estar en oposición a
los derechos de abortar es 0.06 mayor
en hombres.
● Probabilidad de estar en oposición
aumenta con la edad.
Totalmente en
oposición a
derechos de
aborto
Totalmente a
favor de
derechos de
aborto
Comparación con Encuesta CEP
ACM Web Science 2019, Boston, Junio 2019
*** p < 0.001%
¿Qué permite identificar la posición de las
personas?
El lenguaje que utilizan (matar, decidir) y las
hashtags que difunden.
¡Pero también los emoji! Tanto en los tweets
como en los nombres.
¡El corazón verde (o celeste) es equivalente al
pañuelo verde (o celeste) en las
manifestaciones en el mundo físico!
Incluso cuando lo hacemos bien, siempre podemos
manipular la interpretación de los resultados
Y podemos manipular mejor
Ejemplo más complejo: influencia en Twitter
Top-20
20,8%
11,3%
"Torture the data enough and it will confess to anything” (1960s)
(Tortura bastante los datos y confesarán lo que quieras)
Ronald Coase, Nobel Prize Laureate in Economics (1991)
“Las personas más fáciles de manipular son
las que creen que no pueden ser manipuladas”
Yuval Noah Harari, 2019
www.ciencia.cl@polarbeaRBY www.baeza.cl

Contenu connexe

Similaire à ¿Representan los Datos de Medios Sociales a Chile?

Pablo Rodríguez - Inteligencia artificial. Cómo cambiará el mundo (y tu vi...
Pablo Rodríguez - Inteligencia artificial. Cómo cambiará el mundo (y tu vi...Pablo Rodríguez - Inteligencia artificial. Cómo cambiará el mundo (y tu vi...
Pablo Rodríguez - Inteligencia artificial. Cómo cambiará el mundo (y tu vi...
LUISRENECAMPOSGUZMAN
 
Práctica 1 pablito
Práctica 1 pablitoPráctica 1 pablito
Práctica 1 pablito
pfuentes14
 
Práctica 1 pablito
Práctica 1 pablitoPráctica 1 pablito
Práctica 1 pablito
pfuentes14
 
Análisis Predictivo en la red social Twitter para Detectar tweets con tendenc...
Análisis Predictivo en la red social Twitter para Detectar tweets con tendenc...Análisis Predictivo en la red social Twitter para Detectar tweets con tendenc...
Análisis Predictivo en la red social Twitter para Detectar tweets con tendenc...
thienhongphuc002
 
Código y conocimiento para el desarrollo: un enfoque abierto
Código y conocimiento para el desarrollo: un enfoque abiertoCódigo y conocimiento para el desarrollo: un enfoque abierto
Código y conocimiento para el desarrollo: un enfoque abierto
Santiago Nunez
 
2 IdentificacióN Del Problema, El Tema De Trabajo Y La RecoleccióN De Datos ...
2 IdentificacióN Del Problema, El Tema De Trabajo Y La  RecoleccióN De Datos ...2 IdentificacióN Del Problema, El Tema De Trabajo Y La  RecoleccióN De Datos ...
2 IdentificacióN Del Problema, El Tema De Trabajo Y La RecoleccióN De Datos ...
asical2009
 

Similaire à ¿Representan los Datos de Medios Sociales a Chile? (20)

Pablo Rodríguez - Inteligencia artificial. Cómo cambiará el mundo (y tu vi...
Pablo Rodríguez - Inteligencia artificial. Cómo cambiará el mundo (y tu vi...Pablo Rodríguez - Inteligencia artificial. Cómo cambiará el mundo (y tu vi...
Pablo Rodríguez - Inteligencia artificial. Cómo cambiará el mundo (y tu vi...
 
Big data o datos masivos en investigación en odontología
Big data o datos masivos en investigación en odontologíaBig data o datos masivos en investigación en odontología
Big data o datos masivos en investigación en odontología
 
Dlc
DlcDlc
Dlc
 
Big data para medios
Big data para mediosBig data para medios
Big data para medios
 
Estrategias de-búsqueda
Estrategias de-búsquedaEstrategias de-búsqueda
Estrategias de-búsqueda
 
Práctica 1 pablito
Práctica 1 pablitoPráctica 1 pablito
Práctica 1 pablito
 
Práctica 1 pablito
Práctica 1 pablitoPráctica 1 pablito
Práctica 1 pablito
 
Estudio Consumidor Boliviano
Estudio Consumidor BolivianoEstudio Consumidor Boliviano
Estudio Consumidor Boliviano
 
RSE - Datos Abiertos y Sostenibilidad
RSE - Datos Abiertos y SostenibilidadRSE - Datos Abiertos y Sostenibilidad
RSE - Datos Abiertos y Sostenibilidad
 
El Dilema de las redes sociales _ Sherman Rea
El Dilema de las redes sociales _ Sherman ReaEl Dilema de las redes sociales _ Sherman Rea
El Dilema de las redes sociales _ Sherman Rea
 
Future of value of data interim summary spanish 2018 esp
Future of value of data   interim summary spanish 2018 espFuture of value of data   interim summary spanish 2018 esp
Future of value of data interim summary spanish 2018 esp
 
Bibliotemas: Big data
Bibliotemas: Big dataBibliotemas: Big data
Bibliotemas: Big data
 
Análisis Predictivo en la red social Twitter para Detectar tweets con tendenc...
Análisis Predictivo en la red social Twitter para Detectar tweets con tendenc...Análisis Predictivo en la red social Twitter para Detectar tweets con tendenc...
Análisis Predictivo en la red social Twitter para Detectar tweets con tendenc...
 
Profesión: Big Data
Profesión: Big DataProfesión: Big Data
Profesión: Big Data
 
Zuban Córdoba La patria encuestadora
Zuban Córdoba La patria encuestadoraZuban Córdoba La patria encuestadora
Zuban Córdoba La patria encuestadora
 
Código y conocimiento para el desarrollo: un enfoque abierto
Código y conocimiento para el desarrollo: un enfoque abiertoCódigo y conocimiento para el desarrollo: un enfoque abierto
Código y conocimiento para el desarrollo: un enfoque abierto
 
2 IdentificacióN Del Problema, El Tema De Trabajo Y La RecoleccióN De Datos ...
2 IdentificacióN Del Problema, El Tema De Trabajo Y La  RecoleccióN De Datos ...2 IdentificacióN Del Problema, El Tema De Trabajo Y La  RecoleccióN De Datos ...
2 IdentificacióN Del Problema, El Tema De Trabajo Y La RecoleccióN De Datos ...
 
Unidad 2 | Periodismo de datos y visualización de la información
Unidad 2 | Periodismo de datos y visualización de la informaciónUnidad 2 | Periodismo de datos y visualización de la información
Unidad 2 | Periodismo de datos y visualización de la información
 
Tesina mirytic
Tesina miryticTesina mirytic
Tesina mirytic
 
Internet Health Report 2019. Mozilla. Versión Corta
Internet Health Report 2019. Mozilla. Versión CortaInternet Health Report 2019. Mozilla. Versión Corta
Internet Health Report 2019. Mozilla. Versión Corta
 

Plus de Daniel Vak

La visión de Nvidia sobre los Juegos
La visión de Nvidia sobre los JuegosLa visión de Nvidia sobre los Juegos
La visión de Nvidia sobre los Juegos
Daniel Vak
 

Plus de Daniel Vak (20)

Guia de gráficos de tráfico de PIT Chile
Guia de gráficos de tráfico de PIT ChileGuia de gráficos de tráfico de PIT Chile
Guia de gráficos de tráfico de PIT Chile
 
Análisis semanal de datos Covid-19
Análisis semanal de datos Covid-19Análisis semanal de datos Covid-19
Análisis semanal de datos Covid-19
 
Presentación Matemático Hector Pasten @hpasten
Presentación Matemático Hector Pasten @hpastenPresentación Matemático Hector Pasten @hpasten
Presentación Matemático Hector Pasten @hpasten
 
Baeza-Yates: "no cuadra la historia con los datos que entrega el Minsal"
Baeza-Yates: "no cuadra la historia con los datos que entrega el Minsal"Baeza-Yates: "no cuadra la historia con los datos que entrega el Minsal"
Baeza-Yates: "no cuadra la historia con los datos que entrega el Minsal"
 
Presentación Táctica Digital
Presentación Táctica DigitalPresentación Táctica Digital
Presentación Táctica Digital
 
La visión de Nvidia sobre los Juegos
La visión de Nvidia sobre los JuegosLa visión de Nvidia sobre los Juegos
La visión de Nvidia sobre los Juegos
 
Liga Nacional de Basquetbol
Liga Nacional de BasquetbolLiga Nacional de Basquetbol
Liga Nacional de Basquetbol
 
Bar camp 2011
Bar camp 2011  Bar camp 2011
Bar camp 2011
 
Space Oddity Andrew Kolb
Space Oddity Andrew KolbSpace Oddity Andrew Kolb
Space Oddity Andrew Kolb
 
Cms duoc 1
Cms duoc 1Cms duoc 1
Cms duoc 1
 
Cms >DUOC
Cms >DUOCCms >DUOC
Cms >DUOC
 
Informe Subtel 2009
Informe Subtel 2009Informe Subtel 2009
Informe Subtel 2009
 
Esteban Galuzzi Press Summit 09
Esteban Galuzzi   Press Summit 09Esteban Galuzzi   Press Summit 09
Esteban Galuzzi Press Summit 09
 
Intel Press Summit 09
Intel Press Summit 09Intel Press Summit 09
Intel Press Summit 09
 
Introducción Redes Sociales
Introducción Redes SocialesIntroducción Redes Sociales
Introducción Redes Sociales
 
Open Source en los municipios
Open Source en los municipiosOpen Source en los municipios
Open Source en los municipios
 
Presentación OCD
Presentación OCDPresentación OCD
Presentación OCD
 
Gobiernos20
Gobiernos20Gobiernos20
Gobiernos20
 
En estas Fiestas Patrias
En estas Fiestas PatriasEn estas Fiestas Patrias
En estas Fiestas Patrias
 
Primer Encuentro Comunas Digitales
Primer Encuentro Comunas DigitalesPrimer Encuentro Comunas Digitales
Primer Encuentro Comunas Digitales
 

Dernier

Conversacion.pptx en guarani boliviano latino
Conversacion.pptx en guarani boliviano latinoConversacion.pptx en guarani boliviano latino
Conversacion.pptx en guarani boliviano latino
BESTTech1
 
REPORTE DE HOMICIDIO DOLOSO IRAPUATO ABRIL 2024
REPORTE DE HOMICIDIO DOLOSO IRAPUATO ABRIL 2024REPORTE DE HOMICIDIO DOLOSO IRAPUATO ABRIL 2024
REPORTE DE HOMICIDIO DOLOSO IRAPUATO ABRIL 2024
IrapuatoCmovamos
 

Dernier (20)

Principales Retos Demográficos de Puerto Rico
Principales Retos Demográficos de Puerto RicoPrincipales Retos Demográficos de Puerto Rico
Principales Retos Demográficos de Puerto Rico
 
Sistema Nacional de Vigilancia en Salud Pública SIVIGILA
Sistema Nacional de Vigilancia en Salud Pública SIVIGILASistema Nacional de Vigilancia en Salud Pública SIVIGILA
Sistema Nacional de Vigilancia en Salud Pública SIVIGILA
 
Conversacion.pptx en guarani boliviano latino
Conversacion.pptx en guarani boliviano latinoConversacion.pptx en guarani boliviano latino
Conversacion.pptx en guarani boliviano latino
 
EPIDEMIO CANCER PULMON resumen nnn.pptx
EPIDEMIO CANCER PULMON  resumen nnn.pptxEPIDEMIO CANCER PULMON  resumen nnn.pptx
EPIDEMIO CANCER PULMON resumen nnn.pptx
 
Crecimiento del PIB real revisado sexenios neoliberales y nueva era del sober...
Crecimiento del PIB real revisado sexenios neoliberales y nueva era del sober...Crecimiento del PIB real revisado sexenios neoliberales y nueva era del sober...
Crecimiento del PIB real revisado sexenios neoliberales y nueva era del sober...
 
Las familias más ricas del medio oriente (2024).pdf
Las familias más ricas del medio oriente (2024).pdfLas familias más ricas del medio oriente (2024).pdf
Las familias más ricas del medio oriente (2024).pdf
 
MARCO TEORICO, SEMINARIO DE INVESTIGACION,
MARCO TEORICO, SEMINARIO DE INVESTIGACION,MARCO TEORICO, SEMINARIO DE INVESTIGACION,
MARCO TEORICO, SEMINARIO DE INVESTIGACION,
 
variables-estadisticas. Presentación powerpoint
variables-estadisticas. Presentación powerpointvariables-estadisticas. Presentación powerpoint
variables-estadisticas. Presentación powerpoint
 
La Guerra Biologica - Emiliano Paico Vilchez.pdf
La Guerra Biologica - Emiliano Paico Vilchez.pdfLa Guerra Biologica - Emiliano Paico Vilchez.pdf
La Guerra Biologica - Emiliano Paico Vilchez.pdf
 
PRESENTACION SOBRE LA HOJA DE CALCULO ⠀⠀
PRESENTACION SOBRE LA HOJA DE CALCULO ⠀⠀PRESENTACION SOBRE LA HOJA DE CALCULO ⠀⠀
PRESENTACION SOBRE LA HOJA DE CALCULO ⠀⠀
 
6.3 Hidrologia Geomorfologia Cuenca.pptx
6.3 Hidrologia Geomorfologia Cuenca.pptx6.3 Hidrologia Geomorfologia Cuenca.pptx
6.3 Hidrologia Geomorfologia Cuenca.pptx
 
Los idiomas más hablados en el mundo (2024).pdf
Los idiomas más hablados en el mundo  (2024).pdfLos idiomas más hablados en el mundo  (2024).pdf
Los idiomas más hablados en el mundo (2024).pdf
 
REPORTE DE HOMICIDIO DOLOSO IRAPUATO ABRIL 2024
REPORTE DE HOMICIDIO DOLOSO IRAPUATO ABRIL 2024REPORTE DE HOMICIDIO DOLOSO IRAPUATO ABRIL 2024
REPORTE DE HOMICIDIO DOLOSO IRAPUATO ABRIL 2024
 
CUADRO COMPARATIVO DE ARCHIVOS Y CARPETAS.pptx
CUADRO COMPARATIVO DE ARCHIVOS Y CARPETAS.pptxCUADRO COMPARATIVO DE ARCHIVOS Y CARPETAS.pptx
CUADRO COMPARATIVO DE ARCHIVOS Y CARPETAS.pptx
 
AMNIOS Y CORDON UMBILICAL en el 3 embarazo (1).docx
AMNIOS Y CORDON UMBILICAL en el 3 embarazo (1).docxAMNIOS Y CORDON UMBILICAL en el 3 embarazo (1).docx
AMNIOS Y CORDON UMBILICAL en el 3 embarazo (1).docx
 
Investigacion cualitativa y cuantitativa....pdf
Investigacion cualitativa y cuantitativa....pdfInvestigacion cualitativa y cuantitativa....pdf
Investigacion cualitativa y cuantitativa....pdf
 
data lista de ingresantes de la universidad de ucayali 2024.pdf
data lista de ingresantes de la universidad de ucayali 2024.pdfdata lista de ingresantes de la universidad de ucayali 2024.pdf
data lista de ingresantes de la universidad de ucayali 2024.pdf
 
Los primeros 60 países por IDH en el año (2024).pdf
Los primeros 60 países por IDH en el año (2024).pdfLos primeros 60 países por IDH en el año (2024).pdf
Los primeros 60 países por IDH en el año (2024).pdf
 
El Manierismo. El Manierismo
El Manierismo.              El ManierismoEl Manierismo.              El Manierismo
El Manierismo. El Manierismo
 
procedimiento paran la planificación en los centros educativos tipo v(multig...
procedimiento  paran la planificación en los centros educativos tipo v(multig...procedimiento  paran la planificación en los centros educativos tipo v(multig...
procedimiento paran la planificación en los centros educativos tipo v(multig...
 

¿Representan los Datos de Medios Sociales a Chile?

  • 1. ¿Representan los Datos de Medios Sociales a Chile? ¿Y es Big Data? Ricardo Baeza-Yates IMFD, DCC, Universidad de Chile Northeastern University at Silicon Valley Universitat Pompeu Fabra, Catalunya @polarbeaRBY 1
  • 3. Correlación no implica Causalidad Presencia no siempre es Influencia
  • 4. Correlación no implica Causalidad Presencia no siempre es InfluenciaPresencia no siempre es influencia ni el mismo mensaje
  • 5. ¿Qué son Datos Masivos? (Big Data) Los macrodatos es un término que hace referencia a conjuntos de datos tan grandes y complejos como para que hagan falta aplicaciones informáticas no tradicionales de procesamiento de datos para tratarlos adecuadamente. (Wikipedia) ¿Cuán grandes? ¿Cuán complejos?
  • 6. ¿Qué son Datos Masivos? (Big Data) Volumen: la cantidad de datos generados y guardados Variedad: el tipo y naturaleza heterogénea de los datos Velocidad: tasa a la cual se generan y procesan los datos Veracidad: calidad de los datos capturados Valor: los datos generados deben ser útiles y accionables
  • 7. Característica Problema de los datos Problema de procesamiento Volumen Escala, Redundancia Escalabilidad Variedad Heterogeneidad, Complejidad Adaptabilidad, Extensibilidad Veracidad Exhaustividad, Sesgo, Escasez, Ruido, Spam Fiabilidad, Confianza Velocidad Tiempo real En línea Valor Utilidad, Privacidad Depende del negocio
  • 8. ¿Quiénes tienen Big Data? Volumen de Datos Empresas Datos Masivos Datos normales, pequeños, escasos, caros, ….
  • 9. Si, las Redes Sociales Generan Big Data DOMO, 2015
  • 10. Y en Chile También Población: 19M Internet: 15M de usuarios (79%) en Celulares: 14M (74%) Usuarios reales de Twitter: a lo más 3,5M (18%) Red Social ¿Datos Públicos? Usuarios Chilenos* Whatsapp (implícita) Ninguno 14M Facebook Pocos 13M Instagram Algunos 7,3M YouTube Muchos ? Twitter Todos 1,5M * Audiencia publicitaria
  • 11. Estos Usuarios tienen Sesgos Demográficos de Género y Edad
  • 12. Y Geográficos, Económicos, Educacionales, Tecnológicos, etc. 0,5M 1M 2M 2018
  • 13. Otros Sesgos de Muestreo * Los datos que entrega la API de Twitter ya son una muestra * Que tweets seleccionamos: #hashtags, palabras claves, etc. à completitud de opiniones de usuarios menos expertos Y una muestra de big data NO es big data
  • 14. Por lo tanto Twitter es una muestra sesgada No permitido Analógicos Sin Internet
  • 15. ¿Podemos Mitigar estos Sesgos? • Si, parcialmente • Podemos segmentar la muestra y darle a cada segmento el peso correcto que debería tener - Segmentación demográfica: género, edad, etc. y usar el último censo • Más segmentos, menos sesgo pero más error de muestreo • La segmentación debe decidirse SIN mirar los datos (p-hacking)
  • 16. Análisis Longitudinal de Discusión de Ley de Aborto en Chile y Argentina Eduardo Graells-Garrido Ricardo Baeza-Yates Mounia Lalmas rakelilla79@twitter 17
  • 17. Contexto: legislación de Aborto en Chile y Argentina, influencia entre países entre 2015-2018. Leyes discutidas en Twitter extensivamente. Pero: ¿Qué tan representativa es la discusión? ¿Qué podemos aprender de ella?
  • 18. Marcha en defensa de los derechos a abortar en marzo de 2015. Source: MovilH (CC licensed). Manifestación pública en oposición a los derechos a abortar en marzo de 2016. Source: Radio BioBio.19 Marcha en defensa de los derechos a abortar en Argentina, 2018. Source: flickr(CC licensed).
  • 19. Proyecto enviado al congreso Se aprueba idea de legislar, se incluyen casos de violación Cámara de Diputados aprueba el proyecto Comisión de Salud del Senado aprueba el proyecto Senado aprueba idea de legislar Senado aprueba la ley. Denuncia y posterior aprobación del Tribunal Constitucional Legislación en Argentina de ley de aborto libre. Rechazada. 6M tweets :: 660 mil perfiles
  • 20. Palabras y términos más empleados en la discusión, y emoji más frecuente
  • 21. Segmentación en Chile: Género y edad ACM Web Science 2019, Boston, Junio 2019
  • 22. Argentina tiene más perfiles, y mayor representación de mujeres menores a 18 años. Los atributos de perfiles fueron clasificados utilizando XGBoost.
  • 23. Cuentas que participaron en la discusión son en su mayoría consolidadas en la red. Solamente en el estallido social se registró más gente que en el terremoto del 27 de Febrero de 2010.
  • 24. Posiciones A pesar del sesgo poblacional, los resultados son coherentes con la encuesta CEP. Por ejemplo: ● Probabilidad de estar en oposición a los derechos de abortar es 0.06 mayor en hombres. ● Probabilidad de estar en oposición aumenta con la edad. Totalmente en oposición a derechos de aborto Totalmente a favor de derechos de aborto
  • 25. Comparación con Encuesta CEP ACM Web Science 2019, Boston, Junio 2019 *** p < 0.001%
  • 26. ¿Qué permite identificar la posición de las personas? El lenguaje que utilizan (matar, decidir) y las hashtags que difunden. ¡Pero también los emoji! Tanto en los tweets como en los nombres. ¡El corazón verde (o celeste) es equivalente al pañuelo verde (o celeste) en las manifestaciones en el mundo físico!
  • 27. Incluso cuando lo hacemos bien, siempre podemos manipular la interpretación de los resultados
  • 29. Ejemplo más complejo: influencia en Twitter Top-20 20,8% 11,3%
  • 30. "Torture the data enough and it will confess to anything” (1960s) (Tortura bastante los datos y confesarán lo que quieras) Ronald Coase, Nobel Prize Laureate in Economics (1991) “Las personas más fáciles de manipular son las que creen que no pueden ser manipuladas” Yuval Noah Harari, 2019 www.ciencia.cl@polarbeaRBY www.baeza.cl