SlideShare une entreprise Scribd logo
1  sur  35
Periodismo de Datos
 Matemática Básica



                                Sandra Crucianelli
          Knight International Journalism Fellowship
                                        www.icfj.org
                                 scrucianelli@icfj.org
                                       @spcrucianelli
¿Números absolutos?
   Los números solos no dicen nada

   Evite el uso de números absolutos dentro de la crónica
    cuando analiza tendencias, variables o fenómenos
    sociales que pueden modificarse a lo largo del tiempo

   El número absoluto carece de representatividad

   Si escribo que XX dona un 1,5 millones de dólares por
    mes eso parece mucho, pero la percepción es errónea, ya
    que ese valor guarda una relación con sus ingresos

   ¿Y si resulta que el vecino de mi casa es más generoso
    que Bill Gates?
Donaciones por mes
¿Es tan generoso XX?

       Nombre      Donación por mes
XX                1.500.000 $
Goyo              150.000 $
Franco            75.000 $
Susana            35.000 $
Amalia            25.000 $
Juan Pérez (mi    25 $
vecino)
Comparar con otra variable
 Donante      Donación $/   Ganancia $/
              mes           mes
 XX           1.500.000     42.000.000
 Goyo         150.000       5.000.000

 Franco       75.000        4.500.000
 Susana       35.000        800.000

 Amalia       25.000        700.000

 Juan Pérez   25            550
Resultado
  Donante     Donación    Ganancia          %
               $ mes       $ mes       donación/
                                        ganancia
 Juan Pérez   25          550          4,54

 Susana       35.000      800.000      4,37
 XX           1.500.000   42.000.000   3,57

 Amalia       25.000      740.000      3,33
 Goyo         150.000     5.000.000    3

 Franco       75.000      4.500.000    1,66
Regla de las Proporciones
   Si a un elemento A le corresponde uno B, ¿cuál
    será esa correspondencia (x) respecto de un
    elemento C
   A----------B
   C---------- x = ?

La x representa la incógnita

x será igual a : (C x B) / A
Es decir, el producto de C x B dividido el valor de A

¿No recuerda, no entiende para qué le sirve esto?
Ejercicio
 Calculen, cuántas personas integraron
  una manifestación popular para
  apoyar a un candidato.
 Fue muy concurrida: ocupaba 150
  metros de largo y 8 metros de ancho.
Referencias
 Muy Comprimidas = 4 personas x
  metro cuadrado (sin distancia entre
  ellas)
 Medianamente comprimidas = 2
  personas x metro cuadrado
  (separación de medio metro de
  distancia)
 Dispersas = 1 persona x metro
  cuadrado (separación de 1 metro)
Resultado
 Superficie = Lado mayor x Lado
  menor
S = 150 metros x 8 metros
S = 1.200 m²

1 m² ------------------- 4 personas
1.200 m² ---------------X = 4.800 personas
Eliminación de decimales



Eliminación de 1 decimal: (criterio del cinco)
 20,17 = 20,2 ( 7 mayor que 5)
 0,173 = 0,17 ( 3 menor que 5)


Eliminación de 2 decimales: (criterio del 50)
 0,1798 = 0,18 ( 98 mayor que 50)
 3,4919 = 3,49 (19 menor que 50)
Personas, casos, denuncias…
Variables imposibles de fraccionar

 17,6   personas = 18
 15,3   personas = 15
 15,5   personas = Entre 15 y 16...
 19,8   bebés = 20 bebés
 58,2   ancianos = 58 ancianos
Mito del Periodismo
 “El periodismo cuenta noticias, no las
  crea ni las construye”. Falso
 Realidad: El periodismo no “inventa”
  noticias, pero puede construirlas a
  partir de la observación y la
  deducción.
 Herramienta: La entrevista a los
  números
 ¿Qué dicen?
Proceso en el Manejo de
Números
   Recopilación (propia o ajena): A veces
    no vienen solos
   Almacenarlos (archivos, hojas de cálculo)
   Analizarlos
   Resumirlos (selección de datos, ¿qué
    contribuye a mi historia?)
   Comunicarlos (previo proceso de
    interpretación)
Información del Proceso
   Debe formar parte de la crónica
   Hace que el artículo sea sólido y
    transparente.
   Permite la revisión crítica y si pasa
    esa prueba, es válido.
   Una hipótesis periodística no debe
    condicionar al periodista = Tenga su mente
    abierta. A veces los números pueden
    demostrarle al reportero que está
    equivocado.
Medidas de Tendencia Central
Estadística Descriptiva

   Distribución de datos: Tienen a
    acumularse hacia el centro

 Los más comunes son
 Media Arimetica (Valor Medio o
  Promedio)
 Mediana (no aplicable)
 Moda (Valor Más frecuente)
Promedio o Media Arimética
   Suma de todos los casos, dividida por el número
    de casos


   P= Σ n / N
   n: cada dato
   N: cantidad datos totales

   Se distorsiona si tiene valores extremos o no
    representativos del resto.
Ejemplo en que P no sirve

   En las elecciones de cierta ciudad, en los últimos 7
    años, la cantidad de indecisos fue:
   300 – 400 – 500 – 700 – 1200 – 5000 - 8000
   P= 2.300
   El reportero escribió: “en los últimos 7 años el
    promedio de indecisos fue de 2.300”
   Es incorrecto.
   El promedio, en este caso no representa a
    ningún año.
Promedio por clases o
intervalos
   (1) 8000 $      Clase 1: 8000 ( 1
   (9) 3200 $       funcionario)
   (18) 2599$
   (36) 2200$      Clase 2: (2200-3200)
                     P:2457$ (63 funcionarios)
   (32) 1800$
   (21) 1500$
                    Clase 3: (1800-1080)
   (15) 1200$
                     P:1501$
   (12) 1080$
                    ( 80 funcionarios)
   (57) 850$
   (86) 750$
                    Clase 4: (850-360) P:
   (92) 560$        517$ (550 funcionarios)
   (105) 420$
   (210) 360$
Mediana o Valor Central
   Valor que                Ejemplo 1
    representa el punto      7-10-10-12-13-15-17
    central de una           Mediana: 12
    serie de datos.
   Ordenar de menor         Ejemplo 2
    a mayor.                 7-10-10-12-13-15
   Significa que el 50
                             Se toma el P de los
                              centrales internos. En
    % de los valores          este caso= 11
    quedan por debajo        La mediana es 11.
    de ese dato y el
    otro 50 % por
    encima.
Moda
 Es el valor más frecuente, el que se
  más veces se repite en un conjunto
  de datos.
 Ejemplo:
 Cantidad de candidatos por elección
  en los últimos 7 años
 16-20-16-17-16-23-12
 Moda: 16
 Equivale a frecuencia de un dato
Variación Porcentual
   Lo que no cambia no es noticia.
   Lo que cambia sí.
   Toda variación implica un cambio y los cambios
    suelen contener noticias de relevancia.
   Tema de máxima importancia en el análisis de
    tablas numéricas.

Dos operaciones diferentes:

s   Variación % basada en números
    absolutos (expresada en %)

s   Variación entre % (expresada en puntos
    porcentuales)
Ejemplo 1: Caso Votos Impugnados


   1991:   58          1991:    58
   1992:   74          1992:    16 (agregados)
   1993:   192         1993:   118
   1994:   320         1994:   128
   1995:   415         1995:    95
   1996:   512         1996:    97
   1997:   640         1997:   128
   1998:   720         1998:    80
   1999:   960         1999:   240
   2000:   1080        2000:   120
   2001:   1280        2001:   200
Variación Porcentual = ¿En qué año
    ocurrió el mayor incremento?

                       Paso 1:
    1991     ---
                       Calcule la diferencia Vf – Vi
    1992:   +28 %
                       Paso 2
    1993:   +159%     Traslade esa diferencia a %
    1994:   + 66%
    1995:   + 30%     74 - 58: 16
    1996:   + 23%
    1997:   + 25%     58 m................. 100%
    1998:   + 12,5%   16 m.............x = 28%
    1999:   + 33%
    2000:   +12,5%       Si el resultado da negativo,
    2001:   +18,5%        la variación es (-)
                          Mayor incremento: 1993
Variación entre %
   El candidato A medía la semana pasada 10 % de
    intención de voto. Hoy mide 12 %. El reportero
    escribió que la intención de voto del candidato
    aumentó 2 % ¿Es correcto?
   No.
   Lo correcto, en este caso, es escribir que aumentó 2
    puntos porcentuales, ubicándose en el 12 %

   ¿Si el 10 % era el total, la variación % (+2), cuánto
    representa? = La cuenta daría un 20 %, pero es
    confuso para el lector.
   Las variaciones porcentuales entre 2 porcentajes se
    expresan mejor en puntos porcentuales.
   ¿Siempre?
No necesariamente …
   El precio de un producto pasó de 100 $ a 110$. Es
    claro que aumentó el 10 %

   Pero cuando no tienen a la vista los números
    absolutos y solo se dispone de porcentajes, las
    conclusiones son más engañosas.

   Por ejemplo: el interés de una tasa bancaria pasó
    del 10 % a principios de año al 20 % a fin de año.
   Subió el 100 % = correcto (se duplicó)
   En este caso quedaría claro para el lector, pero
    solo porque trabajamos con números sencillos.
   El aumento fue de 10 puntos porcentuales,
    ubicándose al final del año en el 20 %
Ejemplo tomado de crónica
 Resultados % para un candidato: (Variación % neta respecto del
     año anterior)
 Encuesta de Mayo: (+) 35%
 Encuesta de Agosto: (-) 23 %
 El reportero escribe que la intención de voto bajó un 12 %
 Un lector escribe para desmentirlo, diciendo que la baja
     no fue del 12 % sino mayor: casi del 18%

 El reportero se equivocó, el lector tiene razón en que la baja % es
 mayor, pero no es del 18 % , sino del 34 %
 Correcto:
 En agosto, el candidato disminuyó en 12 puntos
 porcentuales su intención de voto, ubicándose en el 23 %
 respecto de la medición de mayo.
 El descenso % sería mayor:
     35 % era el total
 (-) 12 % (diferencia) = (-) 34 % (descenso %)

 El lector se equivoca porque al hacer el cálculo, no considera la
 diferencia neta.
Los cambios porcentuales no son
reversibles
   Es uno de los errores más comunes
   Ejemplo: en un pueblo con 5.000 electores los resultados
    fueron:
   Elección del 2000: El partido A obtuvo 1760 votos
   Elección del 2004: El partido B obtuvo 1570 votos
   Diferencia: (-)190 votos

   El partido A perdió el 10,79 % de los votos obtenidos en el
    2000.

   ¿Cuál sería el % necesario en las elecciones del 2008 para
    recuperarse? ¿10,79 %?

   NO. La base es otra. En votos es 190 pero el % es diferente.

   1570........100%
   190..........x = 12,10%
Otras consideraciones
   Nunca sume, reste o promedie porcentajes a
    menos que tengan la misma base (con lo cual
    podríamos graficar una torta)
   En encuestas electorales, para intención de voto
    verifique que la suma de 100 %.
   Encuestas sobre otros temas, con preguntas abiertas
    pueden dar sumas mayores del 100 % (opciones
    múltiples)
   Recuerde que el concepto de variación porcentual es
    diferente al de “puntos porcentuales de variación”.
   Informe variaciones % si tiene números netos a
    la vista
   Analice la tabla usando puntos % si solo tiene
    porcentajes.
Recuperación Porcentual
   Es uno de los errores más comunes (Bolsa)
   Día 1: Indice DJ cerró 1759,89 puntos
   Día 2: Indice DJ cerró 1569,26 puntos
   (Diferencia: -190,63).
   Perdió el 10,83 %. ¿Qué porcentaje tenía que
    tener el Día 3 para recuperarse? ¿10,83? NO. La
    base es otra. En puntos es 190.63, pero el % es
    diferente.
   1569,26........100%
   190,63..........x= 12,14%
Otras formas de expresar cambios

 1998: 58 indecisos
 2008: 1280 indecisos



¿Cómo expresarían esa medida de
  cambio?
Tantas veces más …
 El reportero escribe: “Ahora hay 22 veces más
  indecisos que hace diez años”.
No es correcto

   1280/58: 22 (Pero el 22 contiene la base)
   Correcto: “21 veces más que hace 10 años”
   Hay que considerar que en 1991 ya había 58
    indecisos (la cuenta no parte del 0)
Tantas veces más...

   El candidato A tiene 20 años
   El candidato B tiene 60 años

   El reportero escribió: “El candidato B es tres
    veces más viejo que el candidato A”.
   Falso.

   Si fuera tres veces más viejo tendría 80.
   En este caso es 2 veces.
Crecimiento
   Una sucesión de datos crece linealmente (o
    ariméticamente) si su tasa de aumento es
    constante (ritmo sostenido), por caso, que todos
    los años aumente el 5 %, significa que a cada
    dato individual se le va sumando una constante
   Una sucesión de datos crece exponencialmente
     (o geométricamente) si su tasa de aumento de
    la sucesión se obtiene multiplicando (no
    sumando) el anterior a un número constante.
Crecimiento
Lineal     Exponencial
Probabilidad: La suma siempre es 1
   Para la elección municipal del 2008 había 12
    candidatos:
   5 Partido A
   7 Partido B

¿Qué probabilidades tienen ambos partidos ?
   P A: 5/12 = 0,4
   P B: 7/ 12 = 0,6
   La suma da 1
   Convirtiendo en %:
   40 % A
   60 % B

Contenu connexe

Tendances (20)

UTPL-ESTADÍSTICA II-I-BIMESTRE-(OCTUBRE 2011-FEBRERO 2012)
UTPL-ESTADÍSTICA II-I-BIMESTRE-(OCTUBRE 2011-FEBRERO 2012)UTPL-ESTADÍSTICA II-I-BIMESTRE-(OCTUBRE 2011-FEBRERO 2012)
UTPL-ESTADÍSTICA II-I-BIMESTRE-(OCTUBRE 2011-FEBRERO 2012)
 
4 estadistica descriptiva
4 estadistica descriptiva4 estadistica descriptiva
4 estadistica descriptiva
 
UTPL-ESTADÍSTICA-I-BIMESTRE-(OCTUBRE 2011-FEBRERO 2012)
UTPL-ESTADÍSTICA-I-BIMESTRE-(OCTUBRE 2011-FEBRERO 2012)UTPL-ESTADÍSTICA-I-BIMESTRE-(OCTUBRE 2011-FEBRERO 2012)
UTPL-ESTADÍSTICA-I-BIMESTRE-(OCTUBRE 2011-FEBRERO 2012)
 
Estadistica 2º eso
Estadistica 2º esoEstadistica 2º eso
Estadistica 2º eso
 
Clase03 eyp
Clase03 eypClase03 eyp
Clase03 eyp
 
Términos Básicos de Estadística l
Términos Básicos de Estadística lTérminos Básicos de Estadística l
Términos Básicos de Estadística l
 
Porcentajes y tanto por ciento
Porcentajes y tanto por cientoPorcentajes y tanto por ciento
Porcentajes y tanto por ciento
 
Estadistica I 02
Estadistica  I 02Estadistica  I 02
Estadistica I 02
 
Organizacion de datos lv
Organizacion de datos lvOrganizacion de datos lv
Organizacion de datos lv
 
Estadistica I 04
Estadistica  I 04Estadistica  I 04
Estadistica I 04
 
Distr de frec
Distr de frecDistr de frec
Distr de frec
 
Fundamentos de Estadistica Basica ccesa007
Fundamentos de Estadistica Basica  ccesa007Fundamentos de Estadistica Basica  ccesa007
Fundamentos de Estadistica Basica ccesa007
 
Problemario estadistica I
Problemario estadistica IProblemario estadistica I
Problemario estadistica I
 
Exposicion final mayo-todo
Exposicion final  mayo-todoExposicion final  mayo-todo
Exposicion final mayo-todo
 
Frecuencias
FrecuenciasFrecuencias
Frecuencias
 
Estadistica descriptiva
Estadistica descriptivaEstadistica descriptiva
Estadistica descriptiva
 
Estadistica proyecto
Estadistica proyectoEstadistica proyecto
Estadistica proyecto
 
Cap 3c2 medidas numéricas si agrupadas
Cap 3c2   medidas numéricas si  agrupadasCap 3c2   medidas numéricas si  agrupadas
Cap 3c2 medidas numéricas si agrupadas
 
Est2 clase2 2
Est2 clase2 2Est2 clase2 2
Est2 clase2 2
 
Resumen temas vistos[1]
Resumen temas vistos[1]Resumen temas vistos[1]
Resumen temas vistos[1]
 

Similaire à Periodismo de Datos: Matemática Básica

Similaire à Periodismo de Datos: Matemática Básica (20)

Porcentajes
PorcentajesPorcentajes
Porcentajes
 
ESTADÍSTICOS DE POSICIÓN.pdf
ESTADÍSTICOS DE POSICIÓN.pdfESTADÍSTICOS DE POSICIÓN.pdf
ESTADÍSTICOS DE POSICIÓN.pdf
 
Clase 12-Estadística-Inferencial.pdf
Clase 12-Estadística-Inferencial.pdfClase 12-Estadística-Inferencial.pdf
Clase 12-Estadística-Inferencial.pdf
 
Tabla de distribucion
Tabla de distribucionTabla de distribucion
Tabla de distribucion
 
2)Analisis descriptivos de datos.pptx
2)Analisis descriptivos de datos.pptx2)Analisis descriptivos de datos.pptx
2)Analisis descriptivos de datos.pptx
 
Guia estadistica
Guia estadisticaGuia estadistica
Guia estadistica
 
Power Estadística ( tecnología de la Matemática)
Power Estadística ( tecnología de la Matemática)Power Estadística ( tecnología de la Matemática)
Power Estadística ( tecnología de la Matemática)
 
Inferencia estadistica
Inferencia estadisticaInferencia estadistica
Inferencia estadistica
 
TEMA 1 . 19 DE JUNIO-6.pptx
TEMA 1 . 19 DE JUNIO-6.pptxTEMA 1 . 19 DE JUNIO-6.pptx
TEMA 1 . 19 DE JUNIO-6.pptx
 
Taller ii 3º año 2012
Taller ii   3º año 2012Taller ii   3º año 2012
Taller ii 3º año 2012
 
MEDIDAS DE DISPERSIÓN
MEDIDAS DE DISPERSIÓNMEDIDAS DE DISPERSIÓN
MEDIDAS DE DISPERSIÓN
 
Medidas Estadística
Medidas EstadísticaMedidas Estadística
Medidas Estadística
 
ESTADISTICA I
ESTADISTICA IESTADISTICA I
ESTADISTICA I
 
ESTADÍSTICA DESCRIPTIVA.pptx
ESTADÍSTICA DESCRIPTIVA.pptxESTADÍSTICA DESCRIPTIVA.pptx
ESTADÍSTICA DESCRIPTIVA.pptx
 
hh
hhhh
hh
 
Porcentajes
PorcentajesPorcentajes
Porcentajes
 
P_Sem04_Ses08_Medidas_dispersión_no_agrupados con ejercicio con 2 muestras.pptx
P_Sem04_Ses08_Medidas_dispersión_no_agrupados con ejercicio con 2 muestras.pptxP_Sem04_Ses08_Medidas_dispersión_no_agrupados con ejercicio con 2 muestras.pptx
P_Sem04_Ses08_Medidas_dispersión_no_agrupados con ejercicio con 2 muestras.pptx
 
Presentation unidad 2
Presentation unidad 2Presentation unidad 2
Presentation unidad 2
 
Organizacion de datos estadisticos
Organizacion de datos estadisticosOrganizacion de datos estadisticos
Organizacion de datos estadisticos
 
Py e 8
Py e 8Py e 8
Py e 8
 

Plus de Sandra Crucianelli

Herramientas digitales para Periodistas 2018
Herramientas digitales para Periodistas 2018Herramientas digitales para Periodistas 2018
Herramientas digitales para Periodistas 2018Sandra Crucianelli
 
Manejo de situaciones de Acoso y Violencia en Redes Sociales
Manejo de situaciones de Acoso y Violencia en Redes SocialesManejo de situaciones de Acoso y Violencia en Redes Sociales
Manejo de situaciones de Acoso y Violencia en Redes SocialesSandra Crucianelli
 
La marca personal del periodista, en Twitter
La marca personal del periodista, en Twitter La marca personal del periodista, en Twitter
La marca personal del periodista, en Twitter Sandra Crucianelli
 
La marca personal del periodista, en Facebook
La marca personal del periodista, en FacebookLa marca personal del periodista, en Facebook
La marca personal del periodista, en FacebookSandra Crucianelli
 
Introducción al Uso de Redes Sociales y Marca Personal
Introducción al Uso de Redes Sociales y Marca Personal Introducción al Uso de Redes Sociales y Marca Personal
Introducción al Uso de Redes Sociales y Marca Personal Sandra Crucianelli
 
Herramientas Digitales de Seguridad para Periodistas de Datos
Herramientas Digitales de Seguridad para Periodistas de Datos Herramientas Digitales de Seguridad para Periodistas de Datos
Herramientas Digitales de Seguridad para Periodistas de Datos Sandra Crucianelli
 
Del Periodismo de Investigación al Periodismo de Base de Datos
Del Periodismo de Investigación al Periodismo de Base de DatosDel Periodismo de Investigación al Periodismo de Base de Datos
Del Periodismo de Investigación al Periodismo de Base de DatosSandra Crucianelli
 
Searching Argentina: Recuperación Web de Datos Oficiales
Searching Argentina: Recuperación Web de Datos Oficiales Searching Argentina: Recuperación Web de Datos Oficiales
Searching Argentina: Recuperación Web de Datos Oficiales Sandra Crucianelli
 
Cómo promover periodismo de datos (versión español)
Cómo promover periodismo de datos (versión español)Cómo promover periodismo de datos (versión español)
Cómo promover periodismo de datos (versión español)Sandra Crucianelli
 
Webinario sobre Periodismo de Datos
Webinario sobre Periodismo de DatosWebinario sobre Periodismo de Datos
Webinario sobre Periodismo de DatosSandra Crucianelli
 
Periodismo de datos: Básico y con recursos gratis
Periodismo de datos: Básico y con recursos gratisPeriodismo de datos: Básico y con recursos gratis
Periodismo de datos: Básico y con recursos gratisSandra Crucianelli
 
Periodismo de Datos: Definiciones y Buenas Prácticas
Periodismo de Datos: Definiciones y Buenas PrácticasPeriodismo de Datos: Definiciones y Buenas Prácticas
Periodismo de Datos: Definiciones y Buenas PrácticasSandra Crucianelli
 
Periodismo de datos introducción
Periodismo de datos introducciónPeriodismo de datos introducción
Periodismo de datos introducciónSandra Crucianelli
 
Líneas de tiempo hackaton abril 2012
Líneas de tiempo hackaton abril 2012Líneas de tiempo hackaton abril 2012
Líneas de tiempo hackaton abril 2012Sandra Crucianelli
 

Plus de Sandra Crucianelli (20)

Herramientas digitales para Periodistas 2018
Herramientas digitales para Periodistas 2018Herramientas digitales para Periodistas 2018
Herramientas digitales para Periodistas 2018
 
Manejo de situaciones de Acoso y Violencia en Redes Sociales
Manejo de situaciones de Acoso y Violencia en Redes SocialesManejo de situaciones de Acoso y Violencia en Redes Sociales
Manejo de situaciones de Acoso y Violencia en Redes Sociales
 
La marca personal del periodista, en Twitter
La marca personal del periodista, en Twitter La marca personal del periodista, en Twitter
La marca personal del periodista, en Twitter
 
La marca personal del periodista, en Facebook
La marca personal del periodista, en FacebookLa marca personal del periodista, en Facebook
La marca personal del periodista, en Facebook
 
Introducción al Uso de Redes Sociales y Marca Personal
Introducción al Uso de Redes Sociales y Marca Personal Introducción al Uso de Redes Sociales y Marca Personal
Introducción al Uso de Redes Sociales y Marca Personal
 
Herramientas Digitales de Seguridad para Periodistas de Datos
Herramientas Digitales de Seguridad para Periodistas de Datos Herramientas Digitales de Seguridad para Periodistas de Datos
Herramientas Digitales de Seguridad para Periodistas de Datos
 
Del Periodismo de Investigación al Periodismo de Base de Datos
Del Periodismo de Investigación al Periodismo de Base de DatosDel Periodismo de Investigación al Periodismo de Base de Datos
Del Periodismo de Investigación al Periodismo de Base de Datos
 
Bases de Datos. Caso México
Bases de Datos. Caso MéxicoBases de Datos. Caso México
Bases de Datos. Caso México
 
Searching Argentina: Recuperación Web de Datos Oficiales
Searching Argentina: Recuperación Web de Datos Oficiales Searching Argentina: Recuperación Web de Datos Oficiales
Searching Argentina: Recuperación Web de Datos Oficiales
 
Cómo promover periodismo de datos (versión español)
Cómo promover periodismo de datos (versión español)Cómo promover periodismo de datos (versión español)
Cómo promover periodismo de datos (versión español)
 
How to promote dj
How to promote djHow to promote dj
How to promote dj
 
Estadística inferencial
Estadística inferencialEstadística inferencial
Estadística inferencial
 
Bases de datos
Bases de datosBases de datos
Bases de datos
 
Deep Web searching
Deep Web searchingDeep Web searching
Deep Web searching
 
Data Teams, Media Party
Data Teams, Media PartyData Teams, Media Party
Data Teams, Media Party
 
Webinario sobre Periodismo de Datos
Webinario sobre Periodismo de DatosWebinario sobre Periodismo de Datos
Webinario sobre Periodismo de Datos
 
Periodismo de datos: Básico y con recursos gratis
Periodismo de datos: Básico y con recursos gratisPeriodismo de datos: Básico y con recursos gratis
Periodismo de datos: Básico y con recursos gratis
 
Periodismo de Datos: Definiciones y Buenas Prácticas
Periodismo de Datos: Definiciones y Buenas PrácticasPeriodismo de Datos: Definiciones y Buenas Prácticas
Periodismo de Datos: Definiciones y Buenas Prácticas
 
Periodismo de datos introducción
Periodismo de datos introducciónPeriodismo de datos introducción
Periodismo de datos introducción
 
Líneas de tiempo hackaton abril 2012
Líneas de tiempo hackaton abril 2012Líneas de tiempo hackaton abril 2012
Líneas de tiempo hackaton abril 2012
 

Periodismo de Datos: Matemática Básica

  • 1. Periodismo de Datos Matemática Básica Sandra Crucianelli Knight International Journalism Fellowship www.icfj.org scrucianelli@icfj.org @spcrucianelli
  • 2. ¿Números absolutos?  Los números solos no dicen nada  Evite el uso de números absolutos dentro de la crónica cuando analiza tendencias, variables o fenómenos sociales que pueden modificarse a lo largo del tiempo  El número absoluto carece de representatividad  Si escribo que XX dona un 1,5 millones de dólares por mes eso parece mucho, pero la percepción es errónea, ya que ese valor guarda una relación con sus ingresos  ¿Y si resulta que el vecino de mi casa es más generoso que Bill Gates?
  • 3. Donaciones por mes ¿Es tan generoso XX? Nombre Donación por mes XX 1.500.000 $ Goyo 150.000 $ Franco 75.000 $ Susana 35.000 $ Amalia 25.000 $ Juan Pérez (mi 25 $ vecino)
  • 4. Comparar con otra variable Donante Donación $/ Ganancia $/ mes mes XX 1.500.000 42.000.000 Goyo 150.000 5.000.000 Franco 75.000 4.500.000 Susana 35.000 800.000 Amalia 25.000 700.000 Juan Pérez 25 550
  • 5. Resultado Donante Donación Ganancia % $ mes $ mes donación/ ganancia Juan Pérez 25 550 4,54 Susana 35.000 800.000 4,37 XX 1.500.000 42.000.000 3,57 Amalia 25.000 740.000 3,33 Goyo 150.000 5.000.000 3 Franco 75.000 4.500.000 1,66
  • 6. Regla de las Proporciones  Si a un elemento A le corresponde uno B, ¿cuál será esa correspondencia (x) respecto de un elemento C  A----------B  C---------- x = ? La x representa la incógnita x será igual a : (C x B) / A Es decir, el producto de C x B dividido el valor de A ¿No recuerda, no entiende para qué le sirve esto?
  • 7. Ejercicio  Calculen, cuántas personas integraron una manifestación popular para apoyar a un candidato.  Fue muy concurrida: ocupaba 150 metros de largo y 8 metros de ancho.
  • 8. Referencias  Muy Comprimidas = 4 personas x metro cuadrado (sin distancia entre ellas)  Medianamente comprimidas = 2 personas x metro cuadrado (separación de medio metro de distancia)  Dispersas = 1 persona x metro cuadrado (separación de 1 metro)
  • 9. Resultado  Superficie = Lado mayor x Lado menor S = 150 metros x 8 metros S = 1.200 m² 1 m² ------------------- 4 personas 1.200 m² ---------------X = 4.800 personas
  • 10. Eliminación de decimales Eliminación de 1 decimal: (criterio del cinco)  20,17 = 20,2 ( 7 mayor que 5)  0,173 = 0,17 ( 3 menor que 5) Eliminación de 2 decimales: (criterio del 50)  0,1798 = 0,18 ( 98 mayor que 50)  3,4919 = 3,49 (19 menor que 50)
  • 11. Personas, casos, denuncias… Variables imposibles de fraccionar  17,6 personas = 18  15,3 personas = 15  15,5 personas = Entre 15 y 16...  19,8 bebés = 20 bebés  58,2 ancianos = 58 ancianos
  • 12. Mito del Periodismo  “El periodismo cuenta noticias, no las crea ni las construye”. Falso  Realidad: El periodismo no “inventa” noticias, pero puede construirlas a partir de la observación y la deducción.  Herramienta: La entrevista a los números  ¿Qué dicen?
  • 13. Proceso en el Manejo de Números  Recopilación (propia o ajena): A veces no vienen solos  Almacenarlos (archivos, hojas de cálculo)  Analizarlos  Resumirlos (selección de datos, ¿qué contribuye a mi historia?)  Comunicarlos (previo proceso de interpretación)
  • 14. Información del Proceso  Debe formar parte de la crónica  Hace que el artículo sea sólido y transparente.  Permite la revisión crítica y si pasa esa prueba, es válido.  Una hipótesis periodística no debe condicionar al periodista = Tenga su mente abierta. A veces los números pueden demostrarle al reportero que está equivocado.
  • 15. Medidas de Tendencia Central Estadística Descriptiva  Distribución de datos: Tienen a acumularse hacia el centro  Los más comunes son  Media Arimetica (Valor Medio o Promedio)  Mediana (no aplicable)  Moda (Valor Más frecuente)
  • 16. Promedio o Media Arimética  Suma de todos los casos, dividida por el número de casos  P= Σ n / N  n: cada dato  N: cantidad datos totales  Se distorsiona si tiene valores extremos o no representativos del resto.
  • 17. Ejemplo en que P no sirve  En las elecciones de cierta ciudad, en los últimos 7 años, la cantidad de indecisos fue:  300 – 400 – 500 – 700 – 1200 – 5000 - 8000  P= 2.300  El reportero escribió: “en los últimos 7 años el promedio de indecisos fue de 2.300”  Es incorrecto.  El promedio, en este caso no representa a ningún año.
  • 18. Promedio por clases o intervalos  (1) 8000 $  Clase 1: 8000 ( 1  (9) 3200 $ funcionario)  (18) 2599$  (36) 2200$  Clase 2: (2200-3200) P:2457$ (63 funcionarios)  (32) 1800$  (21) 1500$  Clase 3: (1800-1080)  (15) 1200$ P:1501$  (12) 1080$  ( 80 funcionarios)  (57) 850$  (86) 750$  Clase 4: (850-360) P:  (92) 560$ 517$ (550 funcionarios)  (105) 420$  (210) 360$
  • 19. Mediana o Valor Central  Valor que  Ejemplo 1 representa el punto  7-10-10-12-13-15-17 central de una  Mediana: 12 serie de datos.  Ordenar de menor  Ejemplo 2 a mayor.  7-10-10-12-13-15  Significa que el 50  Se toma el P de los centrales internos. En % de los valores este caso= 11 quedan por debajo  La mediana es 11. de ese dato y el otro 50 % por encima.
  • 20. Moda  Es el valor más frecuente, el que se más veces se repite en un conjunto de datos.  Ejemplo:  Cantidad de candidatos por elección en los últimos 7 años  16-20-16-17-16-23-12  Moda: 16  Equivale a frecuencia de un dato
  • 21. Variación Porcentual  Lo que no cambia no es noticia.  Lo que cambia sí.  Toda variación implica un cambio y los cambios suelen contener noticias de relevancia.  Tema de máxima importancia en el análisis de tablas numéricas. Dos operaciones diferentes: s Variación % basada en números absolutos (expresada en %) s Variación entre % (expresada en puntos porcentuales)
  • 22. Ejemplo 1: Caso Votos Impugnados  1991: 58  1991: 58  1992: 74  1992: 16 (agregados)  1993: 192  1993: 118  1994: 320  1994: 128  1995: 415  1995: 95  1996: 512  1996: 97  1997: 640  1997: 128  1998: 720  1998: 80  1999: 960  1999: 240  2000: 1080  2000: 120  2001: 1280  2001: 200
  • 23. Variación Porcentual = ¿En qué año ocurrió el mayor incremento? Paso 1:  1991 --- Calcule la diferencia Vf – Vi  1992: +28 % Paso 2  1993: +159% Traslade esa diferencia a %  1994: + 66%  1995: + 30% 74 - 58: 16  1996: + 23%  1997: + 25% 58 m................. 100%  1998: + 12,5% 16 m.............x = 28%  1999: + 33%  2000: +12,5%  Si el resultado da negativo,  2001: +18,5% la variación es (-)  Mayor incremento: 1993
  • 24. Variación entre %  El candidato A medía la semana pasada 10 % de intención de voto. Hoy mide 12 %. El reportero escribió que la intención de voto del candidato aumentó 2 % ¿Es correcto?  No.  Lo correcto, en este caso, es escribir que aumentó 2 puntos porcentuales, ubicándose en el 12 %  ¿Si el 10 % era el total, la variación % (+2), cuánto representa? = La cuenta daría un 20 %, pero es confuso para el lector.  Las variaciones porcentuales entre 2 porcentajes se expresan mejor en puntos porcentuales.  ¿Siempre?
  • 25. No necesariamente …  El precio de un producto pasó de 100 $ a 110$. Es claro que aumentó el 10 %  Pero cuando no tienen a la vista los números absolutos y solo se dispone de porcentajes, las conclusiones son más engañosas.  Por ejemplo: el interés de una tasa bancaria pasó del 10 % a principios de año al 20 % a fin de año.  Subió el 100 % = correcto (se duplicó)  En este caso quedaría claro para el lector, pero solo porque trabajamos con números sencillos.  El aumento fue de 10 puntos porcentuales, ubicándose al final del año en el 20 %
  • 26. Ejemplo tomado de crónica Resultados % para un candidato: (Variación % neta respecto del año anterior) Encuesta de Mayo: (+) 35% Encuesta de Agosto: (-) 23 % El reportero escribe que la intención de voto bajó un 12 % Un lector escribe para desmentirlo, diciendo que la baja no fue del 12 % sino mayor: casi del 18% El reportero se equivocó, el lector tiene razón en que la baja % es mayor, pero no es del 18 % , sino del 34 % Correcto: En agosto, el candidato disminuyó en 12 puntos porcentuales su intención de voto, ubicándose en el 23 % respecto de la medición de mayo. El descenso % sería mayor: 35 % era el total (-) 12 % (diferencia) = (-) 34 % (descenso %) El lector se equivoca porque al hacer el cálculo, no considera la diferencia neta.
  • 27. Los cambios porcentuales no son reversibles  Es uno de los errores más comunes  Ejemplo: en un pueblo con 5.000 electores los resultados fueron:  Elección del 2000: El partido A obtuvo 1760 votos  Elección del 2004: El partido B obtuvo 1570 votos  Diferencia: (-)190 votos  El partido A perdió el 10,79 % de los votos obtenidos en el 2000.  ¿Cuál sería el % necesario en las elecciones del 2008 para recuperarse? ¿10,79 %?  NO. La base es otra. En votos es 190 pero el % es diferente.  1570........100%  190..........x = 12,10%
  • 28. Otras consideraciones  Nunca sume, reste o promedie porcentajes a menos que tengan la misma base (con lo cual podríamos graficar una torta)  En encuestas electorales, para intención de voto verifique que la suma de 100 %.  Encuestas sobre otros temas, con preguntas abiertas pueden dar sumas mayores del 100 % (opciones múltiples)  Recuerde que el concepto de variación porcentual es diferente al de “puntos porcentuales de variación”.  Informe variaciones % si tiene números netos a la vista  Analice la tabla usando puntos % si solo tiene porcentajes.
  • 29. Recuperación Porcentual  Es uno de los errores más comunes (Bolsa)  Día 1: Indice DJ cerró 1759,89 puntos  Día 2: Indice DJ cerró 1569,26 puntos  (Diferencia: -190,63).  Perdió el 10,83 %. ¿Qué porcentaje tenía que tener el Día 3 para recuperarse? ¿10,83? NO. La base es otra. En puntos es 190.63, pero el % es diferente.  1569,26........100%  190,63..........x= 12,14%
  • 30. Otras formas de expresar cambios  1998: 58 indecisos  2008: 1280 indecisos ¿Cómo expresarían esa medida de cambio?
  • 31. Tantas veces más …  El reportero escribe: “Ahora hay 22 veces más indecisos que hace diez años”. No es correcto  1280/58: 22 (Pero el 22 contiene la base)  Correcto: “21 veces más que hace 10 años”  Hay que considerar que en 1991 ya había 58 indecisos (la cuenta no parte del 0)
  • 32. Tantas veces más...  El candidato A tiene 20 años  El candidato B tiene 60 años  El reportero escribió: “El candidato B es tres veces más viejo que el candidato A”.  Falso.  Si fuera tres veces más viejo tendría 80.  En este caso es 2 veces.
  • 33. Crecimiento  Una sucesión de datos crece linealmente (o ariméticamente) si su tasa de aumento es constante (ritmo sostenido), por caso, que todos los años aumente el 5 %, significa que a cada dato individual se le va sumando una constante  Una sucesión de datos crece exponencialmente (o geométricamente) si su tasa de aumento de la sucesión se obtiene multiplicando (no sumando) el anterior a un número constante.
  • 34. Crecimiento Lineal Exponencial
  • 35. Probabilidad: La suma siempre es 1  Para la elección municipal del 2008 había 12 candidatos:  5 Partido A  7 Partido B ¿Qué probabilidades tienen ambos partidos ?  P A: 5/12 = 0,4  P B: 7/ 12 = 0,6  La suma da 1  Convirtiendo en %:  40 % A  60 % B