Este documento presenta lineamientos para la visualización de datos. Explica que debido al gran volumen de datos generados hoy en día, la visualización es importante para convertir la complejidad de los datos en un formato comprensible. También describe cuatro pilares clave para una buena visualización: propósito, contenido, estructura y formato. Finalmente, incluye varios ejemplos de visualizaciones de datos históricas y actuales.
4. Hoy vivimos una revolución digital
Dispositivos conectados generando grandes cantidades de datos.
5. Hoy vivimos una revolución digital
La tendencia.
Más de 50 billones de dispositivos conectados para el año 2020.
Fuente: Bi Intelligence Estimates
6. Tsunami de los datos
¿Cómo surfear esta ola?
Photo by Jeremy Bishop on Unsplash
7. En los últimos años el volumen de la información, ha crecido
exponencialmente, mientras que nuestra capacidad de comprensión está
limitada.
La visualización es un
medio que nos permite
cerrar este gap.
El rol de la visualización
Capacidad de entender
8. ¿Qué es una visualización de datos?
Se refiere a la creación y al estudio de representaciones y exploraciones
visuales de datos.
Ante la gran cantidad de datos que se manejan en un proyecto de Big
Data, la visualización convierte la complejidad de los dataset, a un
formato comprensible, accesible y utilizable.
¿Cuál es su ventaja?
9. “La Visualización actúa como un vehículo para la
construcción del conocimiento, revelando los patrones
que subyacen a los datos”
Juan C. Dürsteler
10. Solución: ¿Mostrar todos los datos?
Saturación de información. No nos facilita
comprender para tomar una decisión.
11. ¿Entonces cómo?
No es presentar todos los datos sin un tratamiento adecuado.
Los datos se deben convertir en información relevante para el
usuario, quien a través de la percepción e interpretación de los
mismos, generará el conocimiento y la sabiduría.
= Frustración
12. Percepción humana
A partir de una simple
representación gráfica, la
percepción humana es una
poderosa máquina, capaz de
rescatar patrones y observar
tendencias o valores atípicos.
Photo by paul morris on Unsplash
15. La percepción humana
Al mismo tiempo, esta percepción puede inducirnos a errores y llevarnos
a conclusiones engañosas, por las propias limitaciones cognitivas.
16. La percepción humana
Sin un marco de referencia, no sólo es difícil evaluar los colores... puede
ser erróneo. La percepción de un color es totalmente contextual e
intuitiva, es decir nuestro cerebro hace sus interpretaciones
automáticamente.
“Visualization Analysis & Design” Tamara Munzner 2014, P.112- 114
¿Qué cuadro de color es más oscuro, A o B?
A
B
22. Conversión de datos en información:
- Recolectar y almacenar los datos relevantes.
- Procesar y transformar los datos, filtrando errores.
- Construcción de tablas de datos.
Diagrama Infoviz / De los datos a la información
23. Diagrama Infoviz / De la información a la visualización
Convertir la información en una visualización gráfica:
Técnicas de creatividad asociadas variables visuales, gramática y sintaxis
del lenguaje gráfico y reglas de composición, metáforas visuales, etc...
24. Comprensión de la visualización por el usuario para crear conocimiento.
Percepción, Gestalt, psicología cognitiva, modelos mentales, usabilidad,
diseño de interacción, etc...
Diagrama Infoviz / De la visualización a la comprensión
25. Basado en el Diagrama InfoVIz de Yuri Engelhardt (Amsterdam) & Juan C. Dürsteler (Barcelona), 2007
Captura del
dato
Ingeniería
electrónica
Ciencia de los
datos
Usabilidad y
experiencia
de usuario
Diseño gráfico y de
interacción
34. Patentes industriales,
Pilar Abiuso & Antonio Bustamante
Diplomado en DataViz UC 2017
Caso de uso
Análisis del problema
¿Quién necesita esta información?
Definir propósito, objetivo
Estructura, prototipar
Formato, presentación
35. Patentes industriales,
Pilar Abiuso & Antonio Bustamante
Diplomado en DataViz UC 2017
Caso de uso
Análisis del problema
¿Quién necesita esta información?
Definir propósito, objetivo
Estructura, prototipar
Formato, presentación
36. Patentes industriales,
Pilar Abiuso & Antonio Bustamante
Diplomado en DataViz UC 2017
Caso de uso
Análisis del problema
¿Quién necesita esta información?
Definir objetivo, pregunta
Estructura, prototipar
Formato, presentación
¿Cómo explorar la inscripción de
patentes de propiedad industrial en el
Instituto Nacional de Propiedad Industrial
(INAPI) en Chile a través de una
visualización dirigida a investigadores y
personas ligadas a la innovación,
teniendo como variables de la patente el
tipo de licencia, año de inscripción,
sector a la que pertenece, autor y país
que inscribe, para descubrir relaciones y
tendencias en investigación en nuestro
país, en un contexto de mucho ruido
entorno a la innovación en Chile… ¿qué
de eso es mito y qué realidad?
37. Patentes industriales,
Pilar Abiuso & Antonio Bustamante
Diplomado en DataViz UC 2017
Caso de uso
Análisis del problema
¿Quién necesita esta información?
Definir propósito, objetivo
Contenido y Estructura, datasets,
prototipar, testear
Formato, presentación
38. Patentes industriales,
Pilar Abiuso & Antonio Bustamante
Diplomado en DataViz UC 2017
Caso de uso
Análisis del problema
¿Quién necesita esta información?
Definir propósito, objetivo
Contenido y Estructura, datasets,
prototipar, testear
Formato, presentación
40. Referencias utilizadas:
- “Designing Data Visualizations” - Noah Iliinsky, Julie Steele, 2011.
- “Four Pillars of Visualization” - IBM 2014 - Noah Iliinsky
- La revista digital de InfoVis.net - Juan C. Dürsteler.
- “Humanizing Big Data: Marketing at the Meeting of Data, Social Science
and Consumer Insight” - Colin Strong, 2015.
- “Design for Information” - Isabel Meirelles, 2013.
- “The Visual Display of Quantitative Information” - Edward R. Tufte 2007.
La tendencia hacia el año 2020, es que sean más de 50 billones de dispositivos conectados.
Ciertas personas se refieren a este fenómeno, como el tsunami de los datos.
Entregar abruptamente los datos = Saturación de información.
Conocer a la persona (al usuario) qué datos necesita para tomar una decisión.No tomar decisiones solo basadas en los datos.
De acuerdo a las necesidades de información del usuario que consume los datos.
70 % vista y 30 % otros sentidos.
50% cerebro solo procesa imágenes.
El cuarteto de Anscombe comprende cuatro conjuntos de datos que tienen las mismas propiedades estadísticas, pero que evidentemente son distintas al inspeccionar sus gráficos respectivos.Cada conjunto consiste de once puntos (x, y) y fueron construidos por el estadístico F. J. Anscombe. El cuarteto es una demostración de la importancia de mirar gráficamente un conjunto de datos antes de analizarlos.Sin embargo, es evidente que las series de datos son diferentes. Una investigación solamente por parámetros estadísticos no es suficiente para detectar patrones.
El cuarteto de Anscombe comprende cuatro conjuntos de datos que tienen las mismas propiedades estadísticas, pero que evidentemente son distintas al inspeccionar sus gráficos respectivos.Cada conjunto consiste de once puntos (x, y) y fueron construidos por el estadístico F. J. Anscombe. El cuarteto es una demostración de la importancia de mirar gráficamente un conjunto de datos antes de analizarlos.Sin embargo, es evidente que las series de datos son diferentes. Una investigación solamente por parámetros estadísticos no es suficiente para detectar patrones.
Diagrama propuesto para construcción del conocimiento usando la percepción.Es por eso que no es solo algo de máquinas, al humano también es importante de considerarlo en la ecuación.En este diagrama aparece el rol de Diseñador de la visualización y el usuario quien consume e interpreta esta representación gráfica, como actores relevantes del proceso.Ambos en base a su contexto y cultura realizan interpretaciones en su propio esquema notacional.
Conversión datos en información, definición del problema,recolección de datos (categóricos, ordinales, numéricos)procesado de datos (metadatos, tratamiento, limpieza, datos derivados, etc) etc...
Un proyecto de datos necesita de:
La tecnología para obtener los datos y realizar las operaciones de gestión de la información, ej. la sensorización en IOT que hacemos en i+d.
Determinan cuáles son los datos relevantes, los patrones significativos y una primera aproximación a una representación visual que haga sentido.
Proposiciones de modelos gráficos atractivos que responden a criterios de percepción humana para su comprensión.
Entender las necesidades de información que requiere el usuario para la generación de conocimiento y la toma de decisiones.
Propósito, conocer el origen de la epidemia de cólera en Londres.
Contenido: mostrar las relaciones que importan, temperatura, ríos.
Contenido: Reducir las referencias geográficas, menos es más.
En cuanto al Contenido, menos es más.
En este ejemplo no es necesario graficar con detalle la geografía, sino el dato demográfico de distribución, el cual es el propósito final de esta visualización. Se mantiene el foco en lo relevante.
Deformar la geografía, privilegiando los datos.
Color es tipo de vuelo.
Azul es alta altitud y blanco indica baja altitud de vuelo.
El diseño de la visualización ocurre en los tres pasos finales, las anteriores son dominio del análisis y exploración de los datos.
Las decisiones basadas puramente en datos pueden no ayudarnos a comprender el mundo real y aplicar el sentido común.Las decisiones basadas en datos deben tener en cuenta el mundo real.
No todo está en los datos.
Ej. Caso pasajera de avión de Portugal a Londres, quien queda sin servicio de comida por falta de puntos de fidelización con la aerolínea.
Al trabajar con grandes cantidades de datos (Big Data), no debemos olvidar que existe una persona, la que genera o consume los datos.
Con la gran cantidad de datos tomamos decisiones, si no consideramos a las personas y solo miramos los datos, se pueden tomar decisiones erróneas.
Aprovechar las ventajas de la percepción humana para transmitir la información y generar conocimiento con los datos.