SlideShare une entreprise Scribd logo
1  sur  198
El proceso de análisis y 
explotación de datos en 
proyectos de Business 
Intelligence 
Módulo 01: Ciclo de vida del Dato en ambientes de BI 
Alex Rayón Jerez 
alex.rayon@urbegi.com 
Octubre, 2014
Índice de contenidos 
● Big Data e impacto sociedad 
● Aplicaciones ámbito empresarial 
● Business Intelligence 
● Bases de datos 
● Tipos de datos 
● Ciclo de análisis de datos 
● Agregación de datos 
● Aspectos legales y éticos
Índice de contenidos 
● Big Data e impacto sociedad 
● Aplicaciones ámbito empresarial 
● Business Intelligence 
● Bases de datos 
● Tipos de datos 
● Ciclo de análisis de datos 
● Agregación de datos 
● Aspectos legales y éticos
Big Data y sociedad 
Introducción 
Según un reciente estudio del 
Supervisor Europeo de Protección 
de Datos (EDPS), un 57% de los 
negocios de la UE utilizan ya algún 
sistema para procesar los datos 
que generan los 369 millones de 
internautas europeos
Big Data y sociedad 
Las 4 V’s del Big Data 
Fuente: http://www.business2community.com/digital-marketing/4-vs-big-data-digital-marketing-0914845
Big Data y sociedad 
Nueva sociología 
● El concepto Big Data no es tecnológica ni 
conceptualmente nada nuevo 
o Realmente, es el tratamiento de datos de toda la vida 
en el campo de la Sociología 
Fuente: http://escueladebellasartesmanuelbelgrano.wordpress.com/category/4o-ano/sociologia/
Big Data y sociedad 
Nueva sociología (II) 
● Sin embargo, lo que sí se dispone ahora es de 
nuevas tecnologías que facilitan hacer ese 
tratamiento de datos 
● Por lo tanto, el Big Data, no introduce un 
nuevo modelo para hacer las cosas; sino que 
aporta una nueva capacidad
Big Data y sociedad 
Economía digital 
● En la economía digital existen cuatro factores 
clave 
1. La tecnología 
2. La capa de servicios asociados 
3. La capacidad para generar negocios 
4. Las competencias digitales: cultura digital
Big Data y sociedad 
Economía digital (II) 
Fuente: http://mundocontact.com/actualidad/page/119/ 
La nube se ha consolidado como el 
modelo sobre el que se desarrolla 
el ecosistema digital 
Por ello el acceso se ha convertido, 
como anticipara el sociólogo y 
economista Jeremy Rifkin, en la 
puerta de entrada a la economía 
digital
Big Data y sociedad 
Economía digital (III) 
● La nube impone sus propias reglas de 
funcionamiento que a su vez van configurando 
la arquitectura de la economía digital 
● Según estimaciones de Deloitte, la actividad 
económica vinculada a la conectividad, solo en 
los países en vías de desarrollo, podría 
generar un aumento del 72% en la tasa de 
crecimiento del PIB, y más de 140 millones de 
nuevos puestos de trabajo
Big Data y sociedad 
La economía digital (IV) 
● Cambio demográfico 
o Decisiones en manos de generación 70 y 80 
o No son aún nativos digitales, pero tienen una serie de 
valores distintivos: 
 Individualismo 
 Personalización 
 Inmediatez 
Fuente: http://www.todocoleccion.net/mabel-somo-generacion-80-una-noche-amor-45-hispavox-1979- 
pedido-minimo-10%E2%82%AC~x25950258
Big Data y sociedad 
La economía digital (V) 
From 
Consumer-oriented Internet 
towards 
Company-oriented Internet 
Source: http://pame95.wordpress.com/2012/11/03/mi-ensayo-planeta-web-2-0-la-intercreatividad-y-web-2- 
0/ 
Source: http://antoniotoriz.blogspot.com.es/2013/08/internet-de-las-cosas.html#sthash.hAa2ha7K.dpbs
Big Data y sociedad 
Transformación digital 
Fuente: http://www.mujeresconsejeras.com/estrategia-digital-5-errores-que-puedes-evitar/2014/02/20/
Big Data y sociedad 
Transformación digital (II) 
Source: http://evigo.com/8570-mckinsey-digital-transformation-e-commerce-coming/
Big Data y sociedad 
Palancas de transformación digital 
1)Social Media 
● Estrategia de captación y fidelización 
● Objetivo: movilizar actitudes para cambiar 
comportamientos 
● Crecimiento en B2B 
● Tráfico en buscadores vs. tráfico en redes 
sociales
Big Data y sociedad 
Palancas de transformación digital (II) 
2) Movilidad 
● Uso de móvil ya es superior al del PC 
o España, Francia y UK lideran el uso de smartphones 
● Aplicaciones B2B a punto de superar las 
aplicaciones B2C 
o De una Internet de consumidores a una Internet de 
empresas 
o Entornos B2B: desarrollar canales de comunicación 
con consumidor final, que sirvan de prescriptores y 
hagan pull sobre los distribuidores
Big Data y sociedad 
Palancas de transformación digital (III) 
3) eCommerce 
● La tecnología expansiona mercados 
● Plan único estrategia on-off 
o Vinculado con estrategias pricing y clienting 
o Herramientas como Minderest 
Fuente: http://www.comunicacion-cultural.com/2012/05/21/la-expansion-internacional-de-las-librerias-abre-nuevos-mercados/comment-page-1/
Big Data y sociedad 
Marketing digital y datos desestructurados 
Las estrategias omnicanal de las empresas 
(CRM, Call Center, Web, Social Media, etc.) han 
traído muchos problemas a las empresas de 
marketing para poder cuantitivizar la presencia 
Fuente: http://www.samueldiosdado.com/02/el-cliente-ya-es-multicanal-es-omnicanal/
Big Data y sociedad 
Marketing digital y datos desestructurados (II) 
Source: http://www.i95dev.com/understanding-omni-channel-and-multichannel/
Índice de contenidos 
● Big Data e impacto sociedad 
● Aplicaciones ámbito empresarial 
● Business Intelligence 
● Bases de datos 
● Tipos de datos 
● Ciclo de análisis de datos 
● Agregación de datos 
● Aspectos legales y éticos
Aplicaciones empresa 
Social Enterprise Stack
Aplicaciones empresa 
Social Enterprise Stack (II) 
Fuente: http://www.gartner.com/newsroom/id/2643919
Aplicaciones empresa 
Social Enterprise Stack (III) 
Fuente: http://www.forbes.com/sites/louiscolumbus/2012/11/08/cloud-computing-and-enterprise-software-forecast-update-2012/
Aplicaciones empresa 
El caso de Zappos 
Fuente: http://www.automotivedigitalmarketing.com/profiles/blogs/social-network-media-savvy 
Fuente: http://catalog.flatworldknowledge.com/bookhub/reader/2861?e=cadden_1.0-ch04_s01
Aplicaciones empresa 
El caso de Zappos (II) 
Fuente: http://www.slideshare.net/CarlaSC/trabajo-final-naming-zappos
Aplicaciones empresa 
El caso de Zappos (III) 
Reflexión BI.01.1: ¿Cuáles son las ventajas 
competitivas y competencias clave? ¿Cuán 
sostenibles son? 
1. Equipo 1: Gran volumen de almacenamiento 
2. Equipo 2: B2C y Cultura corporativa 
3. Equipo 3: Gestión de la información 
4. Equipo 4: Gestión de precios 
5. Equipo 5: Logística y Operaciones 
6. Equipo 6: Gestión de las relaciones B2B 
7. Equipo 7: Ventas
Aplicaciones empresa 
El caso de Zappos (IV) 
Competencia Descripción 
¿Cómo contribuye 
a los objetivos del 
negocio? 
¿Cómo las TIC y las 
plataformas 
digitales ayudan? 
¿Es sostenible? ¿Es 
escalable?
Aplicaciones empresa 
Data Layer 
● En la actividad digital, 
todo genera un dato 
o Tarjetas de crédito 
o Teléfonos móviles 
o Redes sociales 
o Proveedores de Internet 
o Tarjeta de fidelización de 
mercado 
Fuente: http://www.privacidadlogica.es/2012/05/31/modelo-de-informe-sobre-sistema-de-control-horario- 
basado-en-huella-digital/
Aplicaciones empresa 
Data Layer (II) 
No obtiene respuestas quién posee los datos, sino 
quien sabe hacer las preguntas 
Fuente: http://www.xiskya.com/2012/12/21/una-pregunta-poderosa-por-favor/
Aplicaciones empresa 
Data Layer (III) 
En la economía digital, captar datos de clientes 
es cada vez más crítico 
o De 
 1º Vender 
 2º Capturar el dato 
o A 
 1º Capturar el dato 
 2º vender
Aplicaciones empresa 
Data Layer (IV) 
Estrategia de venta directa 
1) Gestionar audiencia 
2) Capturar datos 
3) Convertir a ventas
Aplicaciones empresa 
Data Layer (V) 
1) Gestionar audiencia 
● Fijar público objetivo 
● Identificar espacios digitales donde 
encontrarlos 
● Crear espacios propios para captar datos y 
crear la Base de Datos 
● Definir líneas editoriales y métodos de 
captación
Aplicaciones empresa 
Data Layer (VI) 
2) Captar datos 
● Creación landing page para captar dato 
● Pedir datos necesarios y clasificarlos 
● Realizar seguimiento
Aplicaciones empresa 
Data Layer (VII) 
3) Convertir a venta 
● Segmentación de usuarios 
● Personalización de la oferta 
● Planificar acciones 
● Realizar seguimiento
Aplicaciones empresa 
Data Layer (VIII) 
Fuente: http://www3.weforum.org/docs/WEF_ITTC_PersonalDataNewAsset_Report_2011.pdf
Aplicaciones empresa 
Data Layer (IX) 
Fuente: http://www.theguardian.com/news/datablog/2014/apr/22/how-much-is-personal-data-worth
Aplicaciones empresa 
Data Layer (X) 
Fuente: http://www.ft.com/intl/cms/s/2/927ca86e-d29b-11e2-88ed-00144feab7de.html#axzz2z2agBB6R
Aplicaciones empresa 
Data Layer: aplicaciones de negocio
Aplicaciones empresa 
Data Layer: aplicaciones de negocio (II)
Aplicaciones empresa 
Data Layer: aplicaciones de negocio (III)
Aplicaciones empresa 
Data Layer: aplicaciones de negocio (IV)
Aplicaciones empresa 
Data Layer: aplicaciones de negocio (V)
Aplicaciones empresa 
Data Layer: aplicaciones de negocio (VI)
Aplicaciones empresa 
Data Layer: aplicaciones de negocio (VII) 
Reflexión BI.01.2: Pensad en posibles modelos 
de negocio alrededor de los datos, considerando: 
1. Privacidad 
2. Monetización 
3. Sostenibilidad 
4. Clientes directos e indirectos 
5. Producto 
6. Plataformas tecnológicas necesarias
Aplicaciones empresa 
Data Layer: aplicaciones de negocio (VIII) 
Modelo EFQM de Excelencia 
Fuente: http://www.tqm.es/TQM/ModEur/ModeloEuropeo.htm
Aplicaciones empresa 
Data Layer: aplicaciones de negocio (IX) 
Digital Digital
Aplicaciones empresa 
Application Layer
Aplicaciones empresa 
Application Layer (II) 
● Aplicaciones para la gestión interna 
o Aplicaciones que ayuden y faciliten los procesos 
internos en las empresas, tales como: 
 Selección y el control de personal 
 Gestión de los gastos 
 Facturas 
 Aprovisionamiento 
 Contabilidad 
 etc.
Aplicaciones empresa 
Application Layer (III) 
● Aplicaciones de organización 
o Aplicaciones que den soporte a los empleados para 
mejorar sus tareas y procesos productivos, 
permitiéndoles optimizar el tiempo de trabajo, como: 
 Gestión de emails 
 Calendarios de reuniones 
 Videoconferencias 
 Trabajo en la nube 
 Gestión de documentos 
 Trabajo colaborativo 
 etc.
Aplicaciones empresa 
Application Layer (IV) 
● Aplicaciones de relación con 
clientes/ventas 
o Aplicaciones dirigidas a mejorar y agilizar la relación 
con los clientes de una empresa, y que ayuden a ofrecer 
servicios de venta o información a sus clientes más allá 
de la tienda física, tales como: 
 Herramientas de de gestión de la relación con los 
clientes (CRM), 
 Marketing 
 Venta online 
 etc.
Aplicaciones empresa 
Application Layer (V) 
ERP: Enterprise Resource Planning 
List of ERP Software Packages: http://en.wikipedia.org/wiki/List_of_ERP_software_packages
Aplicaciones empresa 
Application Layer (VI) 
CRM: Customer Relationship Management 
Comparación de software CRM: http://en.wikipedia.org/wiki/Comparison_of_CRM_systems
Aplicaciones empresa 
Application Layer (VII) 
SCM: Supply Chain Management 
Lista de software SCM: http://www.softwareadvice.com/scm/
Aplicaciones empresa 
Application Layer (VIII) 
DRP: Distribution Resource Planner 
Fuente: http://www.libratechno.com/erp.php
Aplicaciones empresa 
Application Layer (IX) 
KMS: Knowledge Management System 
Fuente: http://www.prescientdigital.com/articles/content-management/content-management-in-a-knowledge-management-context/
Aplicaciones empresa 
Application Layer (X) 
eCommerce 
Fuente: http://www.i-fluxtech.com/web-solution/e-Commerce-website.htm 
Comparación de software ecommerce: http://en.wikipedia.org/wiki/Comparison_of_shopping_cart_software
Aplicaciones empresa 
Social Layer 
Fuente: http://www.webvigo.com/blog/el-social-business-intelligence-social-bi/
Aplicaciones empresa 
Social Layer (II) 
La solución no es 
contratar a un 
Community Manager 
Sino redefinir los 
objetivos y 
procedimientos de 
distintas posiciones 
ya existentes dentro 
de las organizaciones Fuente: http://www.enterpriseirregulars.com/19667/the-enterprise-2-0-conference-boston- 
2010-lots-to-see-and-do/
Aplicaciones empresa 
Social Layer (III) 
● Ha habido un boom en tipos de medios 
sociales 
o La idea ha sido agrupar y conectar personas en 
torno a ejes de interés común 
o La mayoría han sido gratuitos: ¿dónde está la 
rentabilidad? La publicidad (Facebook, Twitter) es una 
tarta muy concentrada 
o Casos 
 Pinterest: escaparate de productos y servicios 
 Pheed: suscripción a contenidos de pago 
capitalizando la actividad de personajes célebres
Aplicaciones empresa 
Social Layer (IV) 
“75% of our employees are young people – 
digital natives – and this is how they talk 
to each other. The only way I am going to 
get to them is to talk to them in their 
medium.” 
Giam Swiegers 
CEO Deloitte Australia
Aplicaciones empresa 
Social Layer (V)
Aplicaciones empresa 
Social Layer (VI) 
● Organizaciones 2.0: redárquicas o adhocráticas 
o Capacidad innovadora 
o Capacidad de adaptación al entorno 
● Cultura innovadora 
o Nuevo tipo de directivo o estilos de liderazgo 
transformadores 
o Estilos de gestión de personas 
o Procesos de gestión 
● Y todo ello, haciendo uso de herramientas 2.0
Aplicaciones empresa 
Social Layer (VII)
Aplicaciones empresa 
Social Layer (VIII) 
● Consultores 
McKinsey & 
Company en su 
diario online 
McKinsey Quarterly 
The rise of the 
networked enterprise
Aplicaciones empresa 
Social Layer (IX) 
● Por si esto fuera poco, los 
datos recogidos por 
McKinsey prueban que 
existe una correlación 
directa entre la 
implementación del 
estándar 2.0 y la 
generación de 
beneficios tangibles y 
aumento del ROI
Aplicaciones empresa 
Social Layer (X)
Aplicaciones empresa 
Social Layer (XI)
Aplicaciones empresa 
Social Layer (XII) 
● La identidad digital no se 
está explotando bien 
● La influencia que provocan 
determinados perfiles, y 
que por ende, generan 
engagement 
¿Cómo podemos detectar esa 
influencia y cuantitivizarla? 
Fuente: http://mattica.com/el-futuro-de-la-identidad-digital/
Aplicaciones empresa 
Social Layer (XII) 
Reflexión BI.01.3: Las TIC en la capa social. 
¿Qué puede aportar las TIC en? 
o Formación 
o Selección 
o Desarrollo 
o Sistemas de Gestión Empresarial 
o Marketing 
o Liderazgo 
o Trabajo en equipo 
o etc.
Índice de contenidos 
● Big Data e impacto sociedad 
● Aplicaciones ámbito empresarial 
● Business Intelligence 
● Bases de datos 
● Tipos de datos 
● Ciclo de análisis de datos 
● Agregación de datos 
● Aspectos legales y éticos
Business Intelligence 
Definición 
La raíz conceptual de la inteligencia de 
negocios puede relacionarse con el 
libro “El Arte de la Guerra” de Sun Tzu 
“Para poder ser exitosos en la Guerra, 
se debe conocer complemente las 
fortalezas y debilidades de uno 
mismo, así como las del enemigo. El no 
saber alguna de ellas podría significar 
la derrota” 
Fuente: http://www.taringa.net/posts/apuntes-y-monografias/ 
17030452/El-arte-de-gobernar-bien. 
html
Business Intelligence 
Definición (II) 
En 1989, Howard Dresner, un 
investigador de Gartner Group, 
popularizó el acrónimo de BI (Business 
Intelligence) para indicar 
“El conjunto de conceptos y métodos 
para mejorar la toma de decisiones en 
los negocios, utilizando sistemas de apoyo 
basado en hechos”
Business Intelligence 
Definición (III) 
● En la actualidad, incluye una amplia categoría 
de metodologías, aplicaciones y tecnologías 
que permiten: 
o Reunir, acceder, transformar y analizar ... 
o …. datos, transacciones e información no 
estructurada (interna y externa) … 
o …. con el propósito de ayudar a los usuarios de una 
compañía a tomar mejores decisiones de negocio
Business Intelligence 
¿Big Data? 
Source: http://de.nr-apps.com/blog/2014/01/09/zukunft-des-handels-big-data-und-bitcoins/
Business Intelligence 
¿Big Data? (II) 
“More data does not mean more knowledge” 
[Jenkins2013]
Business Intelligence 
Modelo integral de una solución BI 
Fuente: https://www.pwc.com/ve/es/asesoria-gerencial/boletin/assets/boletin-advisory-edicion-10-2008.pdf
Business Intelligence 
Modelo integral de una solución BI (II) 
SQL 
XML 
CSV 
... 
Data 
Management / 
Integration 
Ciclo / 
Proceso 
datos 
Modelo 
datos 
Dashboard 
Report 
API
Business Intelligence 
Modelo integral de una solución BI (III) 
Un modelo integral de BI pensado como una refinería de datos 
Fuente: 
http://www.lavozdelsandinismo.com/economia/ 
2007-04-16/inicia-en-junio-construccion-de-refineria- 
venezolana-en-nicaragua/
Business Intelligence 
Componentes 
● Un motor de BI/Analytics tiene que cumplir 
siempre tres funciones básicas 
o Obtener datos fuentes 
o Disponer de un almacén estructurados de datos listos 
para explotación 
o Ser capaz de generar reports/informes de los datos
Business Intelligence 
Componentes (II) 
● Estas tres funciones se traducen en: 
1 2 3 
Proceso Modelo 
Plataforma 
explotación 
Datos 
Ciclo de 
análisis 
de datos 
Representación 
para explotación 
Información y 
conocimiento
Business Intelligence 
Componentes (III) 
● Estas tres funciones se traducen en: 
1 2 3 
Proceso Modelo 
Plataforma 
explotación 
Datos 
Ciclo de 
análisis 
de datos 
Representación 
para explotación 
Información y 
conocimiento 
Día 1
Business Intelligence 
Componentes (IV) 
● Estas tres funciones se traducen en: 
1 2 3 
Proceso Modelo 
Plataforma 
explotación 
Datos 
Ciclo de 
análisis 
de datos 
Representación 
para explotación 
Información y 
conocimiento 
Día 2
Business Intelligence 
Componentes (V) 
● Estas tres funciones se traducen en: 
Día 3 
1 2 3 
Proceso Modelo 
Plataforma 
explotación 
Datos 
Ciclo de 
análisis 
de datos 
Representación 
para explotación 
Información y 
conocimiento
Índice de contenidos 
● Big Data e impacto sociedad 
● Aplicaciones ámbito empresarial 
● Business Intelligence 
● Bases de datos 
● Tipos de datos 
● Ciclo de análisis de datos 
● Agregación de datos 
● Aspectos legales y éticos
Bases de Datos 
Problema en BI 
● Los datos para una marca 
o Son ubicuos 
o Inconsistentes 
o No habilitados para explotación → rendimiento! 
o Los datos no siempre están en una Base de Datos 
o Incompletos 
o Perspectiva de captura y la Perspectiva de explotación 
no suelen estar alineadas 
Fuente: http://site-bakner.1minutesite.es/
Bases de Datos 
Necesidad de conocer la BBDD 
● La búsqueda de evidencias en grandes 
volúmenes de datos exige conocer qué tipo 
de evidencias son necesarias 
● Es decir, conocimiento sobre el dominio y 
entender e interpretar los patrones que se 
pueden descubrir
Bases de Datos 
Heterogeneidad 
● Las Bases de Datos heterogéneas son un 
conjunto de BBDD administradas por 
diferentes SGBD 
o La heterogeneidad de éstas se debe a que los datos son 
de diferentes tipos o formatos 
● En el contexto de BBDD heterogéneas se 
distinguen tres tipos de heterogeneidad: 
o Semántica 
o Esquemática 
o Sintáctica
Bases de Datos 
Heterogeneidad: semántica 
● Es la diferencia de la información en el 
contexto 
o Se debe a que el significado de la información se 
intercambia y tiene que ser entendido a través de más 
sistemas 
● Para resolver el conflicto: 
o Se recomienda el uso de ontologías 
 Es la mejor manera de que los individuos 
comprendan la información de sistemas o BBDD 
muy diferentes
Bases de Datos 
Heterogeneidad: semántica (II) 
● Ontologías 
o Si los metadatos sirven para la estructuración del 
contenido, las ontologías hacen posible una semántica 
para construirlos 
o Una ontología es una especificación de una 
conceptualización 
 Es decir, un marco común o una estructura 
conceptual sistematizada y de consenso 
 No sólo para almacenar información, sino también 
para poder buscar y recuperarla
Bases de Datos 
Heterogeneidad: semántica (III) 
● Ontologías (cont.) 
o Define los términos y las relaciones básicas para la 
comprensión de un área del conocimiento, así como 
las reglas para poder combinar los términos para 
definir las extensiones de este tipo de vocabulario 
controlado
Bases de Datos 
Heterogeneidad: semántica (IV) 
● Ontologías (cont.) 
o Se usan para: 
 Favorecer la comunicación entre personas, 
organizaciones y aplicaciones 
 Lograr la interoperabilidad entre sistemas 
informáticos 
 Razonar automáticamente 
 Ingeniería del software
Bases de Datos 
Heterogeneidad: semántica (V) 
● Ontologías (cont.) 
o Se componen de 
 Conceptos: ideas básicas que se intentan 
formalizar. Pueden ser: clases de objetivos, 
métodos, planes, estrategias, etc. 
 Relaciones: interacción y enlace entre los 
conceptos de un dominio: Ejemplos: subclase-de, 
parte-de, conectado-a, etc. 
 Funciones: tipo concreto de relación con una 
identificación mediante el cálculo de una función 
 Instancias: representar objetos determinados 
 Reglas de restricción o axiomas: teoremas que 
deben cumplir los elementos de la ontología
Bases de Datos 
Heterogeneidad: semántica (VI) 
● Ontologías (cont.) 
o Las ontologías formales se expresan en un lenguaje 
estructurado denominado RDF 
 Convertir las declaraciones de los recursos en 
expresiones con la forma sujeto-objeto-predicado 
o OWL 
 Lenguaje de marcado para publicar y compartir 
datos usando ontologías 
 Facilita un modelo de marcado construido sobre 
RDF y codificado en XML
Bases de Datos 
Heterogeneidad: esquemática 
● Diferencias en las abstracciones hechas en 
cuanto a la definición de clases, atributos y 
sus relaciones 
● Para solucionar: 
o Esquema compartido y mediador de contexto 
 El usuario se comunica con el esquema 
compartido, y éste al resolver los conflictos se 
comunica con el mediador de contexto que es el 
encargado de mapear la información 
 Cuando el esquema tenga la solución a la pregunta 
se la envía al mediador para que la vuelva a 
mapear y así pasársela al usuario
Bases de Datos 
Heterogeneidad: sintáctica 
● Se refiere a las diferencias en las 
representaciones de los datos 
Fuente: http://www.juntadeandalucia.es/averroes/ceip_san_rafael/DATOS/INTRODUCCION.htm
Índice de contenidos 
● Big Data e impacto sociedad 
● Aplicaciones ámbito empresarial 
● Business Intelligence 
● Bases de datos 
● Tipos de datos 
● Ciclo de análisis de datos 
● Integración de datos 
● Aspectos legales y éticos
Tipos de datos 
Ventaja competitiva 
● Los datos es tanto un arte como una ciencia 
o Ciencia 
 Mucha investigación 
 Nunca hace Data Mining “sin más” 
o Arte 
 Razonamiento crítico 
 Visión de negocio 
 Conocimiento del dominio
Tipos de datos 
Cambio 
● El avance tecnológico ha cambiado 
sustantivamente las fuentes de datos 
o Se estima que el 80% de la información del mundo 
está desestructurada 
o Los datos desestructurados están creciendo a un ritmo 
de 15 veces superior a los estructurados 
o La capacidad de procesamiento está creciendo a un 
ritmo tan alto que no tenemos en ese sentido 
problemas 
o El acceso a la información es realmente fácil para 
todos 
[Eaton2012]
Tipos de datos 
Fuentes 
● RDBMS (SQL Server, DB2, Oracle, MySQL, 
PostgreSQL, Sybase IQ, etc.) 
● NoSQL Data: HBase, Cassandra, MongoDB 
● OLAP (Mondrian, Palo, XML/A) 
● Web (REST, SOAP, XML, JSON) 
● Files (CSV, Fixed, Excel, etc.) 
● ERP (SAP, Salesforce, OpenERP) 
● Hadoop Data: HDFS, Hive 
● Web Data: Twitter, Facebook, Log Files, Web Logs 
● Others: LDAP/Active Directory, Google Analytics, 
etc.
Tipos de datos 
Fuentes (II) 
Source: http://www.bigdata-startups.com/BigData-startup/understanding-sources-big-data-infographic/
Tipos de datos 
Fuentes (III)
Tipos de datos 
Archivos 
● Documentos escaneados 
● Formularios 
● Registros 
● Archivos en papel 
● ...
Tipos de datos 
Documentos 
● XLS 
● PDF 
● CSV 
● email 
● PPT 
● HTML 
● XML 
● JSON 
● ...
Tipos de datos 
Media 
● Imágenes 
● Vídeos 
● Audio 
● Flash 
● Streaming 
● Podcasts 
● ...
Tipos de datos 
Almacenamiento de datos 
● SQL 
● NoSQL 
● Hadoop 
● Repositorio de documentos 
● Sistema de ficheros 
● ...
Tipos de datos 
Aplicaciones de negocio 
● CRM 
● ERP 
● CMS 
● HRM 
● KMS 
● SCM 
● LMS 
● Intranet 
● ...
Tipos de datos 
Web pública 
● Portales de datos abiertos 
● Institutos de estadística 
● Banco Mundial 
● Wikipedia 
● IMDb 
● ...
Tipos de datos 
Social Media 
● Twitter 
● LinkedIn 
● Facebook 
● Tumblr 
● Blog 
● SlideShare 
● Instagram 
● Google+ 
● Chatter 
● ….
Tipos de datos 
Logs 
● Eventos 
● Servidores 
● Aplicaciones 
● Procesos de negocio 
● CDRs 
● Localización móvil 
● Uso de aplicaciones móviles 
● Clickstream 
● ...
Tipos de datos 
Datos de sensores 
● Dispositivos médicos 
● Sensores de vehículos 
● Satélites 
● Videojuegos 
● ...
Tipos de datos 
Comparación 
Archivos Docs Media BBDD Aplicac. 
Negocio 
Web 
pública 
Social 
Media 
Logs Sensores 
¿Estructura? 
¿Semántica? 
¿Esquemática 
? 
¿Sintáctica?
Tipos de datos 
Desestructurados 
Apache Drill 
Fuente: http://incubator.apache.org/drill/
Índice de contenidos 
● Big Data e impacto sociedad 
● Aplicaciones ámbito empresarial 
● Business Intelligence 
● Bases de datos 
● Tipos de datos 
● Ciclo de análisis de datos 
● Agregación de datos 
● Aspectos legales y éticos
Ciclo de análisis de datos 
Introducción 
Source: Data Mining with WEKA MOOC (http://www.cs.waikato.ac.nz/ml/weka/mooc/dataminingwithweka/)
Ciclo de análisis de datos 
Introducción (II)
Ciclo de análisis de datos 
Retos 
● Los datos están en todos los sitios 
o Datos ubicuos 
● Son inconsistentes 
o Los registros están expresados de diferentes maneras 
en cada sistema 
● Problemas de rendimiento 
o Hacer consultas a base de datos para resumir los datos 
suelen ser largos 
o Lleva al Sistema Operativo a una carga máxima 
● Los datos no siempre están en Bases de Datos 
o Hojas Excel, servicios web, desestructurados, etc.
Ciclo de análisis de datos 
Retos (II) 
● Los datos son incompletos 
● Algunos tipos de datos no están registrados en 
ningún lugar 
[Mazza2012] 
o Al no estar expresados, no podrán ser explotados 
● La perspectiva de almacenamiento no suele 
coincidir con la perspectiva de explotación 
● Los usuarios suelen tener recelos para 
extraer conclusiones de algunos datos
Ciclo de análisis de datos 
Modelos
Ciclo de análisis de datos 
Modelos (II) 
A framework of characteristics for Analytics 
Adam Cooper, 2012 [Cooper2012]
Ciclo de análisis de datos 
Proceso 
1) Seleccionar 2) Capturar 3) Agregar 4) Procesar 5) Utilizar 6) Refinar 
Más datos no 
es más 
conocimiento 
Extracción, 
muestreo y 
ética 
Proceso de 
calidad de 
datos 
Análisis 
+ 
Acción 
Hacer 
operativos los 
trabajos 
anteriores 
Post-procesamiento
Ciclo de análisis de datos 
1) Seleccionar 
1) Seleccionar 
● Plantear las preguntas/problemas a resolver 
● Seleccionar los datos necesarios para responder a las 
preguntas formuladas 
● Éste es precisamente uno de los retos actuales 
o ¿Qué datos son los críticos? 
● Hay que poner sensores allí dónde estén los datos más 
relevantes 
o Para este paso, suele ser interesante contar con 
expertos del dominio
Ciclo de análisis de datos 
1) Seleccionar (II) 
1) Seleccionar 
● Vivimos en una era en la que tener acceso a datos no es el 
problema 
o El reto está en determinar qué datos son significativos 
y significantes y por qué 
Fuente: http://cesar-organizaciones.blogspot.com.es/2011/05/que-es-un-sistema-de-informacion-un.html
Ciclo de análisis de datos 
1) Seleccionar (III) 
1) Seleccionar 
“The basic question is 
not what can we 
measure? The basic 
question is what does 
a good education look 
like? Big questions”
Ciclo de análisis de datos 
1) Seleccionar (IV) 
1) Seleccionar 
Actividad BI.01.1. Big questions 
1. Consumo 
2. Institucional 
3. B2B 
4. Criminalidad 
5. Educación
Ciclo de análisis de datos 
1) Seleccionar (V) 
1) Seleccionar 
Actividad BI.01.1. Big questions 
● Montar equipos de BI 
o Arquitecto BI 
 Administrador fuentes de datos, gestor ETL, 
herramientas tecnológicas 
o Data Manager 
 Administrar datos, minería de datos, analista 
calidad de datos, administrar metadatos 
o Consultor de negocio 
 Procesos a optimizar, necesidades cliente 
Transversal 
- Conocimiento 
dominio 
- Gestión de 
proyecto
Ciclo de análisis de datos 
1) Seleccionar (VI) 
1) Seleccionar 
Actividad BI.01.1. Big questions 
● ¿Qué problemas le puedo ayudar a la empresa a 
resolver? 
o Generación de datos para su captura 
o Procesamiento 
o Explotación de datos 
Leer aplicaciones de ámbito empresarial
Ciclo de análisis de datos 
2) Capturar 
2) Capturar 
● Extracción de los datos 
o Ante la Variedad de las fuentes de datos, se hace 
necesario disponer de un proceso ETL 
● Así, se podrán transformar datos optimizados para 
transacciones a datos optimizados para el análisis y el 
reporting 
● Se pueden emplear técnicas de muestreo de datos 
● Respetar las leyes y la ética 
Leer “Aspectos legales y éticos” 
Leer “Tipos de datos”
Ciclo de análisis de datos 
2) Capturar (II) 
2) Capturar 
Actividad BI.01.2. Integrar en un ETL diferentes 
tipos de datos necesarios para responder a las 
preguntas y resolver los problemas 
● Mínimo 4 diferentes tipos de datos 
● Listado de acciones de cumplimiento ético y de 
leyes
Ciclo de análisis de datos 
2) Capturar (III) 
2) Capturar
Ciclo de análisis de datos 
3) Agregar 
3) Agregar 
● Reto actual: Variedad marketing omnical 
● Necesidad de un modelo de datos normalizado para 
disponer de procesos de datos sostenibles 
● Tareas 
o Limpieza de datos, Integración, Transformación, 
Reducción, Modelado, Rectificación de inconsistencias 
y anomalías, Normalización
Ciclo de análisis de datos 
3) Agregar (II) 
3) Agregar 
Actividad BI.01.3. Preparar los datos para su 
posterior explotación 
● Definir dimensiones (ir) 
● Definir Reglas de Negocio (ir) 
● Análisis metadatos (ir) 
● Flujo de transformación y Reglas de Negocio 
(ir) 
Leer “Bases de Datos” 
Leer “Agregación de Datos”
Ciclo de análisis de datos 
4) Procesar 
4) Procesar 
● Analizar los datos normalizados y preparados 
● Decidir contextos de explotación 
o Predicción 
o Intervención 
o Adaptación 
o Personalización 
o Recomendación 
o Alertas tempranas 
o Reflexión
Ciclo de análisis de datos 
4) Procesar (II) 
4) Procesar 
Motor de 
Analytics 
Predicción 
Adaptación 
Personalización 
Intervención 
... 
Recomendación
Ciclo de análisis de datos 
5) Utilizar 
5) Utilizar 
● Hacer operativos los trabajos anteriores 
● Posibles escenarios de operación 
o Dashboard de KPIs 
o Informes 
o APIs de explotación desde otros sistemas 
o ...
Ciclo de análisis de datos 
5) Utilizar (II) 
5) Utilizar 
Actividad BI.01.4. Pensar en escenarios de puesta 
en valor del conocimiento descubierto 
● ¿Qué? 
● ¿Cómo? 
● ¿Dónde? 
● ¿Cuándo? 
● ¿Por qué?
Ciclo de análisis de datos 
6) Refinar 
6) Refinar 
● Post-procesamiento 
o Nuevos atributos al modelo 
o Nuevos indicadores 
o Nuevos tareas de calidad de datos 
o Nuevos métodos de análisis 
o ….
Índice de contenidos 
● Big Data e impacto sociedad 
● Aplicaciones ámbito empresarial 
● Business Intelligence 
● Bases de datos 
● Datos estructurados y desestructurados 
● Ciclo de análisis de datos 
● Agregación de datos 
● Aspectos legales y éticos
Agregación de datos 
Introducción 
● El enfoque de ETL no es suficiente para dar 
sentido y posibilidad de explotación a los 
datos agregados 
o Los datos, así, deben ser normalizados para poder 
eliminar todos los posibles problemas que pueden 
aparecer en un proceso de integración de datos 
o Por ello, se habla de agregación/integración de datos 
para la normalización de los datos
Agregación de datos 
Introducción (II) 
● Además, la mala calidad de los datos genera 
costes de mantenimiento y reparación 
● Además de estos aspectos económicos, la mala 
calidad de datos también afecta a la 
satisfacción del usuario y a la reputación sobre 
la toma de decisiones estratégicas
Agregación de datos 
Introducción (III) 
● La agregación/integración de datos es el paso 
más complicado de un proyecto de BI 
o Datanami: puede llegar a consumir hasta el 60-70% de 
un proyecto 
o Según otras fuentes, entre un 70 y un 85% 
● Aquí tenemos que hablar de integrar todas las 
fuentes de datos en un dataset con datos 
apropiados para el objetivo concreto que se 
tiene en el proyecto 
● Se hace necesario, por lo tanto, un proceso 
para garantizar la calidad de los datos
Agregación de datos 
Introducción (IV) 
Source: http://www.learningfrontiers.eu/?q=story/will-analytics-transform-education
Agregación de datos 
Gestión de la calidad de los datos 
● La calidad de los datos emergió como una un 
área de investigación académica a comienzos 
de los 90 
o No es nada nuevo tampoco ;-) 
● En grandes y pequeñas compañías, la 
sensibilidad hacia la importancia de la 
calidad de los datos es un fenómeno más 
reciente
Agregación de datos 
Gestión de la calidad de los datos (II)
Agregación de datos 
Gestión de la calidad de los datos (III) 
● El significado principal de la calidad de los 
datos es que resulte apropiado para un 
particular uso que se quiera realizar 
o Aptitud para ser utilizado 
o Adecuación a requisitos 
o Un concepto relativo dependiente de las necesidades 
del usuario
Agregación de datos 
Gestión de la calidad de los datos (IV) 
● De este modo, los mismos datos pueden ser 
evaluados en diferentes grados de calidad en 
función de las necesidades del usuario 
Fuente: http://mitiq.mit.edu/iciq/pdf/an%20evaluation%20framework%20for%20data%20quality%20tools.pdf
Agregación de datos 
Gestión de la calidad de los datos (V) 
● Criterios de medición de la calidad (en función 
de necesidades particulares) 
o Completitud 
 Valores de atributos, registros y tablas 
o Precisión 
 Fiabilidad y veracidad 
o Consistencia 
 Respetar una serie de restricciones/reglas de negocio 
o Relevancia 
 Usabilidad para los stakeholders 
o Unicidad 
 Una entidad (marca, producto, persona, servicio, etc.) 
es observada en contextos diferentes 
[Goasdoué2007]
Agregación de datos 
Criterios: 1) Completitud 
● Falta algún valor? (tabla, columna, instancia) 
o Ejemplos 
 Falta el código postal en el 50% de los registros 
● Algunas métricas 
o Ratio de valores ausentes (tabla, columna, instancia) 
● Para la mejora 
o Estimación del valor por técnicas estadísticas 
o Ignorar el valor para explotaciones futuras 
o Emplearlo, a sabiendas de los problemas que puede 
originar
Agregación de datos 
Criterios: 1) Completitud (II) 
● El rendimiento del modelo (el porcentaje de 
predicciones acertadas) dentro del intervalo 
de confianza establecidos, depende en mucho 
de esta criterio de calidad 
Fuente: http://es.wikipedia.org/wiki/Intervalo_de_confianza
Agregación de datos 
Criterios: 2) Precisión 
● Cercanía entre el valor v y un valor v’ considerando éste 
como la correcta representación de la realidad que el valor v 
intenta representar 
o Ejemplos 
 Algunos proveedores que están marcados como 
Activos fueron a la quiebra hace meses 
● Algunas métricas 
o Número de estimaciones desviadas 
o Comparaciones con valores reales 
Fuente: http://scielo.sld.cu/scielo.php?script=sci_arttext&pid=S0864-34662007000200012
Agregación de datos 
Criterios: 2) Precisión (II) 
● Es un parámetro muy relacionado con la 
precisión, la fiabilidad y la veracidad 
● En la práctica, a pesar de la atención que ha 
recibido, es difícil cuantitivizar la precisión de 
una medición 
o Es una operación muy cara de realizar 
o Esto se debe a que para poder realizarlo hay que 
disponer de datos de referencia externos 
o Por ello, se hacen verificaciones menos estrictas 
(patrones de comienzo de códigos, ratios 
desproporcionados entre géneros, etc.)
Agregación de datos 
Criterios: 3) Consistencia 
● Los datos son consistentes si satisfacen un 
conjunto de restricciones 
● Para que sea efectivo, se deben establecer 
unas estrategias de control 
o Aquí es donde aparece el concepto de “Regla de 
negocio” 
 De este modo, la consistencia se puede ver como 
una subdimensión de la precisión 
 Aún así, la consistencia solo da una medida 
indirecta de la precisión 
● Esta dimensión es esencial en la práctica
Agregación de datos 
Criterios: 3) Consistencia (II) 
● Métricas 
o ratio de % de conjuntos de datos que satisfacen las 
restricciones 
● En el contexto de las herramientas de calidad 
de datos, los flujos de transformación de datos 
y sus reglas de negocio se centran 
básicamente en controles de consistencia
Agregación de datos 
Criterios: 4) Relevancia 
● ¿Son los datos relevantes para la tarea que se 
tiene entre manos? 
● Métricas 
o Grado de utilidad 
● Oportunidades de mejora 
o Encuestas 
 Preguntando a los stakeholders por el grado de 
utilidad de las respuestas dadas, ayudará a mejorar 
la relevancia de tareas de agregación de datos 
futuras (en especial, la primera tarea de selección 
de datos)
Agregación de datos 
Criterios: 4) Relevancia (II) 
● Éste es un problema nuclear al Big Data 
o Con la aparición de grandes volúmenes de datos, los 
usuarios en ocasiones se sienten frustrados por la 
incapacidad para sacar algún dato útil entre toda la 
maraña de datos 
o Por ello, los usuarios pueden tener el prejuicio hacia la 
poca utilidad de los datos resultantes de un proyecto 
de BI 
o Sin embargo, la utilidad juega un papel central en la 
aceptación del proyecto 
o Por lo tanto, habrá que realmente medirlo (y 
mejorarlo, en su caso, si procediera)
Agregación de datos 
Criterios: 5) Unicidad 
● Es un problema que aparece cuando una 
entidad del modelo de datos aparece en más 
de una ocasión 
o Ejemplo 
 Alexander Rayón y Alex Rayón son el mismo 
empleado, pero observado en dos fuentes de datos 
diferentes → pudieran parecer dos entidades, al no 
coincidir a primera vista
Agregación de datos 
Criterios: 5) Unicidad (II) 
● Métricas 
o % de duplicados 
o número de instancias superior a las esperadas (más 
difícil, por no conocer a priori el número de instancias)
Agregación de datos 
Conjuntos de datos 
Dataset 
Instancia / Observación / Puntos de datos 
Asignar valores a las características definidas 
en el modelo de datos para diferentes 
entidades y sus relaciones 
Representado a través de un conjunto de 
características/atributos/medidas 
Atributo de clase 
(para problemas de predicción)
Agregación de datos 
Etapas 
Definir Procesar Publicar
Agregación de datos 
1) Definir 
Definir 
● Dimensiones 
Reglas de negocio 
Esquema / Diccionario de datos 
Modelo de datos 
o Dominio/Contexto: unidad mínima de análisis, 
representación y explotación 
o Tiempo: real-time o bajo demanda 
o Frecuencia: de medición (fija o variable) 
o Extracción de atributos: ¿con qué me quedo? (símil de la 
extracción de keywords representativas en un texto) 
o Jerarquía: para consultas (niveles de abstracción) 
o Granularidad: representación para explotación posterior
Agregación de datos 
1) Definir: Reglas de negocio 
Pensando en las dimensiones de calidad de datos 
anteriormente expuestas 
Source: http://themodernaccountant.com/2012/06/18/pearls-of-wisdom/
Agregación de datos 
1) Definir: Reglas de negocio (II) 
Nivel Esquema: conflictos nominales y estructura 
● Homónimos: mismo nombre para diferentes 
objetos 
● Sinónimos: diferentes nombres para el mismo 
objeto 
● Diferentes tipos de datos 
● Diferentes estructura de componentes 
● Diferentes restricciones de integridad
Agregación de datos 
1) Definir: Reglas de negocio (III) 
Nivel Instancia 
● Atributo 
o Valores nulos, misspellings, valores crípticos, abreviaciones, 
valores embebidos, etc. 
● Registro 
o Dependencias de atributo incorrectas (zip y ciudad) 
● Tipo de registro 
o Transposiciones de palabras, registros duplicados, registros 
contradictorios 
● Fuente 
o Referencias incorrectas (nº departamento es incorrecto) 
● Agregación 
o Granularidad (ventas por grupo vs. ventas por producto) o 
puntos de tiempo (semanal, diaria, quincenal, etc.)
Agregación de datos 
1) Definir: Reglas de negocio (IV)
Agregación de datos 
1) Definir: Reglas de negocio (V) 
Source: Data Mining with WEKA MOOC (http://www.cs.waikato.ac.nz/ml/weka/mooc/dataminingwithweka/)
Agregación de datos 
1) Definir: Esquema / Modelo de datos 
Source: http://en.wikipedia.org/wiki/Data_modeling
Agregación de datos 
1) Definir: Metodología 
Source: http://www.blockmagic.eu/main/?page_id=54
Agregación de datos 
2) Procesar 
Procesar Poner los datos a cumplir todas las 
reglas de negocio 
1) Análisis de datos 
2) Flujo de transformación y 
reglas de negocio 
3) Verificación 
4) Transformación 
- Análisis metadatos de los datos: Profiling (1 a 1) o Mining (patrones) 
- Quitar duplicados 
- Atomización → desdoblar en varios campos 
- Discretización 
- Normalización: modelo referencial; unión; unicidad; nulos 
- Integridad 
- Eliminar ruido (malas observaciones, shocks exógenos, etc.) 
- Outlier → obtención de conclusiones 
- Valores vacíos: 1) Eliminar instancia; 2) Predecir por interpolación; 3) Usarlo para procesar 
- Quitar la tendencia lineal (para fijarse en fluctuaciones… si es lo que interesa) 
- Validación → dependencias de atributos para validar y corregir 
- Verificar efectividad flujo de transformación y reglas de negocio 
- Ejecución en serie 
5) Realimentación - Para evitar trabajos futuros sobre los mismos datos
Agregación de datos 
2) Procesar: Quitar duplicados 
Fuente: http://tutorialenexcel.blogspot.com.es/2012/10/15-tutorial-excel-manejando-la.html
Agregación de datos 
2) Procesar: Atomización 
Fuente: http://www.educarchile.cl/ech/pro/app/detalle?ID=133092
Agregación de datos 
2) Procesar: Discretización 
Fuente: http://7542.fi.uba.ar/tecnica/sonido-en-windows/
Agregación de datos 
2) Procesar: Normalización 
Fuente: http://www.anmopyc.es/noticia/boletin_de_normalizacion_julio_2014
Agregación de datos 
2) Procesar: Integridad 
Fuente: http://diariodelapelusa.blogspot.com.es/2013/04/de-la-integridad.html
Agregación de datos 
2) Procesar: Eliminar ruido 
Fuente: http://www.dominandocamtasia.com/blog/como-eliminar-el-ruido-de-un-video
Agregación de datos 
2) Procesar: Gestión outliers 
Fuente: http://mathworld.wolfram.com/Outlier.html
Agregación de datos 
2) Procesar: Gestión valores vacíos 
Fuente: http://www.fengfly.com/plus/view-169414-1.html
Agregación de datos 
2) Procesar: Quitar la tendencia lineal 
Fuente: http://www.monografias.com/trabajos96/regresion-lineal-simplificada-agricola/regresion-lineal-simplificada-agricola.shtml
Agregación de datos 
2) Procesar: Validación 
Fuente: http://www.empleoagil.com/contenido.php?id=22
Agregación de datos 
3) Publicar 
Publicar 
Estándar a seguir (extensibilidad, productividad 
y evitar fragmentaciones) 
¿Modelo de datos? 
¿Unidad de registro? 
...
Agregación de datos 
3) Publicar (II) 
Fuente: http://www.londonshippingcontainers.co.uk/
Agregación de datos 
3) Publicar (III) 
Source: http://www.activelightning.com/automated_publishing/variable-data-printing.html
Agregación de datos 
Herramientas 
Interactive Data Transformation Tools (IDTs) 
1. Pentaho Data Integration: Kettle PDI 
2. Talend Open Studio 
3. DataCleaner 
4. Talend Data Quality 
5. Google Refine 
6. Data Wrangler 
7. Potter's Wheel ABC
Agregación de datos 
1) Kettle PDI 
● Free to decide where and how realize tasks in 
terms of: 
○ Profiling 
○ Cleansing 
○ Integrity 
○ Validation 
● It is based on metadata
Agregación de datos 
1) Kettle PDI (II)
Agregación de datos 
2) Talend Open Studio
Agregación de datos 
3) DataCleaner 
● Profiling tool recommended by Pentaho 
○ It can also be integrated with Kettle PDI 
● Alternatives: 
○ Desktop tool 
○ Web tool 
○ Plugin in Kettle PDI
Agregación de datos 
3) DataCleaner (II) 
● Features 
○ Data cleansing 
○ Data dictionary definition 
○ Pattern, duplicated, null, etc. search and 
detection 
○ Monitoring 
○ Full results statistics 
○ etc.
Agregación de datos 
3) DataCleaner (III)
Agregación de datos 
4) Talend Data Quality
Agregación de datos 
5) OpenRefine
Agregación de datos 
6) Data Wrangler
Agregación de datos 
7) Potter's Wheel ABC
Índice de contenidos 
● Big Data e impacto sociedad 
● Aplicaciones ámbito empresarial 
● Business Intelligence 
● Bases de datos 
● Tipos de datos 
● Ciclo de análisis de datos 
● Agregación da datos 
● Aspectos legales y éticos
Aspectos legales y éticos 
Fuente: http://www.educause.edu/ero/article/ethics-big-data-and-analytics-model-application
Aspectos legales y éticos (II)
Aspectos legales y éticos 
(III)
Aspectos legales y éticos 
(IV)
Aspectos legales y éticos (V)
El proceso de análisis y 
explotación de datos en 
proyectos de Business 
Intelligence 
Módulo 01: Ciclo de vida del Dato en ambientes de BI 
Alex Rayón Jerez 
alex.rayon@urbegi.com 
Octubre, 2014

Contenu connexe

Tendances

Data Governance — Aligning Technical and Business Approaches
Data Governance — Aligning Technical and Business ApproachesData Governance — Aligning Technical and Business Approaches
Data Governance — Aligning Technical and Business ApproachesDATAVERSITY
 
02 - Preprocessing Data.pdf
02 - Preprocessing Data.pdf02 - Preprocessing Data.pdf
02 - Preprocessing Data.pdfElvi Rahmi
 
Building a Data Strategy – Practical Steps for Aligning with Business Goals
Building a Data Strategy – Practical Steps for Aligning with Business GoalsBuilding a Data Strategy – Practical Steps for Aligning with Business Goals
Building a Data Strategy – Practical Steps for Aligning with Business GoalsDATAVERSITY
 
IT4IT - The Full Story for Digital Transformation - Part 1
IT4IT - The Full Story for Digital Transformation - Part 1IT4IT - The Full Story for Digital Transformation - Part 1
IT4IT - The Full Story for Digital Transformation - Part 1Mohamed Zakarya Abdelgawad
 
Estrategia de Datos, ¿por dónde iniciar una iniciativa de gestión y gobierno ...
Estrategia de Datos, ¿por dónde iniciar una iniciativa de gestión y gobierno ...Estrategia de Datos, ¿por dónde iniciar una iniciativa de gestión y gobierno ...
Estrategia de Datos, ¿por dónde iniciar una iniciativa de gestión y gobierno ...Ramón Hernández
 
Basic patterns for capability map level 0
Basic patterns for capability map level 0Basic patterns for capability map level 0
Basic patterns for capability map level 0Jörgen Dahlberg
 
Data Governance for the Executive
Data Governance for the ExecutiveData Governance for the Executive
Data Governance for the ExecutiveDATAVERSITY
 
Enterprise Data Architect Job Description
Enterprise Data Architect Job DescriptionEnterprise Data Architect Job Description
Enterprise Data Architect Job DescriptionLars E Martinsson
 
Business analysis course week1 - Overview
Business analysis course week1 - OverviewBusiness analysis course week1 - Overview
Business analysis course week1 - Overviewciano3020
 
Cobit 4.1 Highlights
Cobit 4.1 HighlightsCobit 4.1 Highlights
Cobit 4.1 Highlightsgeoffharmer
 
Business Architecture the Key to Enterprise Transformation
Business Architecture the Key to Enterprise TransformationBusiness Architecture the Key to Enterprise Transformation
Business Architecture the Key to Enterprise TransformationMike Walker
 
Business Intelligence for kids (example project)
Business Intelligence for kids (example project)Business Intelligence for kids (example project)
Business Intelligence for kids (example project)Enrique Benito
 
Enterprise Architecture Toolkit Overview
Enterprise Architecture Toolkit OverviewEnterprise Architecture Toolkit Overview
Enterprise Architecture Toolkit OverviewMike Walker
 
DMBOK 2.0 and other frameworks including TOGAF & COBIT - keynote from DAMA Au...
DMBOK 2.0 and other frameworks including TOGAF & COBIT - keynote from DAMA Au...DMBOK 2.0 and other frameworks including TOGAF & COBIT - keynote from DAMA Au...
DMBOK 2.0 and other frameworks including TOGAF & COBIT - keynote from DAMA Au...Christopher Bradley
 
CPG Companies: Evolving Your Analytics-driven Organizations
CPG Companies: Evolving Your Analytics-driven OrganizationsCPG Companies: Evolving Your Analytics-driven Organizations
CPG Companies: Evolving Your Analytics-driven Organizationsaccenture
 
Data Governance Workshop
Data Governance WorkshopData Governance Workshop
Data Governance WorkshopCCG
 
Business intelligence, Data Analytics & Data Visualization
Business intelligence, Data Analytics & Data VisualizationBusiness intelligence, Data Analytics & Data Visualization
Business intelligence, Data Analytics & Data VisualizationMuthu Natarajan
 
Introduction to Business Intelligence
Introduction to Business IntelligenceIntroduction to Business Intelligence
Introduction to Business IntelligenceRonan Soares
 

Tendances (20)

Data Governance — Aligning Technical and Business Approaches
Data Governance — Aligning Technical and Business ApproachesData Governance — Aligning Technical and Business Approaches
Data Governance — Aligning Technical and Business Approaches
 
02 - Preprocessing Data.pdf
02 - Preprocessing Data.pdf02 - Preprocessing Data.pdf
02 - Preprocessing Data.pdf
 
Building a Data Strategy – Practical Steps for Aligning with Business Goals
Building a Data Strategy – Practical Steps for Aligning with Business GoalsBuilding a Data Strategy – Practical Steps for Aligning with Business Goals
Building a Data Strategy – Practical Steps for Aligning with Business Goals
 
IT4IT - The Full Story for Digital Transformation - Part 1
IT4IT - The Full Story for Digital Transformation - Part 1IT4IT - The Full Story for Digital Transformation - Part 1
IT4IT - The Full Story for Digital Transformation - Part 1
 
Estrategia de Datos, ¿por dónde iniciar una iniciativa de gestión y gobierno ...
Estrategia de Datos, ¿por dónde iniciar una iniciativa de gestión y gobierno ...Estrategia de Datos, ¿por dónde iniciar una iniciativa de gestión y gobierno ...
Estrategia de Datos, ¿por dónde iniciar una iniciativa de gestión y gobierno ...
 
Basic patterns for capability map level 0
Basic patterns for capability map level 0Basic patterns for capability map level 0
Basic patterns for capability map level 0
 
Data Governance for the Executive
Data Governance for the ExecutiveData Governance for the Executive
Data Governance for the Executive
 
Enterprise Data Architect Job Description
Enterprise Data Architect Job DescriptionEnterprise Data Architect Job Description
Enterprise Data Architect Job Description
 
Business analysis course week1 - Overview
Business analysis course week1 - OverviewBusiness analysis course week1 - Overview
Business analysis course week1 - Overview
 
Cobit 4.1 Highlights
Cobit 4.1 HighlightsCobit 4.1 Highlights
Cobit 4.1 Highlights
 
Business Architecture the Key to Enterprise Transformation
Business Architecture the Key to Enterprise TransformationBusiness Architecture the Key to Enterprise Transformation
Business Architecture the Key to Enterprise Transformation
 
Business Intelligence for kids (example project)
Business Intelligence for kids (example project)Business Intelligence for kids (example project)
Business Intelligence for kids (example project)
 
Enterprise Architecture Toolkit Overview
Enterprise Architecture Toolkit OverviewEnterprise Architecture Toolkit Overview
Enterprise Architecture Toolkit Overview
 
DMBOK 2.0 and other frameworks including TOGAF & COBIT - keynote from DAMA Au...
DMBOK 2.0 and other frameworks including TOGAF & COBIT - keynote from DAMA Au...DMBOK 2.0 and other frameworks including TOGAF & COBIT - keynote from DAMA Au...
DMBOK 2.0 and other frameworks including TOGAF & COBIT - keynote from DAMA Au...
 
CPG Companies: Evolving Your Analytics-driven Organizations
CPG Companies: Evolving Your Analytics-driven OrganizationsCPG Companies: Evolving Your Analytics-driven Organizations
CPG Companies: Evolving Your Analytics-driven Organizations
 
Data Governance Workshop
Data Governance WorkshopData Governance Workshop
Data Governance Workshop
 
Business intelligence, Data Analytics & Data Visualization
Business intelligence, Data Analytics & Data VisualizationBusiness intelligence, Data Analytics & Data Visualization
Business intelligence, Data Analytics & Data Visualization
 
Data modeling for the business
Data modeling for the businessData modeling for the business
Data modeling for the business
 
BI Business Requirements - A Framework For Business Analysts
BI Business Requirements -  A Framework For Business AnalystsBI Business Requirements -  A Framework For Business Analysts
BI Business Requirements - A Framework For Business Analysts
 
Introduction to Business Intelligence
Introduction to Business IntelligenceIntroduction to Business Intelligence
Introduction to Business Intelligence
 

Similaire à Ciclo de vida del dato en ambientes de Business Intelligence

Introducción al Big Data y el Business Intelligence
Introducción al Big Data y el Business IntelligenceIntroducción al Big Data y el Business Intelligence
Introducción al Big Data y el Business IntelligenceAlex Rayón Jerez
 
Introducción al Big Data y el Business Intelligence
Introducción al Big Data y el Business IntelligenceIntroducción al Big Data y el Business Intelligence
Introducción al Big Data y el Business IntelligenceAlex Rayón Jerez
 
El Big Data y Business Intelligence en mi empresa: ¿de qué me sirve?
El Big Data y Business Intelligence en mi empresa: ¿de qué me sirve?El Big Data y Business Intelligence en mi empresa: ¿de qué me sirve?
El Big Data y Business Intelligence en mi empresa: ¿de qué me sirve?Alex Rayón Jerez
 
Estrategias omnicanal para la mejora de los procesos de comunicación y marke...
	Estrategias omnicanal para la mejora de los procesos de comunicación y marke...	Estrategias omnicanal para la mejora de los procesos de comunicación y marke...
Estrategias omnicanal para la mejora de los procesos de comunicación y marke...Big-Data-Summit
 
Alerta_017
Alerta_017Alerta_017
Alerta_017IPAE
 
Revista TicNews Edición Mayo 2014
Revista TicNews Edición Mayo 2014Revista TicNews Edición Mayo 2014
Revista TicNews Edición Mayo 2014Edicion Ticnews
 
Modelos de negocio en la era digital - Modelos de negocio (II)
Modelos de negocio en la era digital - Modelos de negocio (II)Modelos de negocio en la era digital - Modelos de negocio (II)
Modelos de negocio en la era digital - Modelos de negocio (II)Emilio Rodríguez García
 
Computacion en la nube
Computacion en la nubeComputacion en la nube
Computacion en la nubeBrayan Fuentes
 
Gestión en ciencia y tecnología estudiantes
Gestión en ciencia y tecnología estudiantesGestión en ciencia y tecnología estudiantes
Gestión en ciencia y tecnología estudiantesmariabastidastic
 
Revista Mundo Contact Noviembre 2013
Revista Mundo Contact Noviembre 2013Revista Mundo Contact Noviembre 2013
Revista Mundo Contact Noviembre 2013Mundo Contact
 
Accelerating innovation: realidad y futuro de los modelos de negocio digitaltes
Accelerating innovation: realidad y futuro de los modelos de negocio digitaltesAccelerating innovation: realidad y futuro de los modelos de negocio digitaltes
Accelerating innovation: realidad y futuro de los modelos de negocio digitaltesAMETIC
 
Sistemas de Información
Sistemas de InformaciónSistemas de Información
Sistemas de InformaciónLILENE
 
Aporte de los datos a la analítica en la transformación digital - (Mariano Mu...
Aporte de los datos a la analítica en la transformación digital - (Mariano Mu...Aporte de los datos a la analítica en la transformación digital - (Mariano Mu...
Aporte de los datos a la analítica en la transformación digital - (Mariano Mu...Mariano Muñoz Martín
 
Tecnologías innovadoras para desarrollar nuevos negocios
Tecnologías innovadoras para desarrollar nuevos negociosTecnologías innovadoras para desarrollar nuevos negocios
Tecnologías innovadoras para desarrollar nuevos negociosItop Consulting
 
Tendencias de la Tecnología de Información.
Tendencias de la Tecnología de Información.Tendencias de la Tecnología de Información.
Tendencias de la Tecnología de Información.Roberto Ramírez Amaya
 
Presentación Capitulo 1 Perspectivas de la Tecnología Informatica
Presentación Capitulo 1 Perspectivas de la Tecnología InformaticaPresentación Capitulo 1 Perspectivas de la Tecnología Informatica
Presentación Capitulo 1 Perspectivas de la Tecnología InformaticaMauricio Meza Fajardo
 
Revista Mundo Contact Enero 2014
Revista Mundo Contact Enero 2014Revista Mundo Contact Enero 2014
Revista Mundo Contact Enero 2014Mundo Contact
 

Similaire à Ciclo de vida del dato en ambientes de Business Intelligence (20)

Introducción al Big Data y el Business Intelligence
Introducción al Big Data y el Business IntelligenceIntroducción al Big Data y el Business Intelligence
Introducción al Big Data y el Business Intelligence
 
Introducción al Big Data y el Business Intelligence
Introducción al Big Data y el Business IntelligenceIntroducción al Big Data y el Business Intelligence
Introducción al Big Data y el Business Intelligence
 
El Big Data y Business Intelligence en mi empresa: ¿de qué me sirve?
El Big Data y Business Intelligence en mi empresa: ¿de qué me sirve?El Big Data y Business Intelligence en mi empresa: ¿de qué me sirve?
El Big Data y Business Intelligence en mi empresa: ¿de qué me sirve?
 
Estrategias omnicanal para la mejora de los procesos de comunicación y marke...
	Estrategias omnicanal para la mejora de los procesos de comunicación y marke...	Estrategias omnicanal para la mejora de los procesos de comunicación y marke...
Estrategias omnicanal para la mejora de los procesos de comunicación y marke...
 
Alerta_017
Alerta_017Alerta_017
Alerta_017
 
Emprendiendo con mi app
Emprendiendo con mi appEmprendiendo con mi app
Emprendiendo con mi app
 
Revista TicNews Edición Mayo 2014
Revista TicNews Edición Mayo 2014Revista TicNews Edición Mayo 2014
Revista TicNews Edición Mayo 2014
 
Modelos de negocio en la era digital - Modelos de negocio (II)
Modelos de negocio en la era digital - Modelos de negocio (II)Modelos de negocio en la era digital - Modelos de negocio (II)
Modelos de negocio en la era digital - Modelos de negocio (II)
 
Computacion en la nube
Computacion en la nubeComputacion en la nube
Computacion en la nube
 
Gestión en ciencia y tecnología estudiantes
Gestión en ciencia y tecnología estudiantesGestión en ciencia y tecnología estudiantes
Gestión en ciencia y tecnología estudiantes
 
Wp 2015-07
Wp 2015-07Wp 2015-07
Wp 2015-07
 
Revista Mundo Contact Noviembre 2013
Revista Mundo Contact Noviembre 2013Revista Mundo Contact Noviembre 2013
Revista Mundo Contact Noviembre 2013
 
Accelerating innovation: realidad y futuro de los modelos de negocio digitaltes
Accelerating innovation: realidad y futuro de los modelos de negocio digitaltesAccelerating innovation: realidad y futuro de los modelos de negocio digitaltes
Accelerating innovation: realidad y futuro de los modelos de negocio digitaltes
 
Sistemas de Información
Sistemas de InformaciónSistemas de Información
Sistemas de Información
 
Computacion en la nube
Computacion en la nubeComputacion en la nube
Computacion en la nube
 
Aporte de los datos a la analítica en la transformación digital - (Mariano Mu...
Aporte de los datos a la analítica en la transformación digital - (Mariano Mu...Aporte de los datos a la analítica en la transformación digital - (Mariano Mu...
Aporte de los datos a la analítica en la transformación digital - (Mariano Mu...
 
Tecnologías innovadoras para desarrollar nuevos negocios
Tecnologías innovadoras para desarrollar nuevos negociosTecnologías innovadoras para desarrollar nuevos negocios
Tecnologías innovadoras para desarrollar nuevos negocios
 
Tendencias de la Tecnología de Información.
Tendencias de la Tecnología de Información.Tendencias de la Tecnología de Información.
Tendencias de la Tecnología de Información.
 
Presentación Capitulo 1 Perspectivas de la Tecnología Informatica
Presentación Capitulo 1 Perspectivas de la Tecnología InformaticaPresentación Capitulo 1 Perspectivas de la Tecnología Informatica
Presentación Capitulo 1 Perspectivas de la Tecnología Informatica
 
Revista Mundo Contact Enero 2014
Revista Mundo Contact Enero 2014Revista Mundo Contact Enero 2014
Revista Mundo Contact Enero 2014
 

Plus de Alex Rayón Jerez

El Big Data en la dirección comercial: market(ing) intelligence
El Big Data en la dirección comercial: market(ing) intelligenceEl Big Data en la dirección comercial: market(ing) intelligence
El Big Data en la dirección comercial: market(ing) intelligenceAlex Rayón Jerez
 
Herramientas y metodologías Big Data para acceder a datos no estructurados
Herramientas y metodologías Big Data para acceder a datos no estructuradosHerramientas y metodologías Big Data para acceder a datos no estructurados
Herramientas y metodologías Big Data para acceder a datos no estructuradosAlex Rayón Jerez
 
Las competencias digitales como método de observación de competencias genéricas
Las competencias digitales como método de observación de competencias genéricasLas competencias digitales como método de observación de competencias genéricas
Las competencias digitales como método de observación de competencias genéricasAlex Rayón Jerez
 
El Big Data en mi empresa ¿de qué me sirve?
El Big Data en mi empresa  ¿de qué me sirve?El Big Data en mi empresa  ¿de qué me sirve?
El Big Data en mi empresa ¿de qué me sirve?Alex Rayón Jerez
 
Aplicación del Big Data a la mejora de la competitividad de la empresa
Aplicación del Big Data a la mejora de la competitividad de la empresaAplicación del Big Data a la mejora de la competitividad de la empresa
Aplicación del Big Data a la mejora de la competitividad de la empresaAlex Rayón Jerez
 
Análisis de Redes Sociales (Social Network Analysis) y Text Mining
Análisis de Redes Sociales (Social Network Analysis) y Text MiningAnálisis de Redes Sociales (Social Network Analysis) y Text Mining
Análisis de Redes Sociales (Social Network Analysis) y Text MiningAlex Rayón Jerez
 
Marketing intelligence con estrategia omnicanal y Customer Journey
Marketing intelligence con estrategia omnicanal y Customer JourneyMarketing intelligence con estrategia omnicanal y Customer Journey
Marketing intelligence con estrategia omnicanal y Customer JourneyAlex Rayón Jerez
 
Modelos de propensión en la era del Big Data
Modelos de propensión en la era del Big DataModelos de propensión en la era del Big Data
Modelos de propensión en la era del Big DataAlex Rayón Jerez
 
Customer Lifetime Value Management con Big Data
Customer Lifetime Value Management con Big DataCustomer Lifetime Value Management con Big Data
Customer Lifetime Value Management con Big DataAlex Rayón Jerez
 
Big Data: the Management Revolution
Big Data: the Management RevolutionBig Data: the Management Revolution
Big Data: the Management RevolutionAlex Rayón Jerez
 
Optimización de procesos con el Big Data
Optimización de procesos con el Big DataOptimización de procesos con el Big Data
Optimización de procesos con el Big DataAlex Rayón Jerez
 
La economía del dato: transformando sectores, generando oportunidades
La economía del dato: transformando sectores, generando oportunidadesLa economía del dato: transformando sectores, generando oportunidades
La economía del dato: transformando sectores, generando oportunidadesAlex Rayón Jerez
 
Cómo crecer, ser más eficiente y competitivo a través del Big Data
Cómo crecer, ser más eficiente y competitivo a través del Big DataCómo crecer, ser más eficiente y competitivo a través del Big Data
Cómo crecer, ser más eficiente y competitivo a través del Big DataAlex Rayón Jerez
 
El poder de los datos: hacia una sociedad inteligente, pero ética
El poder de los datos: hacia una sociedad inteligente, pero éticaEl poder de los datos: hacia una sociedad inteligente, pero ética
El poder de los datos: hacia una sociedad inteligente, pero éticaAlex Rayón Jerez
 
Búsqueda, organización y presentación de recursos de aprendizaje
Búsqueda, organización y presentación de recursos de aprendizajeBúsqueda, organización y presentación de recursos de aprendizaje
Búsqueda, organización y presentación de recursos de aprendizajeAlex Rayón Jerez
 
Deusto Knowledge Hub como herramienta de publicación y descubrimiento de cono...
Deusto Knowledge Hub como herramienta de publicación y descubrimiento de cono...Deusto Knowledge Hub como herramienta de publicación y descubrimiento de cono...
Deusto Knowledge Hub como herramienta de publicación y descubrimiento de cono...Alex Rayón Jerez
 
Fomentando la colaboración en el aula a través de herramientas sociales
Fomentando la colaboración en el aula a través de herramientas socialesFomentando la colaboración en el aula a través de herramientas sociales
Fomentando la colaboración en el aula a través de herramientas socialesAlex Rayón Jerez
 
Utilizando Google Drive y Google Docs en el aula para trabajar con mis estudi...
Utilizando Google Drive y Google Docs en el aula para trabajar con mis estudi...Utilizando Google Drive y Google Docs en el aula para trabajar con mis estudi...
Utilizando Google Drive y Google Docs en el aula para trabajar con mis estudi...Alex Rayón Jerez
 
Procesamiento y visualización de datos para generar nuevo conocimiento
Procesamiento y visualización de datos para generar nuevo conocimientoProcesamiento y visualización de datos para generar nuevo conocimiento
Procesamiento y visualización de datos para generar nuevo conocimientoAlex Rayón Jerez
 
Marketing intelligence: Optimizando la estrategia a través del Big Data
Marketing intelligence: Optimizando la estrategia a través del Big DataMarketing intelligence: Optimizando la estrategia a través del Big Data
Marketing intelligence: Optimizando la estrategia a través del Big DataAlex Rayón Jerez
 

Plus de Alex Rayón Jerez (20)

El Big Data en la dirección comercial: market(ing) intelligence
El Big Data en la dirección comercial: market(ing) intelligenceEl Big Data en la dirección comercial: market(ing) intelligence
El Big Data en la dirección comercial: market(ing) intelligence
 
Herramientas y metodologías Big Data para acceder a datos no estructurados
Herramientas y metodologías Big Data para acceder a datos no estructuradosHerramientas y metodologías Big Data para acceder a datos no estructurados
Herramientas y metodologías Big Data para acceder a datos no estructurados
 
Las competencias digitales como método de observación de competencias genéricas
Las competencias digitales como método de observación de competencias genéricasLas competencias digitales como método de observación de competencias genéricas
Las competencias digitales como método de observación de competencias genéricas
 
El Big Data en mi empresa ¿de qué me sirve?
El Big Data en mi empresa  ¿de qué me sirve?El Big Data en mi empresa  ¿de qué me sirve?
El Big Data en mi empresa ¿de qué me sirve?
 
Aplicación del Big Data a la mejora de la competitividad de la empresa
Aplicación del Big Data a la mejora de la competitividad de la empresaAplicación del Big Data a la mejora de la competitividad de la empresa
Aplicación del Big Data a la mejora de la competitividad de la empresa
 
Análisis de Redes Sociales (Social Network Analysis) y Text Mining
Análisis de Redes Sociales (Social Network Analysis) y Text MiningAnálisis de Redes Sociales (Social Network Analysis) y Text Mining
Análisis de Redes Sociales (Social Network Analysis) y Text Mining
 
Marketing intelligence con estrategia omnicanal y Customer Journey
Marketing intelligence con estrategia omnicanal y Customer JourneyMarketing intelligence con estrategia omnicanal y Customer Journey
Marketing intelligence con estrategia omnicanal y Customer Journey
 
Modelos de propensión en la era del Big Data
Modelos de propensión en la era del Big DataModelos de propensión en la era del Big Data
Modelos de propensión en la era del Big Data
 
Customer Lifetime Value Management con Big Data
Customer Lifetime Value Management con Big DataCustomer Lifetime Value Management con Big Data
Customer Lifetime Value Management con Big Data
 
Big Data: the Management Revolution
Big Data: the Management RevolutionBig Data: the Management Revolution
Big Data: the Management Revolution
 
Optimización de procesos con el Big Data
Optimización de procesos con el Big DataOptimización de procesos con el Big Data
Optimización de procesos con el Big Data
 
La economía del dato: transformando sectores, generando oportunidades
La economía del dato: transformando sectores, generando oportunidadesLa economía del dato: transformando sectores, generando oportunidades
La economía del dato: transformando sectores, generando oportunidades
 
Cómo crecer, ser más eficiente y competitivo a través del Big Data
Cómo crecer, ser más eficiente y competitivo a través del Big DataCómo crecer, ser más eficiente y competitivo a través del Big Data
Cómo crecer, ser más eficiente y competitivo a través del Big Data
 
El poder de los datos: hacia una sociedad inteligente, pero ética
El poder de los datos: hacia una sociedad inteligente, pero éticaEl poder de los datos: hacia una sociedad inteligente, pero ética
El poder de los datos: hacia una sociedad inteligente, pero ética
 
Búsqueda, organización y presentación de recursos de aprendizaje
Búsqueda, organización y presentación de recursos de aprendizajeBúsqueda, organización y presentación de recursos de aprendizaje
Búsqueda, organización y presentación de recursos de aprendizaje
 
Deusto Knowledge Hub como herramienta de publicación y descubrimiento de cono...
Deusto Knowledge Hub como herramienta de publicación y descubrimiento de cono...Deusto Knowledge Hub como herramienta de publicación y descubrimiento de cono...
Deusto Knowledge Hub como herramienta de publicación y descubrimiento de cono...
 
Fomentando la colaboración en el aula a través de herramientas sociales
Fomentando la colaboración en el aula a través de herramientas socialesFomentando la colaboración en el aula a través de herramientas sociales
Fomentando la colaboración en el aula a través de herramientas sociales
 
Utilizando Google Drive y Google Docs en el aula para trabajar con mis estudi...
Utilizando Google Drive y Google Docs en el aula para trabajar con mis estudi...Utilizando Google Drive y Google Docs en el aula para trabajar con mis estudi...
Utilizando Google Drive y Google Docs en el aula para trabajar con mis estudi...
 
Procesamiento y visualización de datos para generar nuevo conocimiento
Procesamiento y visualización de datos para generar nuevo conocimientoProcesamiento y visualización de datos para generar nuevo conocimiento
Procesamiento y visualización de datos para generar nuevo conocimiento
 
Marketing intelligence: Optimizando la estrategia a través del Big Data
Marketing intelligence: Optimizando la estrategia a través del Big DataMarketing intelligence: Optimizando la estrategia a través del Big Data
Marketing intelligence: Optimizando la estrategia a través del Big Data
 

Dernier

FORMAS DE TRANSPORTE EN MASA-PDF.pdf lclases
FORMAS DE TRANSPORTE EN MASA-PDF.pdf  lclasesFORMAS DE TRANSPORTE EN MASA-PDF.pdf  lclases
FORMAS DE TRANSPORTE EN MASA-PDF.pdf lclasesjvalenciama
 
Clase 2 Ecosistema Emprendedor en Chile.
Clase 2 Ecosistema Emprendedor en Chile.Clase 2 Ecosistema Emprendedor en Chile.
Clase 2 Ecosistema Emprendedor en Chile.Gonzalo Morales Esparza
 
gua de docente para el curso de finanzas
gua de docente para el curso de finanzasgua de docente para el curso de finanzas
gua de docente para el curso de finanzassuperamigo2014
 
Efectos del cambio climatico en huanuco.pptx
Efectos del cambio climatico en huanuco.pptxEfectos del cambio climatico en huanuco.pptx
Efectos del cambio climatico en huanuco.pptxCONSTRUCTORAEINVERSI3
 
COPASST Y COMITE DE CONVIVENCIA.pptx DE LA EMPRESA
COPASST Y COMITE DE CONVIVENCIA.pptx DE LA EMPRESACOPASST Y COMITE DE CONVIVENCIA.pptx DE LA EMPRESA
COPASST Y COMITE DE CONVIVENCIA.pptx DE LA EMPRESADanielAndresBrand
 
Presentación Final Riesgo de Crédito.pptx
Presentación Final Riesgo de Crédito.pptxPresentación Final Riesgo de Crédito.pptx
Presentación Final Riesgo de Crédito.pptxIvnAndres5
 
ADMINISTRACION FINANCIERA CAPITULO 4.pdf
ADMINISTRACION FINANCIERA CAPITULO 4.pdfADMINISTRACION FINANCIERA CAPITULO 4.pdf
ADMINISTRACION FINANCIERA CAPITULO 4.pdfguillencuevaadrianal
 
LIC-ZIEGLER-Planificación y Control de Gestión
LIC-ZIEGLER-Planificación y Control de GestiónLIC-ZIEGLER-Planificación y Control de Gestión
LIC-ZIEGLER-Planificación y Control de GestiónBahamondesOscar
 
Presentacion III ACTIVIDADES DE CONTROL. IV UNIDAD..pdf
Presentacion III ACTIVIDADES DE CONTROL. IV UNIDAD..pdfPresentacion III ACTIVIDADES DE CONTROL. IV UNIDAD..pdf
Presentacion III ACTIVIDADES DE CONTROL. IV UNIDAD..pdfLuisAlbertoAlvaradoF2
 
TIPOS DE PLANES administracion una perspectiva global - KOONTZ.pptx
TIPOS DE PLANES administracion una perspectiva global - KOONTZ.pptxTIPOS DE PLANES administracion una perspectiva global - KOONTZ.pptx
TIPOS DE PLANES administracion una perspectiva global - KOONTZ.pptxKevinHeredia14
 
modulo+penal+del+16+al+20+hhggde+enero.pdf
modulo+penal+del+16+al+20+hhggde+enero.pdfmodulo+penal+del+16+al+20+hhggde+enero.pdf
modulo+penal+del+16+al+20+hhggde+enero.pdfmisssusanalrescate01
 
Modelo de convenio de pago con morosos del condominio (GENÉRICO).docx
Modelo de convenio de pago con morosos del condominio (GENÉRICO).docxModelo de convenio de pago con morosos del condominio (GENÉRICO).docx
Modelo de convenio de pago con morosos del condominio (GENÉRICO).docxedwinrojas836235
 
Buenas Practicas de Almacenamiento en droguerias
Buenas Practicas de Almacenamiento en drogueriasBuenas Practicas de Almacenamiento en droguerias
Buenas Practicas de Almacenamiento en drogueriasmaicholfc
 
PPT DIAGNOSTICO DAFO Y CAME MEGAPUERTO CHANCAY
PPT DIAGNOSTICO DAFO Y CAME MEGAPUERTO CHANCAYPPT DIAGNOSTICO DAFO Y CAME MEGAPUERTO CHANCAY
PPT DIAGNOSTICO DAFO Y CAME MEGAPUERTO CHANCAYCarlosAlbertoVillafu3
 
Plan General de Contabilidad Y PYMES pdf
Plan General de Contabilidad Y PYMES pdfPlan General de Contabilidad Y PYMES pdf
Plan General de Contabilidad Y PYMES pdfdanilojaviersantiago
 
el impuesto genera A LAS LAS lasventas IGV
el impuesto genera A LAS  LAS lasventas IGVel impuesto genera A LAS  LAS lasventas IGV
el impuesto genera A LAS LAS lasventas IGVTeresa Rc
 
INFORMATIVO CIRCULAR FISCAL - RENTA 2023.ppsx
INFORMATIVO CIRCULAR FISCAL - RENTA 2023.ppsxINFORMATIVO CIRCULAR FISCAL - RENTA 2023.ppsx
INFORMATIVO CIRCULAR FISCAL - RENTA 2023.ppsxCORPORACIONJURIDICA
 
informacion-finanTFHHETHAETHciera-2022.pdf
informacion-finanTFHHETHAETHciera-2022.pdfinformacion-finanTFHHETHAETHciera-2022.pdf
informacion-finanTFHHETHAETHciera-2022.pdfPriscilaBermello
 
ISO 45001-2018.pdf norma internacional para la estandarización
ISO 45001-2018.pdf norma internacional para la estandarizaciónISO 45001-2018.pdf norma internacional para la estandarización
ISO 45001-2018.pdf norma internacional para la estandarizaciónjesuscub33
 

Dernier (20)

FORMAS DE TRANSPORTE EN MASA-PDF.pdf lclases
FORMAS DE TRANSPORTE EN MASA-PDF.pdf  lclasesFORMAS DE TRANSPORTE EN MASA-PDF.pdf  lclases
FORMAS DE TRANSPORTE EN MASA-PDF.pdf lclases
 
Clase 2 Ecosistema Emprendedor en Chile.
Clase 2 Ecosistema Emprendedor en Chile.Clase 2 Ecosistema Emprendedor en Chile.
Clase 2 Ecosistema Emprendedor en Chile.
 
gua de docente para el curso de finanzas
gua de docente para el curso de finanzasgua de docente para el curso de finanzas
gua de docente para el curso de finanzas
 
Efectos del cambio climatico en huanuco.pptx
Efectos del cambio climatico en huanuco.pptxEfectos del cambio climatico en huanuco.pptx
Efectos del cambio climatico en huanuco.pptx
 
COPASST Y COMITE DE CONVIVENCIA.pptx DE LA EMPRESA
COPASST Y COMITE DE CONVIVENCIA.pptx DE LA EMPRESACOPASST Y COMITE DE CONVIVENCIA.pptx DE LA EMPRESA
COPASST Y COMITE DE CONVIVENCIA.pptx DE LA EMPRESA
 
Presentación Final Riesgo de Crédito.pptx
Presentación Final Riesgo de Crédito.pptxPresentación Final Riesgo de Crédito.pptx
Presentación Final Riesgo de Crédito.pptx
 
Tarea-4-Estadistica-Descriptiva-Materia.ppt
Tarea-4-Estadistica-Descriptiva-Materia.pptTarea-4-Estadistica-Descriptiva-Materia.ppt
Tarea-4-Estadistica-Descriptiva-Materia.ppt
 
ADMINISTRACION FINANCIERA CAPITULO 4.pdf
ADMINISTRACION FINANCIERA CAPITULO 4.pdfADMINISTRACION FINANCIERA CAPITULO 4.pdf
ADMINISTRACION FINANCIERA CAPITULO 4.pdf
 
LIC-ZIEGLER-Planificación y Control de Gestión
LIC-ZIEGLER-Planificación y Control de GestiónLIC-ZIEGLER-Planificación y Control de Gestión
LIC-ZIEGLER-Planificación y Control de Gestión
 
Presentacion III ACTIVIDADES DE CONTROL. IV UNIDAD..pdf
Presentacion III ACTIVIDADES DE CONTROL. IV UNIDAD..pdfPresentacion III ACTIVIDADES DE CONTROL. IV UNIDAD..pdf
Presentacion III ACTIVIDADES DE CONTROL. IV UNIDAD..pdf
 
TIPOS DE PLANES administracion una perspectiva global - KOONTZ.pptx
TIPOS DE PLANES administracion una perspectiva global - KOONTZ.pptxTIPOS DE PLANES administracion una perspectiva global - KOONTZ.pptx
TIPOS DE PLANES administracion una perspectiva global - KOONTZ.pptx
 
modulo+penal+del+16+al+20+hhggde+enero.pdf
modulo+penal+del+16+al+20+hhggde+enero.pdfmodulo+penal+del+16+al+20+hhggde+enero.pdf
modulo+penal+del+16+al+20+hhggde+enero.pdf
 
Modelo de convenio de pago con morosos del condominio (GENÉRICO).docx
Modelo de convenio de pago con morosos del condominio (GENÉRICO).docxModelo de convenio de pago con morosos del condominio (GENÉRICO).docx
Modelo de convenio de pago con morosos del condominio (GENÉRICO).docx
 
Buenas Practicas de Almacenamiento en droguerias
Buenas Practicas de Almacenamiento en drogueriasBuenas Practicas de Almacenamiento en droguerias
Buenas Practicas de Almacenamiento en droguerias
 
PPT DIAGNOSTICO DAFO Y CAME MEGAPUERTO CHANCAY
PPT DIAGNOSTICO DAFO Y CAME MEGAPUERTO CHANCAYPPT DIAGNOSTICO DAFO Y CAME MEGAPUERTO CHANCAY
PPT DIAGNOSTICO DAFO Y CAME MEGAPUERTO CHANCAY
 
Plan General de Contabilidad Y PYMES pdf
Plan General de Contabilidad Y PYMES pdfPlan General de Contabilidad Y PYMES pdf
Plan General de Contabilidad Y PYMES pdf
 
el impuesto genera A LAS LAS lasventas IGV
el impuesto genera A LAS  LAS lasventas IGVel impuesto genera A LAS  LAS lasventas IGV
el impuesto genera A LAS LAS lasventas IGV
 
INFORMATIVO CIRCULAR FISCAL - RENTA 2023.ppsx
INFORMATIVO CIRCULAR FISCAL - RENTA 2023.ppsxINFORMATIVO CIRCULAR FISCAL - RENTA 2023.ppsx
INFORMATIVO CIRCULAR FISCAL - RENTA 2023.ppsx
 
informacion-finanTFHHETHAETHciera-2022.pdf
informacion-finanTFHHETHAETHciera-2022.pdfinformacion-finanTFHHETHAETHciera-2022.pdf
informacion-finanTFHHETHAETHciera-2022.pdf
 
ISO 45001-2018.pdf norma internacional para la estandarización
ISO 45001-2018.pdf norma internacional para la estandarizaciónISO 45001-2018.pdf norma internacional para la estandarización
ISO 45001-2018.pdf norma internacional para la estandarización
 

Ciclo de vida del dato en ambientes de Business Intelligence

  • 1. El proceso de análisis y explotación de datos en proyectos de Business Intelligence Módulo 01: Ciclo de vida del Dato en ambientes de BI Alex Rayón Jerez alex.rayon@urbegi.com Octubre, 2014
  • 2. Índice de contenidos ● Big Data e impacto sociedad ● Aplicaciones ámbito empresarial ● Business Intelligence ● Bases de datos ● Tipos de datos ● Ciclo de análisis de datos ● Agregación de datos ● Aspectos legales y éticos
  • 3. Índice de contenidos ● Big Data e impacto sociedad ● Aplicaciones ámbito empresarial ● Business Intelligence ● Bases de datos ● Tipos de datos ● Ciclo de análisis de datos ● Agregación de datos ● Aspectos legales y éticos
  • 4. Big Data y sociedad Introducción Según un reciente estudio del Supervisor Europeo de Protección de Datos (EDPS), un 57% de los negocios de la UE utilizan ya algún sistema para procesar los datos que generan los 369 millones de internautas europeos
  • 5. Big Data y sociedad Las 4 V’s del Big Data Fuente: http://www.business2community.com/digital-marketing/4-vs-big-data-digital-marketing-0914845
  • 6. Big Data y sociedad Nueva sociología ● El concepto Big Data no es tecnológica ni conceptualmente nada nuevo o Realmente, es el tratamiento de datos de toda la vida en el campo de la Sociología Fuente: http://escueladebellasartesmanuelbelgrano.wordpress.com/category/4o-ano/sociologia/
  • 7. Big Data y sociedad Nueva sociología (II) ● Sin embargo, lo que sí se dispone ahora es de nuevas tecnologías que facilitan hacer ese tratamiento de datos ● Por lo tanto, el Big Data, no introduce un nuevo modelo para hacer las cosas; sino que aporta una nueva capacidad
  • 8. Big Data y sociedad Economía digital ● En la economía digital existen cuatro factores clave 1. La tecnología 2. La capa de servicios asociados 3. La capacidad para generar negocios 4. Las competencias digitales: cultura digital
  • 9. Big Data y sociedad Economía digital (II) Fuente: http://mundocontact.com/actualidad/page/119/ La nube se ha consolidado como el modelo sobre el que se desarrolla el ecosistema digital Por ello el acceso se ha convertido, como anticipara el sociólogo y economista Jeremy Rifkin, en la puerta de entrada a la economía digital
  • 10. Big Data y sociedad Economía digital (III) ● La nube impone sus propias reglas de funcionamiento que a su vez van configurando la arquitectura de la economía digital ● Según estimaciones de Deloitte, la actividad económica vinculada a la conectividad, solo en los países en vías de desarrollo, podría generar un aumento del 72% en la tasa de crecimiento del PIB, y más de 140 millones de nuevos puestos de trabajo
  • 11. Big Data y sociedad La economía digital (IV) ● Cambio demográfico o Decisiones en manos de generación 70 y 80 o No son aún nativos digitales, pero tienen una serie de valores distintivos:  Individualismo  Personalización  Inmediatez Fuente: http://www.todocoleccion.net/mabel-somo-generacion-80-una-noche-amor-45-hispavox-1979- pedido-minimo-10%E2%82%AC~x25950258
  • 12. Big Data y sociedad La economía digital (V) From Consumer-oriented Internet towards Company-oriented Internet Source: http://pame95.wordpress.com/2012/11/03/mi-ensayo-planeta-web-2-0-la-intercreatividad-y-web-2- 0/ Source: http://antoniotoriz.blogspot.com.es/2013/08/internet-de-las-cosas.html#sthash.hAa2ha7K.dpbs
  • 13. Big Data y sociedad Transformación digital Fuente: http://www.mujeresconsejeras.com/estrategia-digital-5-errores-que-puedes-evitar/2014/02/20/
  • 14. Big Data y sociedad Transformación digital (II) Source: http://evigo.com/8570-mckinsey-digital-transformation-e-commerce-coming/
  • 15. Big Data y sociedad Palancas de transformación digital 1)Social Media ● Estrategia de captación y fidelización ● Objetivo: movilizar actitudes para cambiar comportamientos ● Crecimiento en B2B ● Tráfico en buscadores vs. tráfico en redes sociales
  • 16. Big Data y sociedad Palancas de transformación digital (II) 2) Movilidad ● Uso de móvil ya es superior al del PC o España, Francia y UK lideran el uso de smartphones ● Aplicaciones B2B a punto de superar las aplicaciones B2C o De una Internet de consumidores a una Internet de empresas o Entornos B2B: desarrollar canales de comunicación con consumidor final, que sirvan de prescriptores y hagan pull sobre los distribuidores
  • 17. Big Data y sociedad Palancas de transformación digital (III) 3) eCommerce ● La tecnología expansiona mercados ● Plan único estrategia on-off o Vinculado con estrategias pricing y clienting o Herramientas como Minderest Fuente: http://www.comunicacion-cultural.com/2012/05/21/la-expansion-internacional-de-las-librerias-abre-nuevos-mercados/comment-page-1/
  • 18. Big Data y sociedad Marketing digital y datos desestructurados Las estrategias omnicanal de las empresas (CRM, Call Center, Web, Social Media, etc.) han traído muchos problemas a las empresas de marketing para poder cuantitivizar la presencia Fuente: http://www.samueldiosdado.com/02/el-cliente-ya-es-multicanal-es-omnicanal/
  • 19. Big Data y sociedad Marketing digital y datos desestructurados (II) Source: http://www.i95dev.com/understanding-omni-channel-and-multichannel/
  • 20. Índice de contenidos ● Big Data e impacto sociedad ● Aplicaciones ámbito empresarial ● Business Intelligence ● Bases de datos ● Tipos de datos ● Ciclo de análisis de datos ● Agregación de datos ● Aspectos legales y éticos
  • 21. Aplicaciones empresa Social Enterprise Stack
  • 22. Aplicaciones empresa Social Enterprise Stack (II) Fuente: http://www.gartner.com/newsroom/id/2643919
  • 23. Aplicaciones empresa Social Enterprise Stack (III) Fuente: http://www.forbes.com/sites/louiscolumbus/2012/11/08/cloud-computing-and-enterprise-software-forecast-update-2012/
  • 24. Aplicaciones empresa El caso de Zappos Fuente: http://www.automotivedigitalmarketing.com/profiles/blogs/social-network-media-savvy Fuente: http://catalog.flatworldknowledge.com/bookhub/reader/2861?e=cadden_1.0-ch04_s01
  • 25. Aplicaciones empresa El caso de Zappos (II) Fuente: http://www.slideshare.net/CarlaSC/trabajo-final-naming-zappos
  • 26. Aplicaciones empresa El caso de Zappos (III) Reflexión BI.01.1: ¿Cuáles son las ventajas competitivas y competencias clave? ¿Cuán sostenibles son? 1. Equipo 1: Gran volumen de almacenamiento 2. Equipo 2: B2C y Cultura corporativa 3. Equipo 3: Gestión de la información 4. Equipo 4: Gestión de precios 5. Equipo 5: Logística y Operaciones 6. Equipo 6: Gestión de las relaciones B2B 7. Equipo 7: Ventas
  • 27. Aplicaciones empresa El caso de Zappos (IV) Competencia Descripción ¿Cómo contribuye a los objetivos del negocio? ¿Cómo las TIC y las plataformas digitales ayudan? ¿Es sostenible? ¿Es escalable?
  • 28. Aplicaciones empresa Data Layer ● En la actividad digital, todo genera un dato o Tarjetas de crédito o Teléfonos móviles o Redes sociales o Proveedores de Internet o Tarjeta de fidelización de mercado Fuente: http://www.privacidadlogica.es/2012/05/31/modelo-de-informe-sobre-sistema-de-control-horario- basado-en-huella-digital/
  • 29. Aplicaciones empresa Data Layer (II) No obtiene respuestas quién posee los datos, sino quien sabe hacer las preguntas Fuente: http://www.xiskya.com/2012/12/21/una-pregunta-poderosa-por-favor/
  • 30. Aplicaciones empresa Data Layer (III) En la economía digital, captar datos de clientes es cada vez más crítico o De  1º Vender  2º Capturar el dato o A  1º Capturar el dato  2º vender
  • 31. Aplicaciones empresa Data Layer (IV) Estrategia de venta directa 1) Gestionar audiencia 2) Capturar datos 3) Convertir a ventas
  • 32. Aplicaciones empresa Data Layer (V) 1) Gestionar audiencia ● Fijar público objetivo ● Identificar espacios digitales donde encontrarlos ● Crear espacios propios para captar datos y crear la Base de Datos ● Definir líneas editoriales y métodos de captación
  • 33. Aplicaciones empresa Data Layer (VI) 2) Captar datos ● Creación landing page para captar dato ● Pedir datos necesarios y clasificarlos ● Realizar seguimiento
  • 34. Aplicaciones empresa Data Layer (VII) 3) Convertir a venta ● Segmentación de usuarios ● Personalización de la oferta ● Planificar acciones ● Realizar seguimiento
  • 35. Aplicaciones empresa Data Layer (VIII) Fuente: http://www3.weforum.org/docs/WEF_ITTC_PersonalDataNewAsset_Report_2011.pdf
  • 36. Aplicaciones empresa Data Layer (IX) Fuente: http://www.theguardian.com/news/datablog/2014/apr/22/how-much-is-personal-data-worth
  • 37. Aplicaciones empresa Data Layer (X) Fuente: http://www.ft.com/intl/cms/s/2/927ca86e-d29b-11e2-88ed-00144feab7de.html#axzz2z2agBB6R
  • 38. Aplicaciones empresa Data Layer: aplicaciones de negocio
  • 39. Aplicaciones empresa Data Layer: aplicaciones de negocio (II)
  • 40. Aplicaciones empresa Data Layer: aplicaciones de negocio (III)
  • 41. Aplicaciones empresa Data Layer: aplicaciones de negocio (IV)
  • 42. Aplicaciones empresa Data Layer: aplicaciones de negocio (V)
  • 43. Aplicaciones empresa Data Layer: aplicaciones de negocio (VI)
  • 44. Aplicaciones empresa Data Layer: aplicaciones de negocio (VII) Reflexión BI.01.2: Pensad en posibles modelos de negocio alrededor de los datos, considerando: 1. Privacidad 2. Monetización 3. Sostenibilidad 4. Clientes directos e indirectos 5. Producto 6. Plataformas tecnológicas necesarias
  • 45. Aplicaciones empresa Data Layer: aplicaciones de negocio (VIII) Modelo EFQM de Excelencia Fuente: http://www.tqm.es/TQM/ModEur/ModeloEuropeo.htm
  • 46. Aplicaciones empresa Data Layer: aplicaciones de negocio (IX) Digital Digital
  • 48. Aplicaciones empresa Application Layer (II) ● Aplicaciones para la gestión interna o Aplicaciones que ayuden y faciliten los procesos internos en las empresas, tales como:  Selección y el control de personal  Gestión de los gastos  Facturas  Aprovisionamiento  Contabilidad  etc.
  • 49. Aplicaciones empresa Application Layer (III) ● Aplicaciones de organización o Aplicaciones que den soporte a los empleados para mejorar sus tareas y procesos productivos, permitiéndoles optimizar el tiempo de trabajo, como:  Gestión de emails  Calendarios de reuniones  Videoconferencias  Trabajo en la nube  Gestión de documentos  Trabajo colaborativo  etc.
  • 50. Aplicaciones empresa Application Layer (IV) ● Aplicaciones de relación con clientes/ventas o Aplicaciones dirigidas a mejorar y agilizar la relación con los clientes de una empresa, y que ayuden a ofrecer servicios de venta o información a sus clientes más allá de la tienda física, tales como:  Herramientas de de gestión de la relación con los clientes (CRM),  Marketing  Venta online  etc.
  • 51. Aplicaciones empresa Application Layer (V) ERP: Enterprise Resource Planning List of ERP Software Packages: http://en.wikipedia.org/wiki/List_of_ERP_software_packages
  • 52. Aplicaciones empresa Application Layer (VI) CRM: Customer Relationship Management Comparación de software CRM: http://en.wikipedia.org/wiki/Comparison_of_CRM_systems
  • 53. Aplicaciones empresa Application Layer (VII) SCM: Supply Chain Management Lista de software SCM: http://www.softwareadvice.com/scm/
  • 54. Aplicaciones empresa Application Layer (VIII) DRP: Distribution Resource Planner Fuente: http://www.libratechno.com/erp.php
  • 55. Aplicaciones empresa Application Layer (IX) KMS: Knowledge Management System Fuente: http://www.prescientdigital.com/articles/content-management/content-management-in-a-knowledge-management-context/
  • 56. Aplicaciones empresa Application Layer (X) eCommerce Fuente: http://www.i-fluxtech.com/web-solution/e-Commerce-website.htm Comparación de software ecommerce: http://en.wikipedia.org/wiki/Comparison_of_shopping_cart_software
  • 57. Aplicaciones empresa Social Layer Fuente: http://www.webvigo.com/blog/el-social-business-intelligence-social-bi/
  • 58. Aplicaciones empresa Social Layer (II) La solución no es contratar a un Community Manager Sino redefinir los objetivos y procedimientos de distintas posiciones ya existentes dentro de las organizaciones Fuente: http://www.enterpriseirregulars.com/19667/the-enterprise-2-0-conference-boston- 2010-lots-to-see-and-do/
  • 59. Aplicaciones empresa Social Layer (III) ● Ha habido un boom en tipos de medios sociales o La idea ha sido agrupar y conectar personas en torno a ejes de interés común o La mayoría han sido gratuitos: ¿dónde está la rentabilidad? La publicidad (Facebook, Twitter) es una tarta muy concentrada o Casos  Pinterest: escaparate de productos y servicios  Pheed: suscripción a contenidos de pago capitalizando la actividad de personajes célebres
  • 60. Aplicaciones empresa Social Layer (IV) “75% of our employees are young people – digital natives – and this is how they talk to each other. The only way I am going to get to them is to talk to them in their medium.” Giam Swiegers CEO Deloitte Australia
  • 62. Aplicaciones empresa Social Layer (VI) ● Organizaciones 2.0: redárquicas o adhocráticas o Capacidad innovadora o Capacidad de adaptación al entorno ● Cultura innovadora o Nuevo tipo de directivo o estilos de liderazgo transformadores o Estilos de gestión de personas o Procesos de gestión ● Y todo ello, haciendo uso de herramientas 2.0
  • 64. Aplicaciones empresa Social Layer (VIII) ● Consultores McKinsey & Company en su diario online McKinsey Quarterly The rise of the networked enterprise
  • 65. Aplicaciones empresa Social Layer (IX) ● Por si esto fuera poco, los datos recogidos por McKinsey prueban que existe una correlación directa entre la implementación del estándar 2.0 y la generación de beneficios tangibles y aumento del ROI
  • 68. Aplicaciones empresa Social Layer (XII) ● La identidad digital no se está explotando bien ● La influencia que provocan determinados perfiles, y que por ende, generan engagement ¿Cómo podemos detectar esa influencia y cuantitivizarla? Fuente: http://mattica.com/el-futuro-de-la-identidad-digital/
  • 69. Aplicaciones empresa Social Layer (XII) Reflexión BI.01.3: Las TIC en la capa social. ¿Qué puede aportar las TIC en? o Formación o Selección o Desarrollo o Sistemas de Gestión Empresarial o Marketing o Liderazgo o Trabajo en equipo o etc.
  • 70. Índice de contenidos ● Big Data e impacto sociedad ● Aplicaciones ámbito empresarial ● Business Intelligence ● Bases de datos ● Tipos de datos ● Ciclo de análisis de datos ● Agregación de datos ● Aspectos legales y éticos
  • 71. Business Intelligence Definición La raíz conceptual de la inteligencia de negocios puede relacionarse con el libro “El Arte de la Guerra” de Sun Tzu “Para poder ser exitosos en la Guerra, se debe conocer complemente las fortalezas y debilidades de uno mismo, así como las del enemigo. El no saber alguna de ellas podría significar la derrota” Fuente: http://www.taringa.net/posts/apuntes-y-monografias/ 17030452/El-arte-de-gobernar-bien. html
  • 72. Business Intelligence Definición (II) En 1989, Howard Dresner, un investigador de Gartner Group, popularizó el acrónimo de BI (Business Intelligence) para indicar “El conjunto de conceptos y métodos para mejorar la toma de decisiones en los negocios, utilizando sistemas de apoyo basado en hechos”
  • 73. Business Intelligence Definición (III) ● En la actualidad, incluye una amplia categoría de metodologías, aplicaciones y tecnologías que permiten: o Reunir, acceder, transformar y analizar ... o …. datos, transacciones e información no estructurada (interna y externa) … o …. con el propósito de ayudar a los usuarios de una compañía a tomar mejores decisiones de negocio
  • 74. Business Intelligence ¿Big Data? Source: http://de.nr-apps.com/blog/2014/01/09/zukunft-des-handels-big-data-und-bitcoins/
  • 75. Business Intelligence ¿Big Data? (II) “More data does not mean more knowledge” [Jenkins2013]
  • 76. Business Intelligence Modelo integral de una solución BI Fuente: https://www.pwc.com/ve/es/asesoria-gerencial/boletin/assets/boletin-advisory-edicion-10-2008.pdf
  • 77. Business Intelligence Modelo integral de una solución BI (II) SQL XML CSV ... Data Management / Integration Ciclo / Proceso datos Modelo datos Dashboard Report API
  • 78. Business Intelligence Modelo integral de una solución BI (III) Un modelo integral de BI pensado como una refinería de datos Fuente: http://www.lavozdelsandinismo.com/economia/ 2007-04-16/inicia-en-junio-construccion-de-refineria- venezolana-en-nicaragua/
  • 79. Business Intelligence Componentes ● Un motor de BI/Analytics tiene que cumplir siempre tres funciones básicas o Obtener datos fuentes o Disponer de un almacén estructurados de datos listos para explotación o Ser capaz de generar reports/informes de los datos
  • 80. Business Intelligence Componentes (II) ● Estas tres funciones se traducen en: 1 2 3 Proceso Modelo Plataforma explotación Datos Ciclo de análisis de datos Representación para explotación Información y conocimiento
  • 81. Business Intelligence Componentes (III) ● Estas tres funciones se traducen en: 1 2 3 Proceso Modelo Plataforma explotación Datos Ciclo de análisis de datos Representación para explotación Información y conocimiento Día 1
  • 82. Business Intelligence Componentes (IV) ● Estas tres funciones se traducen en: 1 2 3 Proceso Modelo Plataforma explotación Datos Ciclo de análisis de datos Representación para explotación Información y conocimiento Día 2
  • 83. Business Intelligence Componentes (V) ● Estas tres funciones se traducen en: Día 3 1 2 3 Proceso Modelo Plataforma explotación Datos Ciclo de análisis de datos Representación para explotación Información y conocimiento
  • 84. Índice de contenidos ● Big Data e impacto sociedad ● Aplicaciones ámbito empresarial ● Business Intelligence ● Bases de datos ● Tipos de datos ● Ciclo de análisis de datos ● Agregación de datos ● Aspectos legales y éticos
  • 85. Bases de Datos Problema en BI ● Los datos para una marca o Son ubicuos o Inconsistentes o No habilitados para explotación → rendimiento! o Los datos no siempre están en una Base de Datos o Incompletos o Perspectiva de captura y la Perspectiva de explotación no suelen estar alineadas Fuente: http://site-bakner.1minutesite.es/
  • 86. Bases de Datos Necesidad de conocer la BBDD ● La búsqueda de evidencias en grandes volúmenes de datos exige conocer qué tipo de evidencias son necesarias ● Es decir, conocimiento sobre el dominio y entender e interpretar los patrones que se pueden descubrir
  • 87. Bases de Datos Heterogeneidad ● Las Bases de Datos heterogéneas son un conjunto de BBDD administradas por diferentes SGBD o La heterogeneidad de éstas se debe a que los datos son de diferentes tipos o formatos ● En el contexto de BBDD heterogéneas se distinguen tres tipos de heterogeneidad: o Semántica o Esquemática o Sintáctica
  • 88. Bases de Datos Heterogeneidad: semántica ● Es la diferencia de la información en el contexto o Se debe a que el significado de la información se intercambia y tiene que ser entendido a través de más sistemas ● Para resolver el conflicto: o Se recomienda el uso de ontologías  Es la mejor manera de que los individuos comprendan la información de sistemas o BBDD muy diferentes
  • 89. Bases de Datos Heterogeneidad: semántica (II) ● Ontologías o Si los metadatos sirven para la estructuración del contenido, las ontologías hacen posible una semántica para construirlos o Una ontología es una especificación de una conceptualización  Es decir, un marco común o una estructura conceptual sistematizada y de consenso  No sólo para almacenar información, sino también para poder buscar y recuperarla
  • 90. Bases de Datos Heterogeneidad: semántica (III) ● Ontologías (cont.) o Define los términos y las relaciones básicas para la comprensión de un área del conocimiento, así como las reglas para poder combinar los términos para definir las extensiones de este tipo de vocabulario controlado
  • 91. Bases de Datos Heterogeneidad: semántica (IV) ● Ontologías (cont.) o Se usan para:  Favorecer la comunicación entre personas, organizaciones y aplicaciones  Lograr la interoperabilidad entre sistemas informáticos  Razonar automáticamente  Ingeniería del software
  • 92. Bases de Datos Heterogeneidad: semántica (V) ● Ontologías (cont.) o Se componen de  Conceptos: ideas básicas que se intentan formalizar. Pueden ser: clases de objetivos, métodos, planes, estrategias, etc.  Relaciones: interacción y enlace entre los conceptos de un dominio: Ejemplos: subclase-de, parte-de, conectado-a, etc.  Funciones: tipo concreto de relación con una identificación mediante el cálculo de una función  Instancias: representar objetos determinados  Reglas de restricción o axiomas: teoremas que deben cumplir los elementos de la ontología
  • 93. Bases de Datos Heterogeneidad: semántica (VI) ● Ontologías (cont.) o Las ontologías formales se expresan en un lenguaje estructurado denominado RDF  Convertir las declaraciones de los recursos en expresiones con la forma sujeto-objeto-predicado o OWL  Lenguaje de marcado para publicar y compartir datos usando ontologías  Facilita un modelo de marcado construido sobre RDF y codificado en XML
  • 94. Bases de Datos Heterogeneidad: esquemática ● Diferencias en las abstracciones hechas en cuanto a la definición de clases, atributos y sus relaciones ● Para solucionar: o Esquema compartido y mediador de contexto  El usuario se comunica con el esquema compartido, y éste al resolver los conflictos se comunica con el mediador de contexto que es el encargado de mapear la información  Cuando el esquema tenga la solución a la pregunta se la envía al mediador para que la vuelva a mapear y así pasársela al usuario
  • 95. Bases de Datos Heterogeneidad: sintáctica ● Se refiere a las diferencias en las representaciones de los datos Fuente: http://www.juntadeandalucia.es/averroes/ceip_san_rafael/DATOS/INTRODUCCION.htm
  • 96. Índice de contenidos ● Big Data e impacto sociedad ● Aplicaciones ámbito empresarial ● Business Intelligence ● Bases de datos ● Tipos de datos ● Ciclo de análisis de datos ● Integración de datos ● Aspectos legales y éticos
  • 97. Tipos de datos Ventaja competitiva ● Los datos es tanto un arte como una ciencia o Ciencia  Mucha investigación  Nunca hace Data Mining “sin más” o Arte  Razonamiento crítico  Visión de negocio  Conocimiento del dominio
  • 98. Tipos de datos Cambio ● El avance tecnológico ha cambiado sustantivamente las fuentes de datos o Se estima que el 80% de la información del mundo está desestructurada o Los datos desestructurados están creciendo a un ritmo de 15 veces superior a los estructurados o La capacidad de procesamiento está creciendo a un ritmo tan alto que no tenemos en ese sentido problemas o El acceso a la información es realmente fácil para todos [Eaton2012]
  • 99. Tipos de datos Fuentes ● RDBMS (SQL Server, DB2, Oracle, MySQL, PostgreSQL, Sybase IQ, etc.) ● NoSQL Data: HBase, Cassandra, MongoDB ● OLAP (Mondrian, Palo, XML/A) ● Web (REST, SOAP, XML, JSON) ● Files (CSV, Fixed, Excel, etc.) ● ERP (SAP, Salesforce, OpenERP) ● Hadoop Data: HDFS, Hive ● Web Data: Twitter, Facebook, Log Files, Web Logs ● Others: LDAP/Active Directory, Google Analytics, etc.
  • 100. Tipos de datos Fuentes (II) Source: http://www.bigdata-startups.com/BigData-startup/understanding-sources-big-data-infographic/
  • 101. Tipos de datos Fuentes (III)
  • 102. Tipos de datos Archivos ● Documentos escaneados ● Formularios ● Registros ● Archivos en papel ● ...
  • 103. Tipos de datos Documentos ● XLS ● PDF ● CSV ● email ● PPT ● HTML ● XML ● JSON ● ...
  • 104. Tipos de datos Media ● Imágenes ● Vídeos ● Audio ● Flash ● Streaming ● Podcasts ● ...
  • 105. Tipos de datos Almacenamiento de datos ● SQL ● NoSQL ● Hadoop ● Repositorio de documentos ● Sistema de ficheros ● ...
  • 106. Tipos de datos Aplicaciones de negocio ● CRM ● ERP ● CMS ● HRM ● KMS ● SCM ● LMS ● Intranet ● ...
  • 107. Tipos de datos Web pública ● Portales de datos abiertos ● Institutos de estadística ● Banco Mundial ● Wikipedia ● IMDb ● ...
  • 108. Tipos de datos Social Media ● Twitter ● LinkedIn ● Facebook ● Tumblr ● Blog ● SlideShare ● Instagram ● Google+ ● Chatter ● ….
  • 109. Tipos de datos Logs ● Eventos ● Servidores ● Aplicaciones ● Procesos de negocio ● CDRs ● Localización móvil ● Uso de aplicaciones móviles ● Clickstream ● ...
  • 110. Tipos de datos Datos de sensores ● Dispositivos médicos ● Sensores de vehículos ● Satélites ● Videojuegos ● ...
  • 111. Tipos de datos Comparación Archivos Docs Media BBDD Aplicac. Negocio Web pública Social Media Logs Sensores ¿Estructura? ¿Semántica? ¿Esquemática ? ¿Sintáctica?
  • 112. Tipos de datos Desestructurados Apache Drill Fuente: http://incubator.apache.org/drill/
  • 113. Índice de contenidos ● Big Data e impacto sociedad ● Aplicaciones ámbito empresarial ● Business Intelligence ● Bases de datos ● Tipos de datos ● Ciclo de análisis de datos ● Agregación de datos ● Aspectos legales y éticos
  • 114. Ciclo de análisis de datos Introducción Source: Data Mining with WEKA MOOC (http://www.cs.waikato.ac.nz/ml/weka/mooc/dataminingwithweka/)
  • 115. Ciclo de análisis de datos Introducción (II)
  • 116. Ciclo de análisis de datos Retos ● Los datos están en todos los sitios o Datos ubicuos ● Son inconsistentes o Los registros están expresados de diferentes maneras en cada sistema ● Problemas de rendimiento o Hacer consultas a base de datos para resumir los datos suelen ser largos o Lleva al Sistema Operativo a una carga máxima ● Los datos no siempre están en Bases de Datos o Hojas Excel, servicios web, desestructurados, etc.
  • 117. Ciclo de análisis de datos Retos (II) ● Los datos son incompletos ● Algunos tipos de datos no están registrados en ningún lugar [Mazza2012] o Al no estar expresados, no podrán ser explotados ● La perspectiva de almacenamiento no suele coincidir con la perspectiva de explotación ● Los usuarios suelen tener recelos para extraer conclusiones de algunos datos
  • 118. Ciclo de análisis de datos Modelos
  • 119. Ciclo de análisis de datos Modelos (II) A framework of characteristics for Analytics Adam Cooper, 2012 [Cooper2012]
  • 120. Ciclo de análisis de datos Proceso 1) Seleccionar 2) Capturar 3) Agregar 4) Procesar 5) Utilizar 6) Refinar Más datos no es más conocimiento Extracción, muestreo y ética Proceso de calidad de datos Análisis + Acción Hacer operativos los trabajos anteriores Post-procesamiento
  • 121. Ciclo de análisis de datos 1) Seleccionar 1) Seleccionar ● Plantear las preguntas/problemas a resolver ● Seleccionar los datos necesarios para responder a las preguntas formuladas ● Éste es precisamente uno de los retos actuales o ¿Qué datos son los críticos? ● Hay que poner sensores allí dónde estén los datos más relevantes o Para este paso, suele ser interesante contar con expertos del dominio
  • 122. Ciclo de análisis de datos 1) Seleccionar (II) 1) Seleccionar ● Vivimos en una era en la que tener acceso a datos no es el problema o El reto está en determinar qué datos son significativos y significantes y por qué Fuente: http://cesar-organizaciones.blogspot.com.es/2011/05/que-es-un-sistema-de-informacion-un.html
  • 123. Ciclo de análisis de datos 1) Seleccionar (III) 1) Seleccionar “The basic question is not what can we measure? The basic question is what does a good education look like? Big questions”
  • 124. Ciclo de análisis de datos 1) Seleccionar (IV) 1) Seleccionar Actividad BI.01.1. Big questions 1. Consumo 2. Institucional 3. B2B 4. Criminalidad 5. Educación
  • 125. Ciclo de análisis de datos 1) Seleccionar (V) 1) Seleccionar Actividad BI.01.1. Big questions ● Montar equipos de BI o Arquitecto BI  Administrador fuentes de datos, gestor ETL, herramientas tecnológicas o Data Manager  Administrar datos, minería de datos, analista calidad de datos, administrar metadatos o Consultor de negocio  Procesos a optimizar, necesidades cliente Transversal - Conocimiento dominio - Gestión de proyecto
  • 126. Ciclo de análisis de datos 1) Seleccionar (VI) 1) Seleccionar Actividad BI.01.1. Big questions ● ¿Qué problemas le puedo ayudar a la empresa a resolver? o Generación de datos para su captura o Procesamiento o Explotación de datos Leer aplicaciones de ámbito empresarial
  • 127. Ciclo de análisis de datos 2) Capturar 2) Capturar ● Extracción de los datos o Ante la Variedad de las fuentes de datos, se hace necesario disponer de un proceso ETL ● Así, se podrán transformar datos optimizados para transacciones a datos optimizados para el análisis y el reporting ● Se pueden emplear técnicas de muestreo de datos ● Respetar las leyes y la ética Leer “Aspectos legales y éticos” Leer “Tipos de datos”
  • 128. Ciclo de análisis de datos 2) Capturar (II) 2) Capturar Actividad BI.01.2. Integrar en un ETL diferentes tipos de datos necesarios para responder a las preguntas y resolver los problemas ● Mínimo 4 diferentes tipos de datos ● Listado de acciones de cumplimiento ético y de leyes
  • 129. Ciclo de análisis de datos 2) Capturar (III) 2) Capturar
  • 130. Ciclo de análisis de datos 3) Agregar 3) Agregar ● Reto actual: Variedad marketing omnical ● Necesidad de un modelo de datos normalizado para disponer de procesos de datos sostenibles ● Tareas o Limpieza de datos, Integración, Transformación, Reducción, Modelado, Rectificación de inconsistencias y anomalías, Normalización
  • 131. Ciclo de análisis de datos 3) Agregar (II) 3) Agregar Actividad BI.01.3. Preparar los datos para su posterior explotación ● Definir dimensiones (ir) ● Definir Reglas de Negocio (ir) ● Análisis metadatos (ir) ● Flujo de transformación y Reglas de Negocio (ir) Leer “Bases de Datos” Leer “Agregación de Datos”
  • 132. Ciclo de análisis de datos 4) Procesar 4) Procesar ● Analizar los datos normalizados y preparados ● Decidir contextos de explotación o Predicción o Intervención o Adaptación o Personalización o Recomendación o Alertas tempranas o Reflexión
  • 133. Ciclo de análisis de datos 4) Procesar (II) 4) Procesar Motor de Analytics Predicción Adaptación Personalización Intervención ... Recomendación
  • 134. Ciclo de análisis de datos 5) Utilizar 5) Utilizar ● Hacer operativos los trabajos anteriores ● Posibles escenarios de operación o Dashboard de KPIs o Informes o APIs de explotación desde otros sistemas o ...
  • 135. Ciclo de análisis de datos 5) Utilizar (II) 5) Utilizar Actividad BI.01.4. Pensar en escenarios de puesta en valor del conocimiento descubierto ● ¿Qué? ● ¿Cómo? ● ¿Dónde? ● ¿Cuándo? ● ¿Por qué?
  • 136. Ciclo de análisis de datos 6) Refinar 6) Refinar ● Post-procesamiento o Nuevos atributos al modelo o Nuevos indicadores o Nuevos tareas de calidad de datos o Nuevos métodos de análisis o ….
  • 137. Índice de contenidos ● Big Data e impacto sociedad ● Aplicaciones ámbito empresarial ● Business Intelligence ● Bases de datos ● Datos estructurados y desestructurados ● Ciclo de análisis de datos ● Agregación de datos ● Aspectos legales y éticos
  • 138. Agregación de datos Introducción ● El enfoque de ETL no es suficiente para dar sentido y posibilidad de explotación a los datos agregados o Los datos, así, deben ser normalizados para poder eliminar todos los posibles problemas que pueden aparecer en un proceso de integración de datos o Por ello, se habla de agregación/integración de datos para la normalización de los datos
  • 139. Agregación de datos Introducción (II) ● Además, la mala calidad de los datos genera costes de mantenimiento y reparación ● Además de estos aspectos económicos, la mala calidad de datos también afecta a la satisfacción del usuario y a la reputación sobre la toma de decisiones estratégicas
  • 140. Agregación de datos Introducción (III) ● La agregación/integración de datos es el paso más complicado de un proyecto de BI o Datanami: puede llegar a consumir hasta el 60-70% de un proyecto o Según otras fuentes, entre un 70 y un 85% ● Aquí tenemos que hablar de integrar todas las fuentes de datos en un dataset con datos apropiados para el objetivo concreto que se tiene en el proyecto ● Se hace necesario, por lo tanto, un proceso para garantizar la calidad de los datos
  • 141. Agregación de datos Introducción (IV) Source: http://www.learningfrontiers.eu/?q=story/will-analytics-transform-education
  • 142. Agregación de datos Gestión de la calidad de los datos ● La calidad de los datos emergió como una un área de investigación académica a comienzos de los 90 o No es nada nuevo tampoco ;-) ● En grandes y pequeñas compañías, la sensibilidad hacia la importancia de la calidad de los datos es un fenómeno más reciente
  • 143. Agregación de datos Gestión de la calidad de los datos (II)
  • 144. Agregación de datos Gestión de la calidad de los datos (III) ● El significado principal de la calidad de los datos es que resulte apropiado para un particular uso que se quiera realizar o Aptitud para ser utilizado o Adecuación a requisitos o Un concepto relativo dependiente de las necesidades del usuario
  • 145. Agregación de datos Gestión de la calidad de los datos (IV) ● De este modo, los mismos datos pueden ser evaluados en diferentes grados de calidad en función de las necesidades del usuario Fuente: http://mitiq.mit.edu/iciq/pdf/an%20evaluation%20framework%20for%20data%20quality%20tools.pdf
  • 146. Agregación de datos Gestión de la calidad de los datos (V) ● Criterios de medición de la calidad (en función de necesidades particulares) o Completitud  Valores de atributos, registros y tablas o Precisión  Fiabilidad y veracidad o Consistencia  Respetar una serie de restricciones/reglas de negocio o Relevancia  Usabilidad para los stakeholders o Unicidad  Una entidad (marca, producto, persona, servicio, etc.) es observada en contextos diferentes [Goasdoué2007]
  • 147. Agregación de datos Criterios: 1) Completitud ● Falta algún valor? (tabla, columna, instancia) o Ejemplos  Falta el código postal en el 50% de los registros ● Algunas métricas o Ratio de valores ausentes (tabla, columna, instancia) ● Para la mejora o Estimación del valor por técnicas estadísticas o Ignorar el valor para explotaciones futuras o Emplearlo, a sabiendas de los problemas que puede originar
  • 148. Agregación de datos Criterios: 1) Completitud (II) ● El rendimiento del modelo (el porcentaje de predicciones acertadas) dentro del intervalo de confianza establecidos, depende en mucho de esta criterio de calidad Fuente: http://es.wikipedia.org/wiki/Intervalo_de_confianza
  • 149. Agregación de datos Criterios: 2) Precisión ● Cercanía entre el valor v y un valor v’ considerando éste como la correcta representación de la realidad que el valor v intenta representar o Ejemplos  Algunos proveedores que están marcados como Activos fueron a la quiebra hace meses ● Algunas métricas o Número de estimaciones desviadas o Comparaciones con valores reales Fuente: http://scielo.sld.cu/scielo.php?script=sci_arttext&pid=S0864-34662007000200012
  • 150. Agregación de datos Criterios: 2) Precisión (II) ● Es un parámetro muy relacionado con la precisión, la fiabilidad y la veracidad ● En la práctica, a pesar de la atención que ha recibido, es difícil cuantitivizar la precisión de una medición o Es una operación muy cara de realizar o Esto se debe a que para poder realizarlo hay que disponer de datos de referencia externos o Por ello, se hacen verificaciones menos estrictas (patrones de comienzo de códigos, ratios desproporcionados entre géneros, etc.)
  • 151. Agregación de datos Criterios: 3) Consistencia ● Los datos son consistentes si satisfacen un conjunto de restricciones ● Para que sea efectivo, se deben establecer unas estrategias de control o Aquí es donde aparece el concepto de “Regla de negocio”  De este modo, la consistencia se puede ver como una subdimensión de la precisión  Aún así, la consistencia solo da una medida indirecta de la precisión ● Esta dimensión es esencial en la práctica
  • 152. Agregación de datos Criterios: 3) Consistencia (II) ● Métricas o ratio de % de conjuntos de datos que satisfacen las restricciones ● En el contexto de las herramientas de calidad de datos, los flujos de transformación de datos y sus reglas de negocio se centran básicamente en controles de consistencia
  • 153. Agregación de datos Criterios: 4) Relevancia ● ¿Son los datos relevantes para la tarea que se tiene entre manos? ● Métricas o Grado de utilidad ● Oportunidades de mejora o Encuestas  Preguntando a los stakeholders por el grado de utilidad de las respuestas dadas, ayudará a mejorar la relevancia de tareas de agregación de datos futuras (en especial, la primera tarea de selección de datos)
  • 154. Agregación de datos Criterios: 4) Relevancia (II) ● Éste es un problema nuclear al Big Data o Con la aparición de grandes volúmenes de datos, los usuarios en ocasiones se sienten frustrados por la incapacidad para sacar algún dato útil entre toda la maraña de datos o Por ello, los usuarios pueden tener el prejuicio hacia la poca utilidad de los datos resultantes de un proyecto de BI o Sin embargo, la utilidad juega un papel central en la aceptación del proyecto o Por lo tanto, habrá que realmente medirlo (y mejorarlo, en su caso, si procediera)
  • 155. Agregación de datos Criterios: 5) Unicidad ● Es un problema que aparece cuando una entidad del modelo de datos aparece en más de una ocasión o Ejemplo  Alexander Rayón y Alex Rayón son el mismo empleado, pero observado en dos fuentes de datos diferentes → pudieran parecer dos entidades, al no coincidir a primera vista
  • 156. Agregación de datos Criterios: 5) Unicidad (II) ● Métricas o % de duplicados o número de instancias superior a las esperadas (más difícil, por no conocer a priori el número de instancias)
  • 157. Agregación de datos Conjuntos de datos Dataset Instancia / Observación / Puntos de datos Asignar valores a las características definidas en el modelo de datos para diferentes entidades y sus relaciones Representado a través de un conjunto de características/atributos/medidas Atributo de clase (para problemas de predicción)
  • 158. Agregación de datos Etapas Definir Procesar Publicar
  • 159. Agregación de datos 1) Definir Definir ● Dimensiones Reglas de negocio Esquema / Diccionario de datos Modelo de datos o Dominio/Contexto: unidad mínima de análisis, representación y explotación o Tiempo: real-time o bajo demanda o Frecuencia: de medición (fija o variable) o Extracción de atributos: ¿con qué me quedo? (símil de la extracción de keywords representativas en un texto) o Jerarquía: para consultas (niveles de abstracción) o Granularidad: representación para explotación posterior
  • 160. Agregación de datos 1) Definir: Reglas de negocio Pensando en las dimensiones de calidad de datos anteriormente expuestas Source: http://themodernaccountant.com/2012/06/18/pearls-of-wisdom/
  • 161. Agregación de datos 1) Definir: Reglas de negocio (II) Nivel Esquema: conflictos nominales y estructura ● Homónimos: mismo nombre para diferentes objetos ● Sinónimos: diferentes nombres para el mismo objeto ● Diferentes tipos de datos ● Diferentes estructura de componentes ● Diferentes restricciones de integridad
  • 162. Agregación de datos 1) Definir: Reglas de negocio (III) Nivel Instancia ● Atributo o Valores nulos, misspellings, valores crípticos, abreviaciones, valores embebidos, etc. ● Registro o Dependencias de atributo incorrectas (zip y ciudad) ● Tipo de registro o Transposiciones de palabras, registros duplicados, registros contradictorios ● Fuente o Referencias incorrectas (nº departamento es incorrecto) ● Agregación o Granularidad (ventas por grupo vs. ventas por producto) o puntos de tiempo (semanal, diaria, quincenal, etc.)
  • 163. Agregación de datos 1) Definir: Reglas de negocio (IV)
  • 164. Agregación de datos 1) Definir: Reglas de negocio (V) Source: Data Mining with WEKA MOOC (http://www.cs.waikato.ac.nz/ml/weka/mooc/dataminingwithweka/)
  • 165. Agregación de datos 1) Definir: Esquema / Modelo de datos Source: http://en.wikipedia.org/wiki/Data_modeling
  • 166. Agregación de datos 1) Definir: Metodología Source: http://www.blockmagic.eu/main/?page_id=54
  • 167. Agregación de datos 2) Procesar Procesar Poner los datos a cumplir todas las reglas de negocio 1) Análisis de datos 2) Flujo de transformación y reglas de negocio 3) Verificación 4) Transformación - Análisis metadatos de los datos: Profiling (1 a 1) o Mining (patrones) - Quitar duplicados - Atomización → desdoblar en varios campos - Discretización - Normalización: modelo referencial; unión; unicidad; nulos - Integridad - Eliminar ruido (malas observaciones, shocks exógenos, etc.) - Outlier → obtención de conclusiones - Valores vacíos: 1) Eliminar instancia; 2) Predecir por interpolación; 3) Usarlo para procesar - Quitar la tendencia lineal (para fijarse en fluctuaciones… si es lo que interesa) - Validación → dependencias de atributos para validar y corregir - Verificar efectividad flujo de transformación y reglas de negocio - Ejecución en serie 5) Realimentación - Para evitar trabajos futuros sobre los mismos datos
  • 168. Agregación de datos 2) Procesar: Quitar duplicados Fuente: http://tutorialenexcel.blogspot.com.es/2012/10/15-tutorial-excel-manejando-la.html
  • 169. Agregación de datos 2) Procesar: Atomización Fuente: http://www.educarchile.cl/ech/pro/app/detalle?ID=133092
  • 170. Agregación de datos 2) Procesar: Discretización Fuente: http://7542.fi.uba.ar/tecnica/sonido-en-windows/
  • 171. Agregación de datos 2) Procesar: Normalización Fuente: http://www.anmopyc.es/noticia/boletin_de_normalizacion_julio_2014
  • 172. Agregación de datos 2) Procesar: Integridad Fuente: http://diariodelapelusa.blogspot.com.es/2013/04/de-la-integridad.html
  • 173. Agregación de datos 2) Procesar: Eliminar ruido Fuente: http://www.dominandocamtasia.com/blog/como-eliminar-el-ruido-de-un-video
  • 174. Agregación de datos 2) Procesar: Gestión outliers Fuente: http://mathworld.wolfram.com/Outlier.html
  • 175. Agregación de datos 2) Procesar: Gestión valores vacíos Fuente: http://www.fengfly.com/plus/view-169414-1.html
  • 176. Agregación de datos 2) Procesar: Quitar la tendencia lineal Fuente: http://www.monografias.com/trabajos96/regresion-lineal-simplificada-agricola/regresion-lineal-simplificada-agricola.shtml
  • 177. Agregación de datos 2) Procesar: Validación Fuente: http://www.empleoagil.com/contenido.php?id=22
  • 178. Agregación de datos 3) Publicar Publicar Estándar a seguir (extensibilidad, productividad y evitar fragmentaciones) ¿Modelo de datos? ¿Unidad de registro? ...
  • 179. Agregación de datos 3) Publicar (II) Fuente: http://www.londonshippingcontainers.co.uk/
  • 180. Agregación de datos 3) Publicar (III) Source: http://www.activelightning.com/automated_publishing/variable-data-printing.html
  • 181. Agregación de datos Herramientas Interactive Data Transformation Tools (IDTs) 1. Pentaho Data Integration: Kettle PDI 2. Talend Open Studio 3. DataCleaner 4. Talend Data Quality 5. Google Refine 6. Data Wrangler 7. Potter's Wheel ABC
  • 182. Agregación de datos 1) Kettle PDI ● Free to decide where and how realize tasks in terms of: ○ Profiling ○ Cleansing ○ Integrity ○ Validation ● It is based on metadata
  • 183. Agregación de datos 1) Kettle PDI (II)
  • 184. Agregación de datos 2) Talend Open Studio
  • 185. Agregación de datos 3) DataCleaner ● Profiling tool recommended by Pentaho ○ It can also be integrated with Kettle PDI ● Alternatives: ○ Desktop tool ○ Web tool ○ Plugin in Kettle PDI
  • 186. Agregación de datos 3) DataCleaner (II) ● Features ○ Data cleansing ○ Data dictionary definition ○ Pattern, duplicated, null, etc. search and detection ○ Monitoring ○ Full results statistics ○ etc.
  • 187. Agregación de datos 3) DataCleaner (III)
  • 188. Agregación de datos 4) Talend Data Quality
  • 189. Agregación de datos 5) OpenRefine
  • 190. Agregación de datos 6) Data Wrangler
  • 191. Agregación de datos 7) Potter's Wheel ABC
  • 192. Índice de contenidos ● Big Data e impacto sociedad ● Aplicaciones ámbito empresarial ● Business Intelligence ● Bases de datos ● Tipos de datos ● Ciclo de análisis de datos ● Agregación da datos ● Aspectos legales y éticos
  • 193. Aspectos legales y éticos Fuente: http://www.educause.edu/ero/article/ethics-big-data-and-analytics-model-application
  • 194. Aspectos legales y éticos (II)
  • 195. Aspectos legales y éticos (III)
  • 196. Aspectos legales y éticos (IV)
  • 197. Aspectos legales y éticos (V)
  • 198. El proceso de análisis y explotación de datos en proyectos de Business Intelligence Módulo 01: Ciclo de vida del Dato en ambientes de BI Alex Rayón Jerez alex.rayon@urbegi.com Octubre, 2014