1. Ing. Andrés Eyherabide
@aeyherabide
www.datalytics.com Presentación Pentaho Enterprise Edition
2. La Empresa
Fundada en el año 2007, Datalytics es una empresa de servicios profesionales
independiente, orientada exclusivamente a las prácticas de:
Data Integration
Business Intelligence
Data Mining
Oficinas en las ciudades de Buenos Aires, Rosario y Medellín.
Equipo de trabajo interdisciplinario, con +25 profesionales de diversas áreas.
Implementaciones en Argentina, Chile, Brasil, Colombia, España y USA.
Nuestros servicios incluyen la consultoría, capacitación, implementación y el apoyo
necesario para asegurar una solución exitosa que soporte los procesos de negocios.
Datalytics ha certificado su Sistema de Gestión de calidad para la “Provisión de Servicios
de Business Intelligence y Data Mining” bajo la norma ISO 9001:2008 por Bureau
Veritas.
3. Nuestros servicios
ETL DW OLAP & Reporting
VSAM
MQSeries
AS/400
Pentaho,
Oracle/Hyperion,
Microstrategy,
DB2 UDB
SAS, Etc.
Informix
Oracle Extract
Microsoft Transform
... Clean
Siebel Load
PeopleSoft
DW
Datastage ODS Data Mart
SAP R/3
Informatica
XML Oracle
Oracle DI
Pentaho DI IBM DB2
SAS DIS SQL Server
Archivos Planos
Etc. Teradata
FTP
Sybase IQ
Etc.
Data Mining
SAS, SPSS,
Web Logs Rapid Miner
4. Nuestros servicios
Relevamiento de implementaciones de BI. Análisis de GAP.
Consultoría, diseño e implementación de estrategias y soluciones de BI.
Integración de datos de múltiples fuentes: estructuradas y no estructuradas, locales o en
la nube, migración desde aplicaciones legacy, etc.
Utilización de técnicas y herramientas de BI para otras aplicaciones como:
Web y Social Media Analytics (Google Analytics, Twitter, Facebook, etc.).
Sistemas de gestión de campañas con herramientas de ETL.
Herramienta de gestión de Fuerza de Ventas.
Solución de gestión de evaluaciones de desempeño.
Procesos de limpieza, estandarización y normalización de datos
Desarrollo de modelos de Data Mining (descriptivos y predictivos).
6. Pentaho Partnership
Primer Platinum Reseller, Systems Integrator and Training Partner en América Latina.
Partners desde Marzo 2008. Larga y fluida relación.
Oferta de cursos oficiales y a medida, presenciales y vía web.
+50 implementaciones en clientes de distinta escala distribuidos en 6 países.
+20 consultores especializados en la Plataforma.
8. Que es Pentaho?
Pentaho es la empresa líder en
Commercial Open Source Business
Intelligence & Data Integration
Compañía americana fundada en 2004,
con HQ en Orlando (FL)
Modelo Low Cost y metodología ágil de
implementación, acelerando la generación
de valor y el ROI
Auspiciada por Benchmark Capital, Index
Ventures and NEA
+ de 160 partners, entre ellos algunas de
las empresas de tecnología más
innovadoras del mercado
9. Presencia internacional en aumento
+ 10.000 implementaciones
+185 países
+ 1.200 clientes comerciales
Debút en los cuadrantes mágicos de BI Gartner (2012)
En promedio 1 descarga cada 30 segundos (!)
# Suscripciones
Q1 Q2 Q3 Q4 Q1 Q2 Q3 Q4 Q1 Q2 Q3 Q4
'09 '09 '09 '09 '10 '10 '10 '10 '11 '11 '11 '11
10. Modelo de Negocios
Write Build
Contribute Test
Open Source Community Enterprise Edition
Pentaho contrata los principales Software certificado, listo para ambientes de
desarrolladores de cada módulo, y dirige el producción
desarrollo de cada uno de los proyectos Módulos exclusivos, funcionalidad adicional y
La comunidad contribuye nueva facilidades de uso
funcionalidad, testeo e innovación Soporte técnico oficial
Lo anterior mejora la calidad del producto Modelo de suscripción que minimiza la
mediante la rápida detección de defectos inversión inicial
11. Liderazgo en el mundo Open Source
# 1 OS BI
# 1 en OS DI/ETL
# 2 en OS Data Mining
Fuente TDWI y BeyeNetwork
12. El Open Source según Gartner
“Para el 2012, el 80% de todo software comercial
incluirá algún elemento Open Source”
“Hay variedad de herramientas/software open source en un estadío maduro,
estable y bien soportadas. Ellas proveen una significativa oportunidad para
vendedores y usuarios de bajar el costo total de ownership e incrementar el ROI.”
“Ignorar esta realidad pondrá a las compañías en una sería posición de
desventaja competitiva. Embeber sofware Open Source se convertirá en la
inversión mínima que muchos grandes vendors encontrarán necesaria para
mantener su ventaja competitiva durante los próximos 5 años.”
Gartner Group, año 2008
13. Open Source dentro de Close Source
5 años después, los megavendors de BI le hicieron caso al Grupo Gartner.
SAP/Business Objects:
Apache Tomcat, MySQL, Eclipse, Python, Subversion, etc…
IBM/Cognos:
Apache Tomcat, Apache Derby, PostgreSQL, iSeries Appliance (Talend)
Greenplum:
PostgreSQL, Proyecto R, Map/Reduce
Information Builders:
Magnify (Lucene), Rstat (Proyecto R), Open Portal Services (Apache Jetspeed)
14. Adopción Open Source BI
50%
Fuente: Open Source Adoption in the BI Market, 3rd Nature, 2009
15. Por qué Open Source?
Fuente: Open Source Adoption in the BI Market, 3rd Nature, 2009
18. La visión de Pentaho sobre el futuro de BI
Por que Pentaho considera que una plataforma que una data
integration con business analytics es crítico para el futuro
Drivers
Incremento exponencial de datos
Diversidad de información
Arquitecturas Cloud y Móviles
Masificación de IT
Next Generation
Analytics
BI for Business • Integration of transaction &
Legacy BI Analysts big data
• Transaction data • In-Memory • User-driven, collaborative
• IT-driven • Self Service • Cloud-ready, Embedded,
• On premise • Visualization Mobile
2000 2007 2012
19. La visión de Pentaho sobre el futuro de BI
Drivers
Incremento exponencial de datos
Diversidad de información
Arquitecturas Cloud y Móviles
Masificación de IT
Next Generation
Analytics
BI for Business • Integration of transaction &
Legacy BI Analysts big data
• Transaction data • In-Memory • User-driven, collaborative
• IT-driven • Self Service • Cloud-ready, Embedded,
• On premise • Visualization Mobile
2000 2007 2012
20. Plataforma unificada
Integrar información de manera visual desde múltiples fuentes de información
Visualizar y analizar la información de la compañía de manera interactiva
Interfaz web de usuario final desarrollada para permitir self-service BI, reduciendo la
dependencia de IT
Transaction Data Data Data Analyst
Data Integration Discovery Mining
Access Reports
Integrate Dashboards Predictive Decision
Web Data Cleanse Analysis Analytics Maker
Enrich Visualizations
External Data/ Business
Partner Apps Capa de metadatos compartida User
21. Plataforma moderna
Plataforma integral Plataforma completa, con visión unificada de integración y análisis de datos
de bajo costo Enfoque ágil para rápidas iteraciones y desarrollo de prototipos evolutivos
Modelo de suscripción low cost
Diversidad de Datos estructurados, no estructurados y NoSQL
Datos Soporte nativo para plataformas emergentes como Hadoop, Cassandra, etc.
Diversidad de Reporting, dashboards, análisis OLAP, data mining, análisis predictivo
Análisis Poderosas herramientas para usuarios y analistas de negocio, investigadores
Embedded Arquitectura orientada a servicios (SOA). Integración y reusabilidad
Analytics Basa en estándares, altamente extendible y fácil de embeber/integrar
100% Java, multi-plataforma (Windows, Linux, Unix, Mac OS)
Arquitectura
Modular y liviana, de arquitectura sencilla
Moderna
Alta-performance, escalable
22. Guiado por una metodología
La misión de Agile BI es acelerar el ROI.
Crear soluciones de calidad de manera rápida y sencilla, promoviendo la participación
del usuario final durante el desarrollo y reduciendo los riesgos de desvíos en la
implementación.
Una plataforma integrada reduce los tiempos de desarrollo.
Rápidas iteraciones promueven la
participación de los analistas
de negocio.
Single
Developme
La agilidad para adaptarse a nuevos nt
Environmen
requerimientos y a un entorno t
cambiante es vital para satisfacer
las necesidades del negocio.
23. Suscripción anual Low Cost
“En un proyecto de 5 años, open source BI cuesta
82% menos que los BI Megavendors y 77% menos
que empresas dedicadas a BI”
(Fuente: BI Platform Licensing Models and Negotiating Strategies, Abril 2010)
En un período de 3 años, la reducción de
costos de Pentaho respecto a otros productos
propietarios:
• Implementaciones Grandes (500 usuarios): 95%
• Implementaciones Medianas (100 usuarios): 72%
• Implementaciones Pequeñas (25 usuarios): 55%
(Fuente: Lowering the Cost of Business Intelligence With Open Source, 2010)
24. Pentaho BA Suite
Pentaho está compuesta por un
conjunto de herramientas, una por cada
etapa de su proyecto de BI.
Estructura modular y embebible:
Data Integration
Pentaho Reporting
Pentaho Analysis
Pentaho Dashboards
Pentaho Data Mining
Arquitectura multiplataforma
Soporte para Mobile BI
Énfasis en Big Data (Hadoop, bases
analíticas, NoSQL, etc.).
25. Pentaho Data Integration
Permite tomar información de
diferentes fuentes, consolidarla y
cargarla en un repositorio analítico.
Su entorno de trabajo visual y drag &
drop se traduce en un menor tiempo de
desarrollo y un mantenimiento más
sencillo y agilidad para incorporar
nuevas fuentes de información e
indicadores.
Plug-in de Agile BI:
Data Discovery:
Análisis y visualización de información en
tiempo real
Data Modeling:
Modelado y publicación de cubos OLAP
para prototipado y validación de
requerimientos
26. Pentaho Data Integration
+ de 150 steps para manipulación, enriquecimiento de datos y generación de reportes.
Repositorio integrado: control de versiones para trabajo colaborativo y scheduling de
procesos.
Conectividad nativa contra:
Típicas: SQL Server, Oracle, DB2, Teradata, Sybase IQ, SAP, MySQL, PostgreSQL, etc.
No tan típicas: AS/400, Hadoop, LDAP/Active Directory, SalesForce, Google Analytics, etc.
Nuevos Features:
Soporte para MongoDB.
ElasticSearch.
Archivos HL7.
Capacidad de documentación automática.
cliente REST.
Etc…
27. Portal Web
Los usuarios pueden acceder a la información
mediante la web en cualquier momento,
desde cualquier lugar con conectividad.
100% personalizable e integrable.
El Portal integra todos los módulos de la
solución y provee servicios críticos para los
usuarios como son:
Fácil acceso a información del negocio.
Análisis de tipo Ad-Hoc.
Scheduling de reportes de manera intuitiva.
Descarga de información. Análisis offline.
También provee servicios para
administradores:
Administración de usuarios y seguridad.
Auditoria y monitoreo de rendimiento, etc.
29. Pentaho Report Designer
Conectividad con múltiples fuentes de
información:
Bases de datos (SQL Server, Oracle, DB2,
Teradata, Sybase, …).
Transformaciones de Pentaho Data
Integration.
Otros: Metadata de Pentaho, OLAP (XML/A,
MDX), XML.
Principales Características:
Reportes pixel-perfect.
Desarrollo 100% drag & drop.
Utilización de parámetros y variables.
Posibilidad de descargar la información en
diversos formatos (html, pdf, xls, etc.).
30. Pentaho Enterprise Edition (EE)
Interactive Reporting Analyzer Dashboard Designer
• Reportes detallados vía Drag & drop • Reportes sumarizados vía Drag & drop • Dashboards on-demand
• Selección, filtrado y formateo online • Analisis y visualización avanzada • Punto de integración de análisis
• Integración con Dashboards • Navegación vía Drill-through y linkeo • Tablas, gráficos, reportes, etc.
Advanced Data Integration Enterprise Console Big Data
• Desarrollo colaborativo • Soporte nativo para Hadoop
• Automatización integrada • Bases de datos NoSQL
• Plugin de Agile BI para prototipado • Administración centralizada • Soporte para Amazon EMR
• Steps adicionales: Data Mining, • Monitoreo y diagnostico • Procesamiento distributed
Google Docs, Google Analytics, etc. • Auditoría de la plataforma
31. Pentaho Ad-Hoc Reporting
Diseñador Web de reportes de tipo Drag &
Drop.
Capacidad de los analistas de negocio de
generar sus propios reportes operativos
desde la web.
Selección de campos, totales por columna,
filtros, ordenamiento, etc.
Modificación de Look & Feel: fonts, colores,
tamaño de las columnas, etc.
Posibilidad de descargar la información en
diversos formatos (html, pdf, excel, etc.)
La Capa de negocios permite presentar la
información a los usuarios en términos de
negocio: los usuarios ven “Ventas” y
“Clientes” en vez de CUST_TBLE u
ORDR_TBLE.
32. Diferenciales de Int. Reporting (EE only)
Interfaz web: resulta más sencillo para el usuario el usuario promedio crear reportes
operacionales de manera ad-hoc, sin depender de IT.
Drag & Drop: agregar, mover o borrar campos en tiempo real desde el reporte.
Edición y formatting: fonts y colores, filtrado, ordenamiento, agrupamiento, agregación.
Export de grandes volúmenes de información en diversos formatos: Excel, PDF, etc.
Creación de reportes basados en templates, para darle a los reportes la impronta visual de
la compañía.
Mas funcionalidad en la web: menos casos
donde se requiere Report Designer (cliente
desktop orientado a IT).
33. Pentaho Analysis
Los cubos OLAP permiten a los usuarios
interacturar y visualizar la información de
manera multi-dimensional:
Ejemplo: ventas por regional, por unidad de
negocio, por año fiscal.
Navegar y explorar la información de
manera 100% intuitiva:
Análisis Ad-Hoc, Self-Service BI.
Drill-down, Drill-up.
Pivot, Slice and Dice.
Seleccionar miembros específicos para el
análisis.
Interacción con alto rendimiento:
Tecnología optimizada para manipular
grandes volumenes de información en seg.
34. Diferenciales de Pentaho Analyzer (EE only)
Capacidad analítica: cliente web 2.0 orientada a Drag & Drop que permite a los usuarios
finales mantener una conversación más fluida con los datos.
Análisis de información en formato de tablas pivot y gráficos, con soporte para multi-
charting y drill down en gráficos, brindando mayor facilidad para navegar la información y
descubrir patrones y anomalías.
Ordenamiento y filtrado mediante click derecho, más intuitivo para el usuario promedio.
Métricas creadas por los usuarios en tiempo real, sin código MDX o SQL.
Filtros dinámicos. Ejemplo: mes actual.
Export de grandes volúmenes de información
en diversos formatos: Excel, PDF, etc.
Mondrian Enterprise Cache: arquitectura de
última generación para trabajar con BIG DATA.
Mobile BI: Plug-in para iPad.
35. Dashboard Designer (EE only)
Dashboards interactivos en minutos.
Orientado a usuarios finales (no IT)
Desarrollo amigable y 100% web.
Permite reunir en una única pantalla
diversos elementos:
Tablas Pivot
Gráficos
Mapas
Contenido existente (Ej.: reportes)
Contenido externo (Ej.: páginas web)
Controles para filtros
Link entre objetos:
Dentro del mismo Dashboard
Entre Dashboards u otros reportes de Pentaho
36. Pentaho Data Integration (EE only)
Pentaho Data Integration Server: arquitectura
cliente/servidor.
Repositorio Enterprise:
Almacenamiento y cersionador
Seguridad y control de acceso
Scheduling
Data Integration Web Console:
Ejecución, monitoreo y gestión de procesos
Análisis de performance, trends, históricos.
Configuración de umbrales de alerta
Steps exclusivos:
Google Docs
Google Analytics
Full Agile BI Plug-in
37. Pentaho Enterprise Console (EE only)
Administración de usuarios y roles
Integración de seguridad con Active Directory/LDAP
Health Check de la plataforma
Configuración de conexiones
Configuración de servicios:
Servidor OLAP
Application Server
Servidor SMTP
Monitoreo de uso, auditoría
Scheduling de reportes
Data Integration Console
Administración de licencias
38. Pentaho EE – 3 Sabores
Basic Professional Enterprise
Operational Reporting
Dashboards
Data Integration
Interactive Reporting &
Analysis
Data Mining
Big Data y NoSQL
39. Por qué Pentaho?
Arquitectura moderna, con una solución analítica integral (DI + BI).
Suscripción Low Cost: se paga a medida que se van obteniendo resultados.
Soporte para Mobile BI, Big Data y Cloud Analytics.
Más de 10.000 implementaciones / batallas ganadas.
Tasa de innovación acelerada, con una comunidad de + 10.000 desarrolladores.
Socio tecnológico de las empresas más innovadoras del mercado de BI.
90% más efectiva en materia de costo que los sistemas tradicionales de BI.